Tuần này trong 60 giây
Cuộc chạy đua vũ trang về cơ sở hạ tầng AI đang nóng lên trên toàn cầu
Tuần này, OpenAI đã công bố hai thỏa thuận cơ sở hạ tầng khổng lồ: một quan hệ đối tác mang tính bước ngoặt với Nvidia để triển khai ít nhất 10 gigawatt hệ thống GPU và việc mở rộng sáng kiến Stargate với Oracle và SoftBank để xây dựng năm trung tâm dữ liệu AI mới. Những động thái này nhấn mạnh quy mô đầu tư đổ vào điện toán AI, với việc Nvidia cam kết lên tới 100 tỷ đô la khi công suất được đưa vào hoạt động. Đồng thời, lệnh cấm gần đây của Trung Quốc đối với chip AI của Nvidia cho thấy sự phân mảnh ngày càng tăng của chuỗi cung ứng và cuộc đua toàn cầu ngày càng gay gắt nhằm đảm bảo an ninh cho cơ sở hạ tầng AI. Chúng ta sẽ tìm hiểu sâu hơn về cuộc chạy đua này trong phần Phân tích sâu hơn.
xAI của Elon Musk tham gia cuộc đua cung cấp năng lượng cho AI của chính phủ
Công ty khởi nghiệp xAI của Musk đã đạt được thỏa thuận với Tổng cục Dịch vụ Công Mỹ (GSA) để bán chatbot Grok cho các cơ quan liên bang với giá chỉ 42 xu/người dùng trong vòng 18 tháng. Mức giá hời này, đi kèm với hỗ trợ tích hợp từ các kỹ sư xAI, giúp Grok cạnh tranh trực tiếp với các đối thủ trong cuộc đua giành sự chấp thuận của chính phủ. OpenAI và Anthropic trước đây đã đưa ra mức giá tương tự là 1 đô la/người dùng, và Perplexity cũng đã tham gia cuộc đua với mức giá 0,25 đô la. Như chúng tôi đã giải thích trong một số báo trước , những thỏa thuận “bán lỗ” được giảm giá sâu này phản ánh nỗ lực rộng lớn hơn của các công ty AI nhằm đảm bảo sự chấp thuận lâu dài của chính phủ.
DeepMind phát hành Gemini Robotics 1.5 cho các nhiệm vụ AI vật lý
Google DeepMind đã giới thiệu Gemini Robotics 1.5, một hệ thống mới được thiết kế để đưa dòng mô hình Gemini của mình vào thế giới thực. Phiên bản này bao gồm hai thành phần: Gemini Robotics 1.5, một mô hình thị giác-ngôn ngữ-hành động, chuyển đổi các lệnh thành lệnh vận động, và Gemini Robotics-ER 1.5, một mô hình lý luận hiện thân, lập kế hoạch nhiệm vụ, lý giải về môi trường và có thể gọi các công cụ bên ngoài như Google Tìm kiếm. Hai mô hình này hoạt động cùng nhau trong một hệ thống đại lý, cho phép robot hoàn thành các nhiệm vụ phức tạp, nhiều bước với các giải thích bằng ngôn ngữ tự nhiên và cải thiện khả năng hiểu biết không gian. Theo DeepMind, đây là một bước tiến tới các đại lý vật lý đa năng hơn, với quyền truy cập ban đầu được triển khai thông qua Google AI Studio.
OpenAI giới thiệu ChatGPT Pulse và các tính năng mới dành cho nhóm
OpenAI đã ra mắt bản xem trước của ChatGPT Pulse , một trải nghiệm cập nhật hàng ngày mới, chủ động hiển thị nội dung được cá nhân hóa dựa trên lịch sử trò chuyện, bộ nhớ, phản hồi và các công cụ được kết nối như Google Calendar. Pulse hiện có sẵn cho người dùng Pro trên thiết bị di động và cung cấp các thẻ hình ảnh ngắn mỗi sáng để người dùng có thể quản lý và điều chỉnh theo thời gian. Riêng OpenAI cũng công bố các dự án chia sẻ dành cho người dùng doanh nghiệp, cho phép các nhóm cộng tác trong ChatGPT với ngữ cảnh, tệp và hướng dẫn liên tục.
DeepSeek phát hành V3.1-Terminus trong khi kỳ vọng vào R2 ngày càng tăng
Trong khi nhiều người đang chờ đợi DeepSeek R2, nhóm đã phát hành V3.1-Terminus , một phiên bản cải tiến của mô hình V3.1 hiện có, tập trung vào tính ổn định và phản hồi của người dùng. Bản cập nhật cải thiện tính nhất quán của ngôn ngữ (giảm nhầm lẫn CN/EN), loại bỏ các vấn đề về ký tự ngẫu nhiên và mang lại kết quả đáng tin cậy hơn trên các phép đo điểm chuẩn. Việc sử dụng công cụ Agentic đã đạt được những bước tiến lớn nhất, với những cải tiến về hiệu suất trong các tác vụ như BrowseComp, SimpleQA và Terminal-bench. Mô hình hiện có sẵn trên ứng dụng, web và API, với các trọng số mở được công bố trên Hugging Face.
Nhìn sâu hơn vào tin tức tuần này
Cuộc chạy đua vũ trang cơ sở hạ tầng AI lớn
Trong khi các tiêu đề báo thường tập trung vào các mô hình AI, thì một cuộc đua thầm lặng nhưng có hậu quả lớn hơn đang diễn ra bên dưới: cuộc chạy đua xây dựng phần cứng và trung tâm dữ liệu hỗ trợ chúng.
Trong ba năm qua, và đặc biệt là trong vài tháng gần đây, Mỹ, Trung Quốc và Châu Âu đều đã tăng cường cam kết của mình đối với cơ sở hạ tầng AI.
Mỹ: Khả năng phục hồi của vị trí nhưng không phải của nguồn cung?
Tại Mỹ, các tập đoàn công nghệ tư nhân đang dẫn đầu xu hướng này với sự hỗ trợ của chính phủ. Microsoft, Google, Meta, Amazon và OpenAI đầu tư hàng chục tỷ đô la mỗi năm để mở rộng các trung tâm dữ liệu AI, thường với các ưu đãi cấp nhà nước.
Dự án Stargate của OpenAI hiện đang xây dựng các cơ sở trên khắp Texas, Ohio và New Mexico, nhắm tới mục tiêu đạt 10 gigawatt điện toán AI—đủ sức mạnh để cạnh tranh với mức tiêu thụ của các quốc gia nhỏ.
Tuần này, OpenAI và Nvidia đã công bố một bức thư bày tỏ ý định về mối quan hệ đối tác trị giá 100 tỷ đô la, sẽ cung cấp 10 GW hệ thống GPU, với giai đoạn đầu tiên sẽ được triển khai trực tuyến vào năm 2026 trên nền tảng Vera Rubin của Nvidia (nền tảng kế thừa Blackwell, được thiết kế để đào tạo hiệu quả hơn trên quy mô lớn).
Bằng cách neo giữ năng lực tính toán tại lãnh thổ Mỹ, quốc gia này sẽ giảm sự phụ thuộc vào Đài Loan, nơi hầu hết các chip tiên tiến của Nvidia vẫn được sản xuất.
Tuy nhiên, việc phát triển AI của Mỹ phụ thuộc rất nhiều vào một nhà cung cấp duy nhất. Nếu Nvidia gặp khó khăn – dù là do gián đoạn chuỗi cung ứng, vấn đề sản xuất hay sự thay thế cạnh tranh – thì toàn bộ hệ sinh thái của Mỹ đều cảm nhận được. Mỹ đã đạt được khả năng phục hồi về vị trí nhưng chưa đạt được khả năng phục hồi về nguồn cung .
Đó là lý do tại sao các nhà hoạch định chính sách và tiếng nói trong ngành đã thúc đẩy đa nguồn cung ứng . Việc hỗ trợ AMD, Intel và các công ty khởi nghiệp về chip AI như Cerebras hay Groq được coi là bước tiếp theo hướng tới một hệ sinh thái cân bằng hơn.
Trung Quốc: Tự lực cánh sinh là điều cần thiết
Đường hướng của Trung Quốc bị định hình bởi các biện pháp kiểm soát xuất khẩu của Mỹ, vốn đã ngăn cản nước này tiếp cận các chip Nvidia hàng đầu. Thay vì lùi bước, Bắc Kinh đã tăng cường hành động. Tháng này, chính quyền đã đi xa đến mức cấm các tập đoàn công nghệ trong nước mua GPU Nvidia, buộc các công ty như Alibaba, Baidu và Tencent phải áp dụng các giải pháp thay thế nội địa.
Huawei đã lấp đầy khoảng trống đó bằng cách đưa ra lộ trình phát hành bộ xử lý AI Ascend mới hàng năm, với hiệu năng tăng gấp đôi sau mỗi chu kỳ. Các “siêu node” Atlas 950 và 960 sắp ra mắt của hãng sẽ liên kết hàng nghìn chip Ascend thành các cụm AI khổng lồ, tận dụng lưới điện rộng lớn của Trung Quốc để bù đắp cho hiệu suất thấp hơn so với GPU Nvidia.
Châu Âu: Chủ quyền và quan hệ đối tác
Châu Âu từ lâu đã tụt hậu trong lĩnh vực tính toán AI, nhưng đang bắt kịp bằng cách tập trung vào “chủ quyền kỹ thuật số” (ý tưởng cho rằng Châu Âu nên lưu trữ và kiểm soát cơ sở hạ tầng cung cấp năng lượng cho các hệ thống AI của mình, thay vì hoàn toàn phụ thuộc vào các nhà cung cấp đám mây của Mỹ hoặc phần cứng của Trung Quốc).
Chương trình gigafactory AI trị giá 20 tỷ euro của EU và các Nhà máy AI của EuroHPC đang tạo ra các trung tâm khu vực cho các nhà nghiên cứu và doanh nghiệp, trong khi các dự án quốc gia ở Pháp và Đức đang xây dựng các cơ sở siêu máy tính có chủ quyền.
Những cột mốc gần đây cho thấy sự tiến bộ: Siêu máy tính JUPITER của Đức đã trở thành hệ thống exascale đầu tiên của Châu Âu trong tháng này, trong khi Vương quốc Anh công bố Stargate UK , một dự án hợp tác với OpenAI và Nvidia sẽ triển khai 31.000 GPU trên đất Anh.
Tính toán trở thành địa chính trị
Bài học sâu sắc hơn là quỹ đạo của AI có thể phụ thuộc ít hơn vào việc ai thiết kế thuật toán thông minh nhất mà phụ thuộc nhiều hơn vào việc ai kiểm soát năng lượng, chip và cơ sở hạ tầng vật lý để chạy chúng.
Trong thế kỷ 20, các quốc gia truyền tải điện năng thông qua đường ống dẫn dầu, tuyến đường vận chuyển và cáp ngầm dưới biển. Trong thế kỷ 21, những điểm nghẽn đó có thể trông giống như các cụm GPU, lưới truyền tải và hệ thống làm mát hơn.
Điện toán đã trở thành một hình thức đòn bẩy kinh tế. Nếu một quốc gia có thể đào tạo những mô hình lớn nhất và cho thuê năng lực cho các quốc gia khác, quốc gia đó không chỉ giành được vị thế dẫn đầu về mặt kỹ thuật mà còn có được sức mạnh mặc cả trong thương mại, quốc phòng và ngoại giao. Đó là lý do tại sao các chính phủ đang coi các trung tâm dữ liệu và nhà máy sản xuất như những tài sản chiến lược, trợ cấp cho chúng theo cách họ từng làm với các nhà máy thép hoặc nhà máy sản xuất máy bay.
Nó cũng gợi ý về một loại lỗ hổng mới. Chi phí năng lượng, tắc nghẽn chuỗi cung ứng, hay thậm chí là các cuộc tấn công mạng vào trung tâm dữ liệu có thể lan rộng ra ngoài lĩnh vực công nghệ. Cũng giống như sự gián đoạn của dầu mỏ từng gây chấn động nền kinh tế toàn cầu, sự gián đoạn của điện toán một ngày nào đó có thể gây ra tác động tương tự cho các ngành công nghiệp phụ thuộc vào AI.
Các trường hợp sử dụng trong ngành
Nhà máy Hyundai tại Georgia được xây dựng dựa trên AI và Robot
Nhà máy Metaplant America mới của Hyundai, một cơ sở trị giá 7,6 tỷ đô la trải rộng trên 278 sân bóng đá, được thiết kế ngay từ đầu như một trung tâm sản xuất ưu tiên AI. Các phương tiện di chuyển qua 23 hệ thống AI hoặc robot, với máy bay không người lái, cánh tay robot, và thậm chí cả Spot của Boston Dynamics được sử dụng cho kiểm soát chất lượng và hậu cần. Nhà máy vận hành mô phỏng hoạt động song sinh kỹ thuật số hoàn chỉnh, cho phép bảo trì dự đoán và phát hiện lỗi theo thời gian thực. Hyundai cho biết phương pháp này giúp giảm chi phí và quản lý gián đoạn tốt hơn.
Citi Pilots Các đại lý AI nội bộ cho nghiên cứu khách hàng
Citigroup đã bắt đầu chương trình thí điểm AI agentic với quy mô 5.000 người dùng bên trong nền tảng Stylus Workspaces độc quyền của mình. Giờ đây, nhân viên có thể yêu cầu một AI thực hiện các tác vụ nhiều bước — chẳng hạn như tìm hiểu khách hàng trên các hệ thống nội bộ và nguồn công khai, xây dựng hồ sơ và dịch hồ sơ — tất cả chỉ trong một lần. Hệ thống sử dụng các mô hình từ các nhà cung cấp như Google và Anthropic, và các mục tiêu ban đầu bao gồm đo lường tác động, mô hình sử dụng và hiệu quả chi phí trên toàn bộ quy trình nghiên cứu và lập hồ sơ.
Ống nghe được tăng cường AI cho phép chẩn đoán tim nhanh chóng
Các nhà nghiên cứu tại Đại học Hoàng gia London và Eko Health đã phát triển một ống nghe tích hợp AI có thể phát hiện suy tim, bệnh van tim và loạn nhịp tim chỉ trong 15 giây. Trong một thử nghiệm tại Anh với 12.000 bệnh nhân, công cụ này đã tăng gấp đôi tỷ lệ phát hiện suy tim so với các xét nghiệm thông thường và tăng gấp ba lần chẩn đoán rung nhĩ. Thiết bị ghi lại dữ liệu điện tâm đồ và âm thanh đồng thời, sau đó được phân tích trên đám mây bằng các mô hình AI được đào tạo để phát hiện các kiểu tim tinh vi. Mặc dù không được thiết kế để sàng lọc thường quy, các bác sĩ lâm sàng cho biết nó có thể giúp chẩn đoán nhanh hơn tại các cơ sở chăm sóc sức khỏe ban đầu và giảm số ca nhập viện cấp cứu.

