Phân tích - Bình luận

Mục tiêu 1.000 tỷ USD mới của Nvidia nói lên điều gì?

Nam Trần • 18/03/2026 03:07

Tại hội nghị GTC thường niên diễn ra ở California tuần này, CEO Jensen Huang của Nvidia đã tuyên bố một kỷ nguyên mới của trí tuệ nhân tạo (AI) đã bắt đầu.

jensen-huang-gtc-2024_3d4392c1-5608-4de2-b1c8-fb618602fbe5-prv.jpg — Nvidia tiếp tục tăng tốc nhằm hướng tới kỷ nguyên mới của Trí tuệ Nhân tạo (Ảnh: Nvidia)

Nhưng đó không phải kỷ nguyên huấn luyện mô hình, mà là kỷ nguyên suy luận (inference).

Inference - từ khóa của thời đại mới

Trong nhiều năm, Nvidia thống trị thị trường nhờ bán GPU (đơn vị xử lý đồ họa) - dòng loại chip mạnh mẽ dùng để huấn luyện các mô hình AI lớn. Nhưng cuộc chơi đang thay đổi.

Khi các công ty AI chuyển từ giai đoạn xây dựng mô hình sang giai đoạn kiếm tiền từ mô hình, nhu cầu thực tế trên thị trường đã dịch chuyển sang inference - quá trình cho phép mô hình phản hồi câu hỏi của người dùng trong thời gian thực. Đây là thứ xảy ra mỗi khi bạn gõ một câu hỏi vào ChatGPT hay bất kỳ trợ lý AI nào khác.

GPU truyền thống của Nvidia vốn không được thiết kế tối ưu cho tác vụ này. Chúng tiêu thụ quá nhiều điện năng và thiếu bộ nhớ để mô hình truy xuất dữ liệu huấn luyện một cách linh hoạt. Đó là lý do vì sao Huang đã dành phần lớn bài phát biểu chủ đề của mình để giới thiệu một sản phẩm được thiết kế từ đầu cho inference.

Con át chủ bài

Sản phẩm chủ lực được công bố tại GTC là rack máy chủ Nvidia Groq 3 LPX — một hệ thống kết hợp 72 máy chủ thế hệ tiếp theo Vera Rubin với 256 chip mới gọi là LPU (Language Processing Unit). LPU được phát triển bởi Groq, một startup mà Nvidia đã thâu tóm đội ngũ lãnh đạo cấp cao thông qua thỏa thuận cấp phép công nghệ trị giá 20 tỷ USD hồi tháng 12 năm ngoái.

Về hiệu năng, Nvidia cho biết hệ thống mới có thể tạo ra 700 triệu token — đơn vị đo lường cơ bản trong tính toán AI — mỗi giây. Con số này gấp 350 lần so với thế hệ GPU Hopper trước đó của Nvidia. Đồng thời, dung lượng bộ nhớ băng thông cao của hệ thống mới cũng gấp 500 lần Hopper, trực tiếp giải quyết điểm nghẽn bộ nhớ vốn là hạn chế lớn của GPU truyền thống trong tác vụ inference.

"Làn sóng inference đã đến. Đây chính là bí quyết", Huang tuyên bố trong bài phát biểu.

Màn trình diễn của Nvidia hứa hẹn sẽ biến robot và AI vật lý thành một thị trường tiềm năng mới

Mục tiêu 1.000 tỷ USD và AI vật lý

Con số 1.000 tỷ USD doanh thu chip Blackwell và Rubin vào cuối 2027 là một nâng cấp đáng kể so với kỳ vọng trước đó của công ty — mức 500 tỷ USD vào cuối 2026. Đây là tín hiệu rõ ràng rằng Nvidia đang đặt cược rằng nhu cầu đầu tư hạ tầng AI toàn cầu vẫn còn rất xa điểm bão hòa.

Bên cạnh phần cứng, Nvidia cũng công bố hàng loạt mở rộng kinh doanh khác. Trong lĩnh vực xe tự hành, công ty bổ sung 4 đối tác mới cho hệ thống tính toán robotaxi của mình, gồm BYD, Geely Auto, Hyundai và Nissan. Đây là bước đi nhằm mở rộng sự hiện diện của Nvidia trong chuỗi giá trị ô tô tự hành toàn cầu.

Nvidia cũng thành lập một liên minh phần mềm gồm các công ty như Cursor, Mistral, Perplexity, Reflection và Thinking Machines, với mục tiêu đơn giản hóa việc phát triển các mô hình AI mã nguồn mở tiên tiến. Huang mô tả đây là đòn bẩy để chuyển đổi toàn bộ ngành phần mềm dịch vụ (SaaS) thành ngành AI tác nhân dịch vụ (AaaS).

Cùng lúc với bài phát biểu của Huang, Nscale - startup điện toán đám mây có trụ sở tại Anh, được Nvidia hậu thuẫn - công bố kế hoạch xây dựng cụm trung tâm dữ liệu công suất 1,35 gigawatt tại West Virginia, sử dụng các máy chủ Vera Rubin mới. Dự án này, có tên Monarch Compute Campus, được mô tả là một trong những cơ sở điện toán AI lớn nhất thế giới.

Không kém phần ấn tượng về mặt biểu tượng. Khi gần cuối buổi thuyết trình, một robot hình dạng người tuyết trong hoạt hình bước lên sân khấu - biểu trưng cho sự hợp tác giữa Nvidia, DeepMind và Disney. Con robot này hội thoại cùng Huang về bộ phận Omniverse của Nvidia — mảng phát triển sản phẩm AI vật lý cho robot.

Màn trình diễn dù ngắn ngủi cũng là một thông điệp đáng chú ý, rằng tham vọng của Nvidia đang vươn ra xa hơn nhiều so với những chiếc chip.

Vấn đề hiện nay không phải là liệu Nvidia có đang định hình tương lai của AI hay không, mà là liệu thị trường có thể hấp thụ được tốc độ đầu tư mà công ty này đang thúc đẩy hay không.