Phân tích - Bình luận

“World model” – bước nhảy vọt tiếp theo của AI

Nam Trần 30/09/2025 04:06

World Model đang dần trở thành hiện thực, mở ra bước nhảy mới giúp AI không chỉ xử lý dữ liệu mà còn học hỏi, dự đoán và hành động trong môi trường thực.

Trong hơn một thập kỷ qua, trí tuệ nhân tạo (AI) đã thay đổi cuộc sống của con người thông qua những mô hình ngôn ngữ lớn (LLM) như ChatGPT, Gemini hay Claude. Chúng học hỏi từ hàng tỷ văn bản, hình ảnh, video và trở thành công cụ đắc lực trong nhiều lĩnh vực.

unnamed.png
AI có thể "trưởng thành" hơn nhờ học hỏi từ các thế giới mô phỏng giúp nó trở nên thông minh hơn và thật hơn so với các mô hình ngôn ngữ lớn hiện tại (Ảnh: Google Deepmind)

Nhưng các chuyên gia ngày càng nhận thấy một giới hạn: AI hiện tại chỉ “thông minh sách vở” chứ chưa đủ “từng trải”. Để thực sự tiến hóa, AI cần có khả năng mô phỏng, thử nghiệm và rút kinh nghiệm từ môi trường, tương tự như cách con người học hỏi ngoài đời.

Đó chính là nơi khái niệm “mô hình thế giới” (world models) xuất hiện. Các mô hình này giúp AI không chỉ xử lý dữ liệu có sẵn, mà còn tự hình thành một phiên bản trừu tượng của thế giới trong “bộ não” ảo của mình. Chúng cho phép AI lên kế hoạch, đưa ra quyết định và dự đoán tương lai dựa trên những quy luật như vật lý, thời gian hay hành vi xã hội.

Thay vì chỉ dự đoán từ ngữ tiếp theo trong một câu, AI với mô hình thế giới có thể hình dung một chiếc xe sẽ di chuyển ra sao khi gặp chướng ngại vật, hay cách một cánh tay robot cần phối hợp để nhặt đồ mà không làm rơi.

Khi AI “chơi đùa” để trưởng thành

Điểm then chốt của mô hình thế giới là huấn luyện AI trong các không gian mô phỏng cực kỳ chân thực. Hãy hình dung một em bé học đi, học nói, học chơi qua va vấp hàng ngày. AI cũng vậy, để “khôn lớn”, chúng cần những sân chơi ảo, nơi có thể phạm sai lầm mà không gây hậu quả ngoài đời thực.

Một ví dụ nổi bật là Genie 3 – hệ thống mới của Google DeepMind. Chỉ từ một gợi ý bằng văn bản, Genie 3 có thể tạo ra cảnh quan ảo thế giới mở, ảnh thực đến mức giống như trò chơi điện tử khổng lồ.

Trong không gian này, các AI non trẻ có thể tự do thử nghiệm, từ học cách di chuyển trong điều kiện bão lũ cho tới quan sát cách con người tương tác. Thông qua quá trình học tăng cường, chúng dần hiểu cách đạt mục tiêu, giống như động vật và con người ngoài đời.

Điều này có ý nghĩa đặc biệt trong bối cảnh AI hiện tại vẫn gặp khó khăn với những bài toán không gian. Dù được “ăn” hàng tỷ dữ liệu, các chatbot đôi khi vẫn không biết giữ vị trí quân cờ khi chơi cờ vua, hay thực hiện nước đi sai luật.

Ngược lại, một chiếc máy Atari từ năm 1979 lại thắng nhờ có cơ chế lưu trữ vị trí quân cờ – tức một dạng mô hình thế giới sơ khai. Sự khác biệt cho thấy không phải dữ liệu khổng lồ, mà chính mô hình hóa môi trường mới quyết định khả năng tư duy của AI.

Từ phòng thí nghiệm đến đường phố

Không chỉ dừng ở nghiên cứu, mô hình thế giới đang tạo ra tác động thực tế.

Waabi, một công ty khởi nghiệp tại Toronto, đã xây dựng cả một vũ trụ ảo có tên Waabi World chỉ để huấn luyện xe tải tự lái. Trong môi trường này, AI có thể lái hàng triệu km ảo, va chạm, học cách xử lý tình huống mà không gây thiệt hại ngoài đời. CEO Raquel Urtasun cho biết phần mềm của Waabi có thể điều khiển xe tải thật trên đường trước cuối năm nay.

waabi.png
Các công ty như Waabi (Canada) xây dựng các thế giới ảo để huấn luyện cho xe tải tự lái (Ảnh: Waabi.ai)

Nvidia – tập đoàn chip AI hàng đầu – cũng coi mô hình thế giới là chìa khóa để mở ra “AI vật lý”, nơi robot, xe tự lái và thiết bị thông minh có thể hoạt động an toàn trong thế giới thực.

Fei-Fei Li, Giáo sư Đại học Stanford được mệnh danh “mẹ đỡ đầu AI”, thậm chí đã huy động 230 triệu USD để lập công ty World Labs, tập trung phát triển mô hình thế giới.

Các ứng dụng tiềm năng trải rộng: từ drone quân sự có thể tính toán địa hình và gió, tới robot chăm sóc người già hiểu được hành vi con người. Nếu LLM đang dần thay thế công việc văn phòng, thì AI sở hữu mô hình thế giới có thể tiến sang cả lĩnh vực lao động chân tay – lái xe tải, sửa chữa, thậm chí chăm sóc y tế.

Cạnh tranh hướng tới AGI

Điểm hấp dẫn nhất của mô hình thế giới là lời hứa hẹn về AGI – trí tuệ nhân tạo tổng quát, tức AI thông minh ngang hoặc vượt con người.

Các nhà đầu tư mạo hiểm, các phòng thí nghiệm lớn từ Google, Nvidia đến các startup đều tin rằng đây là con đường ngắn nhất để tiến tới mục tiêu đó.

Chuyên gia Moritz Baier-Lentz của Lightspeed nhận định, drone chiến đấu an toàn hơn, xe tự lái ổn định hơn hay robot mới linh hoạt hơn đều đang hưởng lợi trực tiếp từ công nghệ này.

Tuy vậy, vẫn còn nhiều câu hỏi chưa lời giải. Gary Marcus, cựu lãnh đạo AI của Uber, cảnh báo rằng các mô hình hiện tại vẫn chỉ dừng ở xác suất – tức đoán “có khả năng nhất” – chứ chưa thật sự hiểu thế giới. Để đạt AGI, AI phải thoát khỏi vòng lặp dự đoán để tiến tới suy luận logic, điều mà con người và động vật làm hàng ngày.

Dù còn tranh cãi, một điều rõ ràng: “mô hình thế giới” đang định hình tương lai AI. Chúng mở ra viễn cảnh robot có thể tự định hướng trong nhà máy, xe tải tự lái băng qua hàng nghìn km đường cao tốc, hay hệ thống y tế ảo giúp bác sĩ dự đoán chính xác hơn.

Nếu LLM là bước đầu của “kỷ nguyên ngôn ngữ”, thì mô hình thế giới có thể là bước nhảy vọt, đưa AI từ màn hình máy tính ra thế giới thực, trở thành bạn đồng hành trong đời sống hàng ngày.

(0) Bình luận
Nổi bật
Mới nhất
“World model” – bước nhảy vọt tiếp theo của AI
POWERED BY ONECMS - A PRODUCT OF NEKO