Mô hình mới nhất V4 của startup Trung Quốc gây ấn tượng về giá và kiến trúc, song bị đánh giá vẫn tụt hậu 3–6 tháng so với các hệ thống tiên tiến nhất của OpenAI và Google.
Hơn một năm sau khi làm chao đảo Thung lũng Silicon, DeepSeek đã trình làng phiên bản tiếp theo của mình. Và lần này, thị trường có lẽ đã bớt dậy sóng.

Ngày 24/4, startup đến từ Hàng Châu công bố các phiên bản preview của dòng mô hình mới nhất mang tên V4 — bao gồm V4 Flash và V4 Pro — với tuyên bố đạt hiệu năng hàng đầu trong các bài kiểm tra lập trình và đưa ra những bước tiến lớn trong khả năng lý luận và xử lý tác vụ tự động. Tuy nhiên, mô hình mới, dù có giá sử dụng thấp hơn nhiều so với các đối thủ, vẫn không thu hẹp đáng kể khoảng cách về năng lực AI so với Mỹ.
"Mô hình này không đủ khả năng cạnh tranh với các hệ thống tiên tiến nhất của Mỹ, và không có dấu hiệu thu hẹp khoảng cách," theo Chris McGuire, thành viên cấp cao về Trung Quốc và công nghệ mới nổi tại Council on Foreign Relations.
DeepSeek V4 Pro là mô hình mixture-of-experts với tổng cộng 1,6 nghìn tỷ tham số, trong đó chỉ 49 tỷ tham số được kích hoạt mỗi lượt xử lý — giúp giảm chi phí vận hành đáng kể. Đây là mô hình open-weight lớn nhất hiện có, vượt qua Kimi K 2.6 của Moonshot AI (1,1 nghìn tỷ) và M1 của MiniMax (456 tỷ).
Startup này đặc biệt nhấn mạnh kỹ thuật gọi là kiến trúc chú ý kết hợp (Hybrid Attention Architecture), cho phép mô hình lưu giữ ngữ cảnh tốt hơn trong các cuộc hội thoại dài. Cửa sổ ngữ cảnh 1 triệu token — đủ để xử lý toàn bộ một cơ sở mã (codebase) lớn hoặc một tài liệu dài trong một lần prompt — cũng được coi là một bước nhảy vọt về kỹ thuật.
Theo DeepSeek, V4-Pro vượt trội toàn bộ các mô hình mã nguồn mở trong các bài kiểm tra toán học và lập trình, chỉ thua Google Gemini 3.1 Pro — một mô hình mã nguồn đóng — về tri thức tổng quát. Tuy nhiên, startup tự thừa nhận V4 vẫn đang ở sau các mô hình dẫn đầu khoảng ba đến sáu tháng.
Nếu có một điểm mà DeepSeek thực sự tạo ra sức ép, đó là mức giá. V4 Pro được định giá 3,48 USD cho mỗi triệu token đầu ra, trong khi OpenAI và Anthropic lần lượt thu 25 và 30 USD cho cùng khối lượng công việc. V4 Flash thậm chí còn rẻ hơn, ở mức 0,28 USD.
Một nhà phân tích nhận định mức giá này là "trần giá, được đặt một cách chủ ý thấp hơn mức OpenAI và Anthropic cần để bù chi phí. "Ý đồ chiến lược là khiến các đối thủ Mỹ không thể tăng giá mà không bị coi là tham lam", vị chuyên gia này nhấn mạnh.
Điểm đáng chú ý không kém: để phát triển V4, DeepSeek hợp tác với Huawei, sử dụng công nghệ siêu nút (supernode) kết hợp các cụm chip Ascend 950 — đồng nghĩa với việc mô hình mới này được đào tạo hoàn toàn trên phần cứng Trung Quốc, không phụ thuộc vào Nvidia như các phiên bản trước.
"Giả định cũ rằng bạn không thể đào tạo một mô hình tiên tiến mà không có phần cứng Nvidia, giờ đây đã được chứng minh là sai về mặt thực nghiệm," theo Rishav Ganguli, nhà sáng lập New Dawn AI.
Tác động thị trường lần này được cho là không mạnh như cú sốc R1 hồi đầu năm ngoái. Cổ phiếu SMIC, nhà sản xuất chip Trung Quốc chế tạo chip Ascend cho Huawei, tăng 10% tại Hong Kong. Ngược lại, cổ phiếu của MiniMax và Knowledge Atlas — hai đối thủ nội địa của DeepSeek — giảm hơn 9%.

Dữ liệu từ Chỉ số AI Stanford 2026 vẽ nên bức tranh rõ hơn về trạng thái cuộc đua. Khoảng cách hiệu năng giữa mô hình AI tốt nhất của Mỹ và Trung Quốc đã thu hẹp xuống còn 2,7%. Năm 2023, khoảng cách này dao động từ 17,5 đến 31,6 điểm phần trăm. Mỹ đầu tư 285,9 tỷ USD vào AI tư nhân trong năm 2025, cao gấp 23 lần Trung Quốc, song dẫn đầu về hiệu năng mô hình chỉ chưa đầy ba điểm phần trăm.
Song bức tranh không đồng đều. Trong khi Silicon Valley vẫn giữ lợi thế nhỏ ở các mô hình tiên tiến nhất, các công ty Trung Quốc được đánh giá là đã "thực sự thu hẹp" khoảng cách về hiệu năng AI so với các đối thủ Mỹ. Tuy nhiên, V4 vẫn thiếu các tính năng đa phương thức, như xử lý âm thanh, video hay hình ảnh, trong khi nhiều mô hình mã nguồn đóng của Mỹ đã tích hợp đầy đủ các năng lực này.
Sự ra đời của V4 không tránh khỏi bối cảnh địa chính trị căng thẳng. Chỉ một ngày trước khi DeepSeek công bố V4, Nhà Trắng cáo buộc các thực thể nước ngoài tiến hành các chiến dịch quy mô công nghiệp nhằm "chắt lọc" các mô hình AI tiên tiến từ các công ty Mỹ.
Cuộc cạnh tranh AI Mỹ–Trung vẫn tiếp tục, song với cấu trúc đã thay đổi. Mỹ còn giữ được ngôi vị dẫn đầu về năng lực tuyệt đối, nhưng khoảng cách đang thu hẹp nhanh hơn dự đoán của nhiều người. Và DeepSeek, dù V4 chưa tạo ra làn sóng như R1, vẫn đang chứng minh rằng vòng bảo hộ chip của Washington không phải là bức tường không thể vượt qua.