Việc phát triển mô hình AI chất lượng cao với chi phí thấp đòi hỏi sự sáng tạo và cả đầu tư lớn về tài chính, nhân lực, cho thấy tương lai của DeepSeek còn nhiều thách thức.
Trong một tuần đầy sôi động, công ty khởi nghiệp trí tuệ nhân tạo (AI) DeepSeek của Trung Quốc đã công bố hàng loạt thông tin kỹ thuật quan trọng, hé lộ chiến lược phát triển đối thủ cạnh tranh của ChatGPT. Điểm đáng chú ý là DeepSeek đã tối ưu hóa chi phí tính toán xuống mức chỉ bằng một phần nhỏ so với thông thường, đánh dấu một bước tiến quan trọng trong nỗ lực thúc đẩy sự phát triển AI toàn cầu theo hướng cởi mở hơn.
Sự tương phản với OpenAI
Theo truyền thông quốc tế đưa tin, trong những ngày qua, DeepSeek đã công bố 8 dự án nguồn mở trên nền tảng GitHub, cộng đồng phát triển phần mềm mã nguồn mở lớn nhất thế giới. Đây là lần đầu tiên công ty công khai chi tiết về cách khai thác tối đa hiệu suất phần cứng trong ba lĩnh vực quan trọng: tính toán, truyền thông và lưu trữ. Những yếu tố này đóng vai trò cốt lõi trong quá trình đào tạo và triển khai mô hình AI quy mô lớn.
DeepSeek khẳng định những tài liệu được chia sẻ không chỉ là nghiên cứu lý thuyết mà còn là các thành phần đã được thử nghiệm thực tế. Nhóm nghiên cứu của công ty cho biết họ muốn cung cấp cho cộng đồng AI một cách minh bạch nhất về những tiến bộ công nghệ mà họ đạt được.
Động thái này ngay lập tức nhận được sự hoan nghênh từ cộng đồng AI toàn cầu. Nhiều nhà phát triển đã ca ngợi DeepSeek vì tinh thần chia sẻ và sự cởi mở trong nghiên cứu. Đặc biệt, một số chuyên gia, bao gồm cả người sáng lập nền tảng phát triển AI Hyperbolic đã gọi DeepSeek là “OpenAI thực sự”, ám chỉ sự đối lập với OpenAI – công ty đã từ bỏ mô hình nguồn mở để tập trung vào chiến lược kinh doanh độc quyền.
OpenAI - công ty đứng sau ChatGPT, ban đầu khởi động với định hướng phát triển AI nguồn mở, nhưng sau đó đã dần chuyển sang mô hình nguồn đóng. Điều này đồng nghĩa với việc họ giữ kín các phương pháp đào tạo cũng như chi phí vận hành của hệ thống AI.
Nhà sáng lập kiêm CEO của OpenAI, Sam Altman, vào đầu tháng 2 đã thừa nhận rằng công ty của ông “đã đi sai hướng trong lịch sử” và cần tìm một chiến lược nguồn mở khác.
Mới đây, OpenAI có ra mắt GPT-4.5 - phiên bản mới nhất của dòng mô hình GPT-4 được giới thiệu gần hai năm trước. Theo OpenAI, đây là mô hình trò chuyện mạnh mẽ nhất mà họ từng phát triển. Tuy nhiên, mức giá sử dụng GPT-4.5 được xem là khá cao: 150 USD cho mỗi 1 triệu mã thông báo đầu ra. Trong khi đó, DeepSeek chỉ tính phí 0,55 USD cho cùng khối lượng dữ liệu trong khung giờ thấp điểm, tức là rẻ hơn khoảng 270 lần.
Sự khác biệt trong mô hình kinh doanh và chiến lược phát triển không chỉ phản ánh qua mức giá, mà còn qua hiệu quả thực tế của các mô hình AI. Một số nhóm nghiên cứu AI đã áp dụng kỹ thuật của DeepSeek và đạt được những cải tiến đáng kể. Cụ thể, nhóm vLLM – một dự án AI nguồn mở có nguồn gốc từ Đại học California, Berkeley báo cáo rằng họ đã tăng hiệu suất hệ thống lên đến 16% sau khi tích hợp một trong những phương pháp do DeepSeek công bố.
Bên cạnh đó, DeepSeek tiếp tục cải thiện tính cạnh tranh bằng cách giảm giá dịch vụ API truy cập mô hình AI tới 75%. Động thái này diễn ra sau hơn hai tuần công ty phải tạm dừng dịch vụ do nhu cầu sử dụng tăng đột biến, khiến hệ thống gặp quá tải.
Thách thức và cạnh tranh trong thị trường
Dù đạt được những thành tựu đáng kể, DeepSeek vẫn đang phải đối mặt với sự cạnh tranh khốc liệt từ nhiều đối thủ AI toàn cầu, đặc biệt là các công ty có sự hậu thuẫn mạnh về tài chính và công nghệ.
Một số công ty có thể kể đến như: Anthropic do Amazon hậu thuẫn, vừa ra mắt Claude 3.7 Sonnet vào ngày 25/2, một mô hình AI có khả năng suy luận mạnh mẽ hơn và hiệu suất vượt trội trong toán học và lập trình. Đây là một bước tiến lớn của Anthropic nhằm cạnh tranh với GPT-4.5 và các mô hình AI khác.
Tiếp đó là Tencent Holdings, tập đoàn công nghệ hàng đầu Trung Quốc cũng không đứng ngoài cuộc chơi khi ra mắt Turbo S vào ngày 27/2. Turbo S được thiết kế để tối ưu tốc độ phản hồi và dự kiến sẽ có hiệu suất nhanh hơn cả R1 của DeepSeek và GPT-4.5 của OpenAI.
Ngoài những ông lớn kể trên, thị trường AI còn ghi nhận sự tham gia ngày càng đông đảo của các công ty khởi nghiệp, các phòng nghiên cứu độc lập và cả những tập đoàn công nghệ truyền thống như Google và Meta, tất cả đều đang nỗ lực phát triển các mô hình AI thế hệ mới.
Sự kiện DeepSeek công khai thông tin kỹ thuật về mô hình AI không chỉ là một động thái mang tính chiến lược mà còn là dấu hiệu cho thấy cuộc đua AI đang có xu hướng mở rộng theo hướng phi tập trung hơn. Trong bối cảnh OpenAI và một số công ty lớn khác ngày càng kiểm soát chặt chẽ công nghệ của họ, DeepSeek dường như đang đặt cược vào một tương lai mà AI sẽ phát triển theo mô hình hợp tác toàn cầu.
Một trong những lợi thế lớn nhất của DeepSeek chính là khả năng tối ưu chi phí và hiệu suất phần cứng. Công ty này đã tìm ra những cách tối ưu hóa quá trình tính toán, truyền thông và lưu trữ để giảm đáng kể chi phí đào tạo mô hình. Điều này có thể tạo ra một làn sóng đổi mới trong ngành AI, đặc biệt là đối với các công ty khởi nghiệp và nhóm nghiên cứu không có nguồn lực tài chính dồi dào như các tập đoàn lớn.
Mặc dù vậy, tương lai của DeepSeek vẫn còn nhiều thách thức. Việc phát triển mô hình AI chất lượng cao với chi phí thấp không chỉ đòi hỏi sự sáng tạo mà còn cần sự đầu tư lớn về tài chính và nhân lực. Bên cạnh đó, việc duy trì cam kết nguồn mở trong dài hạn có thể gặp nhiều trở ngại, đặc biệt khi công ty cần huy động vốn để mở rộng hoạt động.
DeepSeek đang nổi lên như một đối thủ đáng gờm trong lĩnh vực AI, không chỉ nhờ vào công nghệ tiên tiến mà còn nhờ vào chiến lược nguồn mở đầy táo bạo. Việc công ty này công khai thông tin về phương pháp tối ưu hóa và cung cấp các công cụ AI với giá thành thấp đang tạo ra sự khác biệt lớn trên thị trường.
Trong bối cảnh cuộc đua AI đang ngày càng nóng lên, DeepSeek có thể là một trong những nhân tố quan trọng định hình tương lai của AI toàn cầu. Tuy nhiên, liệu họ có thể duy trì chiến lược này và đối đầu với những gã khổng lồ như OpenAI, Anthropic hay Tencent hay không, vẫn là câu hỏi mở cần thời gian trả lời.