Các "ông lớn" AI hướng tới phần mềm nhỏ, tiết kiệm chi phí

TRƯỜNG ĐẶNG 09/07/2024 03:00

Các gã khổng lồ công nghệ đang làm đủ mọi cách để thu gọn phần mềm AI nhằm làm cho nó nhỏ hơn, rẻ hơn, nhanh hơn và chuyên dụng hơn.

Các công ty hàng đầu về AI đang tìm kiếm các phần mềm tiết kiệm hơn

Các công ty hàng đầu về AI đang tìm kiếm các phần mềm tiết kiệm hơn.

Vốn lớn cho các sản phẩm nhỏ hơn

Cuộc cạnh tranh AI đang nhắm tới sự phát triển quy mô lớn: các mô hình khổng lồ được đào tạo trên hàng tỷ dữ liệu, hay cố gắng bắt chước trí thông minh ở cấp độ con người.

>>Cách huy động nhân tài bán dẫn của một "ông lớn" Mỹ

Nhưng trên mặt trận công nghệ, các gã khổng lồ công nghệ và các công ty khởi nghiệp đang làm đủ mọi cách để thu gọn phần mềm AI nhằm làm cho nó nhỏ hơn, rẻ hơn, nhanh hơn và chuyên dụng hơn.

Loại phần mềm AI này—được gọi là mô hình ngôn ngữ vừa hoặc nhỏ—được đào tạo trên ít dữ liệu hơn và thường được thiết kế cho các nhiệm vụ cụ thể.

Các mô hình lớn nhất, như OpenAI GPT-4, tiêu tốn hơn 100 triệu USD để phát triển và sử dụng hơn một nghìn tỷ thông số, thước đo kích thước của chúng.

Các mô hình nhỏ hơn thường được đào tạo trên các tập dữ liệu hẹp hơn—chẳng hạn như chỉ về các vấn đề pháp lý—và có thể tốn ít hơn 10 triệu USD để đào tạo, sử dụng ít hơn 10 tỷ tham số. Các mô hình nhỏ hơn cũng sử dụng ít sức mạnh tính toán hơn và do đó chi phí thấp hơn để đáp ứng từng truy vấn.

Microsoft đã phát triển dòng mô hình nhỏ có tên Phi, mà Giám đốc điều hành Satya Nadella cho biết có kích thước bằng 1/100 mô hình miễn phí ChatGPT và thực hiện nhiều tác vụ tương đối tốt.

Yusuf Mehdi, Giám đốc thương mại của Microsoft cho biết: “Tôi nghĩ chúng ta ngày càng tin rằng đây sẽ là một thế giới của những mô hình khác nhau.

Microsoft là một trong những công ty công nghệ lớn đầu tiên đặt cược hàng tỷ USD vào AI và công ty nhanh chóng nhận ra rằng việc vận hành nó đang trở nên đắt đỏ hơn so với dự đoán ban đầu của công ty.

Công ty gần đây cũng đã ra mắt máy tính xách tay AI sử dụng hàng chục mô hình AI để tìm kiếm và tạo hình ảnh. Các mô hình này yêu cầu rất ít dữ liệu để có thể chạy trên một thiết bị và không yêu cầu quyền truy cập vào các siêu máy tính dựa trên đám mây khổng lồ như ChatGPT .

Google—cũng như các công ty khởi nghiệp về AI Mistral, Anthropic và Cohere—cũng đã phát hành các mẫu nhỏ hơn trong năm nay. Apple đã công bố lộ trình AI của riêng mình vào tháng 6 với kế hoạch sử dụng các mô hình nhỏ để có thể chạy phần mềm hoàn toàn trên điện thoại nhằm giúp phần mềm nhanh hơn và an toàn hơn.

>>Hé lộ mức lương "béo bở" ngành AI

Ngay cả OpenAI, công ty đi đầu trong phong trào mô hình lớn, gần đây đã phát hành một phiên bản của mô hình hàng đầu mà họ cho là vận hành rẻ hơn. Một phát ngôn viên cho biết công ty sẵn sàng tung ra các mẫu máy nhỏ hơn trong tương lai.

Các mô hình tiết kiệm hơn là xu hướng nhằm tối ưu chi phí đang ngày càng đắt đỏ của lĩnh vực trí tuệ nhân tạo

Các mô hình tiết kiệm hơn là xu hướng nhằm tối ưu chi phí đang ngày càng đắt đỏ của lĩnh vực trí tuệ nhân tạo

Xu hướng hợp thời

Đối với nhiều nhiệm vụ, như tóm tắt tài liệu hoặc tạo hình ảnh, các mô hình lớn được cho là quá mức cần thiết. Do đó, xu hướng mới là tìm ra cách sử dụng AI tạo sinh với chi phí rẻ hơn trong bối cảnh lợi nhuận của nó vẫn chưa rõ ràng.

Yoav Shoham, đồng sáng lập của AI21 Labs, một công ty AI có trụ sở tại Israel, cho biết vì sử dụng ít sức mạnh tính toán hơn nên các mô hình nhỏ có thể trả lời các câu hỏi với chi phí chỉ bằng 1/6 so với các mô hình ngôn ngữ lớn trong nhiều trường hợp.

Điều quan trọng là tập trung các mô hình nhỏ hơn này vào một tập hợp dữ liệu như thông tin liên lạc nội bộ, tài liệu pháp lý hoặc số liệu bán hàng để thực hiện các tác vụ cụ thể như viết email—một quá trình được gọi là tinh chỉnh. Quá trình đó cho phép các mô hình nhỏ thực hiện hiệu quả như mô hình lớn trong các nhiệm vụ đó với chi phí thấp hơn.

Alex Ratner, đồng sáng lập của Snorkel AI, một công ty khởi nghiệp giúp các công ty tùy chỉnh các mô hình AI, cho biết: “Bắt những mô hình chuyên biệt, nhỏ hơn này hoạt động trong những lĩnh vực nhàm chán nhưng quan trọng hơn này”.

Công ty xếp hạng tín nhiệm Experian đã chuyển từ mô hình lớn sang mô hình nhỏ cho các chatbot AI mà nó sử dụng để tư vấn tài chính và dịch vụ khách hàng.

Ali Khan, Giám đốc dữ liệu của Experian cho biết, sau khi được đào tạo về dữ liệu nội bộ của công ty, các mô hình nhỏ hơn sẽ hoạt động tốt như các mô hình lớn với chi phí thấp hơn.

Các mô hình nhỏ hơn cũng sẽ nhanh hơn. Clara Shih, người đứng đầu Salesforce cho biết: “Cuối cùng, bạn phải trả quá nhiều tiền và gặp vấn đề về độ trễ với các mô hình lớn. Nó quá mức cần thiết.”

Có thể bạn quan tâm

  • EU vấp nhiều rào cản để kiềm chế năng lực công nghệ Trung Quốc

    EU vấp nhiều rào cản để kiềm chế năng lực công nghệ Trung Quốc

    03:00, 23/06/2024

  • Trung Quốc âm thầm chiếm lĩnh chuỗi cung ứng công nghệ Đông Nam Á

    Trung Quốc âm thầm chiếm lĩnh chuỗi cung ứng công nghệ Đông Nam Á

    03:00, 02/06/2024

  • Lộ diện

    Lộ diện "chiến trường" mới của chuỗi cung ứng công nghệ toàn cầu

    03:00, 01/06/2024

  • Không phải công nghệ, một ngành khác ở Indonesia hút mạnh vốn đầu tư

    Không phải công nghệ, một ngành khác ở Indonesia hút mạnh vốn đầu tư

    03:00, 30/05/2024

  • Công nghệ sạc pin xe điện lại có đột phá mới

    Công nghệ sạc pin xe điện lại có đột phá mới

    04:00, 26/05/2024

TRƯỜNG ĐẶNG