Siêu máy tính của Nvidia: kỷ nguyên mới cho ChatGPT?
Nvidia vừa giới thiệu siêu máy tính DGX GH200, trang bị bộ nhớ gấp 500 lần máy tính bình thường, được thiết kế chuyên xử lý các thuật toán trí tuệ nhân tạo mạnh chưa từng có trước đây.
>>Cú bứt tốc ngoạn mục của Nvidia
Cấu hình như thế nào?
Để mô tả DGX GH200, cần phải đề cập đến một số thuật ngữ mà người dùng thông thường ít khi nào nghe thấy. Chẳng hạn thuật ngữ ‘exaflop” trong câu “DGX GH200 có hiệu suất 1 exaflop và có bộ nhớ chung 144 terabytes”.
Con số 144 terabytes bộ nhớ chung nghĩa là siêu máy tính này có bộ nhớ gấp gần 500 lần so với hệ thống DGX A100 đơn lẻ. Vậy còn “exaflop” là gì?
Nói một cách đơn giản, 1 exaflop tương đương với tỷ tỷ (1018) FLOP (floating-point operations per second) - một thước đo hiệu suất máy tính. Để so sánh, thì RTX 4090 của Nvidia có thể đạt đến 100 teraflops (TFLOP) khi được ép xung. Và 1 TFLOP chỉ tương đương với 1 nghìn tỷ (1012) FLOP.
Sự khác biệt quả thực đáng kinh ngạc. Tuy nhiên cần nhớ RTX 4090 không phải là một GPU (Graphics Processing Unit- bộ xử lý đồ họa) trung tâm dữ liệu. Trong khi đó DGX GH200 tích hợp số lượng đáng kể các GPU hiệu suất cao, thứ không thể tìm thấy trong bất kỳ máy tính phổ thông nào.
Siêu máy tính này sử dụng đến 256 siêu chip GH200 Grace Hopper của Nvidia. Nhờ vào công nghệ kết nối NVLink của Nvidia, các con chip có thể hoạt động cùng nhau trong một hệ thống thống nhất, tạo nên một GPU cực khủng.
Trong siêu máy tính, siêu chip GH200 không cần kết nối PCIe truyền thống giữa CPU (Central Processing Unit - bộ xử lý trung tâm) và GPU. Thay vào đó, Nvidia trang bị sẵn CPU Nvidia Grace dựa trên ARM và GPU H100 Tensor Core. Đồng thời họ còn sử dụng NVLink-C2C để kết nối một số chip.
Với cấu hình này, băng thông giữa bộ xử lý và card đồ họa được cải thiện đáng kể, lên đến 7 lần, cũng như tiết kiệm điện năng lên đến 5 lần.
Việc “ép” hơn 200 con chip vào một cỗ máy duy nhất đã đủ làm người ta kinh ngạc rồi. Tuy nhiên siêu máy tính lần này còn cho thấy một sự tiến bộ khác của Nvidia. Đó là trước đây, NVLink chỉ có thể kết nối cùng lúc với chỉ 8 GPU. Từ 8 nhảy lên 256 quả thực là một bước tiến lớn.
DGX GH200 sẽ làm được những gì?
Khi xây dựng siêu máy tính, mục đích của Nvidia là phục vụ các chương trình nghiên cứu và phát triển AI của mình. Trước mắt, họ sẽ kết nối 4 hệ thống DGX GH200 bằng Quantum-2 InfiniBand. Nvidia kỳ vọng dự án này có thể xuất hiện trực tuyến vào cuối năm nay.
Đồng thời Nvidia cũng chia sẻ sản phẩm của mình với thế giới, bắt đầu bằng ba ông lớn Google Cloud, Meta và Microsoft. Mục đích cũng tương tự, phát triển khả năng của AI tạo sinh. Một khi đã đến tay Google và Microsoft, thì gần như chắc chắn hai công ty này sẽ dùng DGX GH200 để cải thiện sức mạnh của các công cụ như Bard, ChatGPT và Bing Chat.
Khả năng tính toán đáng kể khiến siêu máy tính DGX GH200 rất thích hợp trong việc cải thiện quá trình đào tạo các mô hình ngôn ngữ phức tạp. Dĩ nhiên vẫn chưa có hướng đi cụ thể từ các bên liên quan, nhưng có thể suy luận theo hướng này: hiệu suất cao hơn, tức là mô hình sẽ lớn hơn, phạm vi dữ liệu được đào tạo lớn hơn, đồng thời độ chính xác và sắc thái của văn bản cũng tốt hơn. Kết quả là những sản phẩm nội dung do AI tạo sinh phát triển sẽ thể hiện được chiều sâu về văn hóa, kiến thức về ngữ cảnh, có tính kết nối tốt. Đồng thời các chatbot AI chuyên dụng cũng có thể bắt đầu xuất hiện, thay thế con người trong một số lĩnh vực như công nghệ.
Câu hỏi được đặt ra ở đây là: Con người nên lo sợ nguy cơ mất việc làm, hay nên hào hứng với các cải tiến mà siêu máy mang lại? Câu trả lời không hề đơn giản. Nhưng có một điều chắc chắn. Đó là DGX GH200 của Nvidia có thể làm rung chuyển mọi thứ trong thế giới AI, và Nvidia tiếp tục vị thế dẫn đầu về AI so với đối thủ AMD.
Có thể bạn quan tâm