Kinh tế thế giới

Tiết kiệm điện, Nvidia tính "nhúng nước" hệ thống máy chủ

Trường Đặng 14/08/2024 03:30

Nvidia đang thử nghiệm phương pháp mới để kiểm soát nhiệt độ máy chủ nhằm hạn chế việc sử dụng điều hòa không khí.

gb200.jpg
Dàn máy chủ HB200 tối tân nhất của Nvidia đòi hỏi một giải pháp tản nhiệt mới để phù hợp với xu thế bền vững của thế giới

Làm mát chất lỏng - giải pháp cũ mà mới

Các giá máy chủ GB200 sắp tới của Nvidia sẽ chứa các chip Blackwell thế hệ tiếp theo. Mức độ tiêu thụ điện năng của nó cũng tương ứng với hiệu suất mà nó đạt được. Vậy nên, để giảm bớt nhiệt độ và tiết kiệm điện năng, hệ thống làm mát bằng chất lỏng lưu thông trong các ống chạy qua phần cứng thay vì bằng không khí đang được công ty nghiên cứu áp dụng.

Làm mát bằng chất lỏng đã quá phổ biến với thị trường máy tính chơi game cao cấp hàng thập kỷ qua. Nhưng trên quy mô lớn hơn như máy chủ của trung tâm dữ liệu, nó đối mặt những thách thức lớn. Chưa kể, chi phí ban đầu của việc lưu thông chất lỏng qua các thiết bị điện tử phức tạp có thể cao hơn nhiều lần so với việc lắp đặt điều hòa không khí và quạt.

Một phát ngôn viên của Nvidia cho biết công ty cũng đang làm việc với các nhà cung cấp về các công nghệ làm mát bổ sung, bao gồm tính tới việc ngâm toàn bộ máy tính có kích thước bằng ngăn kéo vào một loại chất lỏng không dẫn điện có khả năng hấp thụ và tiêu tán nhiệt.

Làm mát đột nhiên trở thành một lĩnh vực kinh doanh sôi động khi các kỹ sư cố gắng “thuần hóa” một trong những kẻ tiêu thụ điện năng lớn nhất thế giới.

Theo nghiên cứu của Goldman Sachs, các trung tâm dữ liệu toàn cầu—các trang trại máy tính lớn xử lý các phép tính AI—dự kiến sẽ chiếm 8% tổng nhu cầu điện của Hoa Kỳ vào năm 2030, so với khoảng 3% hiện nay.

Các trung tâm dữ liệu, nơi chứa tới hàng chục nghìn máy chủ, thường sử dụng quạt và điều hòa không khí khiến việc làm mát chiếm tới 40% mức tiêu thụ điện năng. Tỷ lệ này có thể giảm xuống còn 10% hoặc ít hơn với công nghệ tiên tiến hơn, theo Shaolei Ren, Phó giáo sư kỹ thuật điện và máy tính tại Đại học California, Riverside.

Dù vậy, rò rỉ chất lỏng rõ ràng là rủi ro lớn nhất của hệ thống làm mát loại này. “Nếu chỉ một giọt nước duy nhất rơi vào máy chủ, chẳng hạn như GB200 trị giá hàng triệu USD, nó có thể gây ra thiệt hại nghiêm trọng,” Oliver Lien, Tổng giám đốc của Forcecon Technology, công ty hợp tác với các nhà sản xuất bán dẫn về làm mát, cho biết.

Điều đó vẫn không ngăn cản được các công ty áp dụng đột phá mới. “Làm mát bằng chất lỏng chắc chắn là điều không thể tránh khỏi đối với các ứng dụng AI cao cấp từ các công ty như Nvidia, AMD hoặc Google,” Lien nói.

Super Micro Computer, thường được gọi là Supermicro, sẽ sử dụng hệ thống làm mát bằng chất lỏng trong khoảng 30% số giá máy mà hãng giao hàng vào năm tới. 2 tháng vừa qua, công ty đã giao hơn 1.000 giá máy AI làm mát bằng chất lỏng, chiếm hơn 15% số trung tâm dữ liệu mới triển khai toàn cầu.

Supermicro cho biết hệ thống làm mát bằng chất lỏng của họ cho phép các trung tâm dữ liệu giảm mức tiêu thụ điện năng từ 30% đến 40%.

Nvidia đã nói rằng các trung tâm dữ liệu làm mát bằng chất lỏng có thể tối ưu công suất tính toán hơn trong cùng một không gian vì các chip làm mát bằng không khí cần nhiều không gian hơn trong máy chủ.

Nếu chỉ sử dụng làm mát bằng không khí, máy tính hiệu suất cao cần nhiệt độ phòng máy chủ dưới 10 độ C, lãnh đạo Forcecon Technology cho biết. Ngoài việc sử dụng nhiều điện năng, quạt tạo ra bụi có thể cản trở hiệu suất và tiếng ồn.

Đổi lại các tiện ích đó là một mức giá không hề dễ chịu. Các hệ thống làm mát bằng chất lỏng cho giá máy cao cấp GB200 của Nvidia có giá hơn 80.000 USD, gấp khoảng 15 đến 20 lần so với hệ thống làm mát bằng không khí cho một giá máy hiện tại với các chip H100 của Nvidia, theo ước tính của Morgan Stanley. Họ dự đoán thị trường cho các hệ thống đó sẽ tăng hơn gấp đôi lên 4,8 tỷ USD vào năm 2027.

supermicro-4u-universal-gpu-system-for-liquid-cooled-nvidia-hgx-h100-and-hgx-200-at-sc23-1.jpg
Các công ty Đài Loan đang đi đầu trong ngành làm mát chất lỏng cho máy chủ bằng những sáng kiến mới.

Nhiều thách thức, nhưng cũng đầy triển vọng

Trong các hệ thống này, máy bơm sẽ lưu thông chất làm mát tới các kênh vi mô bên trong các tấm lạnh trên các chip và rút chất lỏng khi nó nóng lên.

Một trong những khó khăn trong quá trình phát triển của hệ thống kiểu này, ngoài vấn đề an toàn còn là sự thiếu hụt các bộ phận chuyên dụng.

Supermicro cho biết họ đã phải trì hoãn các lô hàng trị giá khoảng 800 triệu USD vì thiếu hụt linh kiện chủ yếu liên quan đến làm mát bằng chất lỏng.

Các giám đốc điều hành cho biết một bộ phận có nguồn cung hạn chế được gọi là bộ ngắt kết nối nhanh phổ thông, một vật dụng giúp ngăn ngừa rò rỉ khi các bộ phận của hệ thống ống dẫn được ngắt kết nối.

Bộ phận này chủ yếu được sản xuất bởi các công ty Mỹ và châu Âu, nhưng hơn một nửa hoạt động kinh doanh hệ thống làm mát toàn cầu được tập trung ở các công ty Đài Loan, theo Edward Kung, người đứng đầu các dự án làm mát bằng chất lỏng của Intel và là Chủ tịch Hiệp hội Quản lý Nhiệt Đài Loan.

Các công ty Đài Loan đang hưởng lợi từ kinh nghiệm làm mát máy tính chơi game của họ, giống như cách Nvidia bắt đầu là nhà sản xuất chip cho các trò chơi và chuyển sang AI.

Nhiều người trong ngành nghĩ rằng bước tiếp theo có thể là ngâm toàn bộ trong chất lỏng hấp thụ nhiệt. Cooler Master, một đối tác lâu năm của Nvidia, được cho cũng đang nghiên cứu công nghệ ngâm cho các sản phẩm Nvidia tiềm năng trong tương lai. Tuy nhiên, công nghệ này vẫn đang bị hoài nghi bởi chất lỏng, bể tùy chỉnh rất tốn kém và việc bảo trì cũng rắc rối hơn.

Trường Đặng