Tại sự kiện GTC 2022 đang diễn ra, kiến trúc Hopper dành cho doanh nghiệp, máy chủ và hệ thống siêu máy tính chuyên nghiệp đã được Nvidia giới thiệu. Hai trong số những sản phẩm đầu tàu của kiến trúc chip xử lý này là CPU mang tên Grace, một cụm chip CPU khổng lồ với 144 nhân xử lý và 600GB RAM, và GPU GH100 dành cho data center, với 80 tỷ transistor, băng thông bộ nhớ HBM3 3TB/s và sức mạnh xử lý gần 4000 teraflops.
Kết hợp tiến trình sản xuất chip bán dẫn 4nm của TSMC với công nghệ bộ nhớ HBM3, GH100 của Nvidia đúng là một chip GPU cực mạnh phục vụ cho quá trình nghiên cứu trí thông minh nhân tạo, machine learning, deep neural network và những tác vụ yêu cầu máy tính hiệu năng rất cao khác.
Những đổi mới công nghệ cơ bản của kiến trúc chip xử lý Hopper bao gồm:
Hopper GH100
Kết hợp tiến trình sản xuất chip bán dẫn 4nm của TSMC với công nghệ bộ nhớ HBM3, GH100 của Nvidia đúng là một chip GPU cực mạnh phục vụ cho quá trình nghiên cứu trí thông minh nhân tạo, machine learning, deep neural network và những tác vụ yêu cầu máy tính hiệu năng rất cao khác.

Những đổi mới công nghệ cơ bản của kiến trúc chip xử lý Hopper bao gồm:
- Nhân Tensor Core thế hệ 4, hiệu năng gấp 6 lần so với nhân tensor trên thế hệ GPU A100 kiến trúc Ampere. Trên mỗi SM (stream microprocessor), hiệu năng tính toán Matrix Multiply Accumulate của GH100 cao gấp đôi so với GA100 xét trên cùng một dạng dữ liệu.
- Tập lệnh DPX mới, tăng tốc Dynamic Programming nhanh gấp 7 lần so với GA100.
- Hệ thống bộ nhớ HBM3, tạo ra băng thông bộ nhớ gấp đôi so với thế hệ GPU cũ. GPU H100 SXM5 có băng thông bộ nhớ lên đến 3TB/s.
- Bộ nhớ đệm L2 dung lượng 50MB cho phép trao đổi những gói dữ liệu lớn giữa các SM, giảm thời gian GPU phải tương tác với VRAM.
- Cầu nối NVLink thế hệ thứ 4, tăng băng thông kết nối lên gấp 3 lần, kết nối nhiều GPU với nhau tạo ra băng thông bộ nhớ 900 GB/s.
- Kết nối PCIe 5.0 tạo ra băng thông gấp đôi (128GB/s) so với PCIe 4.0, qua đó cho phép những GPU H100 làm việc hiệu quả nhất với những CPU máy chủ mạnh nhất hiện tại, hoặc những chip Data Processing Unit.

GH100 được trang bị trong sản phẩm flagship của Nvidia, một mẫu add in card tên là H100 SXM5, kết nối với máy chủ hoặc siêu máy tính nhờ kết nối PCIe 5.0. Mẫu GPU này trang bị 8 cụm xử lý GPC (Graphics Processing Cluster), mỗi GPC có 9 TPC (Texture Processing Cluster), và mỗi TPC trang bị 2 stream microprocessor. Tổng cộng trên bề mặt con chip là 18432 nhân CUDA, kết nối với hệ thống bộ nhớ 80GB HBM3, quản lý bằng 10 memory controller 512-bit.

Nvidia cho biết với cấu hình như thế này, GH100 trang bị trên card SXM5 tạo ra sức mạnh xử lý 4000 teraflops FP8, 2000 teraflops FP16, 1000 teraflops FP32 và 60 teraflops FP64, tức là nhanh hơn thế hệ GA100 trước 3,3 lần, nhanh hơn AMD Instinct MI250X vừa ra mắt 28% xét đến hiệu năng xử lý FP64, và nhanh hơn 5,2 lần xét đến hiệu năng FP16.

Con chip GPU cực mạnh này sẽ được trang bị trong những sản phẩm khác như DGX H100, kết hợp 8 GPU H100, VRAM tối đa 640GB để biến thành một nền tảng siêu máy tính sức mạnh xử lý tối đa 32 petaflop.
![[IMG]](https://photo2.tinhte.vn/data/attachment-files/2022/03/5915351_Tinhte_Nvidia1.jpg)
Hoặc cũng là con chip này, họ sẽ trang bị cho mẫu card tăng tốc H100 PCIe, nhưng phiên bản GPU này chỉ trang bị 114 stream microprocessor thay vì đủ 144 SM như phiên bản cao cấp. Nhưng ngần đó vẫn là đủ để mẫu “card đồ họa” này tạo ra sức mảnh xử lý 800 teraflop FP32, trong khi TDP chỉ ở ngưỡng 350W, phục vụ nghiên cứu khoa học, y khoa, biến đổi khí hậu, v.v...
Quảng cáo

Grace CPU
Nếu như những năm trước, những giải pháp siêu máy tính mà Nvidia bán cho khách hàng đều phải nhờ tới sự trợ giúp của những CPU máy chủ siêu mạnh như Xeon Scalable hay AMD Epyc, thì giờ họ đã có CPU riêng, dựa trên kiến trúc ARM và đặt tên là Grace, kết hợp với GPU Hopper tạo ra tên của nhà nữ khoa học gia người Mỹ.

Grace là một “siêu CPU” với 144 nhân ARM v9, tổng băng thông bộ nhớ 1TB/s thông qua hệ thống chip RAM LPDDR5x, hỗ trợ ECC, phục vụ cho những nhu cầu xử lý máy chủ đám mây hoặc máy tính hiệu năng cao. Nvidia quảng cáo con chip này có hiệu năng so với điện năng tiêu thụ cao gấp đôi so với những giải pháp cao cấp nhất của AMD và Intel hiện giờ, cụ thể hơn là con chip Epyc 7773X 64 nhân vừa được ra mắt, hoặc Xeon Platinum 8380 40 nhân.

Quảng cáo
Khi kết hợp với GPU Hopper, CPU Grace sẽ cho phép tạo ra hiệu năng xử lý nhanh gấp 10 lần so với những hệ thống siêu máy tính DGX hiện tại của Nvidia, vốn sử dụng CPU x86. Và đó chính xác là những gì họ đã làm, khi kết hợp CPU và GPU tạo ra một bo mạch tên là Grace Hopper superchip, phục vụ nhu cầu xử lý AI, máy chủ đám mây hoặc HPC quy mô lớn. Bo mạch này trang bị 600GB bộ nhớ cho GPU, cầu nối NVLink 900 GB/s, nhanh hơn chuẩn PCIe 5.0 gấp 7 lần, và chạy những phần mềm được Nvidia tùy chỉnh riêng mang tên Nvidia Software Stack.