GTC 2022: Kiến trúc Hopper ra mắt, Nvidia giới thiệu CPU ARM 144 nhân & GPU Hopper GH100 4000 TFlops

P.W
23/03/2022 08:03Phản hồi: 51
GTC 2022: Kiến trúc Hopper ra mắt, Nvidia giới thiệu CPU ARM 144 nhân & GPU Hopper GH100 4000 TFlops
Tại sự kiện GTC 2022 đang diễn ra, kiến trúc Hopper dành cho doanh nghiệp, máy chủ và hệ thống siêu máy tính chuyên nghiệp đã được Nvidia giới thiệu. Hai trong số những sản phẩm đầu tàu của kiến trúc chip xử lý này là CPU mang tên Grace, một cụm chip CPU khổng lồ với 144 nhân xử lý và 600GB RAM, và GPU GH100 dành cho data center, với 80 tỷ transistor, băng thông bộ nhớ HBM3 3TB/s và sức mạnh xử lý gần 4000 teraflops.

Hopper GH100


Kết hợp tiến trình sản xuất chip bán dẫn 4nm của TSMC với công nghệ bộ nhớ HBM3, GH100 của Nvidia đúng là một chip GPU cực mạnh phục vụ cho quá trình nghiên cứu trí thông minh nhân tạo, machine learning, deep neural network và những tác vụ yêu cầu máy tính hiệu năng rất cao khác.

Tinhte_Nvidia5.png

Những đổi mới công nghệ cơ bản của kiến trúc chip xử lý Hopper bao gồm:

  • Nhân Tensor Core thế hệ 4, hiệu năng gấp 6 lần so với nhân tensor trên thế hệ GPU A100 kiến trúc Ampere. Trên mỗi SM (stream microprocessor), hiệu năng tính toán Matrix Multiply Accumulate của GH100 cao gấp đôi so với GA100 xét trên cùng một dạng dữ liệu.
  • Tập lệnh DPX mới, tăng tốc Dynamic Programming nhanh gấp 7 lần so với GA100.
  • Hệ thống bộ nhớ HBM3, tạo ra băng thông bộ nhớ gấp đôi so với thế hệ GPU cũ. GPU H100 SXM5 có băng thông bộ nhớ lên đến 3TB/s.
  • Bộ nhớ đệm L2 dung lượng 50MB cho phép trao đổi những gói dữ liệu lớn giữa các SM, giảm thời gian GPU phải tương tác với VRAM.
  • Cầu nối NVLink thế hệ thứ 4, tăng băng thông kết nối lên gấp 3 lần, kết nối nhiều GPU với nhau tạo ra băng thông bộ nhớ 900 GB/s.
  • Kết nối PCIe 5.0 tạo ra băng thông gấp đôi (128GB/s) so với PCIe 4.0, qua đó cho phép những GPU H100 làm việc hiệu quả nhất với những CPU máy chủ mạnh nhất hiện tại, hoặc những chip Data Processing Unit.

Tinhte_Nvidia6.png

GH100 được trang bị trong sản phẩm flagship của Nvidia, một mẫu add in card tên là H100 SXM5, kết nối với máy chủ hoặc siêu máy tính nhờ kết nối PCIe 5.0. Mẫu GPU này trang bị 8 cụm xử lý GPC (Graphics Processing Cluster), mỗi GPC có 9 TPC (Texture Processing Cluster), và mỗi TPC trang bị 2 stream microprocessor. Tổng cộng trên bề mặt con chip là 18432 nhân CUDA, kết nối với hệ thống bộ nhớ 80GB HBM3, quản lý bằng 10 memory controller 512-bit.

Tinhte_Nvidia7.png

Nvidia cho biết với cấu hình như thế này, GH100 trang bị trên card SXM5 tạo ra sức mạnh xử lý 4000 teraflops FP8, 2000 teraflops FP16, 1000 teraflops FP32 và 60 teraflops FP64, tức là nhanh hơn thế hệ GA100 trước 3,3 lần, nhanh hơn AMD Instinct MI250X vừa ra mắt 28% xét đến hiệu năng xử lý FP64, và nhanh hơn 5,2 lần xét đến hiệu năng FP16.

Tinhte_Nvidia2.png

Con chip GPU cực mạnh này sẽ được trang bị trong những sản phẩm khác như DGX H100, kết hợp 8 GPU H100, VRAM tối đa 640GB để biến thành một nền tảng siêu máy tính sức mạnh xử lý tối đa 32 petaflop.

[​IMG]

Hoặc cũng là con chip này, họ sẽ trang bị cho mẫu card tăng tốc H100 PCIe, nhưng phiên bản GPU này chỉ trang bị 114 stream microprocessor thay vì đủ 144 SM như phiên bản cao cấp. Nhưng ngần đó vẫn là đủ để mẫu “card đồ họa” này tạo ra sức mảnh xử lý 800 teraflop FP32, trong khi TDP chỉ ở ngưỡng 350W, phục vụ nghiên cứu khoa học, y khoa, biến đổi khí hậu, v.v...

Quảng cáo



Tinhte_Nvidia8.png

Grace CPU


Nếu như những năm trước, những giải pháp siêu máy tính mà Nvidia bán cho khách hàng đều phải nhờ tới sự trợ giúp của những CPU máy chủ siêu mạnh như Xeon Scalable hay AMD Epyc, thì giờ họ đã có CPU riêng, dựa trên kiến trúc ARM và đặt tên là Grace, kết hợp với GPU Hopper tạo ra tên của nhà nữ khoa học gia người Mỹ.

Tinhte_Nvidia4.png

Grace là một “siêu CPU” với 144 nhân ARM v9, tổng băng thông bộ nhớ 1TB/s thông qua hệ thống chip RAM LPDDR5x, hỗ trợ ECC, phục vụ cho những nhu cầu xử lý máy chủ đám mây hoặc máy tính hiệu năng cao. Nvidia quảng cáo con chip này có hiệu năng so với điện năng tiêu thụ cao gấp đôi so với những giải pháp cao cấp nhất của AMD và Intel hiện giờ, cụ thể hơn là con chip Epyc 7773X 64 nhân vừa được ra mắt, hoặc Xeon Platinum 8380 40 nhân.

Tinhte_Nvidia3.png

Quảng cáo


Khi kết hợp với GPU Hopper, CPU Grace sẽ cho phép tạo ra hiệu năng xử lý nhanh gấp 10 lần so với những hệ thống siêu máy tính DGX hiện tại của Nvidia, vốn sử dụng CPU x86. Và đó chính xác là những gì họ đã làm, khi kết hợp CPU và GPU tạo ra một bo mạch tên là Grace Hopper superchip, phục vụ nhu cầu xử lý AI, máy chủ đám mây hoặc HPC quy mô lớn. Bo mạch này trang bị 600GB bộ nhớ cho GPU, cầu nối NVLink 900 GB/s, nhanh hơn chuẩn PCIe 5.0 gấp 7 lần, và chạy những phần mềm được Nvidia tùy chỉnh riêng mang tên Nvidia Software Stack.
51 bình luận

Xu hướng

Thông số khủng quá
@henry_1177 Intel và AMD bắt đầu run sợ với ARM
@NguyễnDuyĐạt Mình thấy không có gì phải rung sợ hết, có cạnh tranh thì mới có phát triển
@NguyễnDuyĐạt ARM chưa đủ mạnh bằng Intel vs AMD đâu bn.
@henry_1177 Kinh nhỉ 80 tỷ transistor
@henry_1177 Hy vọng sẽ đại hạ giá
Riết sau này công nghệ phát triển, nhà nhà có data center để nghiên cứu khoa học thay vì chơi game giải trí... há há (joking)
@HamDzui thì đúng là vậy mà, hồi đầu thập niên 70 có ai nghĩ PC phổ biến như giờ đâu, máy tính thời đó phụ vụ đưa tàu con thoi vào vũ trụ cấu hình còn cùi bắp hơn con đt 1-2tr bây giờ
@HamDzui Nghiên cứu mua Vietlott
RTX 2060 SUPER của mình chỉ 10TFLOPS, mà con này 4000 TFLOPS chắc mở game 8K Max setting chừng 100 cái màn hình há.
bkb_ct
TÍCH CỰC
một năm
@kevin2012 Qua tới đời rtx 3000 series e thấy đã nhảy vọt rồi toàn là tăng theo cấp số nhân chứ hết % ln, kinh khỉng
hoc_3d
ĐẠI BÀNG
một năm
@kevin2012 Hình như nó sinh ra không phải cho Games rồi!
@kevin2012 4000 TFLOPS là chạy với FP8, 10TFLOPS của 2060 mà bạn nói là FP64/FP32.
hai con số này không so sánh được.
Bạn phải so 10TFLOPS với 60TFLOPS của Hopper
_Vito_
ĐẠI BÀNG
một năm
@laiviet FP32 với FP64 khác nhau nhiều. Cái TFLOPS ng ta thường nói đến là FP32 còn FP64 thì nhỏ hơn nhiều, Ví dụ 3090Ti đạt ~35 TFLOPS FP32 nhưng với FP64 thì chỉ có ~600 GFLOPS tức 0.6 TFLOPS thôi. Con Hopper kia đạt 60 TFLOPS FP64 là rất kinh khủng.
Bài thông tin cpu, gpu nào mới là y như là sắp sửa có vài đứa vào la lối "rút sạc thì thua m1 apple hết", "apple m1 chạy pin cũng render đươc", "apple m1 ít tốn điện hơn", "nóng, tản nhiệt kém thì thua m1 hết"... như mấy đứa điên
nxt96
ĐẠI BÀNG
một năm
@arisato1508 Đối vs isheeper thì m1 mạnh bằng siêu máy tính luôn r, chứ mấy cpu máy tính ko ăn thua j đâu
giá card thấy đang bắt đầu giảm, có khi nào nvidia chuẩn bị ra kiến trúc mới + dòng 4000series nên đại lý bắt đầu xả hàng không?
anfang
TÍCH CỰC
một năm
@LocNguyen6495 tầm tháng 10 là 4000 ra mắt, ko đẩy 3000 nhanh mấy ông kia sao bán 4000 giá cao 😆)
@anfang Ăn quen mồm rồi nên có khi gian thương đẩy 4000 tận mây xanh để kiềm giá 3000 thôi, chứ dễ gì nhả cho ntd lợi được.
@boyngo1988 Tầm này các hãng VGA toàn bán thẳng cho bọn đào coin luôn. Thương gia thì ăn của dân games.
yxmikan
ĐẠI BÀNG
một năm
Với thông số như kia, RTX4000 lại càng được nhiều người mong đợi, ai đang chuẩn bị nhảy RTX3000 vì giá tốt mấy bữa nay chắc lại hold tiếp 😆
Ko mua dc ARM nhưng vẫn có công nghệ để làm là ngon rồi. Cái này chắc đọc cho vui thôi chứ đời trước thì cả VN đâu có vài con
Chốt lại là sẽ train model nhanh hơn =)) Dạ em đội ơn anh NVIDIA
@Duy Luân lại khổ thân ae khoanh mẫu 😌
pikupi
TÍCH CỰC
một năm
@Duy Luân ủa M1 ultra mạnh ngang ngửa RTX3090 đâu ko đem ra train vậy mod?
mushu
ĐẠI BÀNG
một năm
@pikupi M1 tuổi gì mà so về khoản training AI 😃 Encode còn kém nữa là. Mọi người không thiếu điện chỉ cần nhanh thôi. Ra uống cốc cà phê mà quay lại có kết quả nó khác nhiều so với đi về tắm mai lên xem đó.
pikupi
TÍCH CỰC
một năm
@mushu buồn, nghe mod Duy Luan ba hoa nổ tung trời mà train model ko đc sao :v tưởng mod có kiến thức về data science mà lại ko rõ gì sao 😃
Khủng
quá khủng rùi nhưng không phải đồ thương mại phổ thông
Nvidia hôm bữa bị Apple mang ra so sánh giờ biết thân biết phận rồi, ko dám so ngược lại với M1
@baomat1585 Gỡ M1 từ macbook ra mà lắp vào server cho mạnh. 🤣
@baomat1585 Mày bớt điên dùm chú đi cháu ạ. 10 con apple chồng lên nhau cũng ko có tuổi với nvidia nhé con.
@_Vito_ Vậy nên họ vẽ khúc dưới với tỹ lệ 1:/:50... ai thích hiễu sao thì hiễu::: kkkk
2 CPU ghép vào nhau kia như M1 Ultra luôn ngon nhỉ, mà con này để làm gì vậy
_Vito_
ĐẠI BÀNG
một năm
@bomduc Trên kia là 1 CPU với 1 GPU ghép với nhau mà thím :v
Mấy con này chủ yếu để nghiên cứu khoa học, làm mô phỏng hạt nhân, khí hậu, giải mã gen,... các thứ.
@bomduc Thằng nvidia này nó ghép đến 16 bản mạch vào cái main ko sướng hơn sao phải làm cái trò ruồi như Apple đễ PR
@GariNguyen Khác nhau về tốc độ mà ông
ARM ngày càng mạnh 😆
Chọn Mac cho lành. nVidia đã yếu còn bú điện 🤣
Với kiến trúc mới này thì GPU 40xx sắp tới hứa hẹn cũng sẽ khủng lắm đây
@vodanhdaisu 40xx là kiến trúc Lovelace, ko phải Hopper 😔
Tôi đến lạy một số ngài mem Tinh Tếu khi lấy chịp M1 mobility so với con chip server. Không khác gì so sánh xe đạp thống nhất với đầu tàu hoả. Chả hiểu sao mà vẫn nhắm mắt nhắm mũi vào so với cả sánh.
Cười vô mặt
@Anthony2017 đối với i-bò thì M1 siêu cấp vô địch ngân hà vũ trụ rồi, cứ thấy ở đâu có chữ CPU/GPU là auto vào đớp 😆))
Nvidia tay to phết, chắc không có con CPU nào cũng AMD và Intel chung mâm được với con ARM này rồi
@A0kiji Vẫn yếu hơn Epyc 7763 một tí, nhưng mà kiểu của nhà trồng ra, ko phải nhờ anh nào khác.
@P.W nếu Nvidia mua lại ARM thành công thì cũng có khi lấn sân vào sản xuất CPU cho PC, cạnh tranh với Qualcomm luôn ấy nhỉ 😁
@A0kiji Nvidia bỏ kèo mua ARM rồi, nuốt ko có trôi với các anh quản lý với đối thủ cạnh tranh 😔
Với 144 core Arm: apple phải gọi là cụ nhá:
cơ bản là bọn này ko đưa nó cho người dùng cuối::: còn apple thì có:::
Đúng là thời tới, kiến trúc ARM quá khủng.

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2023 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02862713156
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019