Microsoft thuê AMD làm chip riêng cho Azure HBv5 - Zen 4 và HBM3

Lư Thế Nghĩa
23/11/2024 4:8Phản hồi: 17
Microsoft thuê AMD làm chip riêng cho Azure HBv5 - Zen 4 và HBM3
Sự kiện SC (siêu điện toán) thường niên là dịp giới công nghệ được chứng kiến nhiều sản phẩm, giải pháp gây kinh ngạc. Tại SC24 này, Microsoft chào sân với hệ thống ảo hoá (VM) Azure HBv5 dành riêng cho các ứng dụng HPC. Trong đó, hạt nhân sức mạnh của cỗ máy là mẫu chip Instinct đặc biệt do AMD cung cấp, đi cùng hệ thống hạ tầng mạng Quantum-2 InfiniBand của NVIDIA. Giờ đây chúng ta biết rằng con chip từng được đồn có cái tên MI300C nay chỉ được sản xuất riêng cho Microsoft.

Như tựa bài viết, nền tảng chính của HBv5 là kiến trúc Zen 4 và bộ nhớ HBM3. Có lẽ bạn đang thắc mắc - tại sao 2024 sắp hết mà Microsoft còn xài Zen 4 ra đời đã hơn 2 năm? Tại sao không dùng Zen 5?

Đáp án không phải là Microsoft không muốn, mà hiện tại AMD chưa có mẫu Instinct nào trang bị Zen 5 cả. Tính cho tới thời điểm này, hãng sản xuất chip chỉ có 2 dòng Ryzen 9000 và EPYC 9005 áp dụng kiến trúc trên. Còn Instinct vẫn đang dừng ở Zen 4. Theo lộ trình của AMD, sang 2025 công ty này mới ra mắt thế hệ Instinct mới, khả năng cao sẽ là Zen 5.

Vậy Instinct hay đúng hơn là MI300C có gì đặc biệt với Microsoft?

AMD-Instinct-MI300A-Chiplets.jpg

Instinct MI300A là mẫu Instinct duy nhất kèm theo nhân x86 của AMD

Trong danh sách sản phẩm của AMD, nếu Ryzen và EPYC mang thiên hướng CPU x86 thì Radeon và Instinct nghiêng về GPU. 2 model Instinct cao nhất hiện có của công ty này là MI300A và MI300X. Trong đó X ám chỉ đây là XCD hay GPU còn A ám chỉ đây là APU (vừa có XCD, vừa có CCD). Ngoài ra vì là GPU nên Instinct còn được trang bị thêm bộ nhớ VRAM HBM, vốn chỉ dành cho các giải pháp HPC cao cấp.

Song con chip MI300C mà Microsoft đặt hàng thì lại... không phải GPU (C ám chỉ CCD hoặc CPU). Có nghĩa toàn bộ các die GPU được thay hết bằng die CPU. Theo thông số Microsoft cung cấp, 1 hệ thống HBv5 sẽ có tối đa 352 nhân Zen 4, đi kèm 400-450 GB RAM HBM3, với mỗi nhân có trung bình 9 GB RAM.

Microsoft-Azure-HBv5-Instance-with-AMD-MI300C-at-SC24-2.jpg
Mẫu chip MI300C tại SC24

Nhưng tại sao Microsoft lại yêu cầu một con chip "kỳ lạ" như vậy? Câu trả lời ở chỗ công ty này vừa cần nhiều nhân CPU để chạy ảo hoá, lại vừa cần băng thông nhớ cực kỳ khủng. Bộ nhớ HBM mặc dù đã xuất hiện từ lâu (AMD Fury X ra đời từ 2015, là con chip đầu tiên sử dụng HBM) nhưng cho tới nay hầu hết chỉ có mặt cùng GPU. Gần đây nhất chúng ta có CPU Sapphire Rapids của Intel là có phiên bản kèm HBM2e. Nhưng các trục trặc về lộ trình sản phẩm của hãng này có lẽ đã đẩy Microsoft nhìn về AMD. Dù gì AMD dưới triều đại Lisa Su cũng rất tích cực làm các thiết kế custom theo ý khách hàng (Xbox và PlayStation là điển hình).

Ấy là chưa nhắc đến Azure đời cũ cũng xài chip EPYC do AMD cung cấp. Vậy khách có ý và ta có lòng thì cứ triển thôi?

STREAM-Triad.png
So sánh băng thông nhớ giữa các thế hệ Azure HBv

Quảng cáo


Microsoft cho biết HBv5 có băng thông nhớ cực kỳ khủng, 1 VM lên tới 6900 GB/s. Trong khi HBv3 chỉ có 350 GB/s và HBv4 là 780 GB/s. Có nghĩa là cải thiện bộ nhớ gấp 9 lần đời trước! Ngoài ra, do yêu cầu dành cho HPC, nên tính năng SMT trên HBv5 bị tắt đi. Dù sao thì 352 luồng xử lý cũng là con số không hề nhỏ.

Lại nói trên lý thuyết MI300C có thể đạt tới 96 nhân Zen 4 (12 die CCD). Nhưng có lẽ vì yêu cầu chạy liên tục ở xung nhịp cao (tối đa 4 GHz) nên số nhân thực tế Microsoft khai thác trên từng con chip chỉ còn 88 (352 / 4 socket). Ngoài ra với hạ tầng mạng Quantum-2 InfiniBand, mỗi CPU sẽ có 200 Gb/s băng thông mạng để chạy ảo hoá cho riêng mình. Về năng lực lưu trữ, 1 hệ thống HBv5 có 14 TB SSD NVMe cho tốc độ đọc/ghi lần lượt 50/30 GB/s.

Microsoft-Azure-HBv5-Instance-with-AMD-MI300C-at-SC24-3.jpg
Microsoft-Azure-HBv5-Instance-with-AMD-MI300C-at-SC24-1.jpg
Một hệ thống HBv5 có 4 chip MI300C
17 bình luận
Chia sẻ

Xu hướng

Ủa rồi intel...
@hongphuc1992 TeoFan cay
@hongphuc1992 có.mấy ông nhật bị inteo gạt
Đắt khách
"Đùa, bạn thân bao năm mà ông lại làm vậy" - Tèo said
Đến M$ còn bỏ Intel mà đi là hiểu rồi đó 🤣
@bango123 nó thấy mùi lâu rồi, nhưng giờ là lúc thích hợp nhất =))))
Wintel hết hợp đồng rồi ah?
@locgame kinh doanh mà, ko đáp ứng được thì cook =)))
táo chạy intel từ 2020, em cũng bỏ chạy khỏi intel từ 2020, ms cũng chạy intel từ 2024, còn ai chạy intel nữa ko ạ?
@ThietKeWebChuyen-Com Đợt cháy chip vừa rồi nhiều người chạy khỏi inTèo.

Đợt ra mắt Ultra đụt vừa rồi cũng nhiều người chạy nốt
Tèo chắc ngáp ngáp thêm 1-2 năm nữa mà ko chết hẳn thì hy vọng mới đứng dậy dc 🤣🤣
Nhờ có AMD . cpu i7 i9 mới có nhiều core như hiện nay
@AnDu1908 Nhờ nhờ cái con khỉ
Ko nhờ có intel thì lấy đâu ra chip cho amd copy những ngày đầu??
@kulele chứ éo phải ơ Mỹ có luật chống độc quyền hả con , dốt nát quá 😆))
@nguyễn chí danh@3 Phải nói là nhờ nước mỹ và nền kinh tế thị trường. Nhờ amd cái con khỉ nó trước bị intel đấm thì nay cải tiến cpu để chiếm lại thị trường và mục đích sau cùng là đớp tiền thôi chứ ơn nghĩa gì mấy chú ngốc
@kulele ko có Mỹ có luật độc quyền thì intel khốn kiếp nhà bọn m đi hút máu thiên hạ à 😆))) , nhờ có những thằng óc IQ = 0 như m thì intel mới nhồi sọ bọn m 😃))))

Xu hướng

Bài mới










  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019