Tại sự kiện Next Horizon, AMD đã chính thức giới thiệu 2 phiên bản card tăng tốc (accelerator) dành cho khối doanh nghiệp, tập trung vào các tác vụ tính toán cao cấp, trung tâm dữ liệu và máy học (machine learning) có tên Radeon Instinct MI60 và MI50. Bộ đôi này sử dụng các GPU Vega tiến trình 7 nm mà AMD đã công bố trước đó và sẽ bắt đầu được bán ra vào cuối năm nay.
Vẫn là Vega nhưng đây là phiên bản tinh chỉnh của kiến trúc Vega hiện có hay Vega 20, bổ sung các tính năng tập trung vào năng lực tính toán vốn là yếu tố quan trọng trên thị trường HPC. Điều đáng chú ý là GPU Vega 20 tiến trình 7 nm này có các thông số rất gần với dòng Vega 10 tiến trình 14 nm, tức là vẫn có 64 đơn vị tính toán (CU) và dùng bộ nhớ HBM2 nhưng lại có điểm khác biệt lớn đó là khai thác chuẩn kết nối mới là PCIe 4.0 x16 với băng thông đến 31,51 GB/s. Ngoài ra kích thước đế chip cũng nhỏ hơn so với thế hệ Vega 10 trên MI25.
Một điểm được AMD nhấn mạnh là MI60 và MI50 tiết kiệm điện hơn so với thế hệ trước là MI25 với tỉ lệ cắt giảm đến 50% trong hiệu năng tổng thể cao hơn 30%.
Vega 20 có 13,23 tỉ bán dẫn nằm trên một đế cỡ 331 mm2 và các nhân GCN được tối ưu, xung nhịp cao hơn mang lại năng lực tính toán 7,4 TFLOP FP64 hay 14,8 TFLOP FP32 và 29,5 TFLOP FP16. 64 CU cho tổng số 4096 nhân stream tương tự Vega 10 nhưng do được tối ưu cho thị trường HPC thành ra nó đạt được năng lực tính toán cao hơn cũng như được bổ sung các tập lệnh dành cho các tác vụ học sâu (deep learning) và máy học (machine learning). Nói về deep learning thì Radeon Instinct MI60 giờ đây hỗ trợ cả 2 tập lệnh INT8 và INT4 với năng lực tính toán trên lý thuyết là 118 TFLOP đối với INT4 và 59 TFLOP với INT8.
Về phần bộ nhớ, MI60 và MI50 tiếp tục được trang bị bộ nhớ HBM2 với dung lượng lần lượt là 32 và 16 GB với 4 stack 8-Hi nhằm mang lại dung lượng và mật độ cao nhất từ trước đến nay trên một con GPU đơn. HBM2 không chỉ cho băng thông cực lớn lên đến 1 TB/s mà bộ nhớ này trên bộ đôi MI60 và MI50 cũng hỗ trợ ECC. Thiết lập đa GPU cũng được tối ưu với 2 cầu Infinity Fabric cho băng thông ngang hàng đến 200 GB/s, nhanh hơn 6 lần so với PCIe 3.0 và cho phép gắn 4 GPU trong một tổ (hive).Một điểm được AMD nhấn mạnh là MI60 và MI50 tiết kiệm điện hơn so với thế hệ trước là MI25 với tỉ lệ cắt giảm đến 50% trong hiệu năng tổng thể cao hơn 30%.
Nguồn: AMD