Không chỉ làm CPU, các công ty Trung Quốc cũng đang phát triển GPU và cái tên mới nhất là Biren Technology với GPU BR100. Tương tự Innosilicon, Biren Technology nhắm đến thị trường trí thông minh nhân tạo (AI) và tính toán hiệu năng cao (HPC). BR100 được cho có thể đối đầu với A100 hay H100 của NVIDIA.
Các GPU chuyên dùng cho AI và HPC của Biren có 2 phiên bản là BR100 với hiệu năng tính toán FP32 đạt 256 TFLOPS, INT8 là 2 PetaFLOPS. Phiên bản thấp hơn là BR104 với hiệu năng tính toán FP32 đạt 128 TFLOPS và INT8 đạt 1 PetaFLOPS. Cả 2 GPU đều dùng bộ nhớ HBM2E, BR100 được trang bị 64 GB HBM2E, kết nối với bus rộng 4096-bit cho băng thông 1,64 TB/s. BR104 đi với 32 GB HBM2E, băng thông 2048-bit, băng thông 819 GB/s.
Cả 2 phiên bản đều hỗ trợ các định dạng dữ liệu như INT8, FP16, BF16, FP32 và TF32+, không thấy nhắc đến FP64 - định dạng thường dùng với các ứng dụng siêu tính toán. Bên cạnh các năng lực tính toán thì Biren GPU cũng hỗ trợ mã hóa và giải mã H.264.
BR100 sẽ được bán ra dưới dạng OAM (OCP Accelerator Module) dành cho các hệ thống máy chủ, mỗi hệ thống có thể gắn 8 module, các GPU kết nối với nhau bằng kết nối Blink 8-way, mức tiêu thụ điện năng của mỗi module tối đa 550W. BR104 sẽ có dạng card PCIe, hỗ trợ đa GPU với tối đa 3 card. Cả 2 GPU đều dùng giao tiếp PCIe 5.0 x16 với giao thức CXL để kết nối với các bộ gia tốc khác.
Điều đáng chú ý là các GPU này đều được sản xuất trên tiến trình 7nm của TSMC, tương tự như tiến trình của NVIDIA A100. Số lượng bóng bán dẫn của BR100 đạt đến 77 tỉ bóng trong khi A100 là 54,2 tỉ bóng. Biren áp dụng thiết kế chipset và công nghệ đóng gói đa chip trên một chất nền CoWoS 2.5D để đạt được số lượng bóng bán dẫn lớn trong khi vẫn giữ được kích thước GPU dưới giới hạn vật lý.
Được biết Biren đã hợp tác với hãng cung cấp dịch vụ điện toán đám mây và dữ liệu lớn Inspur để triển khai máy chủ tích hợp 8 hệ thống OAM dùng GPU BR100. Baidu và China Mobile sẽ là 2 trong số những khách hàng đầu tiên sử dụng GPU của Biren.
Theo: Tom's Hardware
Các GPU chuyên dùng cho AI và HPC của Biren có 2 phiên bản là BR100 với hiệu năng tính toán FP32 đạt 256 TFLOPS, INT8 là 2 PetaFLOPS. Phiên bản thấp hơn là BR104 với hiệu năng tính toán FP32 đạt 128 TFLOPS và INT8 đạt 1 PetaFLOPS. Cả 2 GPU đều dùng bộ nhớ HBM2E, BR100 được trang bị 64 GB HBM2E, kết nối với bus rộng 4096-bit cho băng thông 1,64 TB/s. BR104 đi với 32 GB HBM2E, băng thông 2048-bit, băng thông 819 GB/s.
Cả 2 phiên bản đều hỗ trợ các định dạng dữ liệu như INT8, FP16, BF16, FP32 và TF32+, không thấy nhắc đến FP64 - định dạng thường dùng với các ứng dụng siêu tính toán. Bên cạnh các năng lực tính toán thì Biren GPU cũng hỗ trợ mã hóa và giải mã H.264.
BR100 sẽ được bán ra dưới dạng OAM (OCP Accelerator Module) dành cho các hệ thống máy chủ, mỗi hệ thống có thể gắn 8 module, các GPU kết nối với nhau bằng kết nối Blink 8-way, mức tiêu thụ điện năng của mỗi module tối đa 550W. BR104 sẽ có dạng card PCIe, hỗ trợ đa GPU với tối đa 3 card. Cả 2 GPU đều dùng giao tiếp PCIe 5.0 x16 với giao thức CXL để kết nối với các bộ gia tốc khác.
Điều đáng chú ý là các GPU này đều được sản xuất trên tiến trình 7nm của TSMC, tương tự như tiến trình của NVIDIA A100. Số lượng bóng bán dẫn của BR100 đạt đến 77 tỉ bóng trong khi A100 là 54,2 tỉ bóng. Biren áp dụng thiết kế chipset và công nghệ đóng gói đa chip trên một chất nền CoWoS 2.5D để đạt được số lượng bóng bán dẫn lớn trong khi vẫn giữ được kích thước GPU dưới giới hạn vật lý.
Được biết Biren đã hợp tác với hãng cung cấp dịch vụ điện toán đám mây và dữ liệu lớn Inspur để triển khai máy chủ tích hợp 8 hệ thống OAM dùng GPU BR100. Baidu và China Mobile sẽ là 2 trong số những khách hàng đầu tiên sử dụng GPU của Biren.
Theo: Tom's Hardware