Trên tay ASUS Ascent GX10: Siêu máy tính AI nằm ngay trên bàn của bạn

Pnghuy
1/11/2025 4:3Phản hồi: 31
EditEdit
Trên tay ASUS Ascent GX10: Siêu máy tính AI nằm ngay trên bàn của bạn
NVIDIA khiến chúng ta không cần phải đi tìm đâu xa khi nghĩ đến những chiếc siêu máy tính (hay siêu máy chủ) để vận hành và huấn luyện các mô hình ngôn ngữ lớn, vì ở ngay trên bàn đã có ASUS Ascent GX10. Được trang bị bộ vi xử lý NVIDIA GB10 Grace Blackwell Superchip, nó cung cấp hiệu suất tính toán phục vụ AI lên đến 1 petaFLOP (1,000,000,000,000,000 - 1 triệu tỷ phép tính mỗi giây), dù chỉ nặng 1,48 kg và có kích thước chỉ 150 × 150 × 51 mm.

unbox-ASUS-Ascent-GX10-pnghuy-27.jpg
Khả năng nổi bật nhất của GX10 là khả năng huấn luyện và chạy những mô hình AI lớn có tới 200 tỷ tham số hoặc khi kết nối hai máy GX10 lại với nhau, bạn có thể xử lý những mô hình có 405 tỷ tham số – những mô hình AI có khả năng suy luận và hiểu biết tương đương các trợ lý AI tiên tiến nhất hiện nay.

ASUS Ascent GX10 là gì?


unbox-ASUS-Ascent-GX10-pnghuy-16.jpg
Trước hết với Ascent GX10 hay những mẫu máy dựa trên nguyên mẫu DGX Spark của NVIDIA thì nó trông như một chiếc mini PC, nhưng bên trong nó là một kiến trúc hoàn toàn khác so với những mẫu mini PC mà chúng ta từng biết.

unbox-ASUS-Ascent-GX10-pnghuy-38.jpg
So với một chiếc Mac mini M4 Pro, có thể thấy Ascent GX10 to hơn một chút, bề thế hơn, nhưng nếu là bản Founder Edition theo Cuhiep nói thì nó nhỏ gon và gọn hơn so với Mac mini M4.

unbox-ASUS-Ascent-GX10-pnghuy-34.jpg
Có lẽ DGX Spark và các phiên bản OEM của nó chính là những mẫu "supercomputer" dễ tiếp cận nhất ở thời điểm này dành cho các nhà phát triển AI, học sinh sinh viên đang nghiên cứu AI hoặc người dùng cá nhân muốn xây dựng hệ thống "máy chủ AI" của riêng mình, các doanh nghiệp muốn tận dụng để xây dựng hệ thống nội bộ chẳng hạn. So với việc thuê máy chủ với mức chi phí cố định hàng tháng thì mức giá khoảng 120 triệu cho phiên bản 128GB RAM và 1TB SSD sẽ là sự lựa chọn tối ưu hơn.

unbox-ASUS-Ascent-GX10-pnghuy-35.jpg
Phía sau của GX10 là 3 cổng USB-C 20Gbps, hỗ trợ DisplayPort Alt Mode và 1 cổng USB-C hỗ trợ nguồn 240W theo chuẩn PD 3.1.

Nó làm được gì?


unbox-ASUS-Ascent-GX10-pnghuy-26.jpg
Dĩ nhiên là để phục vụ các nhu cầu sử dụng AI, xây dựng hệ thống AI hoặc fine-tune các mô hình AI với lượng tham số lên đến 200 tỷ. Ưu thế rõ ràng nhất của DGX Spark hay Ascent GX10 hay cụ thể hơn là siêu chip GB10 đó là bộ nhớ Unified Memory giống như những con chip Apple Silicon và băng thông của nó lên đến 273GB/s.

unbox-ASUS-Ascent-GX10-pnghuy-23.jpg
Và nếu bạn so sánh với một hệ thống với 2 mẫu RTX 4090 hoặc RTX 5090 thì mức VRAM của nó cũng chỉ tối đa khoảng 48GB mà thôi và với mức này để bạn có thể fine-tune một mô hình 200 tỷ tham số là rất khó, gần như là không thể bởi vì mức VRAM bị giới hạn.

Quảng cáo


unbox-ASUS-Ascent-GX10-pnghuy-19.jpg
Còn với GB10, băng thông 273GB/s chưa phải là cái gì đó quá khủng khiếp nhưng kiến trúc Unified Memory giúp cho GB10 có thể fine-tune mô hình tốt hơn một hệ thống 2 con RTX 5090. Còn xét riêng về tốc độ inference thì GB10 chưa chắc đã "ăn" được.

unbox-ASUS-Ascent-GX10-pnghuy-17.jpg
Một ưu điểm nữa của GB10 đó là nó được hỗ trợ tăng tốc FP4 từ phần cứng, thay vì phải qua một lớp emulation, nó cho phép GPU xử lý các mô hình AI (suy luận) nhanh hơn đáng kể và hiệu quả hơn. Thay vì phải xử lý FP4 bằng phần mềm và sẽ dẫn đến hiệu suất bị ảnh hưởng.

unbox-ASUS-Ascent-GX10-pnghuy-12.jpg
Khả năng này cho phép một kỹ thuật gọi là "giải mã phỏng đoán" (speculative decoding), kỹ thuật này sử dụng một mô hình nhỏ, nhanh để "soạn thảo" văn bản và một mô hình lớn hơn, chính xác hơn để "xác minh" nó. Điều này đòi hỏi chạy hai mô hình cùng lúc và nó cần nhiều VRAM, lúc này GB10 sẽ hiệu quả hơn và tốc độ suy luận cũng sẽ nhanh hơn đáng kể so với việc chỉ chạy một mô hình lớn.

unbox-ASUS-Ascent-GX10-pnghuy-14.jpg
Thông số kỹ thuật đầy đủ của ASUS Ascent GX10:

Quảng cáo


  • CPU: 20 nhân ARM (Grace)
  • GPU: Blackwell, AI compute 1 petaFLOP
  • RAM hợp nhất (unified memory): 128GB LPDDR5X (dùng chung cho CPU & GPU)
  • Lưu trữ: 1TB PCIe NVMe.
  • Kết nối: 10GbE, QSFP (hỗ trợ ghép nối nhiều Spark)
  • Điện năng tiêu thụ: 240W chạy 24/7.
  • Hệ điều hành: DGX OS (dựa trên Ubuntu), hỗ trợ Nvidia Sync, SSH đơn giản.

Về Grace Blackwell GB10 Superchip


unbox-ASUS-Ascent-GX10-pnghuy-4.jpg
Đây là "trái tim" của GX10, kết hợp hai bộ xử lý khác nhau:

  • Bộ GPU Blackwell: Là thành phần chuyên xử lý các phép tính song song (parallel computing), tức là xử lý hàng triệu phép tính cùng lúc. GPU này được tối ưu hóa để xử lý các nhiệm vụ AI như nhận dạng ảnh, xử lý ngôn ngữ tự nhiên và dự đoán dữ liệu. GPU Blackwell tích hợp 128 GB bộ nhớ thống nhất, có nghĩa là CPU và GPU cùng sử dụng một vùng bộ nhớ chung, giúp truyền dữ liệu nhanh hơn rất nhiều so với truyền thông thường.

  • Bộ CPU ARM Neoverse V2 (20 nhân): Là bộ xử lý trung tâm, chuyên xử lý các công việc tuần tự (sequential operations) như điều phối dữ liệu, tiền xử lý thông tin trước khi đưa sang GPU. CPU này được thiết kế để tiết kiệm năng lượng (chỉ cần tối đa 180W).

unbox-ASUS-Ascent-GX10-pnghuy-8.jpg
Một thành phần cũng quan trọng không kém đối với GB10 đó là kết nối NVLink-C2C, đây là một công nghệ kết nối tốc độ siêu cao giữa CPU và GPU, cung cấp băng thông 900 GB/giây theo hai chiều. Để so sánh thì băng thông của PCIe 5.0 (theo hai chiều) có tốc độ tối đa là 126GB/s, như vậy NVLink-C2C của NVIDIA có tốc độ gấp khoảng 7 lần.

Điều này có nghĩa là dữ liệu được truyền từ CPU sang GPU (hoặc ngược lại) gần như không có độ trễ, cho phép các mô hình AI huấn luyện và chạy inference (dự đoán) nhanh hơn rất nhiều.

unbox-ASUS-Ascent-GX10-pnghuy-11.jpg
Và bộ nhớ hợp nhất của GB10 cũng là dạng Coherent Unified Memory, tức là NVIDIA đảm bảo CPU và GPU luôn "nhìn thấy" phiên bản dữ liệu mới nhất, tránh bị tình trạng lỗi thời dữ liệu.

unbox-ASUS-Ascent-GX10-pnghuy-13.jpg
Riêng với GX10 sẽ tích hợp NVIDIA ConnectX-7 SmartNIC – một bộ điều hợp mạng đặc biệt hỗ trợ tốc độ lên tới 400 Gbps cho phép kết nối hai chiếc GX10 với nhau bằng cáp kết nối đặc biệt. Với băng thông này, bạn có thể fine-tune mô hình lên đến 405 tỷ tham số.

NVIDIA DGX OS


unbox-ASUS-Ascent-GX10-pnghuy-2.jpg
Đây là phiên bản Ubuntu Linux được tối ưu hóa đặc biệt cho các máy GX10, với tất cả các driver, thư viện và công cụ đã được cài sẵn. Không cần phải cài đặt phức tạp – bạn chỉ cần mở máy và bắt đầu code.

NVIDIA cũng đi kèm một hướng dẫn đầy đủ các bước cài đặt cần thiết để DGX Spark hay GX10 sẵn sàng sử dụng, bao gồm các cài đặt SSH, NVIDIA Sync, AI Workbench…để người dùng sẵn sàng các môi trường để vào việc ngay. Mình sẽ có các chủ đề chia sẻ từng phần ở những bài sau nha.

Vậy ASUS Ascent GX10 sẽ dành cho ai?


  • Nhà phát triển AI & nhà nghiên cứu: Phát triển, tinh chỉnh và kiểm thử các mô hình AI trên máy cá nhân trước khi triển khai lên cloud.
  • Sinh viên & giáo dục: Học tập về AI một cách trực tiếp mà không cần truy cập các máy chủ đắt tiền.
  • Doanh nghiệp: Triển khai AI cục bộ để xử lý dữ liệu nhạy cảm mà không cần gửi lên cloud.
  • Edge Computing: Chạy AI inference gần người dùng, giảm độ trễ và tăng bảo mật dữ liệu.
  • Nghiên cứu khoa học: Chạy các mô phỏng và tính toán phức tạp trực tiếp trên bàn làm việc.

Tạm thời là vậy ha, để mình xem có làm được gì với Ascent GX10 nữa không.

Sản phẩm được phân phối bởi Thế giới máy chủ, anh em cần có thể tham khảo tại đây nha.

31 bình luận

Xu hướng

Cài được win 11 dùng làm kế toán thì quá đẹp 😁
@Nguyễn Bình FM Ôi, bạn bỏ 160 củ ra rồi về cài Windows để làm kế toán ư??? Bạn giàu thế
Bằng 1 con sh160 limited . Giá mắc hơn cả Nvidia
Người OCD thích điều này
8883357-unbox-ASUS-Ascent-GX10-pnghuy-14.jpg
8883346-unbox-ASUS-Ascent-GX10-pnghuy-8.jpg
@Kim L rất là thẳng 😁
Chịu ! Hồi em làm luận văn, có viết cái thuật toán Hidden-Markov, cơ sở của máy học, mà bây giờ cũng không hiểu sao nó build lên mấy tầng mà được như ChatGPT. Còn phần cứng là hoàn toàn ngu.
Anonymox
TÍCH CỰC
6 ngày
con này tốc độ thọt mà cái giá thì trên trời, bỏ bớt số 1 đi thì hợp lý
@Anonymox Nhờ con Ryzen Max 395+ nên mới có con này đấy.
Chứ không ông Huang còn muốn vắt tiền VRAM lâu dài cơ.
Anonymox
TÍCH CỰC
5 ngày
@Dr.Son hiệu năng tương đương nhưng giá gấp đôi, chả hiểu con này mục đích làm gì nữa
@Anonymox Con này mạnh hơn bác ạ, tùy tác vụ mà có thể mạnh hơn gấp đôi hoặc vài chục % đấy.
Nó được support tốt hơn về AI vì là hàng NVIDIA
Nhưng con 395+ lại có lợi thế cài được windows.
Anonymox
TÍCH CỰC
4 ngày
@Dr.Son có thể nó mạnh hơn chút xíu thôi, nhưng không ăn thua lắm bạn ơi, con này dựa trên 5070, mình chạy 5070Ti 1 thời gian phải bán đi vì chậm & driver ubuntu lỗi thi thoảng lại crash, 3090 vẫn là best p/p. Được cái là con này chạy nvidia driver, dễ tương thích hơn, nhưng giá vẫn không mê được
So sánh “NVIDIA DGX Spark vs 4× RTX 5090”

Cấu hình DGX Spark:

CPU ARM 20 nhân (10× Cortex X925 + 10× Cortex A725).

128 GB unified memory, SSD 4 TB.

Tích hợp chip GB10 Superchip.

Hoạt động cực êm, nhỏ hơn cả bàn tay, gần như không tiếng quạt.

Chạy Ubuntu 24.04 LTS, có sẵn CUDA, driver, Llama.cpp cài sẵn.

Cấu hình hệ thống 4× RTX 5090 (Jarvis server):

CPU Intel Sapphire Rapids, 112 luồng, RAM 512 GB DDR5.

4 GPU RTX 5090 (32 GB GDDR7 mỗi chiếc, tổng 128 GB VRAM).

Tiêu thụ điện ~2.500W tổng hệ thống.

Chi phí phần cứng đầy đủ khoảng 15–17 nghìn USD.

So sánh hiệu năng:

Băng thông bộ nhớ: RTX 5090 vượt trội (1.792 GB/s vs 273 GB/s trên Spark).

Khả năng xử lý mô hình:

DGX Spark chạy được mô hình 200 tỷ tham số (Q4), ghép 2 máy đạt 400B.

1 RTX 5090 chỉ chạy ~70 tỷ tham số, 4 GPU hợp lại tương đương Spark về dung lượng.

Kết quả benchmark (Llama.cpp):

RTX 5090 nhanh gấp 2,5–3 lần trong suy luận (inference).

DGX Spark ~70 tokens/s, RTX 5090 ~200 tokens/s.

Với mô hình lớn (GPT-OSS 120B, GLM Air), Spark vẫn thua đáng kể, nhất là tốc độ sinh token.

Ưu điểm DGX Spark:

Rất nhỏ gọn, siêu yên tĩnh, tiết kiệm điện.

“AI supercomputer trên bàn làm việc” đúng nghĩa, sẵn sàng chạy ngay khi mua.

Hạn chế DGX Spark:

Băng thông bộ nhớ thấp → tốc độ inference chậm.

Tản nhiệt yếu, có thể giảm hiệu suất khi tải nặng.

Không phù hợp cho người cần tốc độ sinh token cao hoặc mô hình lớn.

Kết luận:

DGX Spark phù hợp cho nhà nghiên cứu, học tập, hoặc môi trường cần tiết kiệm điện, yên tĩnh, dễ triển khai.

Hệ thống 4× RTX 5090 phù hợp cho AI inference chuyên nghiệp, đòi hỏi hiệu năng cao.

Nếu ưu tiên tốc độ, chọn 5090 rig; nếu ưu tiên gọn nhẹ, tiện lợi, chọn DGX Spark.
sản phẩm đặc thù quá, mình xem cho biết thôi chứ chắc ko bao giờ mua mìnmình, nhưng sẽ ghi nhớ để sau này có ai hỏi chỉ ng ta he he , cám ơn mod
@Nam Air Hihi cám ơn anh
Nhìn thông số thì đẹp nhưng tản nhiệt kiểu này khi train model chắc chạy được 1/10 công suất là crash hệ thống, cho nó train 1 model 500 epoch không biết phải tạm dừng bao nhiêu lần để xong hết 500 epoch, nói chi đến mô hình ngôn ngữ lớn, vứt, thà mua 2 con 5090 mode tản nhiệt nước dùng fp16 còn hiệu quả hơn
@Dr.Son uh tại nhiều người cứ so với 2 con 5090 luôn chứ, nên mình mới nói thế
@hgtvn Tuy khác mà giống, vì con 5090 cũng có nhiều người nhắm dùng để chạy AI nhưng vẫn thọt VRAM.
Cho nên so cũng không hẳn là không hợp lý.
Để có 128Gb VRAM cần tới 4 con 5090 + dàn Rig siêu khủng.
Nói chung nó có giá trị ở chỗ giúp người ta tiếp cận được AI ở mức giá hợp lý (hơn 100tr) chứ không cần phải đầu tư tới 700tr mới chạy được các mô hình hơn 120 tỷ tham số.
Có bác Mod tinhte đầu tư dàn chạy AI tới 500tr mà còn chưa chạy được cái mô hình 120 tỷ tham số của OpenAI =))
Bởi vậy mới thấy con này ngon.
Con HX 395+ của AMD đã chạy cái mô hình 120 tỷ tham số kia rất mượt, con này nó mạnh hơn và được tính hợp cả hỗ trợ giải mã phần cứng cho nên lại càng sắc bén.
Anonymox
TÍCH CỰC
5 ngày
@Dr.Son 500tr mà không chạy được got-oss:120b thì quá lởm, 4 cái GPU 3090Ti là đủ chạy rồi, thêm bộ case chắc tầm $5K
@Anonymox Tại ổng ko đủ kinh nghiệm build máy nên thế.
Cấu hình thì rất xịn, nhưng lại ko ngon cho AI.
Gặp tụi bán hàng không có kiến thức về AI và cũng chả có tâm nữa.
tadaden
ĐẠI BÀNG
5 ngày
nhìn mi nhon phết
Chuyên gia AI hả mod
Quan trọng là chơi game AAA dc ko 😆
@kl2991 câu hỏi hợp lý
@kl2991 ASUS Ascent GX10 được thiết kế và tối ưu hóa chủ yếu cho Trí tuệ Nhân tạo với card NVIDIA GB10 Grace Blackwell Superchip và chạy Ubuntu Linux. Cấu trúc CPU ARM, không phải x86 / x64.
nhìn gọn và ít dây nhợ là thích rồi

Xu hướng

Bài mới








  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2025 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: 70 Bà Huyện Thanh Quan, P. Xuân Hoà, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép cung cấp dịch vụ MXH số 134/GP-BVHTTDL, Ký ngày: 30/09/2025