Lúc 8h tối ngày 28/2 theo giờ Việt Nam, gần hai tháng kể từ khi hội chợ điện tử tiêu dùng CES 2025 diễn ra, đi kèm với đó là keynote giới thiệu các sản phẩm mới của hãng, cuối cùng thì AMD cũng đã có livestream chia sẻ chi tiết kiến trúc chip xử lý đồ họa chơi game RDNA 4 mới nhất của họ.
Và giống như những thông tin ngắn gọn được công bố hồi đầu tháng 1 vừa rồi, hai sản phẩm đầu tiên thuộc Radeon RX 9000 series sẽ là những mẫu card đồ họa nhắm tới thị trường tầm trung, RX 9070 với giá khuyến nghị 549 USD, và RX 9070 XT với giá khuyến nghị 599 USD.
Chỉ vỏn vẹn hai mẫu card đồ họa gaming, dễ khiến chúng ta đi đến câu hỏi rằng RX 9080 hay thậm chí là 9090 XT đâu? Nhưng nếu anh em còn nhớ cách đây ít lâu, đích thân anh Jack Huynh, phó chủ tịch mảng điện toán và đồ họa tiêu dùng của AMD đã khẳng định rồi. Với RDNA 4, AMD sẽ tập trung phục vụ nhu cầu của số đông, phân khúc mà họ nghĩ rằng sẽ giúp tập đoàn tăng trưởng thị phần ở tốc độ ổn định và nhanh nhất.
Ở thời điểm hiện tại, quyết định đó đồng nghĩa với việc, AMD sẽ tập trung vào phân khúc mà phần đông bỏ tiền ra mua card đồ họa về chơi game. Không giống như Nvidia, AMD không có tiềm lực để thực sự phát triển đủ mọi sản phẩm ở mọi phân khúc, bao gồm cả high-end, cùng lúc đủ sức cạnh tranh được với Nvidia. Vậy là với mức giá 600 USD đổ xuống, AMD nhắm tới thị trường gaming cao cấp với RX 9070 và RX 9070 XT, rồi sau đó sẽ là thị trường phổ thông.
Và giống như những thông tin ngắn gọn được công bố hồi đầu tháng 1 vừa rồi, hai sản phẩm đầu tiên thuộc Radeon RX 9000 series sẽ là những mẫu card đồ họa nhắm tới thị trường tầm trung, RX 9070 với giá khuyến nghị 549 USD, và RX 9070 XT với giá khuyến nghị 599 USD.
Chỉ vỏn vẹn hai mẫu card đồ họa gaming, dễ khiến chúng ta đi đến câu hỏi rằng RX 9080 hay thậm chí là 9090 XT đâu? Nhưng nếu anh em còn nhớ cách đây ít lâu, đích thân anh Jack Huynh, phó chủ tịch mảng điện toán và đồ họa tiêu dùng của AMD đã khẳng định rồi. Với RDNA 4, AMD sẽ tập trung phục vụ nhu cầu của số đông, phân khúc mà họ nghĩ rằng sẽ giúp tập đoàn tăng trưởng thị phần ở tốc độ ổn định và nhanh nhất.
Ở thời điểm hiện tại, quyết định đó đồng nghĩa với việc, AMD sẽ tập trung vào phân khúc mà phần đông bỏ tiền ra mua card đồ họa về chơi game. Không giống như Nvidia, AMD không có tiềm lực để thực sự phát triển đủ mọi sản phẩm ở mọi phân khúc, bao gồm cả high-end, cùng lúc đủ sức cạnh tranh được với Nvidia. Vậy là với mức giá 600 USD đổ xuống, AMD nhắm tới thị trường gaming cao cấp với RX 9070 và RX 9070 XT, rồi sau đó sẽ là thị trường phổ thông.

Hay như chính cái slide mà AMD chia sẻ, hai mẫu card đồ họa RX 9070 và 9070 XT là những sản phẩm ở phân khúc giá mà những mẫu card đồ họa gaming hiện giờ được tạo ra phục vụ thị trường gamer với màn hình độ phân giải 1440p, nhưng chúng sở hữu sức mạnh đủ để chơi game ở độ phân giải 4K. Và hãy bắt đầu với sản phẩm đắt tiền hơn, AMD Radeon RX 9070 XT.
Thông số kỹ thuật RX 9070/9070 XT

Trên PCB của Radeon RX 9070 XT là GPU Navi 48 XT phiên bản đầy đủ, không thiếu compute unit nào trong tổng số 64 CU, tức là 4096 nhân xử lý. Cùng với 64 compute unit là 128 ROPs, 64 cụm nhân tăng tốc xử lý ray tracing và 128 cụm nhân tăng tốc xử lý thuật toán AI. Phiên bản reference mà AMD tạo ra sẽ vận hành GPU Navi 48 XT này ở xung nhịp boost 2970 MHz, tức là gần 3 GHz. So sánh với Radeon RX 7800 XT và Radeon RX 7900 GRE, tổng tiêu thụ điện năng của RX 9700 XT cao hơn khoảng 17%, ở ngưỡng 304W.
Trên PCB của mẫu card đồ họa này sẽ là 16GB GDDR6, băng thông chip nhớ 20 Gbps, vận hành thông qua bus interface 256-bit, tạo ra băng thông bộ nhớ 640 GB/s. Kết hợp với nó là 64MB bộ nhớ đệm Infinity Cache thế hệ 3, tăng thêm một phần băng thông dữ liệu gửi vào GPU để xử lý.
Card chạy ở băng thông của chuẩn kết nối PCIe 5.0 x16. Phiên bản reference, như trong hình trên, vận hành với 2 chân 8-pin lấy thêm điện từ nguồn. Vấn đề duy nhất là AMD sẽ không bán những phiên bản RX 9070 XT MBA (Made By AMD) như những năm trước tại thị trường nước ngoài nữa. Có lẽ chúng sẽ chỉ là card reference gửi cho các bên báo giới và các kênh đánh giá linh kiện PC.

Còn trong khi đó, AMD Radeon RX 9070 trang bị GPU Navi 48 XL, 56 compute unit, tức là 3584 nhân xử lý. Trên GPU là 56 cụm tăng tốc xử lý ray tracing thời gian thực, 112 cụm nhân tăng tốc xử lý thuật toán AI, chạy ở xung nhịp 2520 GHz. Trên PCB của mẫu card đồ họa này vẫn là 16GB GDDR6 20 Gbps, kết hợp với bus interface 256-bit, cùng 64MB Infinity Cache 3rd Gen, tạo ra băng thông bộ nhớ giống hệt như RX 9070 XT.
Quảng cáo
So sánh hiệu năng
Những thông tin mà AMD chia sẻ mô tả một sản phẩm thậm chí còn vượt qua được sức mạnh của một số sản phẩm giá đắt hơn nhiều, nhưng ra mắt một hoặc hai thế hệ trước, chẳng hạn như RX 6900 XT hay RTX 3090. Cụ thể hơn, những slide mà AMD chia sẻ thể hiện hiệu năng trung bình của RX 9070 XT như thế này:
- So với RX 6900 XT (4K Max đồ họa): Mạnh hơn trung bình 51%
- So với RX 7900 GRE (4K max đồ họa): Mạnh hơn trung bình 42%
- So với RTX 3090 (4K max đồ họa): Mạnh hơn trung bình 26%
- So với RX 7900 GRE (1440p max đồ họa): Mạnh hơn trung bình 38%


Chỉ so sánh với Radeon RX 7900 GRE, phiên bản Golden Rabbit Edition, ở độ phân giải 4K, chỉnh hết các tùy chọn đồ họa lên ngưỡng cao nhất, thì trung bình RX 9070 XT đem lại tốc độ khung hình cao hơn 42%. Lấy ví dụ cụ thể, Cyberpunk 2077, 4K Ultra không có ray tracing, tốc độ khung hình cao hơn 44%.
Còn khi thử nghiệm với độ phân giải 1440p, RX 9070 XT mạnh hơn chừng 38%. Nhưng trong một số trường hợp, chẳng hạn như F1 24, RX 9070 XT có tốc độ khung hình cao hơn tới 68% ở độ phân giải 1440p, Ultra + Ray Tracing, hoặc Black Myth Wukong, tác phẩm thực sự là điểm yếu của những thế hệ GPU trước của AMD, ở độ phân giải 1440p Ultra, tốc độ khung hình RX 9070 XT đem lại cao hơn tới 44%.
Đó là những gì AMD nói về hiệu năng của Radeon RX 9070 XT. Còn với phiên bản giá rẻ hơn 50 USD, RX 9070, dưới đây là những gì AMD đề cập:
Quảng cáo
- So với RX 6800 XT (4K Max đồ họa): Mạnh hơn trung bình 38%
- So với RX 7900 GRE (4K max đồ họa): Mạnh hơn trung bình 21%
- So với RTX 3080 (4K max đồ họa): Mạnh hơn trung bình 26%
- So với RX 7900 GRE (1440p max đồ họa): Mạnh hơn trung bình 20%


FSR 4, HYPR-RX và hiệu năng xử lý AI on device
Cũng có nhiều khả năng, để tạo ra được những cải thiện về mặt hiệu năng như vậy, người dùng RX 9070 XT và RX 9070 sẽ cần tới những công nghệ nâng độ phân giải hình ảnh render cho khớp với độ phân giải màn hình, FSR 4, kết hợp với cả Frame Generation. Chẳng hựn như trong Microsoft Flight Simulator 2024 hay Kingdom Come Deliverance 2. Điều này đồng nghĩa với việc game cũng phải hỗ trợ những công nghệ để Radeon RX 9000 series vận hành ở hiệu năng tối đa, thay vì chỉ có thuần túy rasterization truyền thống.

Một ví dụ khác là Warhammer 40K: Space Marine 2. Ở độ phân giải 4K, không bật FSR 4 cùng Frame Gen, game chỉ được 53 FPS. Bật lên thì được tới 182 FPS. Cái này khiến mình nhận ra hai điều. Thứ nhất là chưa cần bật FSR 4, RX 9070 XT đã được gần 60 FPS ở độ phân giải 4K rồi. Và thứ hai, giờ có lẽ benchmark không có phần nói riêng về những công nghệ như FSR hay DLSS chắc cũng không được nữa.

Cùng với đó, anh em muốn dùng card đồ họa để tăng tốc xử lý những mô hình AI, tạo sinh hình ảnh hay vận hành chatbot tham số thấp ngay trên hệ thống máy tính cá nhân của mình cũng sẽ có thể trải nghiệm được những cải thiện trong hiệu năng:


![[IMG]](https://photo2.tinhte.vn/data/attachment-files/2025/02/8655994_2025-02-28-3-27-08-1456x819.png)
Giá bán và ngày ra mắt
Ngày 6/3/2025, cả Radeon RX 9070 lẫn Radeon RX 9070 XT đều sẽ được bán ra thị trường cùng lúc, với mức giá khuyến nghị tại thị trường nước ngoài bắt đầu từ ngưỡng 549 và 599 USD. Và như đã nói, sẽ chỉ có những phiên bản custom do các nhà sản xuất OEM như Acer, Asus, Asrock, Gigabyte hay Sapphire, chứ không có phiên bản MBA reference.

Mức giá 599 USD của Radeon RX 9070 XT đặt sản phẩm này ở giữa Nvidia GeForce RTX 5070 và RTX 5070 Ti, vậy nên khi nó ra mắt, chắc chắn các bài đánh giá chi tiết mẫu card đồ họa này sẽ so sánh trực tiếp nó và RX 9070 với RTX 5070 và RTX 5070 Ti, thay vì so sánh với RX 6900 XT hay RTX 3080 như AMD đã làm trong sự kiện vài tiếng đồng hồ trước. Tuy nhiên với 16GB VRAM với kiến trúc RDNA 4, có thể AMD sẽ tạo ra được một sản phẩm thực sự đáng sở hữu đối với nhu cầu gaming.
Chi tiết kiến trúc RDNA 4
Mấy mục trên đây thiết nghĩ là những thông tin anh em quan tâm nhất. Còn chi tiết kiến trúc của thế hệ GPU RDNA 4, thế hệ GPU tiêu dùng phục vụ máy bàn, máy tính cá nhân và laptop cuối cùng trước khi AMD gộp cả RDNA tiêu dùng với CDNA máy chủ đám mây, trở thành kiến trúc hợp nhất UDNA, thì mình để đến cuối, anh em nào muốn theo dõi thì có thể đọc thêm, còn không thì cuộn xuống phần bình luận cũng được không sao cả.
Như đã đề cập ở đầu bài viết, RDNA 4 hiện tại chưa có sản phẩm flagship ở phân khúc high-end, dành riêng cho những người có tiền và chịu chơi. Nhưng điều đó không đồng nghĩa với việc, kiến trúc GPU này không sở hữu những thay đổi hoàn toàn mới để cải thiện trải nghiệm gaming.

Đối với RDNA 4, AMD đã tạo ra những thay đổi phần cứng để có được những cải thiện trải nghiệm như thế này:
- Tối ưu tối đa cho nhu cầu và tác vụ chơi game nặng
- Cải thiện hiệu quả điện toán và xử lý rasterization
- Thay đổi lớn trong hiệu năng xử lý ray tracing thời gian thực
- Hỗ trợ tốt hơn trong việc xử lý machine learning hiệu năng cao
- Cải thiện hiệu quả băng thông bộ nhớ cho mọi tác vụ
- Cải thiện hiệu năng xử lý đa phương tiện cho gamer và content creator
So sánh với RDNA 2, GPU kiến trúc RDNA 4 tạo ra hiệu năng xử lý rasterization, biến vector thành điểm ảnh trên màn hình game của anh em cao hơn gần gấp đôi. Hiệu năng xử lý ray tracing tăng gần 2.5 lần. Xử lý tính toán ma trận số thực dấu phẩy động FP16 tăng 3.5 lần.

Compute Unit kiến trúc mới giờ bao gồm SIMD32 Vector Unit đôi, cũng như hỗ trợ Enhanced Matrix Operations, bao gồm:
- 2x-16b & 4x-8b/4b dense matrix rates
- 4:2 Structured Sparsity for +2x rate
- New 8b Float Data Types
- Matrix load w/transpose
Kiến trúc RDNA 4 cũng đi kèm những cải thiện trong xử lý shading, thanh ghi được điều chuyển chủ động. Khi cần, GPU có thể xin thanh ghi nếu cần. Sau khi xử lý xong, thanh ghi sẽ được trả lại, và phần mềm sẽ theo dõi cũng như kiểm soát tình trạng xử lý. Kết quả là độ trễ bộ nhớ sẽ được giảm, và hiệu năng của những nhân xử lý tăng đáng kể.

Kế đến, là cụm nhân xử lý ray tracing thế hệ thứ 3, tăng gấp đôi tần suất tính toán dò tia và tương tác giữa các tia. Những nhân ray tracing này sở hữu cải thiện hiệu năng cao nhất trong số những cụm nhân xử lý trên GPU. Trên những nhân ray tracing của GPU RDNA 4 là những cải thiện ở những khía cạnh:
- Gấp đôi cụm xử lý box & triangle intersection
- Hardware instance transforms
- Cải thiện quản lý stack ray tracing
- Nén dữ liệu BVH8
- Oriented Bounding Boxes
Với nhân xử lý ray tracing thế hệ mới, yêu cầu bộ nhớ để xử lý BVH (Bounding Volume Hierachy) sẽ giảm đáng kể. Trung bình, nhu cầu ứng dụng dung lượng bộ nhớ trên GPU RDNA 4 giảm tới 40% so với RDNA 3. Những compute unit trên GPU RDNA 4 cho phép tạo ra hiệu năng xử lý dò tia sáng nhanh gấp đôi so với RDNA 3, ở cùng xung nhịp và băng thông bộ nhớ.

Cùng với đó, là bộ xử lý Command Processor được cải tiến, với những bộ tăng tốc xử lý gói dữ liệu. Bộ nhớ đệm cũng được cải tiến, 64MB Infinity Cache thế hệ thứ 3, 8MB bộ nhớ đệm L2, và bộ nhớ đệm trên từng CU dung lượng 2MB. Dù rằng RDNA 4 vẫn chỉ hỗ trợ công nghệ chip nhớ GDDR6, nhưng chip nhớ được nâng cấp lên phiên bản băng thông 20 Gbps, 16GB VRAM chạy trên bus interface 256-bit.

Đối với tác vụ xử lý AI, AMD ứng dụng engine tăng tốc tính toán ma trận thế hệ thứ 3, cải thiện cả tần suất Tensor Dense Rate, hỗ trợ dạng số thực mới 8b float data, hỗ trợ Structured Sparsity, và hỗ trợ xử lý Super Resolution dựa trên mô hình machine learning.




Cũng nhờ cụm nhân xử lý AI này, mà khả năng xử lý ray tracing cũng như path tracing sẽ kết hợp với super resolution để tạo ra những khung hình game được xử lý tuần tự như thế này:




Đối với tác vụ xử lý đa phương tiện, cụm nhân Media Engine được thay đổi về thiết kế băng thông kép, nhân mã hóa/giải mã được thiết kế lại, tăng 25% hiệu năng xử lý những codec AVC, H.264, H.265, tăng gấp đôi băng thông xử lý codec AV1, tối ưu cho streaming game hình vừa nét nhưng dữ liệu thấp. Radiance Display Engine giờ hỗ trợ xuất tín hiệu hình ảnh chuẩn DisplayPort 2.1a, HDMI 2.1b, kết hợp với cụm xử lý scaling & sharpening mới.

Với tất cả những gì đề cập và liệt kê ở trên, tất cả chúng đều được đặt vào die GPU RDNA 4, tên gọi Navi 48. Trên die Navi 48 XT phiên bản đầu đủ là 4 shader engine, trên đó là những “Dual Compute Unit”. Mỗi cụm Dual Compute Unit bao gồm 2 CU, tức là 8 DCU, 16 CU trên mỗi shader engine. Tổng cộng, Navi 48 XT bao gồm 64 compute unit, 4096 stream processor/shader unit.
Trên mỗi Dual Compute Unit là 2 cụm tăng tốc tính toán Ray Tracing. Mỗi shader engine sẽ có 16 Ray Accelerator. Cũng trên mỗi DCU là 4 cụm nhân Matrix Acceleration Engines, tổng cộng trên GPU là 128 cụm tăng tốc tính toán ma trận.