RTX 5070 là một chiếc GPU cực kỳ đặc biệt trong số những chiếc RTX 50 Series mà Nvidia cho ra mắt từ đầu năm đến giờ. Từ lúc cấu hình phần cứng được công bố cho tới hiện tại, mình luôn đứng trước câu hỏi rằng liệu với mức giá rẻ, phần cứng thuần vật lý có giới hạn, liệu kiến trúc cùng loạt công nghệ mới sẽ giúp giấc mơ bình dân hóa 4K gaming có trở thành hiện thực? Trong bài viết này, mình sẽ đi trả lời câu hỏi đó với chiếc RTX 5070 Founder Edition nhé.
RTX 5070 được trang bị kiến trúc GeForce Blackwell - thế hệ RTX thứ 4 của Nvidia, tiếp nối những cải tiến của dòng GPU này từ khi ra mắt hồi 2010 với sự kết hợp giữa công nghệ ray tracing theo thời gian thực và đồ họa raster 3D truyền thống. Điểm đặc biệt trên Blackwell chính là tăng cường khả năng đồ họa bằng công nghệ neural rendering, cho phép GPU sử dụng AI để tạo ra frame hình. Một cách đơn giản, công nghệ này đẩy DLSS tiến thêm một bước, thêm một cách tiếp cận khác để tăng cường khung hình thay vì chỉ dùng AI để tái tạo chi tiết từ frame đã được upscale dựa trên dữ liệu huấn luyện, khung hình trước đó và các vector chuyển động.
Với RTX 5070, trái tim của nó chính là con GB205 được phát triển dựa trên tiến trình 5nm, phát triển dựa trên tiến trình TSMC Nvidia 4N 5nm được tối ưu riêng và đánh dấu lần đầu tiên con chip này được trang bị cho card RTX. GB 205 có diện tích die 263 mm2 với 31,1 tỷ bóng bán dẫn. Đây được đánh giá là một bước tiến trong kỹ thuật gia công khi có thể nhét một lượng lớn bán dẫn vào diện tích nhỏ như thế.
Sơ một chút về kiến trúc Blackwell của Nvidia RTX 5070 Founder Edition
RTX 5070 được trang bị kiến trúc GeForce Blackwell - thế hệ RTX thứ 4 của Nvidia, tiếp nối những cải tiến của dòng GPU này từ khi ra mắt hồi 2010 với sự kết hợp giữa công nghệ ray tracing theo thời gian thực và đồ họa raster 3D truyền thống. Điểm đặc biệt trên Blackwell chính là tăng cường khả năng đồ họa bằng công nghệ neural rendering, cho phép GPU sử dụng AI để tạo ra frame hình. Một cách đơn giản, công nghệ này đẩy DLSS tiến thêm một bước, thêm một cách tiếp cận khác để tăng cường khung hình thay vì chỉ dùng AI để tái tạo chi tiết từ frame đã được upscale dựa trên dữ liệu huấn luyện, khung hình trước đó và các vector chuyển động.

Với RTX 5070, trái tim của nó chính là con GB205 được phát triển dựa trên tiến trình 5nm, phát triển dựa trên tiến trình TSMC Nvidia 4N 5nm được tối ưu riêng và đánh dấu lần đầu tiên con chip này được trang bị cho card RTX. GB 205 có diện tích die 263 mm2 với 31,1 tỷ bóng bán dẫn. Đây được đánh giá là một bước tiến trong kỹ thuật gia công khi có thể nhét một lượng lớn bán dẫn vào diện tích nhỏ như thế.
Trên GB205, chúng ta vẫn có kiến trúc phân cấp quen thuộc mà Nvidia theo đuổi, tuy nhiên được trang bị giao tiếp PCI-Express 5.0 x16, lần đầu tiên được trang bị bộ nhớ GDDR7 12GB với bus 192 bit, tốc độ 28 Gbps, băng thông 672GB/s, tăng 34% so với RTX 4070 vốn chỉ sử dụng GDDR6X với 21 Gbps và băng thông chỉ 504 GB/s. Ngoài ra chúng ta còn có bộ AMP hoàn toàn mới với nhiệm vụ phân bổ tài nguyên AI trên GPU và bộ giải mã - mã hóa NVENC/NVEDC thế hệ 9, hỗ trợ mã hóa AVI 4:2:2 và HECV với hiệu suất xử lý video được cải thiện hơn. Đồng thời, RTX 5080 cũng được trang bị cache L2 với dung lượng 64MB nhằm tăng tốc độ truy xuất dữ liệu.

Đào sâu hơn vào cấu trúc, bên trong GB205 là 6144 nhân CUDA, 48 nhân RT thế hệ 4 và 192 nhân Tensor thế hệ 5 cùng 80 nhân ROP. Các nhân này được tổ chức thành 48 cụm SM, tăng so với con số 46 cụm tren RTX 4070. Toàn bộ con chip có xung nhịp cơ sở là 2.16 GHz và boost 2.51 GHz, mang lại khả năng tính toán 30,9 TFLOPS với các phép tính FP32. Với cấu hình và cách đặt tên này, GB205 sẽ là con chip xếp thứ 3 trong số những con chip kiến trúc Blackwell mà Nvidia ra mắt, xếp sau lần lượt GB203 (trên 5080 và 5070Ti) và GB202 vốn được trang bị trên 5090.
Một điểm quan trọng khác trên GB205 chính là TBP với 250W, cao hơn 25% so với con số 200W trên 4070. Thay đổi này sẽ dễ hiểu để có thể đáp ứng được kiến trúc mới được cải tiến cũng như vận hành bộ nhớ GDDR7 với băng thông lớn hơn rất nhiều so với trước đây.

Các Tensor thế hệ 5, hỗ trợ định dạng FP4 1/8 precision nhằm tối ưu hóa tốc độ các tác vụ AI, tăng thông lượng gấp 32 lần so với nhân Tensor kiến trúc Volta, tích hợp bộ xử lý AI AMP để tối ưu chạy đồng thời các tác vụ AI và đồ họa mà không làm giảm hiệu suất của nhau. Đối với các nhân RT thế hệ 4, Nvidia cho biết họ đã cải thiện hiệu suất xử lý ray tracing và path tracing, tích hợp bộ Mega Geomatry để xử lý các vật thể với số lượng đa giác cực cao và bộ xử lý giao điểm cụm tam giác nhằm cải thiện cách GPU xử lý các cấu trúc hình học phức tạp.
Một số công nghệ khác có thể kể tới trên RTX 5070 chính là việc cải thiện khả năng quản lý năng lượng thông minh bằng clock gating, power gating và rail gating. Ngoài ra xung nhịp cũng được điều chỉnh ở cấp độ từng SM nhằm giảm mức tiêu thụ điện tức thời nhưng không ảnh hưởng tới hiệu suất tổng thể của hệ thống. Ngoài ra, toàn bộ RTX 50 series cũng được hỗ trợ DisplayPort 2.1 cũng như HDMI 2.1.

Quảng cáo
Một kỹ thuật mới quan trọng khác trên RTX 50 series nói chung và RTX 5070 nói riêng chính là Neural Rendering - một bước tiến mới trong thuật toán dựng hình. Từ hơn 20 năm qua, thế giới công nghệ đã trải qua nhiều bước tiến quan trọng, từ shader lập trình, tới HLSL, shader hình học, shader tính toán, ray tracing như khoảng 5 naw qua và bây giờ là Neural Shader trên kiến trúc Blackwell.
Bằng cách hợp nhất hoạt động giữa Cooperative Vector API trong DirectX mà Microsoft vừa phát hành cho phép truy cập vào các nhân Tensor trong API đồ họa và ngôn ngữ shading mới, Neural Rendering cho phép các nhà phát triển có thể tích hợp sâu kỹ thuật mới vào pipline truyền thống. Kết quả cuối cùng là một hệ thống dựng hình hoàn toàn mới, ít tốn bộ nhớ hơn khi xử lý vật liệu phức tạp theo thời gian thực. Từ đó, các sắc thái màu sắc của vật liệu sẽ được tái tạo hiệu quả hơn, chân thực hơn bao giờ hết.

Một điểm cực kỳ quan trọng khác trên RTX 5070 chính là DLSS 4, không chỉ thuần túy là tạo ra thêm nhiều khung hình mà còn là nền tảng cho những tính năng phụ khác. Bằng việc sử dụng kiến trúc deep learning Transformer thay cho RNN trước đó, đồng thời tăng gấp đôi số lượng tham số, tối ưu hiệu suất tính toán lên gấp 4 lần và cải thiện chất lượng hình ảnh đầu ra, tăng cường hiệu suất Ray Reconstruction, các tựa game AAA hoặc các tác vụ nặng đồ họa trước đây sẽ chạy mượt mà ở mức FPS chưa từng thấy trước đây. Trên RTX 50 series, Nvidia đã trang bị một phần cứng riêng nằm trong Display Engine để đảm bảo DLSS 4 hoạt động mượt mà.

Một điểm khác nữa chính là Nvidia Reflex mới. Nếu như trước đây Reflex là một phần không thể thiếu để giảm độ trễ lên tới 50% khi hoạt động với DLSS 3 thì giờ đây với DLSS 4, nó có thể giảm độ trễ lên tới 75%.
Quảng cáo
Thông tin chi tiết về Nvidia RTX 5070 Founder Edition

Bên cạnh có thiết kế và hoàn thiện cực kỳ đẹp, sắc xảo như những chiếc card founder edition khác thì điểm ấn tượng của 5070 FE chính là kích thước nhỏ gọn của nó.

Về kích thước các cạnh, nó chỉ bằng cỡ một nửa so với 2 mẫu card dòng cao hơn là 5080 và 5090 FE. Mình để thử 4080FE vào bên dưới để các bạn dễ hình dung độ nhỏ gọn của chiếc 5070 FE này nhe.

Đồng thời, 5070 FE chỉ chiếm vỏn vẹn 1 slot PCIe trên bo, rất nhỏ gọn và mình nghĩ hoàn toàn có thể nằm trên các case SFF một cách dễ dàng.

Tất nhiên, cân nặng cũng giảm đi đáng kể. Nhờ đó mà chúng ta có thể thoải mái gắn card vào mà không cần cây chống như nhiều mẫu card kích thước lớn hơn khác.

Tương tự như các mẫu card khác, RTX 5070 FE cũng sử dụng cổng cấp nguồn 16 chân tiêu chuẩn và nhờ đó, việc cấp nguồn cho nó cũng sẽ không quá phức tạp khi nâng cấp từ các dòng trước.

Ở phiên bản 5070 FE này thì phần dòng chữ Geforce RTX sẽ không phát sáng.
Kết quả hiệu năng
Mình thử nghiệm Nvidia RTX 5070 Founder Edition lên cấu hình:
- Intel Core i9-14900K
- Mainboard ROG STRIX Z790-E GAMING WIFI
- Tản nhiệt AIO NZXT Kraken Elite 360 RGB
- RAM Kingston Kingston FURY Renegade DDR5-8400 48 GB
- Samsung SSD 980 PRO with Heatsink 1TB
- Nguồn ADATA XPG FUSION 1600 TITANIUM
- Màn hình Asus ROG Swift PG32UCDM 32" OLED 4K 240Hz
- Driver: NVIDIA phiên bản mới nhất (tại thời điểm thử nghiệm)
Mình test trong điều kiện nhiệt độ phòng khoảng 28 độ, thùng máy mở.

Đầu tiên là điểm số 3D Mark DLSS, có thể thấy rõ chênh lệch giữa khi bật và tắt DLSS lớn tới mức độ nào.

Kết quả 3DMark Timespy Extreme

Điểm số trong bài test V-ray RTX

Điểm số bài test Furmark OpenGL MSAA off với fullscreen 4K. Mình thử chạy liên tục 20 phút, đỉnh điểm cao nhất 5070 FE đạt 75 độ C, toàn card ăn không quá 260W điện.

Kế đến, mình thử render một project source video RAW thời lượng khoảng 32 giây trong Davinci Resolve, định dạng đầu ra MP4 với Codec H265, frofile 4:4:4 10 bit, thời gian chỉ có 21 giây là xong. Rất ấn tượng.

Tiếp theo là thử nghiệm game. Mình sẽ trung thành với độ phân giải 4K và bật max setting ở mọi tựa game, tất cả các tùy chọn chất lượng hình ảnh, bao gồm cả Path Traced Indirect Lighting đều Ultra hoặc High nếu không có Ultra. Tất cả nhằm tạo sự thống nhất để các bạn dễ so sánh so với các mẫu card dòng cao hơn trong series RTX 50 series mà bọn mình đã thử nghiệm bữa giờ, đồng thời cũng thử đưa mẫu 5070 này tới giới hạn xem nó sẽ thể hiện tới đâu.

Các thử nghiệm sẽ lần lượt là tắt DLSS để chạy sức mạnh phần cứng raster thuần, sau đó bật DLSS và bắt đầu tăng dần các mức độ Multi Frame Generation từ 2x, 3x đến 4x, tương đương với 1, 2 và 3 khung hình được model transformer tạo ra giữa các khung hình gốc. Kết quả nhìn chung, DLSS 4 thực sự đóng vai trò cực kỳ quan trọng đối với 5070. Với sức mạnh phần cứng vật lý rất giới hạn so với các mẫu card cao cấp hơn thuộc RTX 50 Series, chiếc card tầm cận trung nếu chỉ dựa vào đó sẽ khó có thể chạm vào độ phân giải 4K trên 60Hz.
Tuy nhiên, DLSS 4 là giải pháp không thể phù hợp hơn. Hầu hết các tựa game AAA mình thử nghiệm với setting cao nhất có thể tại 4K đều đạt FPS ở mức trên 120 FPS, riêng chỉ có sát thủ phần cứng Alan Wake 2 thì FPS "chỉ" có đâu đó 80 FPS ở mức cấu hình đồ họa cao nhất và đây là quá đủ để có thể thưởng thức game một cách trọn vẹn trên 5070 FE.

Vào thời điểm Nvidia ra mắt 50 series hồi đầu năm, tổng số lượng game có hỗ trợ DLSS 4 là 75, tuy nhiên con số đó liên tục tăng cùng với những tựa game ra mắt từ hôm đấy đến nay. Tới hiện tại, hầu hết các tựa game mà mình muốn chơi đều có hỗ trợ. Đơn cử như Monster Hunter Wilds nóng hổi cách đây vài ngày, DLSS 4 đã có thể hoạt động để đưa tốc độ khung hình gần chạm mốc 120 fps (bản cập nhật game thứ 2 kể từ lúc ra mắt), đảm bảo nhu cầu đi săn được diễn ra thoải mái nhất trên chiếc card nhỏ gọn này.

Về nhiệt độ ở thời điểm chạy full tải với các tác vụ nặng nề nhất, phần mềm đo được nhiệt độ lúc nóng nhất trên Nvidia RTX 5070 Founder Edition lên tới 81 độ C và lúc này toàn card ăn khoảng 258W điện. Trong khi đó ở trạng thái idle, card chỉ ăn khoảng 6.7W điện, riêng chip GPU ăn 2.6W và khi đó nhiệt độ khoảng 38 độ C, đo được từ phần mềm TPU GPU-Z.
Tạm kết

Với mức giá đề xuất là 549 đô la, RTX 5070 FE rẻ hơn 50 đô so với con số 599 đô la khi RTX 4070 FE ra mắt. Đồng thời, nhờ sử dụng kiến trúc Blackwell mới trên tiến trình mới cùng loạt những bổ sung công nghệ mới, từ pipeline dựng hình, xử lý khối cho tới quản lý điện năng, đặc biệt là DLSS 4 đã giúp 5070 FE chứng minh hiệu năng render 3D tăng đến 1.9 lần và hiệu năng raster thuần túy tăng 20% so với thế hệ trước là 4070.
Nếu so với 3070 trước đây, mức tăng này sẽ là hơn 3 lần và hiệu năng raster của 5070 FE cũng cao hơn 65%, biến nó trở thành một nâng cấp xứng đáng từ RTX 30 series Ampere trước đây. Với nhu cầu các tác vụ GenAI, nhờ sự hỗ trợ FP4 của kiến trúc Blackwell, hiệu suất cũng tăng lên gấp 3 lần so với RTX 4070. Đặc biệt, với mức giá của nó và những gì mà nó mang lại khi chơi gần như mượt hầu hết các tựa game AAA ở độ phân giải 4K, đây thực sự là chiếc GPU dễ chịu nhất mà chúng ta có thể dùng để chạm tới giấc mơ 4K gaming.