Ở trụ sở Nvidia có một siêu máy tính chạy 24/7 trong 6 năm qua, chỉ để huấn luyện và hoàn thiện DLSS

P.W
17/1/2025 8:5Phản hồi: 21
EditEdit
Ở trụ sở Nvidia có một siêu máy tính chạy 24/7 trong 6 năm qua, chỉ để huấn luyện và hoàn thiện DLSS
Lẽ đương nhiên, là nhà sản xuất chip xử lý AI máy chủ đám mây đang chiếm trên 80% thị phần toàn cầu, Nvidia không thiếu những hệ thống siêu máy tính mà họ tự xây dựng và vận hành để phục vụ cho nhu cầu riêng của họ.

Điều chắc chắn thứ hai, là công nghệ nâng cấp độ phân giải hình ảnh game nhờ thuật toán deep learning của Nvidia, chạy trên những card đồ họa GeForce RTX luôn cần lượng dữ liệu huấn luyện ban đầu khổng lồ, cũng như hiệu năng xử lý mạnh hơn máy bàn hàng nghìn hàng vạn lần để thuật toán deep learning sau đó biết nó cần phải làm gì trong mỗi trò chơi anh em thưởng thức.

CES2025: Chi tiết Nvidia DLSS 4, Frame Generation khỏe gấp 3 đời trước, vẫn cứ là AI hữu ích nhất

Thành ra cũng không mấy bất ngờ khi nghe được tuyên bố của phó chủ tịch mảng nghiên cứu deep learning ứng dụng của Nvidia, Brian Catanzaro. Dưới đây là những chia sẻ của phó chủ tịch Catanzaro khi anh giới thiệu về thế hệ thứ 4 của công nghệ nâng cấp hình ảnh DLSS từ Nvidia. Những thay đổi và thậm chí là thử thách khi tạo ra DLSS 4 đều đã được chia sẻ tại sự kiện RTX Blackwell Editor's Day, trong khuôn khổ hội chợ điện tử tiêu dùng CES 2025.

Phó chủ tịch mảng nghiên cứu deep learning chia sẻ: “Làm cách nào chúng tôi có được những tiến bộ với DLSS trong những năm qua? Bạn biết đấy, DLSS tồn tại được 6 năm rồi, và đó là khoảng thời gian nơi chúng tôi liên tục nghiên cứu và cải thiện công nghệ. Thực tế thì ở đại bản doanh của Nvidia, chúng tôi có một siêu máy tính với vài nghìn GPU mới nhất và hiện đại nhất của chúng tôi, chạy 24/7, 365 ngày mỗi năm, liên tục trong vòng 6 năm qua để cải thiện DLSS.”


375755099-10107986320646379-1797301875118157708-n.jpg

Đồng ý là Deep Learning Super Sampling sẽ cần huấn luyện trên một hệ thống chỉ có những GPU với giá hàng chục nghìn USD mỗi chip, để thuật toán biết cách nội suy và tạo sinh những điểm ảnh mới, từ đó giúp những khung hình game có độ phân giải chỉ bằng một nửa hay đôi khi chỉ bằng một phần tư độ phân giải màn hình game của anh em.

Nhưng chắc chắn không thiếu những người nghĩ rằng, đội ngũ kỹ sư phát triển công nghệ DLSS mà anh em đang dùng hàng ngày hàng giờ trên card đồ họa Nvidia sẽ phải chia sẻ thời gian vận hành siêu máy tính để huấn luyện mô hình deep learning với các mảng nghiên cứu khác của Nvidia, chứ không phải mình họ được giành cả hệ thống vài nghìn GPU như vậy.

Chi tiết RTX 50, GPU Blackwell gaming của Nvidia: Tăng sức mạnh xử lý AI, kiến trúc thay đổi mạnh

Ấy vậy nhưng, dựa trên những gì DLSS 3 và DLSS 3.5 trình diễn từ năm 2022 tới nay, có một điều chắc chắn khác, đó là ngần ấy năm huấn luyện mô hình trên máy chủ đám mây vẫn là không đủ để tạo ra một mô hình AI hoàn hảo. Nếu không tin anh em cứ vào vài game chẳng hạn như Red Dead Redemption 2 hay Cyberpunk 2077, mở DLSS ở chế độ Performance chẳng hạn, rồi nhìn vào những đường dây điện bị nhòe trên màn hình như với RDR2, hay những mô hình nhân vật phụ cử động đến đâu là nhòe tới đó trong Cyberpunk 2077.

Điều đó chứng minh một điều rõ ràng, chỉ để mô hình AI học từ những tấm hình screenshot của game là không đủ.

Mwryq7xMMVEqdKEA2w4ff4.jpg

Về khía cạnh đó, phó chủ tịch Catanzaro chia sẻ thêm: "Đây là những gì chúng tôi làm trong quá trình huấn luyện mô hình AI. Chúng tôi sẽ phân tích những thất bại. Khi mô hình vận hành DLSS không làm được một tác vụ gì đó, mô hình tạo ra những hình ảnh có bóng mờ hay chớp lóa hay không nét. Và nhiệm vụ của chúng tôi khi ấy là tìm ra những lần xử lý lỗi như vậy trong những trò chơi chúng tôi dùng để huấn luyện mô hình AI, và tìm ra vấn đề, giải thích lý do vì sao mô hình AI lại tạo ra những sản phẩm, những điểm ảnh nội suy không lý tưởng như vậy.

Quảng cáo



Rồi sau đó, chúng tôi sẽ tìm ra cách để tối ưu tập dữ liệu hình ảnh game dùng để huấn luyện mô hình AI. Vì thế tập dữ liệu huấn luyện mô hình DLSS của chúng tôi luôn luôn được mở rộng. Khi tổng hợp dữ liệu huấn luyện mô hình vận hành DLSS, chúng tôi sẽ tìm những ví dụ mô tả hình ảnh đồ họa đẹp, và những vấn đề khó khăn mà DLSS sẽ phải giải quyết.

Những ví dụ đó được bỏ vào gói dữ liệu huấn luyện mô hình, rồi mô hình deep learning để vận hành DLSS lại được siêu máy tính huấn luyện một lần nữa. Mô hình đã được huấn luyện lại được đem ra thử nghiệm trên cả trăm trò chơi khác nhau. Quy trình ấy cứ lặp đi lặp lại."

CES2025: Nvidia Geforce RTX 50 series chính thức, Blackwell cho mọi nhà, bán ra ngày 30/1

Theo PCGamer
21 bình luận

Xu hướng

ông CEO Nvidia qua VN nhìn mấy cha vn phèn vl.
@Trần Độ Tài Tự nhục à
Dlss hay nhưng thay vì coi như nó là một tính năng phần mềm bổ trợ thì tiếc là nvidia lại chọn dlss làm trung tâm. Các nâng cấp thế hệ sau dần phụ thuộc nhiều vào dlss, và nvi dĩ nhiên ko hỗ trợ frame generation cho các đời card cũ. Giả sử nếu 3060 cũng có FG thì 4060 chắc gì đã hơn nhiều. Và cả thế hệ 5 nữa.
@AudioScience thì mình đã chi bạn diều kiện cụ thể rồi đó. laptop dòng content creators kèm sạc loanh quanh 150-180W, mình mới thấy bạn mới có vấn đề về đọc hiểu ấy. GPU minning, rồi data center ... cũng lấy lượng điện tiêu thụ làm tiêu chí lựa chọn.
Ngta so CPU các đời đều so cùng TDP, so GPU thì cũng so cùng TGP, bạn so khác TGP thì khác nào mình so máy gaming đời cũ với ultrabook đời mới rồi bảo đời mới nó cải lùi?
khi đã so 4xxx với 3xxx là lấy 2 sp có thật ra so, bạn ra điều kiện vô lý, không tưởng là 4xxx sx trên tiến trình 8mm là "cãi cùn", mình đưa giới hạn TGP vào cho nó có cùng điều kiện để so sánh, và giới hạn tgp này xuất hiện trên rất nhiều thiết bị (Kể cả laptop gaming mỏng nhẹ như dòng MSI THIN /Steal). Thậm chí giới hạn TGP ko chì xuất hiện trên mỗi laptop đâu. Bạn nên tìm hiểu nhiều thêm 1 tí đi nhé.
@iMi Shop Khác node tiến trình mà đòi so sánh hiệu năng ở cùng 1 mức tiêu thụ điện. Hahaha. Nếu mà nói như b ấy, muốn cùng điều kiện so sánh, 1 là bảo Nvi làm 4060 ở 8nm như 3060, 2 là làm 3060 ở 5nm như 4060 thì mình sẽ oke so sánh ở cùng mức tiêu thụ điện. Còn không thì đã khác kiến trúc, khác luôn tiến trình thì cứ bung lụa thôi, vốn dĩ đã không có điểm chung rồi. Ông đi lấy lợi thế của 4060 là node tiến trình nhỏ nên ở cùng mức tiêu thụ điện sẽ có hiệu năng tốt hơn đời cũ để làm cái tiêu chí so sánh bắt 3060 theo. Khôn như ông quê tôi đầy. Cái tui đang nói ở đây là so về raw performance, thì phải cho cả 2 con nó bung hiệu năng hết cỡ, bất kì ở mức tiêu thụ nào. Các bài test game so sánh card thì cũng thế thôi. Chứ giờ so 1 con 8nm với 1 con 5nm ở cùng mức ăn điện thì đương nhiên con 8nm chưa đánh đã thua, làm méo gì có cửa. Bảo dân trí thấp lại tự ái.
Cười vô mặt
@AudioScience Hình ảnh so sánh cũng đã post rồi, bạn xem ko hiểu mình cũng bó tay.
Mình ko bắt 3060 theo 4060 về giới hạn TGP, mà rất nhiều sản phẩm "thực tế" như laptop có 2 con này ở cùng TGP. Chứ chẳng ai làm 4060 ở 8nm hay 3060 ở 5nm như bạn "tưởng tượng" cả.
Nếu muốn so về kiến trúc giữa Ampere & Ada Lovelace, ngta lấy con high-end ra so bạn à, vậy mới bung đc hết khả năng của kiến trúc đó.
Chứ cái kiểu đặt tên 4080 rồi đổi thành 4070ti thì chung quy chỉ vì lợi nhuận thôi. Cái tên chỉ mang tính chất thương mại, thích đặt số bao nhiêu, rồi đổi thành số khác là do định hướng kinh doanh, bạn dùng để so sánh "kiến trúc" thì mình thấy mức độ am hiểu của bạn tới đâu rồi.

Nói cho rõ từ đầu mình chẳng muốn so 3060 và 4060, đưa ra vài ví dụ cùng số xx60 và cùng TGP cho bạn thấy Ada Lovelace nó hơn ko chỉ 1 tí. Mời đọc lại comment cũ.
@iMi Shop Người ta đã nói đến thế rồi ông còn không hiểu mà cứ cãi cùn mãi. Xong rồi toàn nói nhảm gì không =))
camera an ninh nhà m chạy 10 năm k thấy lên báo
@ryanmw Vcl
các công nghệ nội suy hình ảnh đã tồn tại từ lâu để giải quyết vấn đề hiệu năng xử lý thuần của GPU không đủ mạnh. ban đầu nó chỉ làm đúng công việc của mình là cải thiện hiệu năng tầm 10-20%. nhưng với DLSS 4 mới nhất thì nó chiếm tới gần 94% (15/16 những điểm ảnh render ra là được AI nội suy từ 1/16 còn lại). thành ra với DLSS 4 thì 94% những gì bạn nhìn thấy trên màn hình không phải là những pixel thật render bởi game mà là do AI dự đoán và vẽ ra, cho dù AI có tiên tiến cỡ nào đi nữa thì không thể nào dự đoán chính xác 100% chỉ với 1 lượng pixel thật ít ỏi như vậy được, nên việc các nhìn thấy các khung hình méo mó như thế là không thể tránh khỏi. ban đầu nó chỉ là công cụ để hỗ trợ trong giai đoạn phần cứng chưa hoàn thiện, nhưng NVIDIA ngày càng khiến nó đi quá xa, thay gì tập trung giải quyết gốc rễ vấn đề là hiệu năng thuần thì họ lại lạm dụng AI lấp liếm, thay vì tận dụng silicon trên die để nâng cấp thêm sức mạnh cho GPU, thì họ lại dùng nó cho những nhân NPU cho AI. tuy nhiên xét trên góc độ kinh doanh thì đó lại là một quyết định vô cùng đúng đắn. hiện tại cơn sốt AI giúp họ trở thành công ty có giá trị chỉ đứng sau Apple, nên việc tập trung nguồn lực vào AI sẽ là một mũi tên trúng nhiều đích
@TTX_412 Nếu Nvidia ra 2 dòng card chơi game có và không tensor core. 1 con tối ưu hiệu năng thuần, 1 con có DLSS, rồi bán cùng giá. Bạn nghĩ người dùng chọn mua cái nào khi cái đi kèm DLSS nó cho ra lượng fps lớn hơn nhiều (và rất nhiều nếu bật thêm FG) hay cái cho ra "hình ảnh tĩnh đẹp hơn một chút" nhưng chơi game ở setting cao ko mượt?
Nhìn qua AMD xem gamer có bật FSR khi chơi game AAA ko, thậm chí bật cả XeSS nữa kìa.
Nhu cầu phần đông khách hàng cần upscale và frame gen thì hãng cung cấp sản phẩm khách hàng muốn, chứ đâu phải lấp liếm. Nếu hãng dùng DLSS để làm đẹp số liệu quảng cáo trong khi "không ai xài" thì mới gọi là lấp liếm.
Cả hiệu năng thuần và công nghệ nội suy đều quan trọng như nhau, nhưng cái sau nó "hiệu quả theo cấp số nhân" nên bạn càm giác như Nvidia cố tình "đẩy đi quá xa". Kiểu như cắt 10% silicone cho AI mà nó x3 fps, giờ cắt thêm 5% nữa mà đc gần x10 fps. Người dùng có muốn không? Không có nó thì mấy cái laptop mỏng nhẹ dưới 2kg chơi game AAA đẹp và mượt nổi không?
AA1x96Pv.jpg

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2026 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: 351/56 Lê Văn Sỹ, P. Nhiêu Lộc, Tp HCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép cung cấp dịch vụ MXH số 134/GP-BVHTTDL, Ký ngày: 30/09/2025