Nvidia: GPU GeForce RTX sẽ tối ưu các tác vụ AI Windows 11, tốc độ hàng trăm TOPS chứ không phải 40

P.W
22/5/2024 5:38Phản hồi: 69
Nvidia: GPU GeForce RTX sẽ tối ưu các tác vụ AI Windows 11, tốc độ hàng trăm TOPS chứ không phải 40
Cũng may là Nvidia đã nhanh chóng có những công bố chính thức ngay sau sự kiện của Microsoft, nghĩa là anh em đang sử dụng máy tính trang bị GPU GeForce RTX của Nvidia cũng sẽ được tận dụng những nhân CUDA hay thậm chí cả những nhân tensor xử lý deep learning mà Nvidia phát triển, để vận hành những tính năng AI của Windows 11 cũng như những phần mềm, ứng dụng có tính năng AI xử lý on device.

Điều này có nghĩa là, ngay khi Windows 11 24H2 ra mắt, với chuẩn Copilot+ PC, anh em sẽ không phải đợi Intel và AMD ra mắt những con chip xử lý máy tính cá nhân đủ sức mạnh 40 TOPS trở lên nữa. Lý do cũng đơn giản. Chẳng hạn như RTX 4080, Nvidia cho biết sức mạnh xử lý AI của card đồ họa này lên tới ngưỡng tối đa 836 TOPS. RTX 4090 thì có sức mạnh lên tới 1321 AI TOPS thông qua nhân Tensor thế hệ 4.

Anh em có thể đọc thêm những tính năng AI đã và sẽ hiện diện trên Windows 11, cũng như những tính năng thuộc chuẩn Copilot+ PC:

Microsoft Copilot + PC: Tiêu chuẩn phần cứng mới của AI PC để thực sự có cái gọi là AI Everywhere

Ngay trước thềm Build, Microsoft tổ chức một sự kiện nói về Copilot, cách mà Copilot sẽ được tích hợp sâu hơn vào Windows, thậm chí là tích hợp vào trong trò chơi Minecraft, sẽ tương tác như thế nào với người dùng.
tinhte.vn

Microsoft Recall: Tính năng mở khoá cho tương lai của PC

Nếu anh em đã dùng tính năng Timeline trên Windows 10 thì sẽ thấy Recall mà Microsoft giới thiệu đêm qua rất quen. Timeline có thể nói là phiên bản sơ khai nhất của tính năng Recall, khi mà nó chưa được tích hợp AI.
tinhte.vn


Còn theo thông tin mới nhất của Nvidia, sắp tới sẽ có phiên bản driver R555 Game Ready Driver. Với bản cập nhật phần mềm vận hành GPU GeForce RTX này, vận hành những mô hình ngôn ngữ để chạy những tính năng AI thông qua ONNX Runtime (ORT) và DirectML sẽ tăng tốc gấp 3 lần. ORT và DirectML chính là những công cụ vận hành những tính năng và mô hình AI ngay trên phần cứng PC Windows.

R555 Game Ready Driver, Studio Driver và RTX Enterprise Driver vừa được ra mắt, với phiên bản 555.85 cho anh em cập nhật.

Còn với các nhà phát triển ứng dụng, nền tảng WebNN cho phép các lập trình viên viết các tính năng và ứng dụng AI, chạy mô hình AI trên nền web cũng sẽ có thể tăng tốc xử lý bằng card RTX thông qua DirectML. PyTorch cũng sẽ hỗ trợ backend vận hành runtime DirectML, tức là với GPU RTX, những dàn máy tính Windows sẽ có thể huấn luyện những mô hình AI phức tạp.

Hiện tại, Nvidia và Microsoft đang hợp tác để tối ưu tốc độ xử lý machine learning trên những GPU RTX, từ laptop đến máy bàn.

Tính ra, Nvidia chính là đơn vị đầu tiên khởi đầu xu hướng AI tiêu dùng trên máy tính cá nhân, với tính năng đến giờ vẫn có ích và được đánh giá cao, là DLSS, ra mắt từ 6 năm trước cùng sự ra mắt của thế hệ card đồ họa RTX 20 series, kiến trúc GPU Turing.

Ngay bây giờ chưa có chip máy tính nào đáp ứng yêu cầu của Microsoft, để đạt chuẩn Copilot+ PC

Đó là yêu cầu sức mạnh xử lý số thực dấu phẩy động của cụm nhân NPU trên mỗi con chip vi xử lý bên trong mỗi hệ thống máy tính cá nhân phải đạt ngưỡng 40 TOPS (trillion operations per second) mà Microsoft vừa đưa ra trong sự kiện rạng sáng nay theo…
tinhte.vn


Và thậm chí hồi đầu tháng này, sau khi có thông tin từ Microsoft đưa ra con số 45 TOPS là con số phù hợp cho một hệ thống AI PC, Nvidia còn lên tiếng bác bỏ ý tưởng này. Theo họ, con số từ 10 đến 45 TOPS trên những chip xử lý của Intel, AMD, Apple và Qualcomm cũng chỉ đủ chạy những “tính năng AI cơ bản”. Những ví dụ mà Nvidia đưa ra, bao gồm chỉnh ảnh, tạo sinh hình ảnh, nâng độ phân giải hình ảnh và hỗ trợ lập trình nâng cao thông qua AI, tất cả chúng đều chỉ làm được ở mức độ căn bản, gọi là có sản phẩm đầu ra, chứ chưa chắc đủ chất lượng phục vụ người dùng hàng ngày.

Đương nhiên là tại sự kiện hồi đầu tháng 5, Nvidia đem RTX 4090 với 1321 AI TOPS ra so sánh với những con chip xử lý giá chỉ bằng một phần lẻ. Nhưng để công bằng thì Tensor thế hệ 3 trên RTX 3060 cũng tạo ra được sức mạnh 102 TOPS rồi.

Quảng cáo


Còn hiện tại, trong bài blog mới của Nvidia, họ so sánh hiệu năng và tốc độ xử lý những mô hình AI với tham số từ 7 đến 8 tỷ, đủ gọn để vận hành on device, xử lý thông qua chip trong máy tính cá nhân. HIệu năng được cải thiện với driver R555 mới ra mắt, đi kèm với đó là những tối ưu để vận hành AI tạo sinh thông qua runtime ORT, chạy những mô hình phổ biến như Llama hay Phi-3-mini:

llm-inference-perf.png

Vậy là, với GPU RTX, Nvidia cho biết người dùng ở mọi nhu cầu sẽ có thể tiếp cận và vận hành những tính năng AI:

  • Với anh em gamer, là DLSS tăng độ phân giải hình, thậm chí còn có thể tạo ra những khung hình mới để tăng tốc độ hình ảnh, chơi game mượt hơn. Gói ứng dụng Nvidia ACE thì cho phép tạo ra những nhân vật ảo với lời thoại, giọng nói và cử động tạo ra bằng AI.
  • Với người sáng tạo nội dung, những tính năng AI trong Adobe Premiere, Blackmagic Design DaVinci Resolver hay Blender cho phép hoàn thành tự động những tác vụ lặp đi lặp lại, tốc độ làm việc nhanh hơn, từ denoise mô hình 3D cho tới tạo hình, tạo cả những đoạn video ngắn.
  • Với các modder làm game, họ có RTX Remix, dựa trên nền tảng RTX Omniverse, với những công cụ AI để lột xác những game PC cũ, khoác lên bộ cánh mới hiện đại và đẹp mắt hơn.
  • Với livestreamer, Nvidia Broadcast có tính năng cắt nền video bằng AI, khử nhiễu hình ảnh, và RTX Video cho phép nâng độ phân giải hình ảnh, tự động điều chỉnh dải màu HDR của video.
  • Với các nhà phát triển ứng dụng, những công cụ dành cho các dev như AI Workbench, cuDNN, TensorRT, Maxine và RTX Video cho phép họ tối ưu nhanh những tính năng machine learning để nhanh chóng thương mại hóa mô hình và giải pháp.

Theo Nvidia
69 bình luận
Chia sẻ

Xu hướng

LYSM
TÍCH CỰC
25 ngày
Vị thế của người đi đầu về AI có khác, mấy cái 40 TOPS vớ va vớ vẩn anh coi như trò trẻ con 😁
GLES
TÍCH CỰC
24 ngày
@Carl ít nhất anh cũng phân biệt INT4, INT8, FLOAT nó khác gì nhau còn chú em dùng cái trang TT này mà đi screenshot chứng minh thì đủ hiểu trình éo thể nào kiếm được nguồn uy tín

để anh ị vào mồm chú vài phát =))))
GLES
TÍCH CỰC
24 ngày
@Carl ị lên vào mồm chú nè

https://www.xda-developers.com/apple-ai-race-losing/

Apple might be losing the AI race that it started

Apple arguably started the AI PC race, but it might well be already losing it.
xda-developers.com
@GLES T phải lấy tài liệu của Qualcomm đập vô mặt thằng lập trình viên mắc dại như m mới được. Nhà m không biết vô phúc đẽ ra thứ óc hot dog như m hay là di truyền từ nhiều đời nữa.
Screenshot 2024-05-24 at 1.01.26 PM.png
GLES
TÍCH CỰC
23 ngày
@Carl Đập vào mặt ai? Tự anh đập mặt anh hả? Công trình khoa học chứng minh INT4 và INT8 ko khác nhau mấy kìa? Anh nghĩ người làm khoa học ngu như anh sao? Nếu anh giỏi thì phản biện bẳng công trình link trên kìa? Có email đó, chửi tụi nó đi, có cái hình marketing mà nghĩ mình đúng, chuẩn bị người khác ị vào mồm rồi căm lại đi
800 TOPS thì Apple sao mà đỡ :/
@Huong-Dung 4090 trên desktop ngon hơn nhiều 4090 trên mobile về mọi mặt,
mà nói chung không thể so sánh một con GPU với 1 con CPU all-in-one được,
GPU nó có hàng ngàn core xử lý, và mục tiêu của nó chỉ sử dụng tốt cho việc nào cần xử lý song song nhiều tác vụ cùng lúc,
Còn CPU của Apple chỉ có vài core, Apple tận dụng để chạy thêm GPU,
không thể so sánh được,
Tất nhiên Apple cũng có thể tăng số lượng core cho phần xử lý song song cho nhanh lên, nhưng làm vậy thì nó lại giống với Intel/AMD/Nvidia làm chip CPU riêng, rồi làm chip GPU riêng ra
Chip M chỉ có thể so sánh với Intel/AMD with integrated graphic mà thôi
@lequangquynh Apple so với RTX mà chứ ai so 😆
NgicMaichi
ĐẠI BÀNG
20 ngày
@lequangquynh đấy là tại thằng apple nó k chừa lối thoát thôi chứ macpro ngày xưa cái gì nó cũng nâng cấp đc hết RAM, CPU, GPU, SSD đều thay đc
@Huong-Dung So với RTX cùi cùi thôi chứ so sao lại 4090 😁
mà thực tế thì cấu hình máy tính giờ khá mạnh, Integrated GPU một số vẫn chạy nhanh hơn mấy GPU rời đời cũ
isheeple
ĐẠI BÀNG
25 ngày
Bảo sao 1 năm rưỡi giá cổ tăng 6 lần
Ồ. Vậy là đây mới thực sự là AI. Chứ đợi Luna Lake, AMD zen 5 hay snap elite hiện tại cũng chỉ là trò trẻ con rẻ tiền chăng?
@nghaimin NPU của đám này chỉ phục vụ cho những laptop mỏng nhẹ, pin trâu, ko card rời nvidia thôi.
Như laptop gaming thì có card nvidia rồi thì cần gì mấy cái NPU đâu.
@nghaimin Nếu tính giá máy tính trang bị Luna Lake, Zen 5, Elite so với máy tính trang bị 4090 thì đúng là rẻ tiền thật.
hp2013
TÍCH CỰC
25 ngày
So với nVidia thì AMD chỉ là trò trẻ con
Bây giờ hầu hết các app làm việc trên PC đều hỗ trợ tensor và cuda để tăng tốc thì sắp tới CPU của intel có lắp chung cũng chỉ là 1 thành phần để giúp máy chạy được thôi 😆)
RTX 4080 thì 836 TOPS. RTX 4090 thì lên tới 1321 AI TOPS thông qua nhân Tensor thế hệ 4

Xem cái 40 TOPS nó quá nhỏ bé
TND NO
TÍCH CỰC
25 ngày
@centernc Cái 40 kìa là giá rẻ và cho laptop, chứ riêng con Rtx 4080 có giá đủ mua con laptop rồi. Bởi vậy ae dùng desktop không lo sợ thiếu AI làm chi.
@centernc Nhỏ bé vậy mới bỏ vào được cái laptop pin 10 tiếng chứ, khủng long như 4090 thì cứ cắm ở nhà rồi lấy máy cái máy nhỏ bé remote vào thôi. Máy nhỏ và máy to đi 1 bộ với nhau vừa mạnh mẽ vừa di động.
GLES
TÍCH CỰC
25 ngày
có hãng trái cây nào đó tự hào 38 TOPS mà, yến vi làm vậy thì làm sao đây
@GLES hẵng trái cây thì có đám fan cuồng bất chấp ko lo gì. chỉ có đám cpu inteo, amd, qc hổm rày quảng cáo ai mấy chục tops để lùa người dùng mua. ai dè xài cái gpu này thì ko cần mua mấy con cpu rác kia.
GLES
TÍCH CỰC
25 ngày
@ragefighter ko biết rác hay ko nhưng hình như $$ cũng hợp tác làm con GPU Xclipse thì phải. Chửi GPU hãng khác rác rưởi trong khi SameSame cũng hợp tác AMD thì rác rưởi luôn 🤣

https://news.samsung.com/global/samsung-introduces-game-changing-exynos-2200-processor-with-xclipse-gpu-powered-by-amd-rdna-2-architecture

Samsung Introduces Game Changing Exynos 2200 Processor With Xclipse GPU Powered by AMD RDNA 2 Architecture

The new premium mobile processor comes with hardware-accelerated ray tracing and state of the art Arm-based processing technology
news.samsung.com


Con ê xịt nốt 2400: 17K MAC NPU (2x GNPU + 2x SNPU) + DSP
méo công bố luôn TOPS 🤣

https://en.wikipedia.org/wiki/Exynos
Exynos - Wikipedia
en.wikipedia.org


thôi lấy tạm con cũ là 26 TOPS thì ước tính con 2400 tầm ~ 30 - 35 TOPS

Con 1480 là ~20 TOPS

https://hardwaretimes.com/samsung-exynos-1480-amd-rdna-xclipse-530-gpu/

Samsung Exynos 1480 Gets AMD RDNA Based Xclipse 530 GPU, 53% Faster than Mali-G68 MP5 | Hardware Times

Samsung has announced the Exynos 1480 SoC, featuring an octa-core CPU and an AMD RDNA-based Xclipse 530 GPU. The former consists of four “Cortex-A78” P-cores clocked at 2.75GHz and four “Cortex-A55” E-cores operating at 2GHz. The Xclipse graphics...
hardwaretimes.com


À VIẾT SAI CHÍNH TẢ NÈ, LÊU LÊU
Screenshot 2024-05-22 185557.png
Đây là động thái lùa gà từ tập đoàn lùa gà , anh microsoft cố gắng PR cái brand copilot pc để cho mấy thằng bán máy như HP , DELL , ASUS , ACER , LENOVO ... có cái để bán máy, mấy thằng bán chip như qualcommn có cái để bán chip , y hệt như thằng in tèo lúc trc đẻ ra cái intel evo rác rưởi ấy . con card 4060 số TOPS đã là 242 , vả chết tươi con snapdragon elite rồi .
@hoanglong0712 NPU của đám intel, amd, snap mới ra là để phục vụ cho laptop mỏng nhẹ, pin trâu thôi bác.
Có dám nhét vô laptop gaming đâu là biết rồi. Lap mỏng nhẹ mà nhét card nvidia thì máy nóng hơn, hao pin hơn, độ dày sẽ dày hơn do phải thiết kế lại tản nhiệt để gánh cả cpu lẫn card nvidia.
Chuẩn Copilot+ pin yêu cầu lướt web > 15 tiếng, laptop gắn card Nvidia bằng cách nào, nếu gắn đc thì làm sao thoả pin > 15 tiếng?
- Chuẩn này dùng cho thiết bị di động, dẹp mấy cái desktop gắn card VGA rời qua một bên đi.
@XuyenViet2019 Vậy là laptop không dùng được NVIDIA hở bác ? 😔
Tiếc nhĩ
@XuyenViet2019 Thì laptop đó khỏi gắn mác Copilot+, thương hiệu Nvidia đâu cần phải gắn thêm mấy cái danh xưng này để làm màu.
@LeeKimĐông mình nghĩ chip nó cũng như M của Apple, nhân đồ họa này kia nằm vô đó hết rồi không cần nvida
@KingofWind1412 Mình hông biết nhưng thấy con Zephyrus G14 mình đang đi cấu hình 5800HS, Ram 16GB, RTX 3050 nên thấy hơi lag lag
Asimotono
ĐẠI BÀNG
25 ngày
Các bác cho em hỏi rtx 3060 12GB MSI nó có đáp ứng được cái yêu cầu này không, em cảm ơn ạ
cũng đang xài RTX mà là RTX 2060 super 😆)
intel đâu rồi
4080 4090 là mấy con gpu rất đắt tiền và nóng ...... phần đông đều là 4060 và 4070, mà thông tin về khả năng xử lý AI của 2 con phổ thông này thì lại quá ít
trên laptop thì rtx 4050 4060 4070 thì phổ biến hơn hẳn 4080 4090 cũng vì đắt, nóng , ngốn pin, lại không phải lúc nào cũng cần con gpu mạnh vậy
tóm lại là nếu muốn 1 con AI pc đúng nghĩa ở thời điểm hiện tại thì cứ mua 1 con laptop giá dưới 1500 và có gpu rtx 4070, bảo đảm chạy copilot+ ngon lành
Sao lại thế nhỉ
Đang nói về laptop mỏng nhẹ đem con 4090 vô so thuật toán xử lý AI với mấy con CPU có GPU tích hợp?
Khác nào so sánh camera trên điện thoại với máy ảnh DSLR chuyên nghiệp? Thử riêng con 4090 có chạy độc lập Win hay Mac mà không có CPU không? Rõ chán
caberfan
ĐẠI BÀNG
25 ngày
@shirley19 😏nhưng mà thằng táo cũng mang y chang con chip M của bọn nó lên Desktop mà. Hay là phải đợi đến lúc đấy thì mới được so, còn lúc này so không được?
@caberfan Bài viết có nhắc Apple à?
Namlvlee
TÍCH CỰC
25 ngày
Rtx 2060 cũng cap phải không vậy mọi người
mrsunb
ĐẠI BÀNG
25 ngày
Đang dùng win10 nên cũng như không
Cười vô mặt
Có phần mềm nào chấm được điểm NPU của card đồ họa hiện tại không các bác
ủa rồi AMD mặc kệ đời trong cuộc chơi này luôn sao ta, xài cái GPU amd mà sao thấy bản thân sắp tụt hậu.

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019