Nvidia ra mắt NVLM 1.0: Hứa hẹn về AI mã nguồn mở

PTW_Dark
3/10/2024 9:11Phản hồi: 12
Nvidia ra mắt NVLM 1.0: Hứa hẹn về AI mã nguồn mở
Nvidia vừa công bố NVLM 1.0, một mô hình ngôn ngữ lớn đa model (LLM) của hãng, với khả năng xử lý vượt trội các nhiệm vụ liên quan đến hình ảnh và ngôn ngữ. Theo Nvidia, NVLM 1.0 có khả năng cạnh tranh được với các mô hình ngôn ngữ lớn độc quyền của các big tech - đơn cử như GPT-4o của OpenAI hay các mô hình với mã nguồn mở như Llama 3-V 405B của Meta hay InternVL 2 của OpenGVLab.

Hiệu suất hứa hẹn của Nvidia NVLM 1.0

Ket-qua-thu-nghiem-Nvidia-NVLM-1.0.png

Khả năng xử lý của Nvidia NVLM 1.0
Nvidia cho biết họ đã tiến hành so sánh NVLM 1.0 với các LLM hàng đầu hiện nay, như GPT-4o và Llama 3-V 405B. Kết quả cho thấy NVLM 1.0 đạt điểm số cao trên các bài kiểm tra OCRBench và VQAv2, vượt trội hơn hoặc tương đương với GPT-4o trong hầu hết các tiêu chí đánh giá quan trọng, bao gồm MathVista, ChartQA và DocVQA. Đặc biệt, sau quá trình huấn luyện, mô hình NVLM-1.0 72B thể hiện sự cải thiện đáng kể trong các bài kiểm tra toán học và lập trình chỉ dựa vào văn bản, với độ chính xác trung bình tăng 4,3 điểm.

Khả năng của NVLM-1.0

Kha-nang-phan-tich-cua-Nvidia-NVLM-1.0.png

Khả năng suy luận của Nvidia NVLM-1.0 dựa vào hình ảnh
Mô hình NVLM-1.0-D 72B cho thấy khả năng giải quyết tốt với các yêu cầu khác nhau. Mô hình có thể tự điều chỉnh độ dài nội dung tạo ra và cung cấp mô tả chi tiết về hình ảnh được cung cấp. NVLM-D-1.0-72B thể hiện khả năng kết hợp nhiều yếu tố như OCR, suy luận và kiến thức chung, cho phép nó hiểu sâu sắc các khía cạnh trong những hình ảnh và bối cảnh khác nhau.
Kha-nang-xu-ly-toan-theo-tung-buoc-cua-Nvidia-NVLM-1.0.png
Khả năng xử lý toán và hướng dẫn từng bước trên Nvidia NVLM-1.0
Ví dụ, mô hình có thể nhận diện và phân thích các meme bằng cách sử dụng các kỹ thuật nhận diện văn bản (OCR) và suy luận để làm rõ ý nghĩa, cũng như trả lời các câu hỏi về vị trí một cách chính xác. Bên cạnh đó, NVLM còn có khả năng thực hiện các phép toán và lập trình dựa trên thông tin hình ảnh.

Quyết định công khai Nvidia NVLM-1.0

Quyết định của Nvidia trong việc công khai trọng số mô hình và mã huấn luyện trên nền tảng Megatron-Core không chỉ giúp các nhà nghiên cứu dễ dàng tiếp cận công nghệ AI này mà còn thách thức xu hướng đóng của các mô hình ngôn ngữ AI độc quyền hiện nay. Hành động này đã nhận được phản ứng tích cực từ cộng đồng, với nhiều chuyên gia khen ngợi khả năng của NVLM 1.0 trong việc thúc đẩy nghiên cứu và phát triển AI toàn cầu.

Mot-so-thu-nghiem-voi-Nvidia-NVLM-1.0.png
Một số thử nghiệm trên Nvidia NVLM-1.0

Tương Lai Của AI mã nguồn mở Mở

Sự ra mắt của Nvidia NVLM 1.0 đánh dấu một bước ngoặt quan trọng trong ngành công nghiệp AI, mở ra cơ hội cho các nhóm nghiên cứu nhỏ hơn và các nhà phát triển độc lập có thể tham gia vào cuộc chơi. Điều này có thể định hình lại cách thức các công ty công nghệ hoạt động và buộc họ phải xem xét lại chiến lược kinh doanh của mình.
Tuy nhiên, với sự phát triển của AI mã nguồn mở, cũng xuất hiện những lo ngại về việc sử dụng sai mục đích và các vấn đề đạo đức. Ngành AI hiện đang phải đối mặt với thách thức trong việc thúc đẩy sự đổi mới trong khi vẫn phải đảm bảo việc sử dụng AI một cách có “đạo đức”.
Theo Nvidia
12 bình luận
Chia sẻ

Xu hướng

72B thì dành cho nhà phát triển là đại gia 😂
@iolna tui training mấy con 1B, 2B thôi bác =)))
@GLES Trên mấy card 24gb thì model nào hiện tại là chạy tốt nhất vậy b? LLM cho general writing thôi b
@intrivil Có llama 3.2 chạy inference đó bác, mới ra.
@baotuan 72B Q4 đâu có ngốn bao nhiêu vram dùng 3 con rtx 2080ti 22GB là được nguyên cái máy chắc tầm 50tr là cùng
Hỏi ngu tí là mấy dự án mã nguồn mở này có lợi gì cho nhà phát triển nhỉ? Không phải sẽ tạo ra nhiều đối thủ cạnh tranh hơn à?
@KeniVinh với nvidia thì nó hơi hơi giống như việt gg làm điện thoại pixel, nó định hướng và duy trì trật tự cho các ứng dụng AI, cũng như tạo ra hàng trăm cty con nhỏ nhỏ AI mới, nhưng chạy trên nền của nvidia. hiện giờ nvi độc tôn hoàn toàn về card xử lí AI, nó làm mấy cái này để duy trì sự độc tôn đó thôi. Ví dụ như phụ thuộc vào 1 thằng chatgpt chả hạn, lỡ chat gpt nó upgrade lên ver 5.0 xài amd firepro rồi sao. Nó tạo ra hàng trăm công ty cạnh tranh để thằng nào rời khỏi hệ sinh thái nvi thì sẽ bị các cty nằm trong xâu xé trước
@KeniVinh Có cộng đồng thì phát triển rộng rãi hơn, mở rộng dễ dàng, không bị phụ thuộc vào bên thứ 3 nào cả từ phần cứng đến phần mềm.
Riêng NVDIA thì tha hồ bán phần cứng.
@KeniVinh Nvidia bán phần cứng mà, nếu đã thích phần mềm của Nvidia thì người dùng sẽ có xu hướng mua thêm phần cứng Nvidia. Như ngày xưa mấy phần mềm đồ họa thì toàn support cho Intel và Nvidia nên rất nhiều người làm kiến trúc chỉ mua combo Intel và Nvidia (nổi tiếng nhất là con Nvidia Quadro, tiếp đến là Intel Xeon) vì nó tương thích tốt nhất với phần mềm họ dùng. Giờ làm AI nếu ai dùng Tensorflow thì chắc chắn có xu hướng mua card Nvidia chắc luôn vì nó chạy nhanh ổn định trên nhân cuda. Đỡ phải mất time fix này nọ.
@KeniVinh nó làm để kích thích nhu cầu xây dựng LLM (train + inference), từ đấy thúc đẩy doanh số bán card.
Vì hiện tại số lượng user đủ tiền tự build LLM quá ít, nên nó làm để hỗ trợ những đối tượng này

Xu hướng

Bài mới










  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019