Mistral ra mắt LLM mã nguồn mở Mistral Nemo 12 tỷ tham số, cải thiện khả năng đa ngôn ngữ

ND Minh Đức
19/7/2024 1:12Phản hồi: 9
EditEdit
Mistral ra mắt LLM mã nguồn mở Mistral Nemo 12 tỷ tham số, cải thiện khả năng đa ngôn ngữ
Mistral hôm nay ra mắt model LLM Mistral NeMo 12 tỷ tham số với context windows 128 ngàn token, hứa hẹn tiếp tục là một LLM mở thay thế cho model Mistral 7B phổ biến trước đây, đồng thời có hiệu năng cao hơn so với các "đối thủ" là Gemma 2 9B và Llama 3 8B.

Mistral cho biết Mistral NeMo có khả năng suy luận, kiến thức và khả năng code chính xác cao nhất hiện nay so với các model khác có cùng kích thước. Mistral Nemo được tạo ra dựa trên mối hợp tác với Nvidia, được huấn luyện bằng 2072 chiếc H100 80GB trên DGX Cloud.

nemo-base-performance.webp

Mistral Nemo sử dụng cơ chế token hóa hoàn toàn mới gọi là Tekken, được huấn luyện để hỗ trợ hiệu quả hơn 100 ngôn ngữ, đồng thời có khả năng xử lý ngôn ngữ tự nhiên dạng text lẫn code một cách hiệu quả hơn so với cơ chế token hóa SentencePiece dùng trên các model trước đây của Mistral. Với khả năng này, Mistral Nemo cho khả năng xử lý đa ngôn ngữ hiệu quả hơn, đặc biệt là tiếng Trung, Ý, Pháp, Đức, Tây Ban Nha và Nga cải thiện 30%, và tiếng Hàn và tiếng Ả Rập hiệu quả hơn lần lượt 2 và 3 lần. So với Llama 3, Tekken cho hiệu suất cao hơn tới 85% ở tất cả các ngôn ngữ.

new-tokenizer-tekken.png

Một số kết quả benchmark, Nemo đạt điểm số MMLU 68%, Instruct 53,4% MixEval Hard, tức là tổng thể cao hơn khá nhiều so với Gemma 2 9B và Llama 3 8B. Tương tự như các phiên bản trước đây, Nemo cũng được phát hành dưới giấy phép mở Apache 2.0. Hiện người dùng đã có thể trải nghiệm thử Model mới trên nền tảng Hugging Face.
9 bình luận

Xu hướng

Công ty có cho sài con Mistral này. Vẫn chưa thấy ông nào đỉnh đc như chatGPT.
@blackberry97 cái đó là hiển nhiên, về AI thì chatGPT nó vẫn đang là ông trùm rồi và sẽ càng ngày càng bỏ xa các đối thủ khác.
@blackberry97 Bên mình xài ChatGPT plus, Claude và Copilot
ChatGPT đúng là vẫn ngon nhất
@magez mới đầu t nghỉ copilot code ngon hơn vì microsoft lấy kho github cho nó học, nhưng xài rồi thấy vẫn không qua nổi ChatGPT
@thanhkhocnhe MS train model lại kiểu khác mà, phù hợp cho việc search thông tin mới hơn, khi nào cần hỏi cái gì mới thì dùng nó cho tiện, còn lại thì cứ ChatGPT hay Claude
Con claude thấy có nhiều cái nó trả lời hay hơn GPT
@thanhkhocnhe tùy ngôn ngữ thôi bạn à, copilot code X++ vẫn ngon hơn, nhưng mình vẫn xài chatGPT do nó có nhiều GPTs hỗ trợ cho công việc code của mình.
có cấu hình host đc con này local ko bạn
nghe hấp dẫn quá, có hướng dẫn cài đặt và sử dụng nữa thì tuyệt, Github Copilot xài thử thấy ngon mà mắc quá, nếu cài được con này local thì quá ok.
hết thuốc rồi, giờ ko so 7 vs 7 nữa.
Phải so 8 vs 7, 9 vs 7 và 12 vs 8,9

Xu hướng

Bài mới








  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2025 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019