Google phát hành 3 model LLM mã nguồn mở: Gemma 2 2B, ShieldGemma và Gemma Scope

Google hôm nay chính thức phát hành 3 model LLM mã nguồn mở hướng tới các nhu cầu chuyên biệt khác nhau, từ model nhỏ gọn chạy locally không đòi nhiều phần cứng cho tới các model nhiều tham số phục vụ cho các nhu cầu cao cấp hơn.

Ngay từ bây giờ, anh em có thể tải các model này về để test thử mà ngoài ra, nó còn cho phép các nhà phát triển có thêm thông tin về mã nguồn của model cũng như nhìn thấy được những tiến bộ mới của Google trong việc phát triển model.

Ba model mã nguồn mở mới được Google phát hành bao gồm Gemma 2 2B, ShieldGemma và Gemma Scope. Mỗi model đều có những mục đích sử dụng chuyên biệt.

[IMG]

Đầu tiên là Gemma 2 2B hướng tới việc phân tích và sinh ra văn bản. Từ tên gọi có thể thấy Gemma 2 2B có 2 tỷ tham số và Google cho biết nó đủ gọn nhẹ để có thể chạy local trên bất cứ phần cứng nào mà không cần đòi hỏi nhiều. Dù vậy, họ tuyên bố rằng hiệu quả của nó cao hơn so với GPT-3.5 của OpenAI. Trong một phép so sánh, model Gemini hiện tại của Google có tới hơn 1 ngàn tỷ tham số. Gemma 2 2B có thể phục vụ cho mục đích nghiên cứu lẫn các ứng dụng thương mại.

Tiếp theo là ShieldGemma. Đây là một model classifier được thiết kế để phát hiện và lọc những output không mong đợi từ model LLM, đảm bảo sự an toàn cho người dùng. Google cho biết ShieldGemma được họ thiết kế để phát hiện ra các ngôn ngữ gây thù địch, ngược đãi, nội dung đồi trụy và những thứ gây nguy hiểm cho con người vốn là mối nguy cơ tiềm tàng nằm trong chính khả năng của model AI. ShieldGemma được xây dựng dựa trên Gemma 2 với những tham số số đã được tùy chỉnh. Số tham số của ShieldGemma được dao động từ 2 tỷ đến 27 tỷ và dĩ nhiên cũng có thể triển khai hoạt động offline.

image3-RSAYD07.original.png

Cuối cùng là model Gemma Scope - model quan trọng trong số 3 model mã nguồn mở vừa được ra mắt. Mục đích của Gemma Scope là giúp người ta hiểu được một cách đơn giản hoạt động của Gemma 2. Nói sơ chút chỗ này, trước giờ đối với các LLM thương mại (như GPT, Gemini, Claude,...) thì việc hiểu hoạt động bên trong của nó, cách nó tạo ra các output trên thực tế vẫn là một vấn đề và không dễ để có thể hiểu sâu, chính xác được. Gemma Scope sinh ra để làm được chuyện đó. Google cho biết nó sử dụng bộ mã hóa tự động rời rạc, cho phép các nhà phát triển có thể "zoomn vào từng điểm cụ thể trong model và giúp hoạt động bên trong của nó trở nên dễ hiểu hơn."

image1-OduFiVU.original.png

Hiện tất cả các model đều có thể tải về. Gemma 2 2B và ShieldGemma có thể tải ngay từ trang của Google, còn Gemma Scope có thể test được thông qua nền tảng Neuronpedia để phục vụ mục đích nghiên cứu.

Trên thực tế, hiện Gemini là model AI cao cấp nhất của Google và hiện tại người dùng chỉ có thể tiếp cận nó thông qua chatbot được Google cung cấp, tương tự như các mà các nhà phát triển LLM thương mại như OpenAI hay Anthropic làm,.. Tuy nhiên, Gemini cũng được tích hợp dưới dạng các tính năng trong sản phẩm của Google như Gmail, Google Drive, Workspace,... tương tự như cách làm của Microsoft sau khi họ đầu tư cho OpenAI để mang về Copilot.

Mặc dù Google không phát hành mã nguồn của Gemini nhưng thực ra trước giờ họ đã phát hành rất nhiều model và các công nghệ liên quan AI để phục vụ nghiên cứu. Thậm chí, Google từng là bên đầu tiên phát hành thuật toán transformer - cái đặt nền móng cho hoạt động của toàn bộ các LLM hienj tại như GPT của OpenAI hay Llama của Meta sau này,... Bởi thế, không quá khó hiểu về các phân chia nhiệm vụ của 3 model mã nguồn mở mà lần này công ty vừa phát hành.

tyller end

GÀ

5 tháng

mấy con model chạy cần gpu không nhỉ, m lại chỉ dùng máy ko gpu, require 8+ vram nữa chứ =(

iolna

@tyller end Mấy cái này càng nhiều chip xử lý càng tốt à bác?

@iolna m không biết, search system requirement thấy đề nghị vậy , cung chưa chạy local bao h

TKNRCT

@tyller end chạy AI thì gpu quan trọng hơn cpu

hatiboy

Trứng

@tyller end Được chứ. Bạn tải LMStudio về, download con model này về chạy thử. Trên tinhte cũng có bài viết hướng dẫn rồi đó
Mà chạy lên thì CPU lúc nào cũng >90%, không làm được gì khác thôi 😆

QuanLyNhaNghi

Nguồn mở là mồi nhử của Google để những kẻ thích free dính chặt vào hệ sinh thái của Google như cách làm với Android, mail..... đổi lại là có được data khách

conco119

@QuanLyNhaNghi Được sài free có lợi cho mình. Mối quan hệ cộng sinh thôi b.

Doof Heinz

@conco119 Nó là cừu hạng A mà. Thích vừa yar phí vừa bị Apple thu thập data mới chịu.

avkidz

@QuanLyNhaNghi Nguồn mở khác với dịch vụ free b ơi. T/h này, bạn tự self-host model, tự xài, thu thập data bằng niềm tin ah.

kedote

@QuanLyNhaNghi Ifan lởm là cứ thích trả phí và bị thu thập thông tin, và bị lừa dối về privacy cơ 😁

angle_squall

@avkidz Nó comment toàn vô tri, ko trả lời nó là xong. Nó toàn ghi bậy bạ gì đó rồi thôi hà

hongphuc1992

Free

Doãn_Chí_Bình

Nói thật về AI Google ko có tuổi đâu
CEO yếu và thiếu tầm nhìn
Đội ngũ nhân tài thì bị đối thủ kéo mất người
Google giờ chỉ có quảng cáo trên tìm kiếm và YouTube là hết ko còn gì nữa.

BlackMan00x

@Doãn_Chí_Bình Thế thằng nào có tuổi? Gemini bản update tuần trước đã leo lên top rank rồi bạn

BBW

@Doãn_Chí_Bình có dùng thường xuyên không mà phát biểu hay thế? Về khoản phân tích thành từng ý thì Gemini free vẫn ngon vcl, rồi chuyển qua 1 con khác viết thành đoạn văn là xong.

Google phát hành 3 model LLM mã nguồn mở: Gemma 2 2B, ShieldGemma và Gemma Scope

CHỦ ĐỀ TƯƠNG TỰ

TbvdfstrfgsdfgsdufusdfjhsdfgsdjgfysdfQ

RbncxbsdgfdghjhjioupiyoutiredcgvhbjijhQ

AI Chatbot Preny tăng tỷ lệ bán hàng cho ngành thời trang

AI chatbot Preny ngành mỹ phẩm hoạt động thế nào?