Google hôm nay chính thức phát hành 3 model LLM mã nguồn mở hướng tới các nhu cầu chuyên biệt khác nhau, từ model nhỏ gọn chạy locally không đòi nhiều phần cứng cho tới các model nhiều tham số phục vụ cho các nhu cầu cao cấp hơn.
Ngay từ bây giờ, anh em có thể tải các model này về để test thử mà ngoài ra, nó còn cho phép các nhà phát triển có thêm thông tin về mã nguồn của model cũng như nhìn thấy được những tiến bộ mới của Google trong việc phát triển model.
Ba model mã nguồn mở mới được Google phát hành bao gồm Gemma 2 2B, ShieldGemma và Gemma Scope. Mỗi model đều có những mục đích sử dụng chuyên biệt.
Ngay từ bây giờ, anh em có thể tải các model này về để test thử mà ngoài ra, nó còn cho phép các nhà phát triển có thêm thông tin về mã nguồn của model cũng như nhìn thấy được những tiến bộ mới của Google trong việc phát triển model.
Ba model mã nguồn mở mới được Google phát hành bao gồm Gemma 2 2B, ShieldGemma và Gemma Scope. Mỗi model đều có những mục đích sử dụng chuyên biệt.
Đầu tiên là Gemma 2 2B hướng tới việc phân tích và sinh ra văn bản. Từ tên gọi có thể thấy Gemma 2 2B có 2 tỷ tham số và Google cho biết nó đủ gọn nhẹ để có thể chạy local trên bất cứ phần cứng nào mà không cần đòi hỏi nhiều. Dù vậy, họ tuyên bố rằng hiệu quả của nó cao hơn so với GPT-3.5 của OpenAI. Trong một phép so sánh, model Gemini hiện tại của Google có tới hơn 1 ngàn tỷ tham số. Gemma 2 2B có thể phục vụ cho mục đích nghiên cứu lẫn các ứng dụng thương mại.
Tiếp theo là ShieldGemma. Đây là một model classifier được thiết kế để phát hiện và lọc những output không mong đợi từ model LLM, đảm bảo sự an toàn cho người dùng. Google cho biết ShieldGemma được họ thiết kế để phát hiện ra các ngôn ngữ gây thù địch, ngược đãi, nội dung đồi trụy và những thứ gây nguy hiểm cho con người vốn là mối nguy cơ tiềm tàng nằm trong chính khả năng của model AI. ShieldGemma được xây dựng dựa trên Gemma 2 với những tham số số đã được tùy chỉnh. Số tham số của ShieldGemma được dao động từ 2 tỷ đến 27 tỷ và dĩ nhiên cũng có thể triển khai hoạt động offline.
Cuối cùng là model Gemma Scope - model quan trọng trong số 3 model mã nguồn mở vừa được ra mắt. Mục đích của Gemma Scope là giúp người ta hiểu được một cách đơn giản hoạt động của Gemma 2. Nói sơ chút chỗ này, trước giờ đối với các LLM thương mại (như GPT, Gemini, Claude,...) thì việc hiểu hoạt động bên trong của nó, cách nó tạo ra các output trên thực tế vẫn là một vấn đề và không dễ để có thể hiểu sâu, chính xác được. Gemma Scope sinh ra để làm được chuyện đó. Google cho biết nó sử dụng bộ mã hóa tự động rời rạc, cho phép các nhà phát triển có thể "zoomn vào từng điểm cụ thể trong model và giúp hoạt động bên trong của nó trở nên dễ hiểu hơn."
Hiện tất cả các model đều có thể tải về. Gemma 2 2B và ShieldGemma có thể tải ngay từ trang của Google, còn Gemma Scope có thể test được thông qua nền tảng Neuronpedia để phục vụ mục đích nghiên cứu.
Trên thực tế, hiện Gemini là model AI cao cấp nhất của Google và hiện tại người dùng chỉ có thể tiếp cận nó thông qua chatbot được Google cung cấp, tương tự như các mà các nhà phát triển LLM thương mại như OpenAI hay Anthropic làm,.. Tuy nhiên, Gemini cũng được tích hợp dưới dạng các tính năng trong sản phẩm của Google như Gmail, Google Drive, Workspace,... tương tự như cách làm của Microsoft sau khi họ đầu tư cho OpenAI để mang về Copilot.
Mặc dù Google không phát hành mã nguồn của Gemini nhưng thực ra trước giờ họ đã phát hành rất nhiều model và các công nghệ liên quan AI để phục vụ nghiên cứu. Thậm chí, Google từng là bên đầu tiên phát hành thuật toán transformer - cái đặt nền móng cho hoạt động của toàn bộ các LLM hienj tại như GPT của OpenAI hay Llama của Meta sau này,... Bởi thế, không quá khó hiểu về các phân chia nhiệm vụ của 3 model mã nguồn mở mà lần này công ty vừa phát hành.