Google Gemini 2.0 chính thức: Bước kế tiếp để đến được kỷ nguyên trợ lý AI

P.W
12/12/2024 8:6Phản hồi: 47
Google Gemini 2.0 chính thức: Bước kế tiếp để đến được kỷ nguyên trợ lý AI
Tháng 12 năm ngoái, Gemini 1.0 chính thức ra mắt, rồi kế đến là Gemini 1.5, với khả năng nhận diện cũng như tạo sinh nhiều hình thái nội dung ngôn ngữ tự nhiên của con người. Và tới đêm qua 11/12/2024 theo giờ Việt Nam, Gemini 2.0 đã chính thức ra mắt, đi kèm nhiều nâng cấp để Google chạy đua ra mắt một công cụ trợ lý AI thực sự, phục vụ cho hàng tỷ người dùng trên toàn thế giới.

Google gọi Gemini 2.0 là một dạng agentic model, nghĩa là có những tính năng và khả năng để trở thành một nền tảng để vận hành dịch vụ trợ lý ảo vận hành bằng mô hình ngôn ngữ. Với Gemini 2.0, Google khẳng định rằng người dùng có thể trải nghiệm những cải tiến mới trên khía cạnh nhận diện đa dạng nguồn ngôn ngữ và nội dung đầu vào, từ hình ảnh, âm thanh cho đến văn bản và cả video nữa.

Phiên bản đã ra mắt chính thức cho người dùng dịch vụ AI Gemini, là mô hình Gemini 2.0 Flash. Kết hợp với đó là một tính năng mới có tên Deep Research, ứng dụng kỹ thuật tư duy lý luận cao cấp, nhận diện được ngữ cảnh dung lượng lớn để đóng vai một trợ lý phục vụ nghiên cứu khoa học, khám phá những chủ đề phức tạp, và tổng hợp báo cáo nghiên cứu khoa học cho người dùng là những nhà nghiên cứu hàn lâm.

Gemini 2.0 Flash


Là phiên bản mô hình ngôn ngữ được nghiên cứu phát triển dựa trên những gì các kỹ sư của Google DeepMind đúc kết được ở thời điểm nghiên cứu phiên bản Gemini 1.5, Gemini 2.0 Flash tạo ra hiệu năng vượt qua 1.5 Pro ở nhiều khía cạnh đo đạc sức mạnh vận hành tạo nội dung, nhưng tốc độ tạo sinh token ngôn ngữ nhanh gấp đôi.

Gemini2.jpg

Bên cạnh việc nhận diện dữ liệu đầu vào dưới dạng đa chế độ ngôn ngữ (multimodal), tức là hiểu được hình ảnh, video và âm thanh, Gemini 2.0 Flash giờ cho phép tạo sinh nhiều dạng nội dung, từ hình ảnh kết hợp văn bản, cho tới nội dung âm thanh dịch sang nhiều thứ tiếng. Rồi Gemini 2.0 Flash cũng có thể tích hợp với kết quả tìm kiếm từ Google Search một cách trưc tiếp, cũng như vài tính năng do người dùng và các nhà phát triển ứng dụng tạo ra và vận hành, với mô hình ngôn ngữ 2.0 Flash làm nền móng.

Người dùng ứng dụng Gemini, công cụ được Google mô tả là trợ lý AI cho mọi người, cũng đã được tiếp cận phiên bản Gemini 2.0 Flash được tối ưu cho ứng dụng chatbot. HIện tại phiên bản này mới chỉ được ứng dụng trên Gemini nền web, trên cả máy tính lẫn điện thoại. Còn ứng dụng Gemini trên điện thoại của anh em sẽ cập nhật sau, hiện giờ ứng dụng vẫn đang chạy Gemini 1.5 Flash.

Project Astra được nâng cấp


Tại sự kiện Google I/O 2024 tổ chức hồi giữa năm nay, Google đã giới thiệu dự án nghiên cứu trợ lý AI vận hành với một cặp kính thực tế tăng cường, kết hợp hình ảnh của thế giới thật với những thông tin hiển thị ảo trên màn hình là tròng kính trong suốt. Vừa rồi, sau quá trình thử nghiệm Google Astra đối với những người làm tester bằng những chiếc điện thoại Android, Google cho biết Gemini 2.0 sẽ cho phép nâng cấp khả năng vận hành của Project Astra để nó vừa thông minh lại vừa an toàn, tuân thủ những quy định và chuẩn mực để phục vụ được cho tất cả mọi người.



Với Gemini 2.0, Project Astra được nâng cấp ở những khía cạnh sau:

  • Văn bản và đối thoại tốt hơn, cho phép trợ lý AI trò chuyện với người dùng bằng nhiều thứ tiếng hơn, thậm chí đôi khi trộn lẫn ngôn ngữ cũng được, và hiểu ngữ cảnh cùng phương ngữ tốt hơn.
  • Sử dụng được những công cụ mới. Với Gemini 2.0, Project Astra có thể sử dụng Google Search, Lens và Maps để phục vụ người dùng hàng ngày thuận tiện và hữu ích hơn.
  • Trí nhớ của trợ lý ảo vận hành bằng mô hình AI tốt hơn, tối đa 10 phút trong mỗi cuộc trò chuyện, và có thể nhớ được những cuộc trò chuyện trong quá khứ, để công cụ được cá nhân hóa tốt hơn cho mỗi nguời dùng.
  • Độ trễ được cải thiện giữa khoảng thời gian người dùng đưa ra câu lệnh hay yêu cầu, cho tới khi AI hiểu và đưa ra câu trả lời cho người dùng.

Project Mariner: Trợ lý ảo hỗ trợ những tác vụ công việc phức tạp


Đây là dự án nghiên cứu trợ lý ảo AI phục vụ nhu cầu công việc, Project Mariner dựa trên mô hình Gemini 2.0. Hiện tại, dự án đang ở thời điểm nghiên cứu sơ khai, với tham vọng khám phá tương lai, cách con người tương tác với những trợ lý AI, bắt đầu với trợ lý tích hợp trong trình duyệt.

Quảng cáo





Project Mariner, dựa trên Gemini 2.0, có khả năng đọc, hiểu và tư duy lý luận dựa trên nội dung trang web, từ những điểm ảnh cho tới những nội dung như văn bản, code, hình ảnh và mẫu điền. Rồi sau đó, trợ lý AI này sẽ sử dụng những thông tin đó để hoàn thành các tác vụ mà người dùng đưa ra, thông qua hình thái một web extension mở rộng cho Google Chrome.

Jules và Genie 2


Đầu tiên, Jules là một phiên bản trợ lý AI phục vụ các lập trình viên và nhà phát triển ứng dụng, giống như cách Microsoft ứng dụng GitHub Copilot trên nền tảng phân phối và chia sẻ code lập trình nổi tiếng. Công cụ trợ lý AI dành cho lập trình viên đang ở dạng thử nghiệm này của Google cho phép tích hợp trực tiếp vào luồng công việc của người dùng trên GitHub. Rồi sau đó, nó có thể giải quyết lỗi laajp trình, tạo ra kế hoạch và triển khai kế hoạch ấy, tất cả song hành với định hướng và sự kiểm soát của con người.



Thứ hai, Genie 2, ra mắt tuần trước, là một AI có khả năng tạo ra những thế giới ảo 3D và ngay lập tức cho phép người dùng, trong trường hợp này là các nhà phát triển game, ngay lập tức trải nghiệm việc điều khiển nhân vật trong thế giới ảo ấy. Tất cả những gì Genie 2 cần, chỉ là một tấm ảnh dùng làm tham chiếu để tạo ra thế giới ảo 3D dựa trên tông màu cũng như phong cách đồ họa mà các nhà làm game indie hay cá nhân mong muốn.

Quảng cáo


Kết hợp Genie 2 với Gemini 2.0, là những nhân vật trong thế giới ảo được tạo ra, vận hành bằng những câu lệnh điều khiển cách NPC hoạt động, sẽ có thêm khả năng tư duy lý luận để trở nên thông minh hơn. Nó hoàn toàn có thể được ứng dụng trong môi trường tự động hóa, giúp những hệ thống robot sản xuất và hỗ trợ con người vận hành hiệu quả hơn.

Theo Google Blog
47 bình luận
Chia sẻ

Xu hướng

ChatGPT vẫn ngon nhất, gemini/AI studio/copilot/perspecsity...cảm giác quá khô khan và chán
@Dragao_ct92 dành cho người mới thôi
@Dragao_ct92 Đúng thế,GPT vẫn là chân ái, còn Gemini nó quảng cáo tùm lum, mà còn trả lời ngáo ngáo kiểu gì ấy
@Tuấn BS Nó có trả lời đúng trọng tâm đâu bắc, toàn nói lòng vòng rồi kêu mình tự lên tra gu gồ.
@Dragao_ct92 Claude mình thấy nuột đấy
Không biết mới như thế nào chứ hiện tại so với ChatGPT thì còn thua xa lắm. Cùng một prompt mà ChatGPT nó hiểu đầy đủ và đưa ra câu trả lời chi tiết hơn rất nhiều so với kiểu trả lời chung chung hoặc thậm chí huề vốn từ Gemini.
@Crazylove4u xem version chỗ nào b nhỉ?
@oldman20 Dùng bản web mới cho chọn version
@Dragao_ct92 tiếp, xem để mở mang đầu óc, đừng thần thánh ChatGPT quá: x. com/aliniikk/status/1868743827252822525
@Extropic T ko quan tâm X. Ông ko phản biện dc mấy cái kia thì hết bài bưng bô Grok, next 😃
không biết mình đặt vấn đề chưa đúng hay sao mà so gemini vs chatgpt thì chatgpt trả lời chuẩn hơn.
đang dùng cái mô hình 1206 trên AI Studio, phải nói nó bá cháy. hỏi 1 câu nó cho hẳn 13 trang trả lời 😆
AI của google thì quá kinh thiên động địa, phá đảo, phá vỡ mọi giới hạn
Thua VIN AI tý thôi
@Doãn_Chí_Bình tất cả phải thua Apple Intelligence 🤡🤡🤡
Mới có thêm con 1.5 pro with deep research cũng bá đạo lắm, nhưng chỉ mới có tiếng anh chứ chưa có tiếng khác
Đưa thêm thông tin về Willow cho đám cừu bớt td với chip A chip M chỉ thay số hàng năm
Các bạn vẫn chưa biết Gemini làm được những gì =))))
@Extropic vào Gemini hỏi trực tiếp nó, nó sẽ trả lời
Khác gì bản cũ đâu. Vẫn lởm
ChatGPT và phần còn lại 😔
Chỉ toàn xài Gemini, thấy ổn hơn
Hoàng đế già đã trở lại
T hay xài gemini nên t biết con này nhiều khi nó rất ngu, trả lời chung chung, hướng dẫn người dùng cách tự làm = tay 😆 ức
Con gemini này ngu lắm. Ngay cả bản trả phí. T dùng mà thua chatGPT nhiều luôn đó. Dùng ức chế vãi
hoy, Gemini ngu như bò, kêu mô tả cái hình nó đọc sai màu, hình vuông nó gọi là lục giác, móa .....
Phiên bản 2.0 đã viết code, làm bài tập được chưa nhỉ?
cái nào ngon nhất ae :v
Screenshot 2024-12-17 101345.png

Xu hướng

Bài mới








  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2025 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019