Google ra mắt mô hình Gemini 2.5, tăng cường khả năng suy luận và xử lý tình huống phức tạp

Pnghuy
26/3/2025 5:56Phản hồi: 24
EditEdit
Google ra mắt mô hình Gemini 2.5, tăng cường khả năng suy luận và xử lý tình huống phức tạp
Google đang tăng tốc trong việc chạy đua với OpenAI, Anthorpic hay xAI về việc triển khai các mô hình mới bằng cách ra mắt mô hình Gemini 2.5, hứa hẹn mang lại những cải tiến vượt trội về khả năng suy luận, lập trình và xử lý các tác vụ đa phương tiện phức tạp.

Gemini 2.5 được cải tiến dựa trên phản hồi từ người dùng và dữ liệu thực tế, giúp nó thích nghi tốt hơn với các câu hỏi khó hoặc không rõ ràng. Ngoài ra, Google cũng tích hợp thêm các công cụ hỗ trợ để mô hình có thể phân tích và suy luận logic tốt hơn, chẳng hạn như xử lý các chuỗi câu hỏi liên tiếp hoặc giải thích các vấn đề có nhiều tầng ý nghĩa.

Ngay khi ra mắt, Gemini 2.5 Pro lập tức đứng đầu bảng xếp hạng LMArena, với một khoảng cách đáng kể so với các đối thủ. Mô hình này đạt được những điểm số ấn tượng trên các bộ dữ liệu đánh giá mã hóa như SWE-Bench Verified và Aider Polyglot. Mặc dù điểm số trên SWE-Bench Verified (63,8%) thấp hơn một chút so với Claude 3.7 Sonnet (70,3%), nhưng Gemini 2.5 Pro lại vượt trội trong việc chuyển đổi và chỉnh sửa code, đạt 74% trên Aider Polyglot. Ngoài ra, trên bộ dữ liệu GPQA (dành cho khoa học), Gemini 2.5 Pro đạt hiệu suất rất tốt so với các mô hình còn lại, cho thấy khả năng xử lý các câu hỏi khoa học phức tạp.

Với AIME 2025 (toán học), mô hình này cũng dẫn đầu, chứng minh năng lực giải quyết các bài toán đòi hỏi tư duy logic sâu. Những kết quả này đạt được chỉ trong một lần chạy (single pass), không cần tối ưu hóa thêm, điều này nhấn mạnh sức mạnh tự nhiên của mô hình. Đặc biệt với bài test Humanity's Last Exam, Gemini 2.5 Pro ghi điểm 18.8% mà không cần dùng công cụ hỗ trợ, vượt qua các mô hình khác và được xem là kết quả "state-of-the-art" (tốt nhất hiện tại) trong nhóm không sử dụng công cụ. Humanity's Last Exam là một bộ dữ liệu do hàng trăm chuyên gia xây dựng để kiểm tra giới hạn kiến thức và khả năng lập luận của con người.
gemini-benchmarks-cropped-light2x.original.png
Về mặt kỹ thuật, Gemini 2.5 nhanh hơn đáng kể so với các phiên bản tiền nhiệm, đồng thời sử dụng ít tài nguyên tính toán hơn. Điều này có được nhờ vào sự kết hợp giữa các thuật toán tối ưu hóa mới và những tiến bộ trong công nghệ học sâu từ DeepMind. Đội ngũ Google nhấn mạnh rằng đây là một phần trong nỗ lực của họ để làm cho AI trở nên thông minh hơn, hiệu quả hơn và hữu ích hơn cho mọi người.
Screenshot 2025-03-26 124542.png
Gemini 2.5 Pro vẫn có context Window là 1 triệu token, cho phép xử lý lượng lớn dữ liệu đầu vào bao gồm hình ảnh, âm thanh, video và cả văn bản cũng như code. Google cho biết họ có kế hoạch mở rộng context window lên 2 triệu token trong tương lai, nhưng hiện tại họ đang muốn tối ưu cho từng trường hợp cụ thể trước.

image.png
Hiện tại Gemini 2.5 Pro đã được triển khai bản dùng thử trên ứng dụng Gemini dành cho người dùng Advanced cũng như trên Google AI Studio.

Google.
24 bình luận

Xu hướng

Lâu rồi chỉ còn dùng Gemini trên điện thoại cho các mục đích vui vẻ như kiểu Google assistant, được cái live của nó tự nhiên hơn gpt.

Còn lại công việc vẫn dùng gpt vì cách trình bày của nó rất mạch lạc, chia ra thành các ý rõ ràng, có thêm cả các các emoji cho các đầu mục rất hợp lý và dễ hình dung.

Nếu GPT sai nó ko fix được bug thì Gemini lại làm rất tốt, nhưng bảo nó code từ đầu thì khá chán.
Cười mặt nồi
@BlackMan00x ChatGPT dạo này trả lời ngắn quá, hỏi tới đâu trả lời tới đó mà lại thiếu ý, phải hỏi thêm 2 3 lần mới xong vấn đề. Cùng câu hỏi thì Grok trả lời đầy đủ và chi tiết hơn nhiều.
@BlackMan00x Gemini có Deep Research dùng hay phết
@BlackMan00x Con Grok ngon hơn nhiều. Phân tích file rất mạnh, tư duy tự nhiên hơn nên prompt rất dễ
Con Gemini này không dám trả lời các vấn đề liên quan đến Woke/Chính trị, chán vô cùng :v Kiểm duyệt của con Gemini này thì còn hơn cả DeepSeek
@hypous mấy cái chuyện đó hỏi con Grok là tốt nhất 😃
Đang sài và công nhận nó tốt hơn o3-mini-high thiệt. Hiểu ngữ cảnh và phân tích tốt hơn. 👍👍👍
@tieuan198 Cậu hỏi nó về code, lập trình à? Lúc trước thấy Gemini bị chê quá trời, bây giờ thấy benchmark ngon ghê. Ưu điểm của nó là windows context lớn, sau này mà ngon nghẻ thì windows context là 1 lợi thế rất lớn.
dùng con này chỉ thêm rước bực vào người 😃
@dark_knjght01 Mỗi con có lợi thế riêng mà ông, riêng trong công việc của tôi thì thấy Gemini ngon hơn Chat GPT rất nhiều, Chat GPT phân tích ngắn gọn quá.
Các bác không thích Gemini thì hãy một lần sử dụng Deep reseach của nó. Đỉnh vô cùng
@jackback9296 Cái này rất hay, mình cái gì ko hiểu quẳng 1 câu vu vơ vào là nó phân tích cụ thể luôn
@jackback9296 Google là trùm tìm kiếm rồi, cái gì liên quan tìm kiếm nó chả làm tốt 😃
AI đang ngày càng bá, mình không hiểu sắp tới Apple Idiot sẽ đi theo hướng nào.
Gemini xài chậm, chatgpt công nhận vô đối
@TôiMinh Từ ngày dùng Gemini giờ chưa thấy xử lý chậm bh luôn ấy
Gemini, chat GPT tương đối hữu ích khi biết đơn giản, lười nghĩ.
Mua đi rồi phán dùng bản miễn phí nó giống nước mưa với cứt chim thôi
Screenshot-20250326-234003-Google.jpg
Xài cả rồi code thì Grok vô đối. Các bạn thấy con nào code tốt hơn ko
Apple của chúng ta mấy chấm rồi anh em 😆
@vietnamMBC Anh em Apple còn đang ăn mừng Siri cuối cùng cũng có tiếng Việt 🤣
@duyvua Công nhận, xong nhìn mấy thánh review cứ như đại cải cách mạng ý, suy cho cùng Apple nó đối xử thị trường Việt như shit mà vẫn nhận đc sự tung hô, đến lạ
@vietnamMBC Nó trơn tru mặc dù hơi ngu và mù tv
Anh em dùng gemini trên Oto - android Auto thấy thế nào?

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2026 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: 351/56 Lê Văn Sỹ, P. Nhiêu Lộc, Tp HCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép cung cấp dịch vụ MXH số 134/GP-BVHTTDL, Ký ngày: 30/09/2025