Open AI vừa cho ra mắt mô hình ChatGPT o1 với khả năng tư duy gần giống con người trong việc giải quyết các vấn đề phức tạp trước khi đưa ra câu trả lời.
Người dùng bản ChatGPT Plus đã có thể truy cập ChatGPT o1-preview và ChatGPT o1-mini
Hiện tại, phiên bản ChatGPT o1-preview đã có sẵn cho các tài khoản ChatGPT Plus hoặc Team, và sẽ sớm được cung cấp cho tài khoản doanh nghiệp (Enterprise) và giáo dục (Edu) vào tuần tới. OpenAI cũng có kế hoạch mang mô hình này đến người dùng miễn phí, tuy nhiên chưa xác định thời gian cụ thể.
ChatGPT o1 và ChatGPT o1-mini
Mô hình ChatGPT o1 được giới thiệu với khả năng xử lý và tìm lời giải cho các tác vụ phức tạp nhanh hơn con người. Điểm đặc biệt là ChatGPT o1 có khả năng tiếp nhận vấn đề, tư duy theo từng bước và phân tích trước khi đưa ra câu trả lời. Bên cạnh đó, OpenAI cũng ra mắt phiên bản giá rẻ ChatGPT o1-mini, chỉ tập trung vào lĩnh vực lập trình. Điều này mang lại một giải pháp kinh tế hơn cho các nhà phát triển nhưng vẫn đảm bảo khả năng tư duy và giải quyết vấn đề giống như o1.Người dùng bản ChatGPT Plus đã có thể truy cập ChatGPT o1-preview và ChatGPT o1-mini
Hiện tại, phiên bản ChatGPT o1-preview đã có sẵn cho các tài khoản ChatGPT Plus hoặc Team, và sẽ sớm được cung cấp cho tài khoản doanh nghiệp (Enterprise) và giáo dục (Edu) vào tuần tới. OpenAI cũng có kế hoạch mang mô hình này đến người dùng miễn phí, tuy nhiên chưa xác định thời gian cụ thể.
Điều thú vị là nếu bạn theo dõi tin đồn về AI, dự án Strawberry mà nhiều nguồn tin đề cập chính là ChatGPT o1 này.
Cách thức hoạt động
Theo OpenAI, ChatGPT o1 được huấn luyện bằng phương thức khác biệt so với các mô hình trước đây. Trước đó, các mô hình sẽ dựa trên tập dữ liệu huấn luyện để tìm ra các mẫu (pattern) và đưa ra câu trả lời. Với ChatGPT o1, nó được huấn luyện bằng một tập dữ liệu đặc biệt được tối ưu cho việc tư duy và phân tích qua từng bước, cùng với kĩ thuật reinforcement learning. Với kĩ thuật này, mô hình sẽ đưa ra câu trả lời khi tương tác với người dùng, giúp mô hình nhận phản hồi tích cực hoặc tiêu cực. Quá trình thử sai này giúp ChatGPT o1 tối ưu hóa cách trả lời hoặc thử phương thức khác, tập trung vào việc tối đa hóa các phản hồi tích cực.Kỹ thuật này được ứng dụng rộng rãi trong nhiều lĩnh vực như robot, trò chơi, hệ thống tự động và các thuật toán đề xuất.
Hiệu năng vượt trội
Để đánh giá hiệu năng của ChatGTP o1, OpenAI đã thực hiện nhiều bài kiểm tra về Toán học, Lập trình, và các bài kiểm tra liên quan đến khả năng xử lý vấn đề của các sinh viên tiến sĩ vật lý, hóa học, y học. Kết quả cho thấy ChatGPT o1 vượt trội hơn GPT-4o trong phần lớn các bài kiểm tra đòi hỏi tư duy phức tạp.Kết quả các mô hình thực hiện trong bài kiểm tra Codeforces. Mô hình o1 sau khi được tối ưu cũng có kết quả rất tốt với điểm 1673 điểm Elo và cao hơn 89% thí sinh tham gia. Nguồn: OpenAI
Cụ thể, trong bài kiểm tra lập trình Codeforces, ChatGPT o1 đạt điểm cao hơn 89% người tham gia. Ngoài ra, phiên bản ChatGPT o1-ioi, được huấn luyện với câu hỏi của Olympic Tin học Quốc tế, đạt điểm cao hơn 93% so với các thí sinh, cao hơn rất nhiều so với ChatGPT-4o hay ChatGPT o1.
Quảng cáo
Về khả năng xử lý toán học, ChatGPT o1 đạt 75% trong kỳ thi Olympic Toán tại Mỹ năm 2024, và sau 1000 lần thử, kết quả tăng lên 93%, xếp ChatGPT o1 vào top 500 học sinh giỏi toán của Mỹ. Trong kỳ thi quốc tế, ChatGPT o1 giải đúng 83% các bài toán, vượt xa GPT-4o với chỉ 13%.
Với khả năng xử lý vấn đề, ChatGPT o1 là mô hình đầu tiên vượt qua các sinh viên tiến sĩ trong thang đo GPQA. Dù không khẳng định ChatGPT o1 giỏi hơn, nhưng nó hiệu quả hơn trong việc giải quyết vấn đề một cách tuần tự.
Ngoài ra, mình thử nghiệm nhanh với một bài toán nhỏ mà chắc anh em ai cũng biết: vừa gà vừa chó - bó lại cho tròn 100 con. Ở đây, tổng số con là 50 con và tổng số chân là 200.
ChatGPT o1 đưa ra từng bước giải quyết vấn đề, chi tiết phân tích và cách làm cũng như kết quả 50 chó - 0 gà
Trong khi ChatGPT 40 cũng đưa ra từng bước, nhưng ngắn gọn hơn và cùng kết quả.
Đánh giá từ người dùng
Quảng cáo
Người dùng ưa thích o1-preview hơn trong các tác vụ đòi hỏi việc tư duy. Nguồn: OpenAI
OpenAI cũng thực hiện khảo sát để đánh giá mức độ ưa thích của người dùng giữa ChatGPT o1 và ChatGPT-4o. Người dùng sẽ được cho biết các câu trả lời mà hai mô hình này đưa ra nhưng không biết rõ câu trả lời nào thuộc mô hình nào. Sau đó, họ sẽ lựa chọn câu trả lời mà họ ưa thích hơn. Kết quả cho thấy phần lớn người dùng ưa thích các câu trả lời mà ChatGPT o1 cung cấp trong phần lớn các lĩnh vực, nhất là lĩnh vực cần tư duy lý luận. Lĩnh vực duy nhất mà ChatGPT-4o được ưa thích hơn là các câu trả lời liên quan đến ngôn ngữ tự nhiên. Điều này, theo OpenAI, cho thấy hiện tại ChatGPT-o1, với góc nhìn của người dùng vẫn có những tình huống không được ưa chuộng hoàn toàn.
Giới hạn và sự an toàn
ChatGPT o1 hiện tại chỉ là phiên bản preview và vẫn có một số giới hạn như chưa có khả năng duyệt web để cung cấp thông tin chính xác hay phân tích tập tin, hình ảnh. Tuy nhiên, OpenAI dự định sẽ sớm cải thiện các tính năng này trong tương lai.Về mặt an toàn, OpenAI khẳng định ChatGPT o1 được thiết kế để tích hợp các tiêu chí an toàn vào quá trình tư duy, phân tích. Điều này thể hiện rằng hãng đang nỗ lực giải quyết các quan ngại về sự an toàn. Việc tư duy theo từng bước sẽ cho phép OpenAI hướng dẫn mô hình tuân theo các giá trị và nguyên tắc con người. Bằng cách này, ChatGPT o1 đạt kết quả rất tốt trong các bài kiểm tra khó nhất về sự an toàn của mô hình trí tuệ nhân tạo. Mặc dù vậy, OpenAI vẫn chưa giải quyết triệt để vấn đề ảo giác (hallucination) nhưng đã giảm thiểu đáng kể số lần xảy ra.
Một vấn đề an toàn khác mà OpenAI nhắc tới là việc mô hình này tư duy thông qua từng bước cho phép hãng quang sát liệu mô hình có đang thao túng người dùng hay không. Tuy nhiên, để cách này vận hành được, mô hình phải được phép thể hiện những suy nghĩ nguyên bản nhất, tự do nhất mà chưa bị can thiệp. Điều này có thể tạo ra những rủi ro nhất định, kết hợp với việc cân nhắc các yếu tố cạnh tranh, trải nghiệm người dùng, OpenAI quyết định ẩn đi những suy nghĩ này mà chỉ hiển thị bản tóm tắt các suy nghĩ đã được tối ưu mà mô hình tạo ra.
ChatGPT o1 đánh dấu một bước tiến mới trong việc tạo ra trí tuệ nhân tạo có khả năng tư duy gần giống con người với hiệu quả vượt trội trong các tác vụ phức tạp. Đồng thời, nó cũng mở ra một cơ hội để con người hiểu rõ hơn cách AI suy nghĩ, nhằm ngăn ngừa việc bị thao túng.
Nguồn [1][2]