OpenAI lại tiếp tục giới thiệu model o1 với khả năng suy luận vượt bậc hơn so với model flagship trước đây của họ cũng như của nhiều nhà phát triển khác. Động thái này không chỉ tiếp tục đẩy nhanh sự phát triển của công nghệ trí thông minh nhân tạo mà đồng thời, sự ra đời của Model o1 còn cho thấy một cách tiếp cận hoàn toàn mới của việc phát triển các model thế hệ tiếp theo.
Model o1-preview hay o1-mini mà OpenAI vừa phát hành không chỉ đơn thuần là bản nâng cấp data so với những model trước đây, mà hơn hết, nó thay đổi cách AI tiếp cận giải quyết vấn đề. Một cách nôm na cho dễ hiểu, các model AI trước đây "nâng cấp" theo kiểu nhét càng nhiều data càng tốt. Trong khi lần này, o1 nâng cấp theo kiểu suy nghĩ dựa trên những data đó.
Nói cách khác, cách tiếp cận của các model trước đây là tạo ra các học sinh học vẹt, nhớ càng nhiều kiến thức càng tốt. Còn với o1, thì cách tiếp cận là tạo ra một học sinh có khả năng hiểu được các nguyên lý cơ bản của kiến thức đã được học.
Dựa trên các bài test, OpenAI nói rằng model o1 vượt trội hơn so với các model trước đây đối với các tác vụ đòi hỏi khả năng suy luận sâu, đặc biệt là trong lĩnh vực STEM. o1 được "tích hợp" khả năng suy luận theo kiểu chain-of-thought, tìm cách bắt chước quá trình giải quyết vấn đề của con người.
OpenAI o1: AI biết học cách suy nghĩ
Model o1-preview hay o1-mini mà OpenAI vừa phát hành không chỉ đơn thuần là bản nâng cấp data so với những model trước đây, mà hơn hết, nó thay đổi cách AI tiếp cận giải quyết vấn đề. Một cách nôm na cho dễ hiểu, các model AI trước đây "nâng cấp" theo kiểu nhét càng nhiều data càng tốt. Trong khi lần này, o1 nâng cấp theo kiểu suy nghĩ dựa trên những data đó.
Nói cách khác, cách tiếp cận của các model trước đây là tạo ra các học sinh học vẹt, nhớ càng nhiều kiến thức càng tốt. Còn với o1, thì cách tiếp cận là tạo ra một học sinh có khả năng hiểu được các nguyên lý cơ bản của kiến thức đã được học.
Khả năng suy luận là điểm quan trọng
Dựa trên các bài test, OpenAI nói rằng model o1 vượt trội hơn so với các model trước đây đối với các tác vụ đòi hỏi khả năng suy luận sâu, đặc biệt là trong lĩnh vực STEM. o1 được "tích hợp" khả năng suy luận theo kiểu chain-of-thought, tìm cách bắt chước quá trình giải quyết vấn đề của con người.
OpenAI cho biết model o1 có thể đạt 89% cuộc thi lập trình Codeforces và đạt độ chính xác 83% khi giải toán trong cuộc thi AIME. Trong một phép so sánh, GPT-4o trước đây chỉ đạt độ chính xác khi giải AIME là 13%. Những con số này phần nào giúp chúng ta hình dung được khả năng phân tích xử lý các vấn đề đòi hỏi suy luận phức tạp của model o1.
Cái giá cho khả năng suy luận của 4o
Tất nhiên bên cạnh khả năng suy luận vượt trội của 4o thì số tiền người dùng cần bỏ ra để xài nó cũng không nhỏ. Cụ thể mỗi 1 triệu token input tốn 15 đô la và 1 triệu token output là 60 đô. Đối với model GPT-4o thì chỉ có 5 đô cho 1 triệu input token và 15 đô cho 1 triệu output token.
Một cái giá khác chính là o1 cũng sẽ trả kết quả về chậm hơn rất nhiều so với 4o hoặc những model trước đây. Nói nôm na thì giống như ăn bánh mì với ăn fine dinning vậy. Một cái nhanh, rẻ và có thể không ngon. Một cái thì mắc, mang lại trải nghiệm tuyệt vời nhưng chắc chắn không ngon.
o1 sẽ dùng để làm gì
Có thể thấy với khả năng suy luận mạnh mẽ, o1 sẽ dành cho những tác vụ phức tạp, thí dụ như những mô hình tính toán khoa học đòi hỏi độ chính xác cao, giải quyết các vấn đề ở những bộ môn phức tạp, phục vụ quá trình nghiên cứu khoa học,...
Đối với hầu hết các tác vụ thông thường khác, bao gồm cả phân tích dữ liệu, model 4o của GPT vẫn đáp ứng được một cách hiệu quả.
Nếu so với các model khác về ứng dụng, mình nghĩ các tác vụ tạo nội dung, code và nhiều thứ khác, Claude 3.5 sẽ phù hợp hơn. Đối với nhu cầu phân tích dữ liệu, xử lý đa model thì Gemini 1.5 Pro sẽ là lựa chọn phù hợp hơn.
Tạm kết
Quảng cáo
Có thể thấy, việc OpenAI ra mắt o1 với khả năng suy luận là một bước chuyển quan trọng trong việc tiếp cận tạo ra model AI. Các model AI sắp tới không chỉ đơn thuần đọ sức mạnh bằng bao nhiêu tỷ tham số nữa mà còn phải được chuyên môn hóa để suy luận hiệu quả trong những vấn đề đặc thù.
Việc hiểu rõ khả năng của từng model sẽ giúp chúng ta lựa chọn đúng công cụ chúng ta cần để giải quyết vấn đề một cách hiệu quả hơn. Chắc chăn, AI không thay thế con người trong việc suy nghĩ nhưng rõ ràng, với khả năng như hiện tại thì nó chắc chắn sẽ là công cụ hiệu quả để tăng cường khả năng suy nghĩ và làm việc của chúng ta nhiều hơn.