Laptop Acer



Sơ lược về model OpenAI o1: khả năng suy luận, chi phí, ứng dụng

ND Minh Đức
14/9/2024 0:14Phản hồi: 18
Sơ lược về model OpenAI o1: khả năng suy luận, chi phí, ứng dụng
OpenAI lại tiếp tục giới thiệu model o1 với khả năng suy luận vượt bậc hơn so với model flagship trước đây của họ cũng như của nhiều nhà phát triển khác. Động thái này không chỉ tiếp tục đẩy nhanh sự phát triển của công nghệ trí thông minh nhân tạo mà đồng thời, sự ra đời của Model o1 còn cho thấy một cách tiếp cận hoàn toàn mới của việc phát triển các model thế hệ tiếp theo.

OpenAI o1: AI biết học cách suy nghĩ


Model o1-preview hay o1-mini mà OpenAI vừa phát hành không chỉ đơn thuần là bản nâng cấp data so với những model trước đây, mà hơn hết, nó thay đổi cách AI tiếp cận giải quyết vấn đề. Một cách nôm na cho dễ hiểu, các model AI trước đây "nâng cấp" theo kiểu nhét càng nhiều data càng tốt. Trong khi lần này, o1 nâng cấp theo kiểu suy nghĩ dựa trên những data đó.

Nói cách khác, cách tiếp cận của các model trước đây là tạo ra các học sinh học vẹt, nhớ càng nhiều kiến thức càng tốt. Còn với o1, thì cách tiếp cận là tạo ra một học sinh có khả năng hiểu được các nguyên lý cơ bản của kiến thức đã được học.

Khả năng suy luận là điểm quan trọng


Dựa trên các bài test, OpenAI nói rằng model o1 vượt trội hơn so với các model trước đây đối với các tác vụ đòi hỏi khả năng suy luận sâu, đặc biệt là trong lĩnh vực STEM. o1 được "tích hợp" khả năng suy luận theo kiểu chain-of-thought, tìm cách bắt chước quá trình giải quyết vấn đề của con người.


OpenAI cho biết model o1 có thể đạt 89% cuộc thi lập trình Codeforces và đạt độ chính xác 83% khi giải toán trong cuộc thi AIME. Trong một phép so sánh, GPT-4o trước đây chỉ đạt độ chính xác khi giải AIME là 13%. Những con số này phần nào giúp chúng ta hình dung được khả năng phân tích xử lý các vấn đề đòi hỏi suy luận phức tạp của model o1.

Cái giá cho khả năng suy luận của 4o


Tất nhiên bên cạnh khả năng suy luận vượt trội của 4o thì số tiền người dùng cần bỏ ra để xài nó cũng không nhỏ. Cụ thể mỗi 1 triệu token input tốn 15 đô la và 1 triệu token output là 60 đô. Đối với model GPT-4o thì chỉ có 5 đô cho 1 triệu input token và 15 đô cho 1 triệu output token.

Một cái giá khác chính là o1 cũng sẽ trả kết quả về chậm hơn rất nhiều so với 4o hoặc những model trước đây. Nói nôm na thì giống như ăn bánh mì với ăn fine dinning vậy. Một cái nhanh, rẻ và có thể không ngon. Một cái thì mắc, mang lại trải nghiệm tuyệt vời nhưng chắc chắn không ngon.

o1 sẽ dùng để làm gì


Có thể thấy với khả năng suy luận mạnh mẽ, o1 sẽ dành cho những tác vụ phức tạp, thí dụ như những mô hình tính toán khoa học đòi hỏi độ chính xác cao, giải quyết các vấn đề ở những bộ môn phức tạp, phục vụ quá trình nghiên cứu khoa học,...

Đối với hầu hết các tác vụ thông thường khác, bao gồm cả phân tích dữ liệu, model 4o của GPT vẫn đáp ứng được một cách hiệu quả.

Nếu so với các model khác về ứng dụng, mình nghĩ các tác vụ tạo nội dung, code và nhiều thứ khác, Claude 3.5 sẽ phù hợp hơn. Đối với nhu cầu phân tích dữ liệu, xử lý đa model thì Gemini 1.5 Pro sẽ là lựa chọn phù hợp hơn.

Tạm kết

Quảng cáo


Có thể thấy, việc OpenAI ra mắt o1 với khả năng suy luận là một bước chuyển quan trọng trong việc tiếp cận tạo ra model AI. Các model AI sắp tới không chỉ đơn thuần đọ sức mạnh bằng bao nhiêu tỷ tham số nữa mà còn phải được chuyên môn hóa để suy luận hiệu quả trong những vấn đề đặc thù.

Việc hiểu rõ khả năng của từng model sẽ giúp chúng ta lựa chọn đúng công cụ chúng ta cần để giải quyết vấn đề một cách hiệu quả hơn. Chắc chăn, AI không thay thế con người trong việc suy nghĩ nhưng rõ ràng, với khả năng như hiện tại thì nó chắc chắn sẽ là công cụ hiệu quả để tăng cường khả năng suy nghĩ và làm việc của chúng ta nhiều hơn.
18 bình luận
Chia sẻ

Xu hướng

DanalTrinh
ĐẠI BÀNG
20 ngày
" Một cái nhanh, rẻ và có thể không ngon. Một cái thì mắc, mang lại trải nghiệm tuyệt vời nhưng chắc chắn không ngon" Ủa????
Cười ra nước mắt
TQB103
ĐẠI BÀNG
20 ngày
@DanalTrinh 👍👍😀😀
tekar
ĐẠI BÀNG
20 ngày
@DanalTrinh đặc sản vẹt như AI
oldman20
TÍCH CỰC
19 ngày
@DanalTrinh Đang định còm thì đã có police chính tả tuýt trc, cám ơn đ/c 😃
holaboy
ĐẠI BÀNG
20 ngày
là chốt lại ko nên xài???
magez
CAO CẤP
20 ngày
@holaboy Mới xài thử hôm qua, công nhận nó thông minh hơn hẳn các model khác.
Hỏi nó câu về thuật toán & code, nó đưa ra kết quả rất tối ưu hơn & cho output ngon lành (mấy model khác như gpt 4o, gemini, copilot, claude) đều đưa ra câu trả lời sai hoặc code có lỗi hoặc output ko đúng.
Nó xử lý chậm hơn model 4o & claude, nhưng cũng ko đáng bao nhiêu, quan trọng là kết quả rất ấn tượng.
@magez o1-preview à.
jn.loc
ĐẠI BÀNG
20 ngày
"Nói nôm na thì giống như ăn bánh mì với ăn fine dinning vậy. Một cái nhanh, rẻ và có thể không ngon. Một cái thì mắc, mang lại trải nghiệm tuyệt vời nhưng chắc chắn không ngon." ỦA x 999 lần, sao đọc thấy lấn cấn vậy nhỉ
Vẫn méo dự báo đc kết quả sổ xố.
Thời Ai đủ thứ kiểu
Vào đâu để xài con này nhỉ?
Mình tìm trong app Gemini (Android) và Perplexity Pro đều ko thấy 🙂
nghe.si
ĐẠI BÀNG
20 ngày
@╰‿╯ Bỏ đi bạn. Bạn ko phù hợp với việc này đâu OpenAI à
@╰‿╯ App chatgpt
centernc2
ĐẠI BÀNG
20 ngày
AI mạnh nên dự báo thời tiết. Đơn giản thế thôi
@centernc2 Từ từ nó làm được tất, quan trọng con người đang dạy nó thế nào thôi.
centernc2
ĐẠI BÀNG
20 ngày
@parkcheungsoovn Từ từ gì nữa, máy tính dự báo thời tiết có lâu rồi
Vẫn không dự được số đề
Xài o1 để dịch, lúc đầu nó suy nghĩ rất lâu, nhưng mà sau khi nó suy nghĩ xong thì nó trả về kết quả rất nhanh, các yêu cầu dịch tiếp theo cũng được trả về siêu nhanh. Có điều, một lúc sau nó từ chối dịch tiếp vì lo ngại bản quyền. Nói túm lại là vứt.

Xu hướng

Bài mới










  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019