Laptop Acer



OpenAI giới thiệu và cho dùng thử ChatGPT o1 với khả năng tư duy gần như con người

nhatminhngo
13/9/2024 4:1Phản hồi: 49
OpenAI giới thiệu và cho dùng thử ChatGPT o1 với khả năng tư duy gần như con người
Open AI vừa cho ra mắt mô hình ChatGPT o1 với khả năng tư duy gần giống con người trong việc giải quyết các vấn đề phức tạp trước khi đưa ra câu trả lời.

ChatGPT o1 và ChatGPT o1-mini

Mô hình ChatGPT o1 được giới thiệu với khả năng xử lý và tìm lời giải cho các tác vụ phức tạp nhanh hơn con người. Điểm đặc biệt là ChatGPT o1 có khả năng tiếp nhận vấn đề, tư duy theo từng bước và phân tích trước khi đưa ra câu trả lời. Bên cạnh đó, OpenAI cũng ra mắt phiên bản giá rẻ ChatGPT o1-mini, chỉ tập trung vào lĩnh vực lập trình. Điều này mang lại một giải pháp kinh tế hơn cho các nhà phát triển nhưng vẫn đảm bảo khả năng tư duy và giải quyết vấn đề giống như o1.


[​IMG]
Người dùng bản ChatGPT Plus đã có thể truy cập ChatGPT o1-preview và ChatGPT o1-mini

Hiện tại, phiên bản ChatGPT o1-preview đã có sẵn cho các tài khoản ChatGPT Plus hoặc Team, và sẽ sớm được cung cấp cho tài khoản doanh nghiệp (Enterprise) và giáo dục (Edu) vào tuần tới. OpenAI cũng có kế hoạch mang mô hình này đến người dùng miễn phí, tuy nhiên chưa xác định thời gian cụ thể.


Điều thú vị là nếu bạn theo dõi tin đồn về AI, dự án Strawberry mà nhiều nguồn tin đề cập chính là ChatGPT o1 này.

Cách thức hoạt động

Theo OpenAI, ChatGPT o1 được huấn luyện bằng phương thức khác biệt so với các mô hình trước đây. Trước đó, các mô hình sẽ dựa trên tập dữ liệu huấn luyện để tìm ra các mẫu (pattern) và đưa ra câu trả lời. Với ChatGPT o1, nó được huấn luyện bằng một tập dữ liệu đặc biệt được tối ưu cho việc tư duy và phân tích qua từng bước, cùng với kĩ thuật reinforcement learning. Với kĩ thuật này, mô hình sẽ đưa ra câu trả lời khi tương tác với người dùng, giúp mô hình nhận phản hồi tích cực hoặc tiêu cực. Quá trình thử sai này giúp ChatGPT o1 tối ưu hóa cách trả lời hoặc thử phương thức khác, tập trung vào việc tối đa hóa các phản hồi tích cực.


Kỹ thuật này được ứng dụng rộng rãi trong nhiều lĩnh vực như robot, trò chơi, hệ thống tự động và các thuật toán đề xuất.

Hiệu năng vượt trội

Để đánh giá hiệu năng của ChatGTP o1, OpenAI đã thực hiện nhiều bài kiểm tra về Toán học, Lập trình, và các bài kiểm tra liên quan đến khả năng xử lý vấn đề của các sinh viên tiến sĩ vật lý, hóa học, y học. Kết quả cho thấy ChatGPT o1 vượt trội hơn GPT-4o trong phần lớn các bài kiểm tra đòi hỏi tư duy phức tạp.


ket-qua-kiem-tra-lap-trinh-codeforces.png
Kết quả các mô hình thực hiện trong bài kiểm tra Codeforces. Mô hình o1 sau khi được tối ưu cũng có kết quả rất tốt với điểm 1673 điểm Elo và cao hơn 89% thí sinh tham gia. Nguồn: OpenAI

Cụ thể, trong bài kiểm tra lập trình Codeforces, ChatGPT o1 đạt điểm cao hơn 89% người tham gia. Ngoài ra, phiên bản ChatGPT o1-ioi, được huấn luyện với câu hỏi của Olympic Tin học Quốc tế, đạt điểm cao hơn 93% so với các thí sinh, cao hơn rất nhiều so với ChatGPT-4o hay ChatGPT o1.

Quảng cáo


Về khả năng xử lý toán học, ChatGPT o1 đạt 75% trong kỳ thi Olympic Toán tại Mỹ năm 2024, và sau 1000 lần thử, kết quả tăng lên 93%, xếp ChatGPT o1 vào top 500 học sinh giỏi toán của Mỹ. Trong kỳ thi quốc tế, ChatGPT o1 giải đúng 83% các bài toán, vượt xa GPT-4o với chỉ 13%.

Với khả năng xử lý vấn đề, ChatGPT o1 là mô hình đầu tiên vượt qua các sinh viên tiến sĩ trong thang đo GPQA. Dù không khẳng định ChatGPT o1 giỏi hơn, nhưng nó hiệu quả hơn trong việc giải quyết vấn đề một cách tuần tự.

Ngoài ra, mình thử nghiệm nhanh với một bài toán nhỏ mà chắc anh em ai cũng biết: vừa gà vừa chó - bó lại cho tròn 100 con. Ở đây, tổng số con là 50 con và tổng số chân là 200.

bai-toan-vua-ga-vua-cho-o1.png
ChatGPT o1 đưa ra từng bước giải quyết vấn đề, chi tiết phân tích và cách làm cũng như kết quả 50 chó - 0 gà
bai-toan-vua-ga-vua-cho-4o.png
Trong khi ChatGPT 40 cũng đưa ra từng bước, nhưng ngắn gọn hơn và cùng kết quả.

Đánh giá từ người dùng

lua-chon-cua-nguoi-dung.png

Quảng cáo




Người dùng ưa thích o1-preview hơn trong các tác vụ đòi hỏi việc tư duy. Nguồn: OpenAI

OpenAI cũng thực hiện khảo sát để đánh giá mức độ ưa thích của người dùng giữa ChatGPT o1 và ChatGPT-4o. Người dùng sẽ được cho biết các câu trả lời mà hai mô hình này đưa ra nhưng không biết rõ câu trả lời nào thuộc mô hình nào. Sau đó, họ sẽ lựa chọn câu trả lời mà họ ưa thích hơn. Kết quả cho thấy phần lớn người dùng ưa thích các câu trả lời mà ChatGPT o1 cung cấp trong phần lớn các lĩnh vực, nhất là lĩnh vực cần tư duy lý luận. Lĩnh vực duy nhất mà ChatGPT-4o được ưa thích hơn là các câu trả lời liên quan đến ngôn ngữ tự nhiên. Điều này, theo OpenAI, cho thấy hiện tại ChatGPT-o1, với góc nhìn của người dùng vẫn có những tình huống không được ưa chuộng hoàn toàn.

Giới hạn và sự an toàn

ChatGPT o1 hiện tại chỉ là phiên bản preview và vẫn có một số giới hạn như chưa có khả năng duyệt web để cung cấp thông tin chính xác hay phân tích tập tin, hình ảnh. Tuy nhiên, OpenAI dự định sẽ sớm cải thiện các tính năng này trong tương lai.

Về mặt an toàn, OpenAI khẳng định ChatGPT o1 được thiết kế để tích hợp các tiêu chí an toàn vào quá trình tư duy, phân tích. Điều này thể hiện rằng hãng đang nỗ lực giải quyết các quan ngại về sự an toàn. Việc tư duy theo từng bước sẽ cho phép OpenAI hướng dẫn mô hình tuân theo các giá trị và nguyên tắc con người. Bằng cách này, ChatGPT o1 đạt kết quả rất tốt trong các bài kiểm tra khó nhất về sự an toàn của mô hình trí tuệ nhân tạo. Mặc dù vậy, OpenAI vẫn chưa giải quyết triệt để vấn đề ảo giác (hallucination) nhưng đã giảm thiểu đáng kể số lần xảy ra.

Một vấn đề an toàn khác mà OpenAI nhắc tới là việc mô hình này tư duy thông qua từng bước cho phép hãng quang sát liệu mô hình có đang thao túng người dùng hay không. Tuy nhiên, để cách này vận hành được, mô hình phải được phép thể hiện những suy nghĩ nguyên bản nhất, tự do nhất mà chưa bị can thiệp. Điều này có thể tạo ra những rủi ro nhất định, kết hợp với việc cân nhắc các yếu tố cạnh tranh, trải nghiệm người dùng, OpenAI quyết định ẩn đi những suy nghĩ này mà chỉ hiển thị bản tóm tắt các suy nghĩ đã được tối ưu mà mô hình tạo ra.

ChatGPT o1 đánh dấu một bước tiến mới trong việc tạo ra trí tuệ nhân tạo có khả năng tư duy gần giống con người với hiệu quả vượt trội trong các tác vụ phức tạp. Đồng thời, nó cũng mở ra một cơ hội để con người hiểu rõ hơn cách AI suy nghĩ, nhằm ngăn ngừa việc bị thao túng.

Nguồn [1][2]
49 bình luận
Chia sẻ

Xu hướng

Thấy thua Apple Idiot về mọi tiêu chí. Ko có siri là 1 điểm trừ lớn rồi.
@angle_squall Móa thâm vãi. iP16 vừa ra chưa bán đó nhe
@angle_squall siri đâu biết bẻ khoá icloud máy người khác như mày nên mày chê nó là đúng rồi
huntergn
ĐẠI BÀNG
14 ngày
@nguyendathp Siri tốt hơn đúng không bạn Đạt?
Dù có quảng cáo thế nào thì cũng thua iPhone 16 về mọi mặt thôi. Định nghĩa lại AI phải như Apple mới là đỉnh của chóp.
@russia.usa.lc thua chứ ko lẽ hơn cty 3k tỷ đô
rồi cũng làm thuê cho Cook cả
Cook nó còn ăn trên đầu trên cổ nữa hay ho gì
dccuong
TÍCH CỰC
21 ngày
Xài chatGPT này viết hàm excel sướng phết, mà xài riết thành ngu luôn
@dccuong Dùng cái này nhiều sau phụ thuộc vào nó còn lệ thuộc còn hơn cả Google Seach nữa.
@zer0_7 Nó là công cụ, giờ tôi đố ông cắt cục thịt mà không sài dao đấy
@dccuong Kiểu như dùng máy tính thôi, riết rồi cũng quên cách tính, nhưng xài nó nhanh hiệu quả
@blackberry97 Bạn tự thái thịt với nhờ người khác thái hộ nó là 2 chuyện hoàn toàn khác nhau nhé. M đã dùng AI làm nhiều thứ VD như lên kịch bản video hay lịch trình đi chơi ... Nếu lười có thể làm theo nó 100% vì nó bày cho mình tất tật gần như chỉ việc "ăn" thôi chứ ko chỉ mỗi "thái thịt" như bạn nói đâu.
centernc2
ĐẠI BÀNG
21 ngày
ChatGPT o1 trả lời đc câu hỏi này thì tư duy như con người.

Nếu Apple ra mắt điện thoại gập thì chiếc điện thoại đó sẽ chạy HĐH iOS hay là iPadOS?
GLES
TÍCH CỰC
21 ngày
@centernc2 1h sáng mà vẫn đấm nhau vậy =)) ngủ đi mấy pa =)))
centernc2
ĐẠI BÀNG
21 ngày
@GLES Kiểu một số người vẫn nghĩ AI thay thế đc con người. Ngày xưa thời còn bé tí tui cũng rất ngạc nhiên chiếc máy tính bỏ túi nó tính toán nhanh hơn con người rất nhiều. Nêu bây giờ t thấy mấy con AI cũng ko có gì là cao siêu cả.

Giống như bạn nói t 1h sáng đi ngủ, chứ như AI thì có biết ngủ là gì, nếu ko ngủ thì sẽ như thế nào đâu. Giờ miêu tả cho AI hiểu ngủ là thứ gì thì cũng giống như bảo người mù bẩm sinh có em này em kia xinh lắm, họ cũng có tưởng tượng ra đc đâu, chỉ biết nghe nói xinh là xinh thế thôi.
nkblu
ĐẠI BÀNG
20 ngày
@centernc2 Chả hiểu các ông vẫn cãi nhau làm cái gì, AI chỉ bắt đầu được đầu từ và phát triển trong vài năm gần đây.

Mà ở đó cứ phán dựa trên những ý kiến, lập luận chủ quan cá nhân, giống như là nó chẳng còn gì để phát triển nữa rồi.

Nghe thấy vớ vẩn thật sự, trước đây thế giới mất bao nhiêu năm để từ cái điện thoại ngu thành cái smartphone.
centernc2
ĐẠI BÀNG
20 ngày
@nkblu Thế với bạn cái Autopilot tự động lái trên máy bay có phải là AI ko?
Ngonnn
Chậm thôi chờ Apple với
binhtam
TÍCH CỰC
21 ngày
@grozar Luôn đi trước đối thủ 2 bước
Rồi ko biết nên vui hay buồn.
SkyNet is coming
Vậy trước giờ nó trả lời ko cần suy nghĩ hả ta
binhtam
TÍCH CỰC
21 ngày
@Methylamine Vấn đề là hồi quy, tức là nó tự vấn câu trả lời của nó nhiều lần trước khi đưa câu trả lời cuối cùng cho người dùng.
Giờ tải app nào ngon ae
Quá nhanh quá nguy hiểm
Dùng chatgpt vẫn là khác bọt nhất trong đống AI
Hồi chiều mới thử, o1-preview nó dịch văn bản nhanh gấp mấy lần 4o. Nhưng mà nó khá là bất ổn định, hay bị lỗi lắm.
Al hay quá
AI giờ đang bị hype quá mức . Dù phần cứng , giả lập , tự học …. Có tốt đến đâu chúng vẫn thiếu một thứ : chính là linh hồn
@Bukkybois12 phần mềm chính là linh hồn, linh hồn của ông cũng là software thôi
Skynet đây rồi chứ đâu =)) Nhưng mà trình độ cỡ này thì vẫn thua Apple IDiot
Năm sau thôi, AI sẽ làm còn tốt hơn bây giờ nhiều. Tốc độ học của nó kinh khủng quá ^^
lion78
ĐẠI BÀNG
20 ngày
Tây mũi lõ vẫn vượt trên châu á ta. Không thể hiểu nổi.

Xu hướng

Bài mới










  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019