Anthropic Claude 3.5 Sonnet: Mô hình ngôn ngữ "cỡ trung bình", mạnh ngang GPT-4o

P.W
25/6/2024 7:30Phản hồi: 17
EditEdit
Anthropic Claude 3.5 Sonnet: Mô hình ngôn ngữ "cỡ trung bình", mạnh ngang GPT-4o
Cuối tuần trước, Anthropic, một trong những đơn vị phát triển mô hình ngôn ngữ AI tạo sinh khá nổi tiếng đã giới thiệu phiên bản Claude 3.5 Sonnet. Mô hình ngôn ngữ này được phát triển dựa trên thế hệ LLM Claude thế hệ 3, ra mắt hồi tháng 3/2024 vừa rồi. Giống như rất nhiều mô hình ngôn ngữ khác, Claude 3.5 Sonnet vẫn có khả năng tạo sinh văn bản, văn học, xử lý dữ liệu và viết code lập trình. Context window, lượng dữ liệu đầu vào mà người dùng chatbot AI có thể nhập vào để mô hình AI hiểu rồi làm việc theo yêu cầu là 200 nghìn token, tức những chuỗi văn bản.

Hiện tại Claude 3.5 Sonnet đã được ra mắt thông qua trang web của chatbot Claude, cũng như API cho các đơn vị muốn ứng dụng mô hình ngôn ngữ này. Cùng lúc, để đảm bảo nguồn thông tin mà Claude gửi về cho người dùng là chính xác, Anthropic cũng cho ra mắt một tính năng mới đặt tên là Artifact, dẫn nguồn những đường link mà mô hình ngôn ngữ kết hợp cùng chế độ tạo sinh tăng cường tìm kiếm được trên mạng internet.

Nhà nghiên cứu AI độc lập Simon Willison chia sẻ trên MXH: “Mô hình này thực sự tốt. Tôi nghĩ đây là mô hình ổn nhất trên thị trường hiện giờ, vừa nhanh hơn vừa có chi phí vận hành rẻ bằng một nửa Claude 3 Opus, rất giống với bước nhảy vọt từ GPT-4 Turbo lên GPT-4o.”

Để benchmark sức mạnh vận hành của những mô hình ngôn ngữ lớn, vài rào cản hiện diện, vì những bài thử nghiệm thường có cảm giác chỉ nhắm vào đánh giá được một vài khía cạnh cụ thể, không mô tả được tổng thể khả năng tạo sinh ngôn ngữ tự nhiên của LLM có mượt mà hay không. Nhưng theo Anthropic, Claude 3.5 Sonnet ngang bằng hoặc tốt hơn những mô hình cạnh tranh trực tiếp như GPT-4o hay Gemini 1.5 Pro trong vài benchmark như MMLU, GSM8K và HumanEval, những bài thử nghiệm đánh giá kiến thức chung, kiến thức toán học và khả năng lập trình.

https://storage-tinhte.vncdn.vn/data/attachment-files/vnetwork/2024/06/8374694_83d38bca47de671d74075d16556f4074.png


Cùng lúc, Claude 3.5 Sonnet cũng vượt qua sức mạnh của Claude 3 Opus với những bài đánh giá khả năng tư duy logic, kỹ năng toán học, kiến thức chung và khả năng lập trình. Riêng với khả năng lập trình, Claude 3.5 Sonnet giải quyết được 64% tổng số câu hỏi được đưa ra, so với 38% của Claude 3 Opus.

caff3d60763b27b59fe33e4ae984530f0dba4ddb-2200x1110-1-640x323.png

Giống như GPT-4o, Claude 3.5 Sonnet cũng có khả năng nhận diện thông tin ngôn ngữ và hình ảnh trong những bức hình người dùng tải vào chatbot. Khả năng nhận diện cũng tốt hơn hẳn so với những phiên bản LLM Claude trước đó của Anthropic.

claude35-artifacts-640x435.jpg

Còn trong khi đó, Artifacts là một công cụ giao diện người dùng cho phép tương tác với những nội dung đã được Claude tạo sinh, như văn bản, code lập trình hay thiết kế trang web, độc lập với ô thoại để người dùng trò chuyện với chatbot AI. Theo Anthropic, đây là một nâng cấp để giúp trang web chatbot Claude.ai trở thành nơi hoàn hảo hơn cho những nhóm nhân sự cùng hợp tác làm việc, ứng dụng sức mạnh của LLM, vừa làm việc được, vừa không mất cuộc trò chuyện ở màn hình còn lại.

Theo ArsTechnica
17 bình luận

Xu hướng

Ông Anthropic Claude 3.5 Sonnet này dốt thế. Sao không chào hàng cho Apple. Bỏ lỡ cơ hội ngàn năm có một rồi.
@Ζεύς Nhìn thống kê nói chuyện kìa, Gemini có điểm số đàng hoàng ngang ngửa nhà người ta, ai như AI demo bằng figma và ae của nhà hoa quả 😆
@Ζεύς nhường Claude là sai lầm nha ông, còn Claude chưa nâng cấp đã cho đáp án chuẩn và mượt hơn ChatGPT và Gemeni bản Pro.
@vinhptfpt Apple chọn chứ làm sao mà họ quyết định được. chả phải ngẫu nhiên Apple chọn OpenAI, chẳng qua là do Microsoft có tí quan hệ với TQ mà thôi, nhưng không ăn thua
@vinhptfpt Bác phải dùng dịch vụ của thằng Anthropic thì bác mới hiểu. Nó thể hiện đẳng cấp hơn người của người Anh. Nó chẳng phải lụy ai cả.
Lạ là sao nó ko giảm xuống 15 USD chứ 20 USD thì cũng ngang GPT rồi, có cạnh tranh rồi thì giảm giá đi chớ =)))
Nhiều chủng loại A.I quá
Thi nhau tạo ra
Loằng ngoằng lộn xộn chẳng biết cái nào tốt
Hi vọng trong tương lai Apple sẽ tái định nghĩa lại ChatAI. Chứ giờ loằng ngoằng lộn xộn quá
Đã test cả 2 từ tuần trước, Sonet khôn hơn Opus nhiều về coding, thằng Opus khi optimize code mình toàn cố sửa đến nỗi break luôn còn Sonet vẫn chạy tốt. Sonet có khả năng ghi nhớ và thực thi toàn cảnh tốt hơn Opus nhiều.
thằng nào xuất hiện cũng xưng mạnh hơn chatgpt và luôn có cái kết 😆
thua gemini rồi
Ảnh màn hình 2024-06-26 lúc 23.01.39.jpg
Tri thức của nhân loại thật không thể tưởng tượng nổi
Sao trước mình tạo acc claude cái bị ban luôn làm sao để đăng ký v nhỉ
dùng ai viết bài đánh giá thằng này cao hơn gpt @@

Xu hướng

Bài mới








  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2025 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019