Cuối tuần trước, Anthropic, một trong những đơn vị phát triển mô hình ngôn ngữ AI tạo sinh khá nổi tiếng đã giới thiệu phiên bản Claude 3.5 Sonnet. Mô hình ngôn ngữ này được phát triển dựa trên thế hệ LLM Claude thế hệ 3, ra mắt hồi tháng 3/2024 vừa rồi. Giống như rất nhiều mô hình ngôn ngữ khác, Claude 3.5 Sonnet vẫn có khả năng tạo sinh văn bản, văn học, xử lý dữ liệu và viết code lập trình. Context window, lượng dữ liệu đầu vào mà người dùng chatbot AI có thể nhập vào để mô hình AI hiểu rồi làm việc theo yêu cầu là 200 nghìn token, tức những chuỗi văn bản.
Hiện tại Claude 3.5 Sonnet đã được ra mắt thông qua trang web của chatbot Claude, cũng như API cho các đơn vị muốn ứng dụng mô hình ngôn ngữ này. Cùng lúc, để đảm bảo nguồn thông tin mà Claude gửi về cho người dùng là chính xác, Anthropic cũng cho ra mắt một tính năng mới đặt tên là Artifact, dẫn nguồn những đường link mà mô hình ngôn ngữ kết hợp cùng chế độ tạo sinh tăng cường tìm kiếm được trên mạng internet.
Nhà nghiên cứu AI độc lập Simon Willison chia sẻ trên MXH: “Mô hình này thực sự tốt. Tôi nghĩ đây là mô hình ổn nhất trên thị trường hiện giờ, vừa nhanh hơn vừa có chi phí vận hành rẻ bằng một nửa Claude 3 Opus, rất giống với bước nhảy vọt từ GPT-4 Turbo lên GPT-4o.”
Để benchmark sức mạnh vận hành của những mô hình ngôn ngữ lớn, vài rào cản hiện diện, vì những bài thử nghiệm thường có cảm giác chỉ nhắm vào đánh giá được một vài khía cạnh cụ thể, không mô tả được tổng thể khả năng tạo sinh ngôn ngữ tự nhiên của LLM có mượt mà hay không. Nhưng theo Anthropic, Claude 3.5 Sonnet ngang bằng hoặc tốt hơn những mô hình cạnh tranh trực tiếp như GPT-4o hay Gemini 1.5 Pro trong vài benchmark như MMLU, GSM8K và HumanEval, những bài thử nghiệm đánh giá kiến thức chung, kiến thức toán học và khả năng lập trình.
https://storage-tinhte.vncdn.vn/data/attachment-files/vnetwork/2024/06/8374694_83d38bca47de671d74075d16556f4074.png
Hiện tại Claude 3.5 Sonnet đã được ra mắt thông qua trang web của chatbot Claude, cũng như API cho các đơn vị muốn ứng dụng mô hình ngôn ngữ này. Cùng lúc, để đảm bảo nguồn thông tin mà Claude gửi về cho người dùng là chính xác, Anthropic cũng cho ra mắt một tính năng mới đặt tên là Artifact, dẫn nguồn những đường link mà mô hình ngôn ngữ kết hợp cùng chế độ tạo sinh tăng cường tìm kiếm được trên mạng internet.
Nhà nghiên cứu AI độc lập Simon Willison chia sẻ trên MXH: “Mô hình này thực sự tốt. Tôi nghĩ đây là mô hình ổn nhất trên thị trường hiện giờ, vừa nhanh hơn vừa có chi phí vận hành rẻ bằng một nửa Claude 3 Opus, rất giống với bước nhảy vọt từ GPT-4 Turbo lên GPT-4o.”
Để benchmark sức mạnh vận hành của những mô hình ngôn ngữ lớn, vài rào cản hiện diện, vì những bài thử nghiệm thường có cảm giác chỉ nhắm vào đánh giá được một vài khía cạnh cụ thể, không mô tả được tổng thể khả năng tạo sinh ngôn ngữ tự nhiên của LLM có mượt mà hay không. Nhưng theo Anthropic, Claude 3.5 Sonnet ngang bằng hoặc tốt hơn những mô hình cạnh tranh trực tiếp như GPT-4o hay Gemini 1.5 Pro trong vài benchmark như MMLU, GSM8K và HumanEval, những bài thử nghiệm đánh giá kiến thức chung, kiến thức toán học và khả năng lập trình.
https://storage-tinhte.vncdn.vn/data/attachment-files/vnetwork/2024/06/8374694_83d38bca47de671d74075d16556f4074.png
Cùng lúc, Claude 3.5 Sonnet cũng vượt qua sức mạnh của Claude 3 Opus với những bài đánh giá khả năng tư duy logic, kỹ năng toán học, kiến thức chung và khả năng lập trình. Riêng với khả năng lập trình, Claude 3.5 Sonnet giải quyết được 64% tổng số câu hỏi được đưa ra, so với 38% của Claude 3 Opus.

Giống như GPT-4o, Claude 3.5 Sonnet cũng có khả năng nhận diện thông tin ngôn ngữ và hình ảnh trong những bức hình người dùng tải vào chatbot. Khả năng nhận diện cũng tốt hơn hẳn so với những phiên bản LLM Claude trước đó của Anthropic.

Còn trong khi đó, Artifacts là một công cụ giao diện người dùng cho phép tương tác với những nội dung đã được Claude tạo sinh, như văn bản, code lập trình hay thiết kế trang web, độc lập với ô thoại để người dùng trò chuyện với chatbot AI. Theo Anthropic, đây là một nâng cấp để giúp trang web chatbot Claude.ai trở thành nơi hoàn hảo hơn cho những nhóm nhân sự cùng hợp tác làm việc, ứng dụng sức mạnh của LLM, vừa làm việc được, vừa không mất cuộc trò chuyện ở màn hình còn lại.
Theo ArsTechnica