Chat GPT o1 vẫn đếm 2 chữ “r” trong strawberry.
Sáng nay mình thử hỏi ChatGPT o1 coi có bao nhiêu chữ “r” trong strawberry, anh em chắc cũng biết vụ này, ChatGPT o1 vẫn đưa ra câu trả lời là có 2 chữ r thôi.
Khoan nói tới ChatGPT o1, các mô hình LLM đều dựa trên kiến trúc transformer, có vai trò phân tách văn bản đầu vào thành các token khác nhau và số hóa để đại diện cho các token đó. Chính vì thế, chúng có thể hiểu “strawberry” là sự kết hợp của hai token “straw” và “berry”, và có thể dẫn đến tính toán số ký tự không chính xác. Điều này cho thấy, dù có khả năng thực hiện các tác vụ nhanh chóng và xử lý lượng dữ liệu khổng lồ, cách các mô hình máy học hiểu về ngôn ngữ vẫn khác với loài người. Chúng không hiểu được các ký tự, nguyên âm, phụ âm, là những thành phần cấu tạo nên ngôn ngữ.
Điều này thật ra là vui thôi, cũng không ảnh hưởng gì lắm vì mình thấy đây vẫn là một công cụ hữu ích phục vụ cho công việc.