Dù công nghệ nhận dạng hình ảnh đã được cải tiến đáng kể trong những năm gần đây nhưng nó vẫn có thể mắc lỗi nghiêm trọng. Chuyện AI nhận nhầm nội dung của một tấm ảnh xảy ra thường xuyên, mình từng gặp nhiều tình huống cười bể bụng với AI khi nó nhận nhầm cái hộp sạc tai nghe Galaxy Buds thành … trứng rung 😁. Tuy nhiên, việc ngày một nhiều các hệ thống quan sát, phân tích ảnh hóa đang được trang bị trên camera an ninh hay xe tự hành thì điều này quả thật đáng lo ngại. Sự sai sót có thể dẫn đến sai lầm chết người, thế nên các nhà nghiên cứu đã chứng minh và tìm cách cải tiến khả năng nhận dạng của AI bằng cách cho nó thử sức với những hình ảnh dễ gây nhầm lẫn.
Những hình ảnh như vậy gọi là "adversarial image" - ảnh đối nghịch. Chúng được thiết kế đặc biệt để đánh lừa AI và thậm chí nhiều hình ảnh được chụp ngẫu nhiên cũng có thể đánh lừa cả chúng ta chứ không chỉ riêng AI.
Để chứng minh AI có thể mắc sai lầm, một nhóm các nhà nghiên cứu đến từ đại học Berkeley, Washington và Chicago đã tạo ra một tập dữ liệu gồm khoảng 7500 ảnh nghịch cảnh và kết quả cho thấy độ chính xác các thuật toán nhận dạng hình ảnh kém hiệu quả hơn hẳn. Phần mềm chỉ có thể nhận dạng 2 - 3% số ảnh này với một số tình huống nhất định và tỉ lệ chính xác giảm đến 90%.
Anh em thử xem có nhìn nhầm 8 hình ảnh này không nhé. Dưới mỗi ảnh là kết quả mà AI đưa ra, mình để trong ngoặc kép:
Những hình ảnh như vậy gọi là "adversarial image" - ảnh đối nghịch. Chúng được thiết kế đặc biệt để đánh lừa AI và thậm chí nhiều hình ảnh được chụp ngẫu nhiên cũng có thể đánh lừa cả chúng ta chứ không chỉ riêng AI.
Để chứng minh AI có thể mắc sai lầm, một nhóm các nhà nghiên cứu đến từ đại học Berkeley, Washington và Chicago đã tạo ra một tập dữ liệu gồm khoảng 7500 ảnh nghịch cảnh và kết quả cho thấy độ chính xác các thuật toán nhận dạng hình ảnh kém hiệu quả hơn hẳn. Phần mềm chỉ có thể nhận dạng 2 - 3% số ảnh này với một số tình huống nhất định và tỉ lệ chính xác giảm đến 90%.
Anh em thử xem có nhìn nhầm 8 hình ảnh này không nhé. Dưới mỗi ảnh là kết quả mà AI đưa ra, mình để trong ngoặc kép:
"Xác tàu đắm" - con tàu này đang bị đám bọ ngoài hành ti nhâm nhi :rolleyes:
"Đồng hồ mặt trời" - chắc nó sẽ đứng cả ngày để chúng ta nhìn bóng đoán giờ.
"Bọ rùa (bọ cánh cam)" - có cam thiệt nhưng không phải bọ.
"Cầu thủ bóng chày" - thật phong cách khi vừa chơi bóng chày vừa câu cá.
Ngọn lửa này AI nhận dạng là "cây đuốc".
Còn người nghệ sĩ này AI nói là đang lái "xe go kart" 😕
Quảng cáo
Rõ ràng đây là "một con gấu đen", AI khẳng định.
Đối với AI thì đây là một "bàn bida".
Chẳng hạn như AI nhận dạng sai cây nến hay cây nấm là "cây đinh" bởi nó dựa trên nền là một tấm gỗ. Tương tự AI nhận dạng 2 tấm ảnh còn lại là "chim ruồi" mặc dù không có con chim nào bởi đồ vật trong ảnh là máng thức ăn dành cho chim ruồi.
4 hình ảnh về con chuồn chuồn cũng bị AI nhận nhầm thành những thứ khác do suy luận từ màu sắc và kết cấu. Từ trái sang AI nhận dạng là "đầu sọ", "quả chuối", "sư tử biển", "găng tay cụt ngón". Không khó để đoán ra tại sao AI mắc sai lầm.Quảng cáo
Sai sót của các hệ thống AI không mới nhưng các nhà nghiên cứu đã cảnh báo trong nhiều năm qua rằng những hệ thống quan sát, ảnh hóa bằng máy tính sử dụng công nghệ học sâu (deep learning) thực tế "nông cạn" và "mỏng manh" bởi chúng không hiểu thế giới theo cùng sắc thái và sự linh hoạt như con người.
Những hệ thống này được dạy với hàng ngàn ảnh mẫu nhằm giúp nó học và phân biệt được cái nào là A cái nào là B. Tuy nhiên chúng ta không biết được AI dựa trên yếu tố nào của hình ảnh để phán đoán.
Một số nghiên cứu cho rằng thay vì quan sát một cách toàn diện, xem xét hình dạng và nội dung tổng thể thì các thuật toán vẫn tập trung vào kết cấu và chi tiết cụ thể. Những phát hiện từ nghiên cứu trên đã góp phần củng cố giải thích này.
Liệu chăng các hệ thống nhận dạng hình ảnh đang mắc sai lầm hệ thống? Thực tế không quá nghiêm trọng bởi thông thường sai sót thường không đáng kể, chẳng hạn như nhận nhầm nắp cống là hố ga hay nhầm xe van với limousine. Và dù các nhà nghiên cứu đã đánh lừa nhiều hệ thống nhận dạng với những hình ảnh tự nhiên như chúng ta thấy ở trên nhưng ngoài kia vẫn còn rất nhiều hệ thống nhận dạng chuyên biệt, được thiết kế cho các mục đích riêng với độ chính xác cao. Chẳng hạn như hệ thống phát hiện các loại bệnh dựa trên ảnh chụp y khoa, mặc dù chúng bị hạn chế khả năng nhưng những bức ảnh "cú lừa" trên không thể ngăn chúng phát hiện ra một khối u ung thư.
Theo: The Verge