Hôm thứ 4 tuần trước, các nhà nghiên cứu Anh Quốc đã công bố báo cáo nghiên cứu khoa học, qua đó mô tả khả năng xét nghiệm lâm sàng những tình trạng bệnh nhãn khoa của mô hình GPT-4 mà họ phát triển. Mô hình AI này đạt điểm số tương đương với những bác sỹ nhãn khoa trong những bài kiểm tra trình độ và khả năng xét nghiệm bệnh lý.
Lý do nhãn khoa là khía cạnh được các đơn vị AI tập trung nghiên cứu và phát triển, là vì tiềm năng đưa công nghệ AI vào sử dụng lâm sàng, cũng như khả năng sử dụng ngành y khoa này để giảm thiểu cũng như cải thiện những vấn đề của AI, ví dụ như tình trạng “hallucination”, nơi mô hình AI tự “vẽ” ra những thông tin sai lệch khiến mọi người hiểu lầm, tạo ra nguy cơ thông tin giả mạo.
Arun Thirunavukarasu, người dẫn đầu cuộc nghiên cứu này viết trong báo cáo khoa học đăng trên tờ tạp chí PLOS Digital Health: “Nghiên cứu này cho thấy những kiến thức cũng như khả năng phân tích lý lẽ của những mô hình ngôn ngữ lớn trong môi trường ngành nhãn khoa gần như không khác biệt so với những chuyên gia trong ngành. Chúng tôi nhận thấy khả năng trả lời những câu hỏi tương đối phức tạp của AI.”
Nghiên cứu này ứng dụng 87 trường hợp bệnh lý nhãn khoa khác nhau để xác định khả năng của GPT-4 so với những bác sỹ sơ cấp, những thực tập sinh và cả những bác sĩ nhãn khoa chuyên nghiệp. Theo kết quả nghiên cứu, điểm số mà GPT-4 có được vượt qua những thực tập sinh, ngang ngửa các bác sỹ nhãn khoa. Kết quả nghiên cứu này đáng đề cập, vì nó so sánh được khả năng của mô hình AI với những bác sĩ đang làm việc trong ngành, thay vì so sánh với kết quả xét nghiệm lâm sàng. Cũng với nghiên cứu này, khả năng của AI được mở rộng, thay vì chỉ khoanh vùng một mảng y tế cụ thể, chẳng hạn như xác định nguy cơ ung thư từ những tấm phim chụp của người bệnh.
GPT-4 vận hành tốt ở những câu hỏi đòi hỏi khả năng ghi nhớ thông tin, và những câu hỏi đòi hỏi khả năng suy luận bậc cao, chẳng hạn như nội suy, diễn giải và xử lý thông tin.
Thirunavukarasu, nhà khoa học đang theo học trường dược lâm sàng thuộc đại học Cambridge cho biết: “Chúng tôi hiện đang đào tạo và huấn luyện AI theo cách cởi mở hơn nhiều, và phát hiện ra những khả năng mà mô hình AI không được đào tạo một cách cụ thể để thực hiện.”
Mô hình AI hoàn toàn có thể được cải thiện bằng cách huấn luyện chuyên sâu dựa trên gói dữ liệu mở rộng, bao gồm những thuật toán quản lý, xóa thông tin cá nhân của bệnh nhân trong những dữ liệu ấy. Điều này, theo Thirunavukarasu, yêu cầu sự cân bằng giữa việc mở rộng lượng dữ liệu và nguồn dữ liệu huấn luyện AI, cùng lúc vẫn phải đảm bảo những thông tin này có chất lượng cao. Và về mặt ứng dụng, AI có thể dùng phân loại bệnh nhân, hoặc ứng dụng ở những vùng nơi người dân bị hạn chế tiếp cận với những chuyên gia y tế.
Sự quan tâm đến việc triển khai AI trong môi trường y khoa lâm sàng đã tăng vọt, sau những bằng chứng nghiên cứu mô tả sức mạnh của AI trong chẩn đoán bệnh lý. Trước đây từng có nghiên cứu cho thấy AI có thể cảnh báo sớm ung thư vú giai đoạn đầu mà các bác sĩ có thể bỏ qua những dấu hiệu sớm. Nhưng cùng lúc, các nhà nghiên cứu khoa học, cả AI lẫn y khoa đều đang phải tìm cách kiểm soát những nguy cơ nghiêm trọng, chẳng hạn như khả năng AI bị “loạn”, dẫn tới việc đưa ra chẩn đoán sai cho bệnh nhân.
Pearse Keane, giáo sư ngành y học AI tại đại học London cho rằng, nghiên cứu mới này thực sự hấp dẫn, và việc sử dụng AI để đánh giá khả năng của chuyên gia y tế là “vô cùng đáng quan tâm.” Nhưng cùng lúc, giáo sư Keane cũng đồng ý rằng còn rất nhiều việc phải làm để AI có thể được ứng dụng trong môi trường lâm sàng. Một ví dụ được vị giáo sư này đưa ra chính là nghiên cứu của chính ông vào năm ngoái, khi hỏi về bệnh thoái hóa điểm vàng ở mắt, mô hình ngôn ngữ đã dẫn nguồn không có thật.
Theo FT
Lý do nhãn khoa là khía cạnh được các đơn vị AI tập trung nghiên cứu và phát triển, là vì tiềm năng đưa công nghệ AI vào sử dụng lâm sàng, cũng như khả năng sử dụng ngành y khoa này để giảm thiểu cũng như cải thiện những vấn đề của AI, ví dụ như tình trạng “hallucination”, nơi mô hình AI tự “vẽ” ra những thông tin sai lệch khiến mọi người hiểu lầm, tạo ra nguy cơ thông tin giả mạo.
Arun Thirunavukarasu, người dẫn đầu cuộc nghiên cứu này viết trong báo cáo khoa học đăng trên tờ tạp chí PLOS Digital Health: “Nghiên cứu này cho thấy những kiến thức cũng như khả năng phân tích lý lẽ của những mô hình ngôn ngữ lớn trong môi trường ngành nhãn khoa gần như không khác biệt so với những chuyên gia trong ngành. Chúng tôi nhận thấy khả năng trả lời những câu hỏi tương đối phức tạp của AI.”
Nghiên cứu này ứng dụng 87 trường hợp bệnh lý nhãn khoa khác nhau để xác định khả năng của GPT-4 so với những bác sỹ sơ cấp, những thực tập sinh và cả những bác sĩ nhãn khoa chuyên nghiệp. Theo kết quả nghiên cứu, điểm số mà GPT-4 có được vượt qua những thực tập sinh, ngang ngửa các bác sỹ nhãn khoa. Kết quả nghiên cứu này đáng đề cập, vì nó so sánh được khả năng của mô hình AI với những bác sĩ đang làm việc trong ngành, thay vì so sánh với kết quả xét nghiệm lâm sàng. Cũng với nghiên cứu này, khả năng của AI được mở rộng, thay vì chỉ khoanh vùng một mảng y tế cụ thể, chẳng hạn như xác định nguy cơ ung thư từ những tấm phim chụp của người bệnh.
GPT-4 vận hành tốt ở những câu hỏi đòi hỏi khả năng ghi nhớ thông tin, và những câu hỏi đòi hỏi khả năng suy luận bậc cao, chẳng hạn như nội suy, diễn giải và xử lý thông tin.
Thirunavukarasu, nhà khoa học đang theo học trường dược lâm sàng thuộc đại học Cambridge cho biết: “Chúng tôi hiện đang đào tạo và huấn luyện AI theo cách cởi mở hơn nhiều, và phát hiện ra những khả năng mà mô hình AI không được đào tạo một cách cụ thể để thực hiện.”
Mô hình AI hoàn toàn có thể được cải thiện bằng cách huấn luyện chuyên sâu dựa trên gói dữ liệu mở rộng, bao gồm những thuật toán quản lý, xóa thông tin cá nhân của bệnh nhân trong những dữ liệu ấy. Điều này, theo Thirunavukarasu, yêu cầu sự cân bằng giữa việc mở rộng lượng dữ liệu và nguồn dữ liệu huấn luyện AI, cùng lúc vẫn phải đảm bảo những thông tin này có chất lượng cao. Và về mặt ứng dụng, AI có thể dùng phân loại bệnh nhân, hoặc ứng dụng ở những vùng nơi người dân bị hạn chế tiếp cận với những chuyên gia y tế.
Sự quan tâm đến việc triển khai AI trong môi trường y khoa lâm sàng đã tăng vọt, sau những bằng chứng nghiên cứu mô tả sức mạnh của AI trong chẩn đoán bệnh lý. Trước đây từng có nghiên cứu cho thấy AI có thể cảnh báo sớm ung thư vú giai đoạn đầu mà các bác sĩ có thể bỏ qua những dấu hiệu sớm. Nhưng cùng lúc, các nhà nghiên cứu khoa học, cả AI lẫn y khoa đều đang phải tìm cách kiểm soát những nguy cơ nghiêm trọng, chẳng hạn như khả năng AI bị “loạn”, dẫn tới việc đưa ra chẩn đoán sai cho bệnh nhân.
Pearse Keane, giáo sư ngành y học AI tại đại học London cho rằng, nghiên cứu mới này thực sự hấp dẫn, và việc sử dụng AI để đánh giá khả năng của chuyên gia y tế là “vô cùng đáng quan tâm.” Nhưng cùng lúc, giáo sư Keane cũng đồng ý rằng còn rất nhiều việc phải làm để AI có thể được ứng dụng trong môi trường lâm sàng. Một ví dụ được vị giáo sư này đưa ra chính là nghiên cứu của chính ông vào năm ngoái, khi hỏi về bệnh thoái hóa điểm vàng ở mắt, mô hình ngôn ngữ đã dẫn nguồn không có thật.
Theo FT