Vừa rồi, bác sĩ Isaac Kohane, người vừa là nhà nghiên cứu khoa học máy tính ở đại học Harvard, vừa nắm giữ tấm bằng y khoa đã cùng hai người đồng nghiệp thử sức mô hình ngôn ngữ GPT-4 mới nhất của OpenAI, với một mục đích duy nhất: Đánh giá khả năng vận hành của mô hình trí thông minh nhân tạo mới nhất này trong môi trường y khoa.
Kết quả nghiên cứu được ghi lại trong cuốn sách sắp được xuất bản: The AI Revolution in Medicine. Hai tác giả cuốn sách này là nhà báo Carey Goldberg và phó chủ tịch nghiên cứu của Microsoft, Peter Lee. Bác sỹ Kohane trong cuốn sách này nói rằng: “Tôi phải choáng váng thừa nhận, đấy là nó (trí thông minh nhân tạo) tốt hơn nhiều bác sỹ tôi từng chứng kiến.”
Cụ thể hơn theo ông Kohane, GPT-4 trả lời chính xác hơn 90% số câu hỏi bài thi cấp giấy phép hành nghề y khoa của Mỹ. Cả hai phiên bản mô hình ngôn ngữ trước đó là GPT-3 và 3.5 đều không tạo ra được điểm số ấn tượng như vậy. Mà thậm chí vài bác sỹ đã được cấp giấy phép hành nghề cũng không đạt được điểm số cao đến như vậy trong bài thi.
GPT-4 không chỉ là một công cụ tìm kiếm thông tin và làm bài thi tốt, nó còn là một công cụ dịch thuật tuyệt vời nữa. Trong cuốn sách của Goldberg và Lee có đoạn mô tả GPT-4 dịch thuật thông tin xuất viện cho một bệnh nhân nói tiếng Bồ Đào Nha, cũng như chắt lọc những thuật ngữ kỹ thuật phức tạp, trở thành những câu chữ mà một học sinh lớp 6 cũng có thể hiểu được.
Kết quả nghiên cứu được ghi lại trong cuốn sách sắp được xuất bản: The AI Revolution in Medicine. Hai tác giả cuốn sách này là nhà báo Carey Goldberg và phó chủ tịch nghiên cứu của Microsoft, Peter Lee. Bác sỹ Kohane trong cuốn sách này nói rằng: “Tôi phải choáng váng thừa nhận, đấy là nó (trí thông minh nhân tạo) tốt hơn nhiều bác sỹ tôi từng chứng kiến.”
Cụ thể hơn theo ông Kohane, GPT-4 trả lời chính xác hơn 90% số câu hỏi bài thi cấp giấy phép hành nghề y khoa của Mỹ. Cả hai phiên bản mô hình ngôn ngữ trước đó là GPT-3 và 3.5 đều không tạo ra được điểm số ấn tượng như vậy. Mà thậm chí vài bác sỹ đã được cấp giấy phép hành nghề cũng không đạt được điểm số cao đến như vậy trong bài thi.

GPT-4 không chỉ là một công cụ tìm kiếm thông tin và làm bài thi tốt, nó còn là một công cụ dịch thuật tuyệt vời nữa. Trong cuốn sách của Goldberg và Lee có đoạn mô tả GPT-4 dịch thuật thông tin xuất viện cho một bệnh nhân nói tiếng Bồ Đào Nha, cũng như chắt lọc những thuật ngữ kỹ thuật phức tạp, trở thành những câu chữ mà một học sinh lớp 6 cũng có thể hiểu được.
Bên cạnh những ví dụ sinh động ấy, GPT-4 cũng có khả năng cung cấp cho các bác sỹ những gợi ý vô cùng hữu ích về cách ứng xử bên giường bệnh, đưa ra những mẹo về cách nói chuyện với bệnh nhân về tình trạng của họ thông qua thứ ngôn ngữ rõ ràng, thân thiện. Và thuật toán AI này còn có thể đọc những báo cáo và nghiên cứu rất dài, rồi tóm tắt chúng trong chớp mắt. Mô hình ngôn ngữ này thậm chí còn có khả năng giải thích lý do nó đưa ra cách xử lý một vấn đề cụ thể nữa.
Nếu hỏi lý do vì sao GPT-4 làm được tất cả những điều này, có thể mô hình ngôn ngữ sẽ trả lời là mọi thứ tạo ra trí thông minh của nó vẫn đang “được giới hạn bằng dữ liệu chứ chưa có sự hiểu biết và có chủ đích thật sự rõ ràng.” Kể cả khi bị giới hạn như vậy, bác sỹ Kohane vẫn cho rằng, GPT-4 có thể bắt chước, dù không hoàn hảo, cách bác sỹ chẩn đoán tình trạng bệnh lý của con người với tỷ lệ chính xác cao.

Isaac Kohane đã tiến hành thử nghiệm tư duy lâm sàng với GPT-4, dựa trên một ca bệnh thực tế liên quan tới một em bé sơ sinh mà ông đã điều trị vài năm trước. Chỉ mới cung cấp cho thuật toán AI vài chi tiết mấu chốt về bệnh nhi mà ông thu thập được khi thăm khám, cũng như vài dữ liệu siêu âm và nồng độ hormone, AI đã đoán trúng một bệnh lý hiếm gặp, 100 nghìn người chỉ có 1 ca, được gọi là tăng sản tuyến thượng thận bẩm sinh. AI làm được điều đó “giống hệt như tôi, với tất cả những năm tháng học tập và kinh nghiệm làm việc của tôi,” Kohane viết.
Thành ra, vị bác sỹ vừa ấn tượng, vừa có đôi chút hoảng sợ.
“Một mặt, tôi có một cuộc trò chuyện vô cùng phức tạp và sâu sắc với một quy trình tính toán, nhưng ở mặt khác, cùng lúc tâm trí tôi choáng váng khi nhận ra rằng hàng triệu gia đình sẽ sớm được tiếp cận với những chuyên môn y tế đầy ấn tượng, cùng lúc tôi vẫn không hiểu làm cách nào chúng tôi có thể đảm bảo hoặc chứng nhận rằng lời khuyên của máy móc là an toàn và hiệu quả.”
Ở một khía cạnh vô cùng công bằng, cuốn sách vừa khen ngợi khả năng của GPT-4, lại vừa đưa ra những ví dụ mô tả sự hoài nghi, bằng những sai lầm ngớ ngẩn của mô hình ngôn ngữ machine learning. Chúng bao gồm những lỗi văn thư rất đơn giản, ví dụ viết sai chỉ số BMI mà chính máy móc đã tính chính xác ngay trước đó, cho tới những lỗi toán học như giải bài Sudoku không chính xác, hay quên bình phương một số hạng trong một phương trình. Những sai lầm thường rất nhỏ, nhưng AI luôn có xu hướng khẳng định nó đúng, kể cả khi bị chất vấn kết quả. Không khó để tưởng tượng việc chỉ một con số sai có thể dẫn đến những sai sót nghiêm trọng trong kê đơn và chẩn đoán bệnh lý.

Quảng cáo
Ấy là chưa kể, GPT-4 hoàn toàn có khả năng “hóa điên”, cách nói khi AI tự bịa ra câu trả lời hoặc không làm việc theo yêu cầu con người.
GPT-4 thì thừa nhận rằng: “Tôi không có ý định lừa dối hay đánh lừa bất kỳ ai, nhưng đôi khi tôi mắc sai lầm hoặc đưa ra dự đoán dựa trên dữ liệu không đầy đủ hoặc không chính xác. Tôi cũng không có khả năng phán đoán lâm sàng cũng như đạo đức nghề nghiệp của một bác sỹ hay một y tá.”
Một giải pháp kiểm tra chéo tiềm năng mà các tác giả đề xuất trong cuốn sách này là mở một phiên chat mới với GPT-4, yêu cầu nó đọc lại và xác minh những kết quả xét nghiệm chính nó đã đưa ra theo cách trung lập nhất. Cách làm này đôi khi giúp máy móc phát hiện ra lỗi sai, dù GPT-4 tương đối ít khi thừa nhận nó sai. Một cách bắt lỗi khác là ra lệnh cho bot hiển thị kết quả làm việc của nó, để con người có thể xác minh kết quả.
Các tác giả cuốn The AI Revolution in Medicine viết, rõ ràng GPT-4 có khả năng giải phóng thời gian và nguồn nhân lực quý giá trong các bệnh viện, cho phép các bác sĩ lâm sàng có thêm nhiều thời gian hơn với các bệnh nhân thay vì ngồi đánh giá bệnh lý trước màn hình máy tính. Tuy nhiên, cùng lúc, họ cũng nói rằng “chúng ta phải buộc tưởng tượng một thế giới với máy móc càng lúc càng thông minh, rồi sẽ tới lúc máy vượt qua con người về trí tuệ. Khi đó chúng ta cần phải nghĩ thật kỹ về cách chúng ta muốn thế giới ấy vận hành.”
Theo Insider