Suchir Balaji, một cựu nhân viên, nhà nghiên cứu trí tuệ nhân tạo làm việc cho OpenAI vừa được phát hiện đã tử vong tại căn hộ của mình ở San Francisco hôm 26/11 vừa rồi, hưởng dương 26 tuổi. Cảnh sát San Francisco và trưởng phòng giám định y khoa thành phố này cho biết, chưa phát hiện ra bằng chứng tội phạm, và các nhà chức trách đặt ra nghi ngờ cái chết của Balaji là do tự sát.
Khi còn làm việc với cương vị nhà nghiên cứu cho startup OpenAI, Suchir Balaji đảm trách vai trò tổng hợp lượng dữ liệu khổng lồ từ nền tảng mạng toàn cầu để phục vụ huấn luyện những mô hình ngôn ngữ hiện đại nhất của OpenAI, rồi từ đó vận hành chatbot ChatGPT.
Chỉ mới ba tháng trước khi từ trần, Balaji đã công khai tố cáo OpenAI vi phạm luật sở hữu trí tuệ của Mỹ khi thu thập dữ liệu và thông tin để phục vụ phát triển ChatGPT. Những thông tin mà anh này nắm trong tay và cung cấp đã trở thành những bằng chứng mấu chốt trong không ít những vụ kiện giữa các nhà xuất bản nội dung, những đơn vị báo chí và các đơn vị nắm giữ bản quyền sở hữu trí tuệ khi họ khởi kiện OpenAI, với những cáo buộc vi phạm bản quyền.
Kể từ khi ra mắt vào tháng 11/2022, ChatGPT nói riêng và bản thân OpenAI đã phải hứng chịu không ít những tranh cãi, thậm chí là phải đối mặt với những vụ kiện vi phạm bản quyền sở hữu trí tuệ. Những đơn vị nắm giữ bản quyền nội dung số cho rằng, OpenAI đã ăn cắp chất xám để biến họ trở thành startup công nghệ quan trọng và nổi tiếng nhất hành tinh hiện tại, với giá trị vốn hóa ước tính vượt ngưỡng 150 tỷ USD.
Khi còn làm việc với cương vị nhà nghiên cứu cho startup OpenAI, Suchir Balaji đảm trách vai trò tổng hợp lượng dữ liệu khổng lồ từ nền tảng mạng toàn cầu để phục vụ huấn luyện những mô hình ngôn ngữ hiện đại nhất của OpenAI, rồi từ đó vận hành chatbot ChatGPT.
Chỉ mới ba tháng trước khi từ trần, Balaji đã công khai tố cáo OpenAI vi phạm luật sở hữu trí tuệ của Mỹ khi thu thập dữ liệu và thông tin để phục vụ phát triển ChatGPT. Những thông tin mà anh này nắm trong tay và cung cấp đã trở thành những bằng chứng mấu chốt trong không ít những vụ kiện giữa các nhà xuất bản nội dung, những đơn vị báo chí và các đơn vị nắm giữ bản quyền sở hữu trí tuệ khi họ khởi kiện OpenAI, với những cáo buộc vi phạm bản quyền.
Kể từ khi ra mắt vào tháng 11/2022, ChatGPT nói riêng và bản thân OpenAI đã phải hứng chịu không ít những tranh cãi, thậm chí là phải đối mặt với những vụ kiện vi phạm bản quyền sở hữu trí tuệ. Những đơn vị nắm giữ bản quyền nội dung số cho rằng, OpenAI đã ăn cắp chất xám để biến họ trở thành startup công nghệ quan trọng và nổi tiếng nhất hành tinh hiện tại, với giá trị vốn hóa ước tính vượt ngưỡng 150 tỷ USD.
Ngày 23/10/2024, trong cuộc phỏng vấn với The New York Times, Balaji công khai khẳng định rằng OpenAI đang gây hại cho mọi doanh nghiệp và đơn vị, những bên nắm giữ bản quyền dữ liệu số, thứ mà OpenAI đã sử dụng để huấn luyện mô hình AI: “Nếu bạn tin điều mà tôi tin, bạn sẽ ngay lập tức rời khỏi OpenAI. Đây không phải một mô hình kinh doanh bền vững đối với toàn bộ hệ sinh thái internet.”
Balaji lớn lên tại Cupertino, California, trước khi theo học trường UC Berkeley, chuyên ngành khoa học máy tính. Đó là thời điểm anh tin tưởng vào tiềm năng của công nghệ trí tuệ nhân tạo đối với toàn xã hội, bao gồm cả khả năng hỗ trợ con người tìm ra những phương thuốc chữa những căn bệnh nguy hiểm nhất, và tìm ra cách ngừng quá trình lão hóa của con người: “Tôi từng nghĩ chúng ta có thể sáng tạo ra những nhà khoa học máy móc để giúp chúng ta giải quyết những vấn đề cấp bách nhất của cuộc sống.”
Ấy vậy nhưng kỳ vọng tích cực của Balaji nhanh chóng rơi xuống thực tại vào năm 2022, hai năm sau khi anh bắt đầu làm việc cho OpenAI. Anh bắt đầu cảm thấy lo ngại về những nhiệm vụ thu thập dữ liệu và thông tin trên mạng internet để huấn luyện mô hình GPT-4, ứng dụng thứ công nghệ huấn luyện bằng cách đọc mọi thứ trên mạng internet để sau đó tạo sinh ra những văn bản và nội dung giống như con người tạo ra.
Trong cuộc phỏng vấn với NYT, Balaji nói rằng OpenAI đã lợi dụng quyền “sử dụng công bằng” trong luật sở hữu trí tuệ của Mỹ, thứ quản lý cách mọi người sử dụng những nội dung được xuất bản từ trước tới nay. Cuối tháng 10 vừa rồi, Balaji có một bài viết dài trên blog cá nhân, mô tả kỹ hơn cách OpenAI lợi dụng những lỗ hổng của luật sở hữu trí tuệ Mỹ để ăn cắp chất xám đem về huấn luyện mô hình AI.
Anh em có thể đọc bài viết chi tiết này tại đây: https://suchir.net/fair_use.html
Trong bài viết này, Balaji viết rằng không có bất kỳ yếu tố nào “ủng hộ quan điểm nói rằng ChatGPT tổng hợp và sử dụng dữ liệu một cách công bằng cả. Nói vậy cũng đồng nghĩa với việc, chẳng riêng gì ChatGPT, mà có thể kết luận nhiều sản phẩm AI tạo sinh hiện tại đều đang vi phạm sở hữu trí tuệ trong quá trình tổng hợp dữ liệu huấn luyện mô hình ngôn ngữ.”
Trong vụ kiện giữa tờ The New York Times với OpenAI, luật sư của tờ báo lớn này đề cập trong một văn bản trình lên thẩm phán tòa án liên bang, rằng Balaji có trong tay “những tài liệu độc nhất và có liên quan” để hỗ trợ quá trình xét xử. Balaji là một trong số ít nhất 12 người đã và đang làm việc tại OpenAI, được luật sư của tờ The New York Times coi là nhân chứng quan trọng trong vụ kiện.
Quảng cáo
Đơn kiện của The New York Times có đoạn: “Microsoft và OpenAI đơn giản chỉ lấy sản phẩm, tác phẩm của các phóng viên, nhà báo, biên tập viên, các cây viết và những người đã cộng tác cung cấp tin bài cho những tờ báo địa phương, và hoàn toàn lờ đi những công sức và nỗ lực để tạo ra những tác phẩm ấy. Rồi họ lờ đi cả quyền sở hữu trí tuệ theo luật pháp, thứ mà những người tạo ra và xuất bản nội dung tin tức nắm giữ.”
Về phần những trang tin và nhà xuất bản, đơn vị sở hữu bản quyền khác, họ luôn khẳng định rằng OpenAI, và ở một chừng mực nào đó là cả Microsoft đã có hành vi đạo văn, ăn cắp văn bản, chất xám, bài viết, từ đó gây hại cho mô hình kinh doanh của họ.
OpenAI luôn phủ nhận những cáo buộc này, và liên tục dẫn luật sở hữu trí tuệ của Mỹ, nói rằng việc họ làm là “sử dụng công bằng” sở hữu trí tuệ, thứ được luật pháp Mỹ bảo vệ: “Chúng tôi thấy tiềm năng lớn của những công cụ AI như ChatGPT trong việc củng cố mối quan hệ giữa các nhà xuất bản và những độc giả, cũng như củng cố trải nghiệm theo dõi và thu thập tin tức.”
Theo Silicon Valley