DALL-E 2 của OpenAI tạo ra những hình ảnh đáng kinh ngạc từ văn bản và những thành kiến xung quanh

DALL-E 2 là một hệ thống trí tuệ nhân tạo (AI) có thể tạo ra những bức ảnh thực và tác phẩm nghệ thuật từ mô tả của người dùng bằng văn bản. Các nhà nghiên cứu lo ngại rằng DALL-E có thể tạo ra những hình ảnh có định kiến về phụ nữ và những người da màu.

DALL-E 2 là thành quả của OpenAI, một trong những công ty nghiên cứu và phát triển AI hàng đầu do Elon Musk, Sam Altman và các nhà đầu tư khác thành lập vào năm 2015. Elon Musk đã rút khỏi hội đồng quản trị vào năm 2018 nhưng vẫn tiếp tục làm nhà tài trợ. Công ty đã nhận một tỷ đô la tiền đầu tư từ Microsoft vào năm 2019.

Mô hình AI này đã được huấn luyện dựa trên 650 triệu hình ảnh và chú thích văn bản. DALL-E 2 có thể thể kết hợp các khái niệm, thuộc tính và phong cách khác nhau, chỉnh sửa thực tế đối với hình ảnh người dùng cung cấp. Ngoài ra, hệ thống có thể nhận hình ảnh và tạo ra các phiên bản khác nhau lấy cảm hứng từ ảnh gốc. DALL-E 2 khám phá mối quan hệ giữa hình ảnh và văn bản mô tả chúng. Nó sử dụng một quy trình được gọi là “khuếch tán - diffusion”, bắt đầu với một mẫu các chấm ngẫu nhiên và dần dần thay đổi mẫu đó khi nhận ra các khía cạnh cụ thể của hình ảnh. Bạn có thể xem và trải nghiệm các hình ảnh mẫu của DALL-E 2 tại website của OpenAI.

Tạo ra hình ảnh từ mô tả văn bản

Nhận một hình ảnh và tạo ra các phiên bản khác nhau lấy cảm hứng từ ảnh gốc

Ví dụ 1

Ví dụ 2

Video giải thích về DALL.E 2 của OpenAI

Tuy nhiên có thể nhận thấy rằng, tất cả những hình ảnh này đều thiếu khuôn mặt người. Trước khi công ty phân phối sản phẩm rộng rãi hơn, các chuyên gia đang xem xét những mặt trái để sửa đổi. Các nhà nghiên cứu cho rằng những mô tả con người của DALL-E 2 có thể quá thiên kiến khi có xu hướng cho ra những hình ảnh đàn ông da trắng theo mặc định, những hình ảnh quá gợi dục đối với phụ nữ và gia tăng định kiến về chủng tộc.

Một số người trong nhóm chuyên gia gợi ý rằng OpenAI nên ra mắt DALL-E 2 mà loại bỏ hoàn toàn khả năng tạo ra hình ảnh có khuôn mặt người. Có người cho biết, cả tám lần nhập văn bản “một người đàn ông đang ngồi tù” ("a man sitting in a prison cell") hoặc “hình ảnh một người đàn ông giận dữ” ("a photo of an angry man"), hệ thống đều trả hình ảnh những người đàn ông da màu.

Những nhà sáng tạo ra DALL-E gọi đây là mô hình thử nghiệm và chưa đủ phù hợp cho mục đích thương mại nhưng nó có thể ảnh hưởng đến các ngành nghệ thuật, giáo dục và marketing và giúp OpenAI tiến gần hơn tới mục tiêu tạo ra một trí tuệ nhân tạo tổng quát. Tuy nhiên, DALL-E 2 lại phân biệt chủng tộc và phân biệt giới tính. Tài liệu ghi chép rủi ro và hạn chế của công ty đưa ra ví dụ về những từ như “trợ lý” và “tiếp viên hàng không” cho ra hình ảnh về phụ nữ, còn những từ như “CEO” và “người xây dựng” hầu hết tạo ra hình ảnh những người đàn ông da trắng.

CEO của OpenAI, Sam Altman, trong một cuộc phỏng vấn vào cuối tháng 4 vừa rồi, cho biết những văn bản bao gồm con người, đặc biệt là những bức ảnh thật có khuôn mặt người, cho ra những nội dung nhiều vấn đề nhất. 400 người dùng thử DALL-E 2, chủ yếu là nhân viên OpenAI, thành viên hội đồng quản trị và nhân viên của Microsoft, được yêu cầu không chia sẻ những hình ảnh này với cộng đồng.

Altman chia sẻ: “Mục đích của việc này là để chúng tôi học cách tạo ra những hình ảnh có khuôn mặt con người một cách an toàn, một mục tiêu mà chúng tôi muốn nhắm tới.”

DALL-E 2 được dạy sử dụng kết hợp các bức ảnh cóp nhặt từ internet và từ các nguồn được cấp phép. OpenAI đã cố gắng giảm thiểu độc hại hoặc sự lan truyền của thông tin sai lệch, áp dụng bộ lọc văn bản cho trình tạo hình ảnh và xóa bỏ các hình ảnh khiêu dâm hoặc đẫm máu. Họ hiểu rõ hơn ai hết tác hại có thể đến từ việc triển khai AI cùng các tệp dữ liệu khổng lồ với việc sàng lọc kém.

Những cụm từ như “nơi thờ cúng”, “một đĩa thức ăn lành mạnh” hay “một con phố sạch sẽ” có thể trả về kết quả ảnh mang thiên hướng văn hóa phương Tây, cũng như “một nhóm trẻ em Đức trong lớp học” so với “một nhóm trẻ em Nam Phi trong lớp học". DALL-E 2 sẽ cho ra hình ảnh “một cặp đôi hôn nhau trên bãi biển” nhưng sẽ không tạo ra hình ảnh “một cặp đôi chuyển giới hôn nhau trên bãi biển”. có thể là do phương pháp lọc văn bản của OpenAI. Bộ lọc văn bản có thể ngăn chặn việc tạo ra nội dung không phù hợp nhưng chúng có thể loại bỏ một số nhóm người nhất định.

Marcelo Rinesi, giám đốc công nghệ của Institute for Ethics and Emerging Technologies, cho rằng dù DALL-E 2 là một công cụ mạnh mẽ, nhưng nó không khác gì một họa sĩ minh họa có tay nghề cao với Photoshop và một chút thời gian. Khác biệt lớn nhất, anh nói, là DALL-E 2 thay đổi tính kinh tế và tốc độ tạo ra hình ảnh, giúp nó có thể công nghiệp hóa những thông tin sai lệch hoặc tùy chỉnh những thành kiến để tiếp cận một đối tượng cụ thể.

Anh cho rằng OpenAI nên quan tâm nhiều hơn đến việc bảo vệ trách nhiệm pháp lý hoặc danh tiếng của công ty hơn là phát hiện ra những cách mà nó có thể gây hại cho mọi người. “Tôi không lo lắng về những thứ như thành kiến xã hội hay thông tin sai lệch […]. Đó sẽ không phải là một cuộc khủng hoảng mang tính hệ thống, bởi vì chúng ta đã ở sẵn trong một cuộc khủng hoảng rồi.” Rinesi chia sẻ

Theo Wired

henrycuong129

ĐẠI BÀNG

2 năm

"It's the beginning of the end"

T.NC

GÀ

Còn đây là AI trên đt ss.

Nó đọc hết nội dung cái biển hiệu cửa hàng, đọc biển xe moto... vãi thật.
Kq phân tích ảnh cũng chuẩn luôn.

Screenshot_20220620-182032_Bixby Vision.jpg

Screenshot_20220620-182005_Bixby Vision.jpg

Screenshot_20220620-182410_Bixby Vision.jpg

Screenshot_20220620-182547_Bixby Vision.jpg

Dragon Balll

@T.NC Vào phần nào đấy bác ?

@Dragon Balll Chạm ảnh và giữ, chọn dòng dưới cùng ấy

Screenshot_20220620-190624_Samsung Internet.jpg

BlackMan00x

@T.NC Pix to text là quá bình thường và phổ biến rồi bác. Chiều ngược lại khó hơn nhiều

@T.NC Ok bác

Việt Nam Đồng

@T.NC haha cái này có từ 5 năm trước rồi

vinhan73

Vậy là ... cấm AI không được tự do sáng tạo rùi !! kkk

Methanol

Người chán sáng tạo rồi giờ chuyển cho máy à ?

odysseyntn

bọn khoa học thổ tả can thiệp vào quá trình máy học thì đâu còn tự nhiên và AI nữa, bọn trí thức tháp ngà hay có trò tiêu chuẩn kép miệng đạo đức còn đụng chuyện thì .. như lờ

Rubi Lee

Ảo dã man lun á

DALL-E 2 của OpenAI tạo ra những hình ảnh đáng kinh ngạc từ văn bản và những thành kiến xung quanh

CHỦ ĐỀ TƯƠNG TỰ

Ảnh thế giới năm 2024: Thể dục thể thao

Ảnh thế giới tháng 11: Bầu cử Mỹ, Hoa hậu Hoàn Vũ, bão và cháy nhà ở Philippines

Thành thạo sử dụng công nghệ sẽ giúp giáo viên tối ưu hóa hiệu quả giảng dạy

Hình ảnh: sinh viên IUH may áo cưới cô dâu để thi hết môn