Bên cạnh Midjourney, Stable Diffusion hay DALL-E thì chúng ta còn một công cụ tạo hình ảnh từ văn bản đến từ một công ty công nghệ lớn khác là Meta “Imagine Meta AI”. Cách hoạt động đối với người dùng cuối của Imagine là tương tự như Midjourney hay DALL-E.
Hiện tại để sử dụng được Imagine Meta AI thì anh em cần phải có VPN, chuyển vùng sang Mỹ vì mới chỉ hỗ trợ quốc gia này, chính vì vậy mà các “nguyên liệu đầu vào” của anh em cũng cần phải cung cấp bằng tiếng Anh. Mình có thử dùng các gợi ý bằng tiếng Việt thì AI của Meta hoàn toàn không hiểu.
Để sử dụng Imagine with Meta AI, anh em truy cập vào địa chỉ imagine.meta.com, sau đó làm theo hướng dẫn trên màn hình là có thể sử dụng được.
AI của Meta hoàn toàn chưa hiểu được tiếng Việt.
Hiện tại để sử dụng được Imagine Meta AI thì anh em cần phải có VPN, chuyển vùng sang Mỹ vì mới chỉ hỗ trợ quốc gia này, chính vì vậy mà các “nguyên liệu đầu vào” của anh em cũng cần phải cung cấp bằng tiếng Anh. Mình có thử dùng các gợi ý bằng tiếng Việt thì AI của Meta hoàn toàn không hiểu.
Để sử dụng Imagine with Meta AI, anh em truy cập vào địa chỉ imagine.meta.com, sau đó làm theo hướng dẫn trên màn hình là có thể sử dụng được.
AI của Meta hoàn toàn chưa hiểu được tiếng Việt.
Cách mà Meta (Facebook) huấn luyện con AI này là dựa vào 1,1 tỷ hình ảnh công khai trên cả hai nền tảng Facebook lẫn Instagram, như vậy hình ảnh mà chúng ta đăng tải lên hai nền tảng này có thể được sử dụng để huấn luyện AI. Model AI mà Meta sử dụng để tạo ra Imagine with Meta AI là con AI Emu. Bản thân con AI Emu này cũng có nhiều biến thể, nó còn có thể tạo ra video, chỉnh sửa hình ảnh hoặc là tạo ra bài hát.
Imagine with Meta AI này hiện tại đang miễn phí trong giai đoạn beta, mỗi lần sử dụng sẽ tạo ra được tối đa 4 hình ảnh. Trong tương lai gần, con AI này sẽ lấy dữ liệu từ những hình ảnh nó tạo ra nhiều hơn, Meta cho biết họ sẽ cố gắng tách bạch và mình bạch về dữ liệu của người dùng được sử dụng.
Một số hình ảnh của Imagine with Meta AI tạo ra và so với DALL-E 3 trên Microsoft Copilot:
Hình ảnh ông lão bán cá.
Tôn Ngộ Không lái mô-tô.
Cô gái với biển cả 😁.
Hình ảnh cô gái bên bãi biển của DALL-E 3 trên Microsoft Copilot.
Hình ảnh được Imagine with Meta AI tạo ra có độ phân giải cao, độ chính xác cũng cao nhưng tuỳ vào độ dồi dào của nguyên liệu mà chúng ta cung cấp, thử nhanh qua một vài mẫu và so sánh vớii DALL-E 3 đang có mặt trên Microsoft Copilot thì mình ấn tượng về cách mà AI của Meta tái tạo hình ảnh khuôn mặt người, nó chân thật và nhìn rất giống người thật, thật hơn nhiều so với DALL-E 3.
Quảng cáo
DALL-E 3 vẫn cho mình các hình ảnh đôi khi đúng ý mình hơn là Imagine with Meta AI, ví dụ như tấm ảnh Tôn Ngộ Không ở trên. Các nhược điểm của DALL-E 3, Midjourney hay Stable Diffusion gặp phải về việc tái tạo các chi tiết bộ phận cơ thể người như tay, khuỷu tay, ngón tay cũng đều gặp phải trên Imagine with Meta AI, so với các model AI được huấn huyện và chạy nội bộ trên máy tính, dành cho người dùng cuối và cần rất nhiều thủ thuật khác nhau thì mới có thể có được sự hoàn chỉnh tương đối.
Nếu anh em không thích dùng nền web, anh em vẫn có thể sử dụng trực tiếp trên ứng dụng Messenger, bằng cách gõ @meta AI /imagine vào khung tìm kiếm trên Messenger, sau đó sử dụng giống như nền web.