Stable Diffusion 3 đã ra mắt, mời anh em ngắm hình tạo ra bằng AI mới nhất

P.W
20/4/2024 7:20Phản hồi: 19
Stable Diffusion 3 đã ra mắt, mời anh em ngắm hình tạo ra bằng AI mới nhất
Theo chia sẻ trên mạng xã hội Reddit cựu CEO Emad Mostaque của Stability AI, người vừa xin từ chức cách đây ít lâu, API của Stable Diffusion 3 đã được cung cấp cho các đơn vị và cá nhân làm nghiên cứu sau quá trình đăng ký sử dụng thử mô hình tạo ảnh bằng thuật toán AI này. Cũng theo anh Mostaque, API luôn luôn ra mắt trước, rồi sau đó từ 2 tuần đến 1 tháng, sẽ bắt đầu có những người huấn luyện API thành những mô hình dạng safetensor cho anh em đang dùng AUTOMATIC1111 hoặc ComfyUI chạy, tạo ra những hình ảnh từ những câu lệnh dạng văn bản.

Trước khi có những safetensor dựa trên API Stable Diffusion 3, những người đã và đang được tiếp cận SD3 đã và đang chiều lòng những anh em mê tạo hình bằng AI bằng cách, mọi người cứ gửi prompt, rồi những người đang nắm giữ API SD3 sẽ tạo hình theo yêu cầu.

Thảo luận trên này rất sôi nổi. Có người đã tổng hợp được những trải nghiệm tạo hình với Stable Diffusion 3, những ưu, nhược điểm và những điều mà những người tạo hình bằng AI cần thay đổi trong cách họ tương tác với mô hình AI:

  • So sánh với DALL-E 3, cách nhân vật con người tương tác với vật thể trong hình vẫn chưa so sánh được về mức độ chân thực.
  • Càng nhiều vật thể xung quanh nhân vật chính của tấm hình, thì phong cách định sẵn của tấm hình theo lệnh của người dùng lại càng không được AI tuân theo.
  • Vì cách vận hành mới, tạo hình bằng những cụm từ khóa rời rạc ngăn cách bằng dấu phẩy sẽ không hiệu quả bằng những câu lệnh dài, chi tiết và tự nhiên về mặt ngôn ngữ.
  • Kết hợp những concept hình ảnh lại với nhau thực sự rất khó.
  • Hình ảnh tạo ra bằng mô hình AI dễ dính artifact do phụ thuộc vào CogVLM trong quá trình đặt tên vật thể ở mỗi tấm hình trong dataset sử dụng để huấn luyện mô hình Stable Diffusion 3.
  • Nếu anh em tạo hình bằng SDXL gặp khó khăn trong việc tạo những khung cảnh hình ảnh phức tạp, thì SD3 cũng không ngoại lệ. SD3 hiểu và làm theo câu lệnh tốt hơn rất nhiều, lấy điều kiện câu lệnh ngắn hơn 77 token (từ hoặc chuỗi từ), dài hơn thì AI sẽ bị khó hiểu.
  • Nếu tạo hình mà có chữ trong hình thì hơi giống ai đó photoshop chữ vào giữa tấm hình chứ trông không tự nhiên.

Và dưới đây là vài ví dụ tạo hình cơ bản bằng Stable Diffusion 3 vừa được chia sẻ trên Reddit:



Prompt: a giant swamp demon crawling out, mist, detailed, intricate roots, horror, wide shot

i-got-access-to-sd3-on-stable-assistant-platform-send-your-v0-lxnzydzb14uc1.webp

Prompt: Scientists richard feynman and albert einstein arguing about quantum mechanics in front of a blackboard in princeton university

i-got-access-to-sd3-on-stable-assistant-platform-send-your-v0-rngizbp224uc1.webp

Prompt: A middle-aged gentleman walks along a sparsely lit avenue in a dense park. His stature is fragile. A cigarette glows in his left hand, his right hand holds the leash of his medium-sized dog. It is a cloudy day with light rain. The photo is a back shot with a slight defocus. Award-winning photo of the year.

i-got-access-to-sd3-on-stable-assistant-platform-send-your-v0-ods85bnb64uc1.webp

Prompt: A tiny human riding a giant mechanical cat into battle - the cat has a cyberpunk themed futuristic cannon on top of it.

Quảng cáo


i-got-access-to-sd3-on-stable-assistant-platform-send-your-v0-0ixmq1ly54uc1.webp

Prompt: a muscly brown bunny eating breakfast in the kitchen next to a chubby creamy unicorn, created in a photorealistic style

i-got-access-to-sd3-on-stable-assistant-platform-send-your-v0-46f8rg2p64uc1.webp

Prompt: Team Fortress 2 gameplay screenshot, Blue Soldier with a metal helmet holding a rocket launcher, standing on grass. A red Spy is behind the Blue Soldier and has a grin on his face and is raising up his knife. This is taken place in ctf_2fort which is a sandy place with concrete buildings and there is a bridge with a roof in the distance.

i-got-access-to-sd3-on-stable-assistant-platform-send-your-v0-lni8yelt44uc1.webp

Prompt: 8k Houdini render of Swirling smoke, bursts of lightning and magical glowing luminosity

Quảng cáo


i-got-access-to-sd3-on-stable-assistant-platform-send-your-v0-rtdcfh8o74uc1.webp

Prompt: An oil painting of a giant menacing spaceship firing laser cannons against a space whale

i-got-access-to-sd3-on-stable-assistant-platform-send-your-v0-i5icestw74uc1.webp

Prompt: ((high quality, masterpiece,masterwork)) [[low resolution, worst quality, blurry, mediocre, bad art, deformed, disfigured, elongated, disproportionate, anatomically incorrect, unrealistic proportions, mutant, mutated, melted, abstract, surrealism, sloppy, crooked, cropped]] oil painting, oil on board, John Berkey Howard Pyle Ashley Wood Alfons Mucha, poseidon, sitting on a barnacle encrusted throne in an underwater kingdom

i-got-access-to-sd3-on-stable-assistant-platform-send-your-v0-mirlp92c04uc1.webp

Prompt: ((still life of a vase with flowers by a window)), 8k, 4k, detailed, attractive, beautiful, impressive, photorealistic, realistic, cinematic composition, volumetric lighting, high-resolution, vivid, detailed, stunning, professional, lifelike, crisp, flawless, DSLR, 4k, 8k, 16k, 1024, 2048, 4096, detailed, sharp, best quality, high quality, highres, absurdres

i-got-access-to-sd3-on-stable-assistant-platform-send-your-v0-m0m65lk344uc1.webp
19 bình luận
Chia sẻ

Xu hướng

Chưa thấy gì đặc biệt
Vứt. Mặt ma mặt quỷ chứ có phải mặt người đâu 😃
TT.png
Từ bản này chính thức chuyển thành ứng dụng trả phí. Sức ép từ các cổ đông là quá lớn đến ngay cả CEO cũng phải từ nhiệm
Copy mấy cái lệnh qua copilot ra hình đẹp hơn nhiều.
Hy vọng smartphone sớm chạy SD hoàn chỉnh trực tiếp.
Nhìn chất lượng thế này đành cầu phép màu nào đó cải thiện chất lượng model khi ra mắt cộng đồng vậy:
0054-ELLA-CLIP.png
0044-ELLA-CLIP.png
0046-ELLA-CLIP.png
0053-ELLA-CLIP.png
0045-ELLA-CLIP.png
Nhìn mấy hình này cũng đẹp mà không biết để làm gì 🤣 vô hồn gì đâu 🙂
@TheHardGuy cho mấy thằng mod tt sài làm thumb cho rẽ tiền khỏi tốn công thuê thợ làm ảnh bạn
mới vừa sdxl xong thì giờ 3.0, đẻ phiên bản như gà cũng chẳng cải tiến gì mấy
mấy Ai vẽ hình này chắc phải đợi vài năm nữa mới thấy cải tiến rõ ràng
toàn ăn cắp của người khác rồi chỉnh sửa thành của riêng
@Chiplovevn Con AI nào mà chả đi lấy ảnh của người khác về học rồi vẽ theo hả bạn ? Nói chuyện có não tí.
@hjepsi_culan ngu à, thì ý tao nói là ai toàn đi ăn cắp ấy chứ riêng gì con này
@Chiplovevn Thì có liên quan gì bài viết này ko thằng hâm ?
@hjepsi_culan tao nói AI ăn cắp chất xám mà trong bài là AI mà không liên quan à thằng ngu
Đang chạy stable trên máy tính mà không biết phiên bản mấy, chỉ biết nó tạo ra hình rất đẹp ( cần vga mạnh để tạo nhanh )
01005-2182554486.png
@tieutu911 sao lại có 2 cái . thế kia
@tieutu911 AI nào tạo mà ướt át dzị
@takapygo thì AI trong bài viết đó. chạy trên pc chứ không phải trên web

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019