Cảm nhận nhanh về Sora: dùng AI tạo video (từ văn bản)

Didu
16/2/2024 9:24Phản hồi: 27
Cảm nhận nhanh về Sora: dùng AI tạo video (từ văn bản)
Mình là người làm nội dung video nên khi Sora ra mắt, mình không chỉ ấn tượng với những gì nó có thể làm mà còn cả lo sợ một ngày nào đó nhỡ đâu mình cũng sẽ mất việc. Sora mới ra mắt và chưa cho số đông sử dụng nhưng một ngày không xa, bạn có thể tạo một đoạn video ngắn chỉ với vài câu lệnh đơn giản. Thật không thể tin nổi.



Chỉ một năm trước, không ai tin rằng với vài câu lệnh đơn giản thì AI sẽ tạo ra được một video. Dĩ nhiên đằng sau đó còn cả một quá trình phân tích và xử lý phức tạp, khác xa với sự đơn giản mà video được tạo ra dưới góc nhìn của người dùng bình thường. OpenAI nói họ phải phân tích câu lệnh, tạo ra một chuỗi giải thích chi tiết hơn rất nhiều rồi mới đưa cho mô hình để tạo ra video. Tức là Sora có khả năng hiểu ngôn ngữ rất tốt, AI sẽ phân tích, bóc tách ra chi tiết để tạo ra một video tự nhiên và đúng với ý của người dùng.




Hầu hết những video ngắn do Sora tạo ra đều từ 2-3 câu lệnh ngắn gọn nhưng nó lại rất hợp logic và hoàn cảnh thực tế. Không chỉ là chỉ đơn giản dựa trên câu lệnh mà Sora còn phân tích để xem hoàn cảnh đó diễn ra vào khoảng thời gian nào, có sự kiện gì xảy ra để tạo ra cảnh vật, nhân vật tự nhiên nhất. Ví dụ là video một cô gái bước đi ở khu downtown Tokyo, chúng ta nhìn cái là biết ngay ở Nhật, khu trung tâm, sự hào nhoáng của cảnh vật và biển quảng cáo. Bộ đồ của cô gái, phong thái bước đi hay màu son môi đều là yêu cầu của người dùng và Sora đã thành công khi tạo ra một video như vậy. Hay như khung cảnh California thời kỳ đào vàng (gold rush), nếu quan tâm về lịch sử và đọc sách thì đó là thời kỳ người ta đổ xô đi đào vàng cho nên chúng ta thấy được cảnh vật rất hợp lý với thời kỳ đó như khu thị trấn, con suối, ngựa là phương tiện di chuyển chính…

Sora có khả năng tạo ra đoạn video Full-HD theo chiều ngang hoặc dọc, nên chúng ta thấy hình ảnh rất sắc nét, màu sắc tự nhiên. Không chỉ vậy, nó còn đủ thông minh để có thể tự căn góc quay, ví dụ một người nào đó tự quay mình thì hình nhân vật sẽ xuất hiện ở trung tâm khung cảnh chứ không bị lệch. Với những video dạng 3D cũng vậy, nó chẳng khác gì những video do những studio hoạt hình chuyên nghiệp tạo ra cả. OpenAI nói Sora có khả năng hiểu ngôn ngữ rất tốt và mình tin điều đó. Ví dụ với video về một chiếc SUV kiểu cổ (câu lệnh là vintage SUV) thì Sora chọn một chiếc xe đại diện rất tốt cho cái vintage và SUV đó là Land Rover Defender. Tức là nó đã rất thông minh để hiểu người dùng muốn gì và muốn xem gì để đưa ra video như vậy.





Hai trong số những video mình thích là chàng trai đang đọc sách trên mây và chú chó ở bãi biển. Tất cả mọi thứ đều giống thật, từ mái tóc, làn da, quần áo hay quang cảnh bãi biển và màu nắng… đều rất tự nhiên và thực tế. Hoặc video một cô gái đang đi tàu điện ở khu ngoại ô Tokyo, nó hợp lý đến khó tin. Cô gái đó đứng sát cửa sổ và khi đó muốn quay được rộng nhất thì phải chuyển qua ống kính siêu rộng trên smartphone, hoặc một tiêu cự nào đó rộng nhất nên khung cảnh chúng ta thấy trong video bị méo ở các góc. Hoặc khi con tàu di chuyển qua tòa nhà sát đó thì bóng phản chiếu của nhân vật xuất hiện, tất cả đều cho cảm giác do một người cầm máy ảnh hoặc điện thoại quay lại.


Mấy con chó sói được sinh ra hơi ảo.

Dĩ nhiên là Sora vẫn có điểm yếu khi khung cảnh có quá nhiều nhân vật thì những cử chỉ đôi khi sẽ không tự nhiên và dễ nhận ra là nhân tạo. Các cử chỉ phức tạp như bước chân đi bộ, môi mấp máy hoặc liên quan đến con người thì chưa hoàn hảo, dĩ nhiên con người trải qua hàng ngàn năm tiến hóa mới được như ngày nay, AI vài năm thì đâu dễ gì 😁 Nhưng mình tin chỉ thời gian ngắn được cải thiện và bổ sung dữ liệu thì Sora sẽ còn mạnh mẽ hơn, những gì nó có thể tạo ra là không tưởng. Sora chưa cho dùng đại trà và những yếu tố liên quan đến an toàn, đạo đức cũng đang được OpenAI phát triển và hoàn thiện. Vì thế mà một người dẫn đầu một công ty rất mạnh về AI như OpenAI quan trọng như thế nào và đây mới chỉ là khởi đầu.

Quảng cáo



Hai ứng dụng mình thấy được với Sora đó là tư liệu và lịch sử. Chúng ta có thể nhờ Sora tạo ra một đoạn video dùng làm tư liệu quảng cáo, dùng trong các bộ phim và tư liệu lịch sử. Những video mang tính lịch sử như thời kỳ cơn sốt vàng hay voi ma mút hoàn toàn có thể nhờ AI tạo dựng và được sử dụng làm tham khảo.

Tìm hiểu thêm về Sora: https://openai.com/sora/

Screenshot 2024-02-16 at 5.35.42 PM.jpg
Những nội dung 3D, hoạt họa như này quá sức bình thường với Sora. Không chỉ văn bản mà chúng ta có thể dùng hình ảnh hoặc một đoạn video để nhờ Sora tạo ra một đoạn video với bối cảnh tương tự.

Screenshot 2024-02-16 at 5.35.55 PM.jpg
Câu lệnh là Big Sur nhìn từ trên cao, với bọt nước trắng, ánh mặt trời rọi vào vực đá và phía xa có ngọn hải đăng. Với Sora thì chúng ta có thể đi du lịch từ xa được rồi :D

Screenshot 2024-02-16 at 5.37.55 PM.jpg

Quảng cáo


Mình khá ấn tượng với video này, về một chú chó đang đeo cây gậy. Cái bóng chiếu vào kính mắt, ánh nắng và con chó thực tế làm sao.

Screenshot 2024-02-16 at 5.35.26 PM.jpg
Khung cảnh Scotland dưới sự tái tạo của Sora. Nhìn cổ kính không kém đời thực. Dĩ nhiên Sora thông minh để chúng ta yêu cầu nó tái tạo Scotland thì nó lại đưa chúng ta sang châu Á được.

Screenshot 2024-02-16 at 5.36.42 PM.jpg
Câu lệnh là các nhà khảo cổ học tìm được một chiếc ghế nhựa. Bản chất là Sora làm đúng nhưng chưa logic lắm ở chỗ như kiểu chiếc ghế bị vùi dưới lớp cát chứ không phải được đào ở rất sâu và nhiều tầng như các hình khảo cổ chúng ta thấy.

Screenshot 2024-02-16 at 5.37.02 PM.jpg
Screenshot 2024-02-16 at 5.37.38 PM.jpg
Nước da, râu và mắt mới thật làm sao.
27 bình luận
Chia sẻ

Xu hướng

blackhole1
ĐẠI BÀNG
3 tháng
Tất cả cũng chỉ để phục vụ con người. Vài năm nữa khi ai cũng chán ngấy với mấy thứ nhân tạo không tự nhiên thì lại đi tìm lại tự nhiên thôi. Đi du lịch, tập gym, đi dạ hít thở không khí trong lành, đọc sách,....coi phim con người đóng
Song Sanh
ĐẠI BÀNG
3 tháng
@blackhole1 Chỉ sợ lúc đó AI nhân tạo mà bạn nói nó giành gần hết công việc tạo thu nhập của con người rồi, lúc đó mất việc cũng chả có đủ tiền lương để chi trả mấy cái tự nhiên như bạn muốn, lúc đó nó nhét gì thì mình xài nấy thôi, kkkkk.
@blackhole1 Tập gym mà kêu là tự nhiên 😏
@blackhole1 Đúng, tự nhiên sẽ thành một thứ xa xỉ mới, giống như đồ thủ công và đồ công nghiệp hiện tại vậy.
huybo02
TÍCH CỰC
3 tháng
@blackhole1 Mấy cái này giống game, tạo nhân vật, khung cảnh, chiếu sáng...nó có công cụ phần mềm hỗ trợ rồi. Giờ AI dùng chuyển ngôn ngữ thành lệnh cho phần mềm nhúng trong và tạo ra. Mình nghĩ vậy.
Thương các em, Yua Mikami, Minami Aizawa, Yui Hatano… đóng phim đã vất vả lắm rồi mà giờ con AI nó lại nhăm nhe lấy mất việc của các em.

Àh mà nếu mà train con AI bằng phim con heo thì nó có nghiện phim này ko nhỉ?
@╰‿╯ Con AI giả tiếng rên ko thật lắm đâu
@╰‿╯ Hey sora. Tạo 1 video hướng dẫn cách hú hí 😆)
@╰‿╯ Ngon
Đáng kinh ngạc
Công nhận có Sora thì tìm cảnh B-roll (phụ - trám) ghép vào videos cực kỳ dễ dàng! 😁
Cười vô mặt
@Cuong Nb hay ha :D
tien dio
TÍCH CỰC
3 tháng
Nếu kết hợp từ một hai bức ảnh và câu lệnh thì dc ko ta
@tien dio chưa rõ là có nhận 2 loại input ko
Rồi add face ai đó làm model và muốn có phim j coi, thể loại nào cũng đc
texudo
ĐẠI BÀNG
3 tháng
Sora là một cuộc cách mạng về công nghệ, openAI có thể thành hãng phim, studio ... sản xuất từ phim hoạt hình cho tới phim người đóng.... một viễn cảnh thật u ám cho nền điện ảnh toàn thế giới
@texudo Tốt mà, ai cũng có thể sản xuất phim 😆
@texudo đó là chuyện tốt bạn ạ
Saga0803
TÍCH CỰC
3 tháng
Không phân biệt được thật giả luôn
😗
Chưa public nhưng thấy mượt ghê
Không thấy để cài đặt trên androi. App hình ntn vậy?
anhchangdc
ĐẠI BÀNG
3 tháng
Sau vụ xóa râu 30 triệu $ như rửa tiền này thì tôi nghĩ ngày AI thay thế đội ngũ kĩ xảo không còn xa nữa
images (11).jpeg
Sao hay vậy ta rất chân thật... Phim hoạt hình 3d cho con nít xem sau này rất nhiều
nên cấm các sp nghệ thuật dùng ai
Có nên gọi người chuyển hoá ngôn ngữ văn bản để thành video này là thiên tài ko nhỉ ?
tahitivn
ĐẠI BÀNG
3 tháng
Giờ tận hưởng những thứ tự nhiên nhất, sau này thật giả lẫn lộn.
Đỉnh quá

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019