Trong 3 video được chia sẻ trên TikTok, Tom Cruise xuất hiện với các hoạt động như đánh golf, làm ảo thuật với đồng xu và một pha vấp té xong đứng lên kể chuyện hài trong một cửa hàng thời trang ở Ý.
Trông như thật nhưng thực chất đây đều là sản phẩm của AI hay Deepfake. 3 video này được đăng tải bởi tài khoản @deeptomcruise trên TikTok (có vẻ như đã xóa hết video) và nếu không soi kỹ thì không thể nào nhận ra đây là video giả. Trong cả 3 video, Tom Cruise đều thể hiện nụ cười sảng khoái rất đặc trưng và những cử chỉ khuôn mặt quen thuộc trong những bộ phim anh từng đóng. Tuy nhiên, nếu soi kỹ thì có thể thấy 3 con người trong 3 video không giống nhau dù mang cùng một bộ mặt của Tom Cruise.
Phần giọng nói được tái tạo rất giống nhưng vẫn dễ nhận thấy nó không khớp với khẩu hình. Thêm nữa là kiểu nói chuyện rất điện ảnh, chất giọng khàn và khó nghe. Trong The Graham Norton Show, anh em có thể nghe giọng thật của Tom Cruise. Dù vậy AI đã nhái rất giống.
Thêm nữa là những fan của Tom Cruise có thể nhận sự khác biệt về chiều cao và tuổi tác. Tom Cruise thực tế chỉ cao 1m7 và anh năm nay đã 58 tuổi. Trong các video thì có người cao có người thấp và trông cũng trẻ hơn, đặc biệt là video trong cửa hàng thời trang ở Ý.
Viện MIT giải thích về cơ chế của deepfake rằng để tạo ra một video deepfake thì người ta sẽ hoán đổi khuôn mặt của một người và thay thế khuôn mặt đó bằng một khuôn mặt của người khác. Thủ thuật này sử dụng các thuật toán nhận dạng khuôn mặt và mạng máy tính học sâu (deep learning) được gọi là bộ mã hóa tự động biến thể (VAE). VAE được dạy để mã hóa và giải mã hình ảnh, chẳng hạn như nếu bạn muốn biến một người trong video thành Nicolas Cage thì bạn sẽ cần 2 bộ mã hóa tự động - một được dạy với các hình ảnh khuôn mặt của diễn Nicolas Cage và một được dạy với hình ảnh khuôn mặt của nhiều người khác nhau.
Các hình ảnh được đưa vào các khung hình video bằng thuật toán nhận diện khuôn mặt để ghi lại những tư thế khác nhau và điều kiện ánh sáng tự nhiên trên khuôn mặt. Một khi các bộ mã hóa và giải mã được dạy xong, bạn có thể kết hợp giữa hình ảnh từ bộ mã hóa với nhiều khuôn mặt khác nhau với hình ảnh từ bộ giải mã với khuôn mặt của Nicolas Cage nhiều góc độ, từ đó tạo ra khuôn mặt của diễn viên này trên cơ thể của một người khác.
Trông như thật nhưng thực chất đây đều là sản phẩm của AI hay Deepfake. 3 video này được đăng tải bởi tài khoản @deeptomcruise trên TikTok (có vẻ như đã xóa hết video) và nếu không soi kỹ thì không thể nào nhận ra đây là video giả. Trong cả 3 video, Tom Cruise đều thể hiện nụ cười sảng khoái rất đặc trưng và những cử chỉ khuôn mặt quen thuộc trong những bộ phim anh từng đóng. Tuy nhiên, nếu soi kỹ thì có thể thấy 3 con người trong 3 video không giống nhau dù mang cùng một bộ mặt của Tom Cruise.
Phần giọng nói được tái tạo rất giống nhưng vẫn dễ nhận thấy nó không khớp với khẩu hình. Thêm nữa là kiểu nói chuyện rất điện ảnh, chất giọng khàn và khó nghe. Trong The Graham Norton Show, anh em có thể nghe giọng thật của Tom Cruise. Dù vậy AI đã nhái rất giống.
Thêm nữa là những fan của Tom Cruise có thể nhận sự khác biệt về chiều cao và tuổi tác. Tom Cruise thực tế chỉ cao 1m7 và anh năm nay đã 58 tuổi. Trong các video thì có người cao có người thấp và trông cũng trẻ hơn, đặc biệt là video trong cửa hàng thời trang ở Ý.
Viện MIT giải thích về cơ chế của deepfake rằng để tạo ra một video deepfake thì người ta sẽ hoán đổi khuôn mặt của một người và thay thế khuôn mặt đó bằng một khuôn mặt của người khác. Thủ thuật này sử dụng các thuật toán nhận dạng khuôn mặt và mạng máy tính học sâu (deep learning) được gọi là bộ mã hóa tự động biến thể (VAE). VAE được dạy để mã hóa và giải mã hình ảnh, chẳng hạn như nếu bạn muốn biến một người trong video thành Nicolas Cage thì bạn sẽ cần 2 bộ mã hóa tự động - một được dạy với các hình ảnh khuôn mặt của diễn Nicolas Cage và một được dạy với hình ảnh khuôn mặt của nhiều người khác nhau.
Các hình ảnh được đưa vào các khung hình video bằng thuật toán nhận diện khuôn mặt để ghi lại những tư thế khác nhau và điều kiện ánh sáng tự nhiên trên khuôn mặt. Một khi các bộ mã hóa và giải mã được dạy xong, bạn có thể kết hợp giữa hình ảnh từ bộ mã hóa với nhiều khuôn mặt khác nhau với hình ảnh từ bộ giải mã với khuôn mặt của Nicolas Cage nhiều góc độ, từ đó tạo ra khuôn mặt của diễn viên này trên cơ thể của một người khác.