Những gương mặt anh em thấy trong hình đầu bài … không ai trong số họ là thật! Tất cả được tạo ra bởi trí thông minh nhân tạo (AI), cụ thể là GAN (Generative Adversarial Networks hay mạng đối nghịch tạo sinh) nhưng là một phiên bản được Nvidia phát triển để có thể tạo ra khuôn mặt con người siêu thật.
GAN là một concept được giới thiệu lần đầu vào năm 2014 bởi nhà nghiên cứu Ian Goodfellow đến từ Google và công ty cũng đã khai thác GAN trong rất nhiều lĩnh vực, đặc biệt là tạo và chuyển đổi hình ảnh. GAN được hình thành trên ý tưởng về sự cạnh tranh (hay đối nghịch) giữa 2 mạng thần kinh ảo gồm mạng phân biệt - có chức năng phân biệt giữa dữ liệu thật và giả, và mạng tạo sinh - có chức năng tạo ra dữ liệu giả với mục tiêu dữ liệu làm sao giống thật nhất có thể khiến mạng phân biệt phải "bó tay".
Sau những thất bại ban đầu thì giờ đây GAN đã trở thành một phát hiện quan trọng và được dùng để tạo ra hình ảnh về động vật, phong cảnh, khuôn mặt con người … giả nhưng có tính thuyết phục cao, tức giống thật nhất. Tuy nhiên, trước những hạn chế về tính minh bạch trong hoạt động nghiên cứu thành ra những cải tiến đối với GAN đến nay chủ yếu đạt được dựa trên hình thức thử và sai. Và GAN cũng chỉ được giới hạn sử dụng với hình ảnh tổng hợp.
Trong nghiên cứu của Nvidia, hãng đề xuất một kiến trúc tạo sinh thay thế cho GAN dựa trên kỹ thuật chuyển giao kiểu mẫu. Hệ thống này có thể học và phân tách nhiều khía cạnh khác nhau của một hình ảnh từ đó kiểm soát tỉ lệ cụ thể, yếu tố trực quan của hình ảnh tổng hợp được.
Những khái niệm này nghe khá là khó hiểu, nhưng cách hoạt động có thể hiểu đơn giản là bạn nhập vào ảnh khuôn mặt của một người thật, hệ thống sẽ học các thành phần của khuôn mặt và áp dụng những đặc tính trên khuôn mặt này vào một hình ảnh tổng hợp. Những hệ thống GAN trước đây không thể kiểm soát những đặc tính cụ thể mà chúng muốn tái tạo còn hệ thống của Nvidia lại có thể điều khiển đặc tính của từng kiểu mẫu (khuôn mặt) cụ thể, chẳng hạn như các thuộc tính khuôn mặt cấp cao như tư thế, đặc điểm nhận dạng, hình dạng … mà không thay đổi các đặc tính khác. Điều này cũng cho phép hệ thống kiểm soát những thành phần đặc biệt trên khuôn mặt như mắt và kiểu tóc.
Nvidia cũng đã công bố tập dữ liệu khuôn mặt con người với hơn 70.000 hình ảnh chất lượng cao được tạo ra bởi hệ thống trên. Tuy nhiên, hạn chế của phương pháp này là hình ảnh tạo ra có độ phân giải không cao, chỉ 1024 x 1024 px và đôi khi chúng ta có thể nhận ra sự giả tạo trong những khuôn mặt được tạo ra.
GAN có thể được khai thác trong nhiều lĩnh vực từ quảng cáo cho đến game. Tuy nhiên, khả năng tạo ra khuôn mặt giống thật của công nghệ này cũng tiềm ẩn những nguy cơ, chẳng hạn như nó có thể được dùng để tạo ra ảnh giả, đánh lừa người xem để đạt được một mục đích nào đó. Chúng ta hắn đã không lạ gì với những ảnh chế, ghép người nổi tiếng "lộ hàng" hay clip nóng và với GAN, ảnh càng trở nên thực hơn.
Sau những thất bại ban đầu thì giờ đây GAN đã trở thành một phát hiện quan trọng và được dùng để tạo ra hình ảnh về động vật, phong cảnh, khuôn mặt con người … giả nhưng có tính thuyết phục cao, tức giống thật nhất. Tuy nhiên, trước những hạn chế về tính minh bạch trong hoạt động nghiên cứu thành ra những cải tiến đối với GAN đến nay chủ yếu đạt được dựa trên hình thức thử và sai. Và GAN cũng chỉ được giới hạn sử dụng với hình ảnh tổng hợp.
Trong nghiên cứu của Nvidia, hãng đề xuất một kiến trúc tạo sinh thay thế cho GAN dựa trên kỹ thuật chuyển giao kiểu mẫu. Hệ thống này có thể học và phân tách nhiều khía cạnh khác nhau của một hình ảnh từ đó kiểm soát tỉ lệ cụ thể, yếu tố trực quan của hình ảnh tổng hợp được.
Bên cạnh đó, Nvidia còn nói đến một kỹ thuật gọi là phối kiểu (style-mixing) theo đó để bản địa hoá, tức là khiến cho khuôn mặt giống thật nhất, theo sắc tộc và địa phương thì Nvidia đã khai thác hình thức phối hợp chính quy hoá trong đó khuôn mặt được tạo ra sử dụng 2 mã tiềm năng thay vì 1 trong quá trình huấn luyện - tức 2 điểm từ 2 khuôn mặt khác nhau được nhập vào hệ thống. Ngoài ra kỹ thuật biến thể ngẫu nhiên cũng là thuộc tính quan trọng cho phép GAN nhận ra sự ngẫu nhiên của các đặc điểm chi tiết trên khuôn mặt chẳng hạn như vị trí của lông mặt, mật độ râu, tàn nhang, lỗ chân lông, …Nvidia cũng đã công bố tập dữ liệu khuôn mặt con người với hơn 70.000 hình ảnh chất lượng cao được tạo ra bởi hệ thống trên. Tuy nhiên, hạn chế của phương pháp này là hình ảnh tạo ra có độ phân giải không cao, chỉ 1024 x 1024 px và đôi khi chúng ta có thể nhận ra sự giả tạo trong những khuôn mặt được tạo ra.
GAN có thể được khai thác trong nhiều lĩnh vực từ quảng cáo cho đến game. Tuy nhiên, khả năng tạo ra khuôn mặt giống thật của công nghệ này cũng tiềm ẩn những nguy cơ, chẳng hạn như nó có thể được dùng để tạo ra ảnh giả, đánh lừa người xem để đạt được một mục đích nào đó. Chúng ta hắn đã không lạ gì với những ảnh chế, ghép người nổi tiếng "lộ hàng" hay clip nóng và với GAN, ảnh càng trở nên thực hơn.
Theo: Medium