Ở tuổi 61, nam diễn viên từng nổi tiếng với những vai trong các tác phẩm bom tấn Hollywood những năm 80 và 90 như Top Gun, Heat, Kiss Kiss Bang Bang vừa trải qua cuộc chiến quan trọng nhất đời ông, đó là chiến thắng căn bệnh ung thư thanh quản. Đáng tiếc là, tiến trình điều trị khủng khiếp đã lấy đi giọng nói lanh lảnh trẻ trung của ông. Nhưng Kilmer lại đang hợp tác với một đơn vị nghiên cứu trí thông minh nhân tạo để tìm lại chất giọng ông từng sở hữu. Công ty ấy là Sonantic, và clip dưới đây là thành quả của AI để tái hiện lại giọng nói của Val Kilmer:
Đồng sáng lập kiêm CEO của Sonantic, Zeena Qureshi cho biết, “chúng tôi coi mình là những chuyên gia kỹ xảo làm việc chuyên trách trong mảng âm thanh. Chúng tôi tạo ra những chất giọng nhân tạo truyền cảm và chân thực nhất, để phục vụ cho ngành công nghiệp giải trí. Vì thế một mặt, chúng tôi hợp tác với các diễn viên để giúp họ ”dạy" một phiên bản AI giả giọng chính họ, thứ có thể được tùy chỉnh và hoạt động theo yêu cầu của họ."
Qureshi, với kiến thức nền trong ngành ngôn ngữ và liệu pháp ngôn ngữ, cho biết công ty của cô vào năm ngoái đã được đại diện của Val Kilmer liên hệ để xem liệu họ có thể giúp nam diễn viên này tạo ra một phiên bản AI giọng nói của ông hay không. “Thời điểm đó là ngay sau khi bộ phim tài liệu Val hoàn tất sản xuất và đang trong giai đoạn hậu kỳ. Và nhóm của Val hy vọng có thể ”trả lại" giọng nói cho nam diễn viên, để dùng trong những vần thơ ông sáng tác, hay những nội dung quảng bá tác phẩm mới, hay chỉ đơn giản là tạo ra cho ông một thứ để tiếp tục sáng tạo. Và đó là những gì chúng tôi đã làm."
Sonantic thường làm việc để tạo ra AI giọng nói của một người dựa vào những dữ liệu thu âm có sẵn. Nhưng trong trường hợp của Kilmer, Sonantic có ít nội dung gốc để dạy AI hơn hẳn vì tác phẩm của Kilmer đều có tác quyền, và vì tình hình bệnh cũng như hệ quả sau khi điều trị, Kilmer thực sự không còn giọng nói để ghi âm cho Sonantic. “Nhóm đại diện của Kilmer đã gửi những dữ liệu âm thanh trước đây. Và thứ mà công nghệ của chúng tôi làm tốt nhất là hiểu tông giọng đó để cố gắng bắt chước giọng nói ấy đến từng chi tiết." John Flynn, giám đốc công nghệ của Sonantic cho biết, AI của họ phức tạp và phát triển hơn nhiều so với những công nghệ tạo ra dữ liệu giọng nói đang được Apple hay Amazon sử dụng cho Siri và Alexa. Công cụ này có thể được tùy chỉnh và cá nhân hóa với từng người, để làm việc, tạo ra và chỉnh sửa những câu thoại theo ý muốn của họ.
Flynn cho rằng, công nghệ của họ có thể coi như “một phiên bản Photoshop hoặc phần mềm chỉnh âm thanh cho những người làm sáng tạo. Nó có cả hệ thống chỉnh câu nói, chỉ việc gõ từ ngữ muốn biến thành câu nói là AI sẽ làm việc. Phần mềm xử lý rất nhanh và có thể kiểm soát và thay đổi cả tông giọng.”
“Với thuật toán của Sonantic, chúng tôi sở hữu rất nhiều kỹ thuật riêng với hệ thống voice engine, một cỗ máy đặc biệt kết hợp thuật toán deep learning để tạo ra giọng nói. Chúng tôi dùng những câu chữ nhập lệnh và để thuật toán học cách phát âm, sau đó dạy thuật toán cách kiểm soát ngữ điệu và trọng âm cũng như cách một người khi nói có biểu cảm ra sao. Nhờ đó, công cụ này tạo ra được những âm thanh chất lượng tốt nhất.”
Thậm chí công nghệ này còn có tốc độ nhanh tới mức hoàn toàn có thể giúp những người mất đi giọng nói tương tác với người khác trong cuộc sống hàng ngày, chứ không chỉ phục vụ cho những dự án sáng tạo như trong trường hợp của Val Kilmer.
Theo People
Đồng sáng lập kiêm CEO của Sonantic, Zeena Qureshi cho biết, “chúng tôi coi mình là những chuyên gia kỹ xảo làm việc chuyên trách trong mảng âm thanh. Chúng tôi tạo ra những chất giọng nhân tạo truyền cảm và chân thực nhất, để phục vụ cho ngành công nghiệp giải trí. Vì thế một mặt, chúng tôi hợp tác với các diễn viên để giúp họ ”dạy" một phiên bản AI giả giọng chính họ, thứ có thể được tùy chỉnh và hoạt động theo yêu cầu của họ."
Qureshi, với kiến thức nền trong ngành ngôn ngữ và liệu pháp ngôn ngữ, cho biết công ty của cô vào năm ngoái đã được đại diện của Val Kilmer liên hệ để xem liệu họ có thể giúp nam diễn viên này tạo ra một phiên bản AI giọng nói của ông hay không. “Thời điểm đó là ngay sau khi bộ phim tài liệu Val hoàn tất sản xuất và đang trong giai đoạn hậu kỳ. Và nhóm của Val hy vọng có thể ”trả lại" giọng nói cho nam diễn viên, để dùng trong những vần thơ ông sáng tác, hay những nội dung quảng bá tác phẩm mới, hay chỉ đơn giản là tạo ra cho ông một thứ để tiếp tục sáng tạo. Và đó là những gì chúng tôi đã làm."
Sonantic thường làm việc để tạo ra AI giọng nói của một người dựa vào những dữ liệu thu âm có sẵn. Nhưng trong trường hợp của Kilmer, Sonantic có ít nội dung gốc để dạy AI hơn hẳn vì tác phẩm của Kilmer đều có tác quyền, và vì tình hình bệnh cũng như hệ quả sau khi điều trị, Kilmer thực sự không còn giọng nói để ghi âm cho Sonantic. “Nhóm đại diện của Kilmer đã gửi những dữ liệu âm thanh trước đây. Và thứ mà công nghệ của chúng tôi làm tốt nhất là hiểu tông giọng đó để cố gắng bắt chước giọng nói ấy đến từng chi tiết." John Flynn, giám đốc công nghệ của Sonantic cho biết, AI của họ phức tạp và phát triển hơn nhiều so với những công nghệ tạo ra dữ liệu giọng nói đang được Apple hay Amazon sử dụng cho Siri và Alexa. Công cụ này có thể được tùy chỉnh và cá nhân hóa với từng người, để làm việc, tạo ra và chỉnh sửa những câu thoại theo ý muốn của họ.
Flynn cho rằng, công nghệ của họ có thể coi như “một phiên bản Photoshop hoặc phần mềm chỉnh âm thanh cho những người làm sáng tạo. Nó có cả hệ thống chỉnh câu nói, chỉ việc gõ từ ngữ muốn biến thành câu nói là AI sẽ làm việc. Phần mềm xử lý rất nhanh và có thể kiểm soát và thay đổi cả tông giọng.”
“Với thuật toán của Sonantic, chúng tôi sở hữu rất nhiều kỹ thuật riêng với hệ thống voice engine, một cỗ máy đặc biệt kết hợp thuật toán deep learning để tạo ra giọng nói. Chúng tôi dùng những câu chữ nhập lệnh và để thuật toán học cách phát âm, sau đó dạy thuật toán cách kiểm soát ngữ điệu và trọng âm cũng như cách một người khi nói có biểu cảm ra sao. Nhờ đó, công cụ này tạo ra được những âm thanh chất lượng tốt nhất.”
Thậm chí công nghệ này còn có tốc độ nhanh tới mức hoàn toàn có thể giúp những người mất đi giọng nói tương tác với người khác trong cuộc sống hàng ngày, chứ không chỉ phục vụ cho những dự án sáng tạo như trong trường hợp của Val Kilmer.
Theo People