Một bài nghiên cứu vừa được công bố từ MIT vào tháng trước có tên gọi Speech2Face đã có thể dự đoán và tái tạo hình ảnh khuôn mặt bằng cách phân tích âm thanh từ giọng nói của người nào đó. Mặc dù không thể hiện chính xác khuôn mặt chi tiết như thế nào, nhưng thuật toán này có thể tạo ra một ảnh khuôn mặt khá trung tính, mang các đặc điểm về giới tính, chủng tộc và tuổi tác một cách chuẩn xác - theo như những bước ảnh được đăng trong bài nghiên cứu này.
Có thể thấy giờ đây công nghệ đã len lỏi trong mọi ngóc ngách của cuộc sống. Nó biết ta đã và đang di chuyển đi đâu, biết ta bàn tán những gì, biết ta thích gì, và có thể trong tương lai không xe sẽ còn biết luôn mặt mũi của chúng ta ra sao.
Các nhà nghiên cứu đã "huấn luyện" cho một mạng lưới "deep neural network" dựa vào hơn hàng triệu các video giáo dục trên YouTube và hơn 100.000 người nói khác nhau, theo con số công bố trong bài báo nghiên cứu. Mặc dù người ta cũng đã lưu ý rằng thuật toán chưa thể tạo ra một hình ảnh khuôn mặt chính xác dựa trên đoạn thu âm này, nhưng những hình ảnh ví dụ lại cho thấy thuật toán này xuất ra kết quả khá tốt, giống với những người làm mẫu. Khoan nói về việc nó có đủ giống để chúng ta nhận biết ai là ai thông qua tấm nhìn không, nhưng thuật toán này mang một ý nghĩa rằng thực tế, một thuật toán cũng có thể dự đoán một người nhìn như thế nào thông qua giọng nói đơn giản.
Nhiều vấn đề mang tính bảo mật riêng tư và đạo đức cũng đã được đặt ra sau khi nghiên cứu này được công bố. Các nhà khoa học nhấn mạnh rằng bộ dữ liệu mà họ đang sử dụng hiện tại chỉ dựa trên một số lượng mẫu nhỏ lấy từ Youtube, nó không mang tính đại diện cho toàn bộ dân số thế giới, và vì thế kết quả có thể sẽ có nhiều sai lệch, một điều hay xảy ra ban đầu khi tạo một hệ thống trí tuệ nhân tạo.
Nếu công nghệ này phát triển lên tầm cao mới, có thể nó sẽ nhận diện được ngày một chính xác hơn và đến lúc này, dù chúng ta có muốn hay không, những vấn đề liên quan tới bảo mật sẽ xảy ra. Công nghệ này có thể dùng cho muôn vàn mục đích tốt, nhưng nếu bị khai thác cũng sẽ đem lại rất nhiều rắc rối xung quanh nó. Anh em có thể coi video minh hoạ tại đây
Có thể thấy giờ đây công nghệ đã len lỏi trong mọi ngóc ngách của cuộc sống. Nó biết ta đã và đang di chuyển đi đâu, biết ta bàn tán những gì, biết ta thích gì, và có thể trong tương lai không xe sẽ còn biết luôn mặt mũi của chúng ta ra sao.
Các nhà nghiên cứu đã "huấn luyện" cho một mạng lưới "deep neural network" dựa vào hơn hàng triệu các video giáo dục trên YouTube và hơn 100.000 người nói khác nhau, theo con số công bố trong bài báo nghiên cứu. Mặc dù người ta cũng đã lưu ý rằng thuật toán chưa thể tạo ra một hình ảnh khuôn mặt chính xác dựa trên đoạn thu âm này, nhưng những hình ảnh ví dụ lại cho thấy thuật toán này xuất ra kết quả khá tốt, giống với những người làm mẫu. Khoan nói về việc nó có đủ giống để chúng ta nhận biết ai là ai thông qua tấm nhìn không, nhưng thuật toán này mang một ý nghĩa rằng thực tế, một thuật toán cũng có thể dự đoán một người nhìn như thế nào thông qua giọng nói đơn giản.
Nhiều vấn đề mang tính bảo mật riêng tư và đạo đức cũng đã được đặt ra sau khi nghiên cứu này được công bố. Các nhà khoa học nhấn mạnh rằng bộ dữ liệu mà họ đang sử dụng hiện tại chỉ dựa trên một số lượng mẫu nhỏ lấy từ Youtube, nó không mang tính đại diện cho toàn bộ dân số thế giới, và vì thế kết quả có thể sẽ có nhiều sai lệch, một điều hay xảy ra ban đầu khi tạo một hệ thống trí tuệ nhân tạo.
Nếu công nghệ này phát triển lên tầm cao mới, có thể nó sẽ nhận diện được ngày một chính xác hơn và đến lúc này, dù chúng ta có muốn hay không, những vấn đề liên quan tới bảo mật sẽ xảy ra. Công nghệ này có thể dùng cho muôn vàn mục đích tốt, nhưng nếu bị khai thác cũng sẽ đem lại rất nhiều rắc rối xung quanh nó. Anh em có thể coi video minh hoạ tại đây
Tham khảo Gizmodo