Thuật toán AI cho tai nghe: Lọc và phát được một nguồn âm duy nhất, mọi tiếng ồn khác đều biến mất

P.W
20/5/2024 7:11Phản hồi: 10
Thuật toán AI cho tai nghe: Lọc và phát được một nguồn âm duy nhất, mọi tiếng ồn khác đều biến mất
Đây là công trình nghiên cứu của Shyam Gollakota cùng các đồng sự tại đại học Washington, Seattle, Mỹ. Trước khi nói đến mô hình thuật toán AI này, phải nói tới cách tai nghe chống ồn chủ động phiên bản thương mại hiện giờ vận hành. Xung quanh những cặp tai nghe full size hay in ear, là một dàn những microphone thu lại âm thanh môi trường bên ngoài. Rồi thuật toán trong phần mềm vận hành tính năng ANC sẽ phân tích và đảo ngược sóng âm thu được từ dàn microphone vận hành ANC, rồi phát sóng âm này lên loa của tai nghe. Cách này luôn có một vấn đề là nếu âm thanh môi trường thay đổi về cường độ, tiếng ồn không đều, thì rất khó tạo ra trải nghiệm chống ồn hoàn hảo.

Còn mô hình AI của Gollakota phát triển thì có khả năng phân tích và tách mọi chi tiết âm thanh bên ngoài, rồi chỉ tập trung vào một hoặc một vài nguồn âm cụ thể, AI sẽ lọc bỏ tất cả những nguồn âm khác.

Công nghệ này được trình diễn trong đoạn clip dưới đây. Trong bài thử nghiệm đầu tiên, AI sẽ cần nhận diện nguồn âm để xác định phần nào trong mọi thứ âm thanh xung quanh người đeo tai nghe cần được tập trung vào. Theo Gollakota, mất 8 mili giây để mô hình AI nhận diện được nguồn âm muốn tập trung và tách ra khỏi tiếng ồn môi trường. Nhờ đó, chỉ có giọng nói của người đứng cạnh phát qua tai nghe tới người đeo, còn tiếng ồn của đài phun nước thì không.

Bài thử nghiệm thứ hai, là hai người ngồi nói cạnh người đeo tai nghe, một nguồn tiếng Anh một nguồn tiếng Hoa. Cũng nhờ mô hình AI, người thử nghiệm có thể tách hai nguồn giọng nói để tập trung vào một nguồn âm duy nhất, lọc hoàn toàn nguồn gióng nói thứ hai:



Được trình diễn tại hội thảo của hai đơn vị đồng tổ chức, Hiệp hội Âm học Hoa Kỳ và Hiệp hội Âm học Canada hồi tuần trước, các nhà khoa học ở đại học Washington trình diễn khả năng của mô hình AI này với một cặp tai nghe đang bán trên thị trường, đã che tên nhưng nhìn thiết kế rất giống Bose QuietComfort Ultra. Âm thanh được neural network xử lý trên một chiếc máy tính cỡ nhỏ Orange Pi, rồi âm thanh xuất ra cổng 3.5mm vào tai nghe.

Gollakota cho biết, mô hình AI này được huấn luyện dựa trên 20 nguồn âm thanh khác nhau, từ tiếng chim hót, tiếng em bé, tiếng đồng hồ báo thức để nhận diện nguồn âm trong vận hành thực tế. Lý thuyết vận hành AI giống hệt như cách năm 2021, các chuyên gia âm thanh và các nhà nghiên cứu dùng thuật toán AI bóc tách mọi lớp âm thanh của bản thu Let It Be, tạo ra một bản thu không hề có chút tạp âm, phục vụ quá trình sản xuất bộ phim tài liệu The Beatles: Get Back của đạo diễn Peter Jackson.

Người dùng sau đó có thể chọn bật hoặc tắt nguồn âm nào trong ứng dụng đi kèm trên điện thoại. Theo các nhà nghiên cứu, phần cứng xử lý thuật toán AI lọc âm thanh hoàn toàn có thể thu nhỏ và đặt gọn gàng vào bên trong earcup của những cặp tai nghe không dây đang bán trên thị trường hiện tại.

Điều quan trọng nhất là, mô hình AI này chẳng cần máy chủ đám mây nào cả, khoảng thời gian 8 mili giây nhận diện âm thanh xung quanh từ microphone thu tiếng dán trên cặp tai nghe là để chip xử lý công suất thấp của Orange Pi vận hành thuật toán theo thời gian thực. Điều đó đồng nghĩa với việc mọi thiết bị di động đều có thể vận hành hiệu quả thuật toán được mô tả là đơn giản này khi nó được thương mại hóa.

Theo New Scientist
10 bình luận
Chia sẻ

Xu hướng

Một trong những ứng dụng rất đáng giá của AI.
Công nghệ phát triển quá nhanh.
nhânh vậy rồi mai mố nó thu vô hết và chỉ nghe những thứ muốn nghe
L.T.D
ĐẠI BÀNG
một tháng
@ometa020983 cũng kiểu như chụp ảnh rồi làm mờ phông tuỳ ý
thế vài bữa app học nhạc sẽ học nhanh hơn roài , lọc âm đúng thiết bị rùi chuyển note để chuyển thành sheet nhạc 1 phút 30 s
Ngon. Mai mốt đi xem concert quay lén về cho cả xóm nghe 😁
Lấy cái này làm beat karaoke chắc ngon.
Huấn luyện cho nó focus vào 1 bộ phim 2 người Nhựt Bổn thì chỉ có bá cháy 🤣
Công nghệ phát triển nhanh thật 👍
Cái nhân loại cần là lọc âm tốt hơn chứ không phải là lọc và chừa lại âm cần nghe tốt hơn như tai nghe này. Tai nghe ANC hiện nay chỉ làm tốt việc lọc các âm thanh ổn định như tiếng xe chạy, tiếng máy bay, chứ đứa bàn bên mà léo nhéo hay con nít hàng ghế trước mà khóc, hay trên xe đò mà bật nhạc mình không ưa thì tai nghe ANC nào cũng chịu thua. Mấy ông AI ngon mà chặn được cái âm thanh đó, chứ cái này là mấy ông lọc bình thường rồi chừa lại tiếng cần nghe như người đối diện, tiếng con khóc, tôi không cần.

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019