Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt

lambui0208
19/2/2013 8:11Phản hồi: 0
Trải nghiệm phần mềm nhận diện giọng nói bằng tiếng Việt
công nghệ nhận diện giọng nói đã không còn chút xa lạ gì với những tín đồ công nghệ trên toàn thế giới. Những hệ điều hành di động đương đại đều có những công cụ hỗ trợ người sử dụng thông qua giọng nói của chính họ, ví như Siri của iOS, Microsoft TellMe hay Google Now trên Android. Thế nhưng điểm chung của những hệ thống trợ giúp bằng giọng nói như vậy đó là chúng đều chỉ hỗ trợ một vài ngôn ngữ lớn, được phần đông dân số thế giới sử dụng như tiếng Anh, tiếng Pháp hay tiếng Trung. Vậy còn với người sử dụng Việt Nam? Đôi khi việc “kỳ cạch” gõ những cụm từ khóa tìm kiếm trên đường hay trong một số trường hợp là không mấy tiện dụng, do đó 1 bộ công cụ nhận diện ngôn ngữ tiếng Việt dành cho smartphone là rất cần thiết.


Và rồi, Nuance Communications, một tập đoàn truyền thông có trụ sở tại Massachusetts, Hoa Kỳ mới đây đã giới thiệu đến cộng đồng sử dụng iOS Việt Nam bộ đôi ứng dụng phục vụ việc tìm kiếm và nhập dữ liệu thông qua giọng nói với cái tên Dragon Search và Dragon Dictation. Hiện cả hai ứng dụng này đều được phân phối miễn phí thông qua hệ thống cửa hàng trực tuyến App Store của Apple.
Giao diện ứng dụng Dragon Dictation.


Điều đặc biệt của bộ đôi ứng dụng này, đó là chúng đều có hệ thống module nhận diện tiếng Việt tương đối hoàn chỉnh, có thể nhận diện hầu hết những câu chữ được nhập vào chiếc điện thoại, ngay cả khi nói bằng giọng nhiều vùng miền khác nhau.


Dragon Dictation


Kỳ thực, Dictation mới chỉ là mức “entrance” trong số những ứng dụng nhận diện giọng nói của Nuance Communications. Công việc chính của Dictation cực kỳ đơn giản: “Diễn xuôi” tất cả những gì người sử dụng nói vào điện thoại dưới dạng đoạn text. Sau đó, ứng dụng cho phép người dùng chia sẻ những gì mình vừa nói thông qua một vài giao thức như SMS, Email, hay thậm chí là chia sẻ lên cả Facebook hay Twitter.
Giao diện chính.
* thiết lập cài đặt.
Lựa chọn ngôn ngữ tiếng Việt cho ứng dụng.
Quá trình thực hiện nhận diện giọng nói.
Kết quả thu được sẽ hiển thị qua text.
Nội dung thu được hết sức chính xác.
Người dùng có thể chia sẻ nội dung này qua tin nhắn, email, Facebook...
Đăng nhập Facebook để chia sẻ đoạn văn bản lên mạng xã hội này hết sức nhanh chóng.


Cá nhân tôi cho rằng với đặc điểm hoạt động hiệu quả với tỉ lệ thành công vào khoảng 85 đến 93% của Dragon Dictation, thì đây rõ ràng là một trải nghiệm cực kỳ hiệu quả cho bất kỳ ai có lối sống bận rộn, vì những gì bạn nói ra hoàn toàn có thể được gửi đi như một bức thư điện tử phục vụ cho nhu cầu công việc, hay thường xuyên chia sẻ những trạng thái mới nhất lên Facebook.
Hay gửi tin nhắn ngay lập tức.


Trong thử nghiệm cụ thể, Dragon Dictation hoạt động rất tốt, với khả năng nhận diện chính xác mọi âm tiết tiếng Việt mà người thử nghiệm nói, trong điều kiện anh nói chậm rãi và rõ ràng từng tiếng. Ngay sau đó là những tính năng chia sẻ đi kèm cũng hoạt động tương đối hiệu quả.
Gửi email với tài khoản đăng nhập sẵn trên thiết bị iOS.


Tuy nhiên, một điều cần ghi nhớ đó là ngay sau khi kết thúc đoạn nói, bạn cần chạm vào nút “Done” ngay phía dưới màn hình để báo cho điện thoại biết rằng bạn đã kết thúc việc nhập dữ liệu, tránh xảy ra tình trạng tạp âm bên ngoài lọt vào gây ảnh hưởng đến kết quả thu được.


Dragon Search

Quảng cáo




Về cơ bản thì Dragon Search của Nuance cũng có cơ chế hoạt động giống y hệt như Dragon Dictation trong mảng nhận diện giọng nói. Tuy nhiên điểm khác biệt lại đến từ những chức năng đi kèm của Dragon Search.
Giao diện Dragon Search.

Giao diện chính.
* cài đặt.
Tiếp tục lựa chọn ngôn ngữ tiếng Việt cho ứng dụng.
Công cụ ghi âm để chuyển đổi thành văn bản.

Sauk hi diễn giải những cụm dữ liệu giọng nói người sử dụng nhập vào điện thoại, Dragon Search sử dụng chính đoạn dữ liệu này để tìm kiếm trên một số công cụ tìm kiếm hay trang web nổi tiếng như Google, Wikipedia hay YouTube. Đây chính là điểm tạo ra lợi thế cho Dragon Search. Thay vì nhập qua màn hình iPhone những cụm từ khóa dễ sai sót (màn hình iPhone tương đối bé, tôi đã có vài lần phát bực vì… gõ mãi không xong một cụm từ khóa), người sử dụng có thể tạo lệnh tìm kiếm ngay bằng giọng nói của chính mình.
Sử dụng công cụ của Google và một số nguồn dữ liệu khác.

Chẳng hạn như Youtube.
Hay Wikipedia.
Khả năng nhận diện giọng nói khá chính xác.
Phần mềm có khả năng phân biệt từ và chữ cái chính xác.


Thời gian tải trang cũng như xử lý thông tin âm thanh của Dragon Search cũng tương đối ấn tượng. Phụ thuộc tương đối nhiều vào tốc độ mạng 3G hoặc WiFi, tuy nhiên tốc độ xử lý của Dragon Search nhanh trong phần lớn trường hợp thử nghiệm của chúng tôi.

Quảng cáo


Lợi thế lớn


Ưu điểm của hai công cụ được giới thiệu ở trên chính là khả năng nhận diện được phát âm tiếng Việt nhiều vùng miền. Không phải ai cũng sở hữu giọng nói giống nhau, đó chính là thứ Nuance đã làm tương đối tốt với sản phẩm nhận diện giọng nói của mình. Trong khi đó việc tích hợp một số công cụ chia sẻ hay tìm kiếm cơ bản lại là ưu điểm thứ 2 của Dragon Search và Dictation.


Tuy nhiên một số lưu ý dành cho người sử dụng, đó là họ nên nói to và rõ ràng, ngắt nghỉ đúng để engine nhận diện làm việc với hiệu quả cao nhất.


Dưới đây là đoạn video trải nghiệm thực tế 2 ứng dụng nhận diện giọng nói Dragon Dictation và Dragon Search:

Ảnh và video: DT
Chia sẻ

Xu hướng

Xu hướng

Bài mới










  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019