Tham dự Tech Lounge

Tham dự Tech Lounge


Tìm hiểu tính năng Text-to-Speech (TTS) trong Android và một vài ứng dụng thực tế

vuhai6
4/7/2013 3:1Phản hồi: 58
Tìm hiểu tính năng Text-to-Speech (TTS) trong Android và một vài ứng dụng thực tế
Tinhte_tts_1.jpg

Tính năng chuyển văn bản thành giọng nói (Text-to-speech hay TTS) được Google trang bị sẵn cho hệ điều hành Android từ phiên bản 1.6 Donut. Tính năng rất hữu ích trong nhiều trường hợp, đặc biệt đối với các phần mềm từ điển, giúp cho bạn có thể nghe phát âm của từ một cách đơn giản, ngoài ra một số phần mềm khác có thể đọc giúp bạn nội dung đang hiển thị trên màn hình, đọc tin nhắn hay số điện thoại đang gọi, hướng dẫn chỉ đường bằng giọng nói... Chỉ có một vài phần mềm trên Android tự xây dựng cơ sở dữ liệu phát âm và giải thuật riêng của mình, còn phần lớn đều dựa vào dịch vụ có sẵn của Google để chuyển văn bản thành giọng nói.
Để có thể làm tốt công việc chuyển văn bản thành giọng nói thì cần rất nhiều những thao tác xử lý chạy bên dưới mỗi khi nhận được một nội dung ở đầu vào, với Google thì họ ưu tiên xử lý tất cả trên server rồi mới trả kết quả về điện thoại của bạn. Cách làm này nhằm giảm bớt dung lượng lưu trữ vì chắc chắn một điều là cơ sở dữ liệu là khá lớn, ưu tiên dung lượng và chúng ta phải hi sinh một chút về kết nối internet, dịch vụ này luôn yêu cầu có internet (3G hoặc wifi) mới có thể chạy được. Ngoài ra bạn có thể cài đặt dịch vụ TTS khác để sử dụng mà không cần dự vào Google, cách làm mình sẽ nói ở bên dưới đây.

Bạn có thể tìm thấy phần tuỳ chỉnh của tính năng này trong Settings -> Accessibility -> Text-to-speech output. Mặc định sẽ luôn có lựa chọn Google Text-to-speech Engine ở đây, tuỳ từng hãng điện thoại mà có hay không có thêm các lựa chọn khác, ví dụ như Samsung có phát triển hệ thống riêng của mình và ở đây thì luôn có thêm lựa chọn khác của Samsung.

Tinhte_tts_2.jpg


Mặc định thì voice data (giọng eng) đã được cài sẵn, vì thế lựa chọn Install voice data chỉ hữu ích khi bạn muốn cài thêm giọng khác như Đức, Tây Ban Nha, Pháp hay Ý. Như đã nói ở trên, tất cả dữ liệu đều được Goolge xử lý trên server nên voice data của họ có dung lượng khá nhỏ, chỉ khoảng vài MB.

Có một điểm hơi khó chịu là giọng của Google Voice không thực sự tốt, nhiều khi khó nghe và nó có hơi hướm của máy nhiều quá. Thật tốt là Text-to-speech out có chấp nhận engine của hãng thứ 3, vì thế bạn có thể cài thêm các dữ liệu khác vào để sử dụng. Trên Android hiện tại có 2 hãng làm khá tốt đó là SVOX với Classic Text To Speech EngineIVONA với IVONA Text-to-Speech HQ. Mình lựa chọn IVONA vì hiện tại phần mềm này đang miễn phí và chất lượng rất tốt, khả năng phát âm tự nhiên và dễ nghe.
Tinhte_tts_3.jpg

Sau khi đã cài đặt được bộ phát âm mới thì bạn có thể ứng dụng nó được rồi. Text To Speech Engine không phải là phần mềm cụ thể mà nó sẽ được các ứng dụng khác sử dụng lại, để phát âm mỗi khi cần thiết, như trong từ điển, mỗi khi cần phát âm 1 từ vựng thì phần mềm từ điển đó sẽ nhờ vào TTS. Sau khi cài đặt IVONA thì phần mềm này cũng có kèm theo 1 phần mềm nho nhỏ cho bạn test âm thanh và cũng có thể dùng ngay phần mềm đó để đánh vào từ khoá cần nghe.
Dưới đây có 2 phần mềm khá hay giúp bạn có thể học tiếng anh đơn giản. Đầu tiên là phần mềm Say2Me được bạn thanhtaivtt giới thiệu trong topic Ứng dụng nhỏ giúp luyện nói tiếng Anh. Ứng dụng tập trung vào luyện nói cho người dùng bằng đưa ra đề bài, lắng nghe người dùng đọc và đưa ra kết quả người dùng đọc có chính xác hay chưa nhờ vào hệ thống nhận dạng giọng nói của Google – Android. Ứng dụng bao gồm hơn 1400 câu giao tiếp hằng ngày. Trong đó, có hơn 300 câu phát âm của người bản xứ, còn lại phát âm dựa vào hệ thông Text to Speech (TTS) của Android được chia thành nhiều cấp độ khác nhau từ dễ đến khó.

Tinhte_tts_4.jpg

Ứng dụng thứ 2 mà mình muốn nói đến là Text to Speech(TTS) Controller (link tải về). Một ứng dụng rất nhỏ, có tính năng phát âm từ được đánh vào, ngoài ra có thể save phần âm thanh đó thành file. Rất thích hợp để bạn lập bộ từ tiếng anh và nghe đi nghe lại hàng ngày.

Tinhte_tts_5.jpg
58 bình luận
Chia sẻ

Xu hướng

lyhongson
TÍCH CỰC
11 năm
Vậy mà từ trước tới giờ xài android mà ko biết cái này, thanks chủ thớt
@lyhongson nhưng mà giọng không chuẩn, không biết nhấn giọng thành ra đọc máy chạy tùm lum.
text to speech
text to speed
text too speech
text too speed
test to speech
text to speed
nine , nice
my mind mike
v.v...
Adroind sắp trở thành bộ não cho Robot tương lai rồi
@dangkinhngac xin bố não này toàn virus ít cũng phải windows 15 😁 20
thanhvinh94
ĐẠI BÀNG
11 năm
@dangkinhngac Cái này cũng bình thường thôi bạn ạ, nó không là cái j` mới mẻ cả, chỉ mới so với những người chưa biết thôi, chứ nó đã xuất hiện trên các OS khác (và kể cả Android) bao nhiêu lâu rồi. Đọc cmt của bạn cứ tưởng GG mới phát minh ra bộ não Robot biết cảm nhận cảm xúc, hihihi
zimihieu
TÍCH CỰC
11 năm
trước h chưa bao h xài cái này.thank thým vuhai6

Sent from my HTC Desire C using Tinhte.vn
Tính năng này không đọc được tiếng Việt nên chả mấy khi dùng
tranhuyvc
TÍCH CỰC
11 năm
@mrdat_k1 vấn đề này ngược lại bạn nhé, từ chữ wa giọng nói hehe
mrdat_k1
TÍCH CỰC
11 năm
@tranhuyvc À ko để ý :p
Mình toàn dùng gg translate rồi bật phát âm trong đó luôn 😁

Sent from my GT-I9100G using Tinhte.vn
@mrdat_k1 Nhập được tiếng Việt nhưng đọc ngược lại thì chưa có bạn ạ. Hy vọng là sẽ có sớm
thanhvinh94
ĐẠI BÀNG
11 năm
@khanhnd0709h Có đấy bạn ạ. Nếu nói 1 cách chính xác thì fải là “Android không hỗ trợ tiếng việt” thì đúng hơn. Trên MS Windows người ta đã có thể phát triển ra các bộ đọc tiếng việt từ lâu rồi. Hiện tại trên iOS/Android mình chưa thấy cái nào hỗ trợ output tiếng việt cả, nhưng input thì có rồi (tính năng nhận diện giọng nói dictate). Là 1 người khiếm thị, dùng các thiết bị công nghệ như smart phone/laptop/pc thì TTS là cứu cánh của giới “mò” (mù) 😁. Mình thấy bộ TTS (thường gọi là bộ đọc) trên iOS có âm thanh rất chuẩn, đọc rất “người”. Giọng anh mĩ trên iOS dùng 1 bộ đọc thuộc bộ Vocalizer có tên là Samantha. Cái này thì các bạn có thể nghe qua thằng Siri, người đấy chứ? :D Vụ này thì mình biết lâu rồi nhưng các bạn do không có nhu cầu nên không biết, cũng là thường thôi mà…
Có lâu rùi mà giờ đọc mới biết , đúng là còn rất nhiều thứ mk chưa biết .
tinh tế nhiều khi đưa ra những thứ những gì ko biết thiệt
Sao ở hình minh họa anh Hải ghi là "test" ?😁
Vật vã mãi với LacViet trên Android 4.1.2 mà không phát âm được. Thua luôn, kể cả đã cài đặt tts. Ai biết chỉ mình cái.
em_ut
TÍCH CỰC
11 năm
@thanh_nhan Không biết bạn xài máy của hãng nào, còn mình xài SS. Trước đây mình cũng cài Lạc Việt và cũng không phát âm được. Khi mở chương trình nó hỏi mình dùng TTS hay bộ phát âm của SS thì mình chọn TTS thế là không nghe được. Sau chọn bộ phát của SS thì nghe được. Lúc đó cũng chưa biết tại sao nhưng qua bài viết này mình đã hiểu rõ vấn đề là do TTS cần phải kết nối internet để GG xử lý dữ liệu rồi trả về nên lúc cho phát âm cũng phải kết nối internet. Còn nếu không muốn mà máy không có sẵn bộ phát âm khác thì bạn có thể dùng mấy cái mà bài viết gợi ý kìa.
vinh.pmf
ĐẠI BÀNG
11 năm
@em_ut TTS (english)của google đã tích hợp sẵn trên nhiều máy rồi.mình dùng phần mềm mSPdict của anh tienlbhoc trên diễn đàn mình khi tra từ không cần bật wifi,3G vẫn chạy bình thường.trong 1 lần nghich ngợm tối ưu rom stock của con máy của mình(lenovo p770) mình dùng titanium backup xoá đi TTS và kết quả là không phát âm được trên mspdict nữa.các bạn thử cài phần mềm xem nếu có biểu tượng loa nhấn vào thử xem,phát âm được là có TTS rồi,
http://www.tinhte.vn/threads/mspdict-tu-dien-khong-the-thieu-cho-nguoi-dung-android.691731/
tranhuyvc
TÍCH CỰC
11 năm
😃 google hỗ trợ nhan dạng âm thanh thành chữ Việt rồi, thật cool. bài anh vuhai giới thiêu là từ chữ viết ra âm thanh. mình thấy có vài ứng dụng từ điển hỗ trợ vấn đề này rồi 😃 nếu kết hop cả hai
tiếng thành chữ
chữ thành tiếng....
anh em mình chắc xài được nhiều trường hợp lắm nhi 😃
"Có thể nói khởi nguồn của nó là năm 1779 khi mà nhà khoa học người Đan Mạch Christian Kratzenstein " , cho mình hỏi thông tin này có chính xác không ? Với thời điểm này mà đến bây giờ chúng ta mới tiến được đến đây ? Quả là quá dài.
"Có thể nói khởi nguồn của nó là năm 1779 khi mà nhà khoa học người Đan Mạch Christian Kratzenstein"Bác xem lại dùm em nhé lúc đó người ta còn chưa xài điện xoay chiều!
nice
Chính xác đấy bạn. Xem thêm tại:
http://en.wikipedia.org/wiki/Christian_Gottlieb_Kratzenstein
(Trong bài viết là 1769, không phải 1779)
Tuy nhiên đó không phải là xử lý bằng máy tính, mà sử dụng cộng hưởng và khí cụ để tổng hợp âm thanh của các nguyên âm.
Có thể coi đó là nền tảng/nguyên lý của kỹ thuật này (chứ không phải của công nghệ này).
ussh999
TÍCH CỰC
11 năm
Quan trọng là độ chính xác tới đâu. Nhiều PM nhưng chưa thực sự hiệu quả. Tiếng Việt lại càng khó.
để cái link wiki đó, các bác vào tham khảo.
thực ra không biết do loa điện thoại hay do giọng đọc mà nhiều từ nghe không chuẩn và dễ bị nhầm
em_ut
TÍCH CỰC
11 năm
@gomchao Với lại tiếng Anh có những từ viết giống nhau nhưng phát âm lại khác nhau, ví dụ như từ đọc "read' trong tiếng Anh 3 thì đều viết giống nhau nhưng hiện tại lại đọc khác với quá khứ và pp thì máy không phân biệt được. Ngày xưa khi mới dùng máy tính trên windows 98 mình có dùng 1 chương trình đọc kiểu này của MS, đọc cả tiếng Anh lẫn tiếng Tây Ban Nha và cũng đã phát hiện những trường hợp tương tự.
Google voice seach mà phăng các bạn ơi.nhận diện tiếng việt rất chuẩn .tải google dich về nữa gặp thằng tây nào bật chế độ hội thoại nói chuyện vô tư.😁
dung google translate chụp cái file cần đọc, sau khi nó scan nhận được mấy cái chữ thì copy cho vào "IVONA" cho nó đọc.dùng để dạy mấy bé mới tập phát âm tiếng anh rất tốt, mấy ai phát âm được chuẩn kể cả những từ đơn giản

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019