J2Team: Chia sẻ phần mềm text2speech tiếng Việt

Nam Air
8/4/2024 10:14Phản hồi: 7
J2Team: Chia sẻ phần mềm text2speech tiếng Việt
Chia sẻ phần mềm Voice Engine chuyển đổi văn bản thành giọng nói Tiếng Việt miễn phí
Giới thiệu

viXXTS là phần mô hình chuyển đổi văn bản thành giọng nói tiếng Việt. Demo dưới đây giúp bạn sử dụng mô hình này miễn phí trên Google Colab và máy cá nhân.
Github: https://github.com/thinhlpg/vixtts-demo
Huggingface: https://huggingface.co/capleaf/viXTTS
Để sử dụng thì bạn cần vào link Github. Hướng dẫn sử dụng ở video bên dưới.
Tính năng của demo trên Colab:
  • Chuyển đổi văn bản thành giọng nói Tiếng Việt và 17 ngôn ngữ khác
  • Clone giọng với 6 giây giọng nói
  • Giảm ồn giọng mẫu
  • Lưu output thành từng câu vào Google Drive
Hạn chế: (thật ra đây là những tính năng để tránh mô hình bị dùng để lừa đảo)
  • Cho kết quả nói chậm / nhảm nếu câu đầu vào dưới 10 từ (ví dụ “Em ăn cơm chưa.” = 4 từ)
  • Đôi khi ngắt nghỉ không chuẩn
  • Thời gian tạo kết quả là lâu.
  • Kết quả đánh giá MOS cho thấy âm thanh do mô hình tạo ra vẫn kém con người về độ tự nhiên và độ giống: Người thật: độ giống ~3.7, độ tự nhiên ~3.68; viXTTS: độ giống ~3.29, độ tự nhiên ~3.28
Bạn có thể dùng phần mềm này với mục đích:
  • Mục đích cá nhân, học tập, nghiên cứu, thử nghiệm
Bạn KHÔNG được dùng phần mềm này với mục đích:
  • Mục đích trái đạo đức, vi phạm pháp luật Việt Nam
  • Tạo ra nội dung gây thù ghét, kỳ thị, bạo lực hoặc nội dung vi phạm bản quyền
  • Giả mạo danh tính hoặc gây hiểu nhầm rằng nội dung được tạo ra bởi một cá nhân hoặc tổ chức khác
Theo #j2team_share
7 bình luận
Chia sẻ

Xu hướng

Phần mềm vô cùng hữu dụng nhưng cũng nhạy cảm phết, rất dễ bị lợi dụng làm mục đích xấu.
magez
CAO CẤP
3 tháng
@bachhacden Phần mềm text to speech thì có lâu rồi.
Còn cái clone voice thì ko được tự nhiên lắm, nên muốn giả mạo ai đó cũng khó
stevedat
TÍCH CỰC
3 tháng
Hardware Recommendations
At least 10GB of free disk space
At least 16GB of RAM
Nvidia GPU with a minimum of 4GB of VRAM
By default, the model will utilize the GPU. In the absence of a GPU, it will run on the CPU and run much slower.
- Chạy trên Ubuntu, chưa hỗ trợ MacOs và Windows
@stevedat local mới thế, bấm cho chạy trên colab kìa, cài chi cho nặng máy 😁
Mà win có WSL2 nên phang đc
Setup hơi lâu, thôi đi ăn cơm, tý tôi demo thử giọng chủ tịch vậy
Screenshot 2024-04-08 183058.png
magez
CAO CẤP
3 tháng
@Huong-Dung Cho giọng chủ tịch giả làm fan android chê Apple là chuẩn bài 😁
giọng này so với fpt ai thì có ngon bằng không bạn? thấy nhiều người review phim hay làm

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019