Google phát triển hệ thống nhận dạng giọng nói hoạt động không cần mạng, thử nghiệm trên Nexus 5
bk9sw
bk9sw
11/3/16 Bình luận: 17 Lượt xem: 10,344

Google phát triển hệ thống nhận dạng giọng nói hoạt động không cần mạng, thử nghiệm trên Nexus 5

Thảo luận trong '[Android] Tin tức - Đánh giá' bắt đầu bởi bk9sw, 11/3/16. Trả lời: 17, Xem: 10344.

  1. bk9sw

    bk9sw Moderator

    Tham gia:
    30/3/08
    Được thích:
    73,151
    Best Answers:
    2
    bk9sw
    VIP
    #1 bk9sw, 11/3/16
    Sửa lần cuối: 13/3/16
    Google đã vừa phát triển một hệ thống nhận dạng giọng nói dung lượng đủ nhỏ để chiếc điện thoại Nexus 5 có thể phản hồi "nhanh hơn thời gian thực" mà không cần kết nối Internet.

    Hệ thống này không cần đến trung tâm phân tích dữ liệu từ xa, không phụ thuộc vào kết nối mạng và có thể dùng trên nhiều thiết bị như smartphone, smartwatch hay mọi loại thiết bị có bộ nhớ eo hẹp khác. Theo tài liệu được nhóm nghiên cứu tại Google công bố, mục tiêu của họ là nhằm tạo ra một hệ thống nhận dạng giọng nói không quá nặng nhưng hoạt động chính xác để có thể chạy trực tiếp trên thiết bị.

    Nói về yếu tố nhỏ nhẹ thì hệ thống nhận dạng giọng nói này có dung lượng chỉ 20,3 MB và khi được thử nghiệm trên chiếc Nexus 5 với CPU 2,26 GHz, 2 GB RAM thì tỉ lệ sai từ của hệ thống vào khoảng 13,5% với thử thách đọc chính tả.

    Google sở hữu hàng tá nghiên cứu tương tự và không khó để hình dung hệ thống nhận dạng giọng nói trên hoạt động dựa trên các công nghệ máy học (machine-learning). Trong trường hợp này, Google gọi là "mạng thần kinh định kỳ (RNNs) bộ nhớ dài ngắn hạn (LSTM) và được dạy bởi mạng thần kinh nhân tạo phân loại theo thời gian (CTC) và mô hình rủi ro tối thiểu Bayes (sMBR)." Những kỹ thuật rất cao siêu mà chỉ dân trong nghề mới hiểu được :)

    Để thu nhỏ hệ thống, các nhà nghiên cứu đã phát triển một mô hình chung dành cho mỗi cặp định danh gồm chỉ thị giọng nói và lệnh. Với việc sử dụng nhiều kỹ thuật khác nhau, họ đã nén mô hình nhận biết âm thanh này xuống còn 1/10 so với dung lượng ban đầu.

    Các nhà nghiên cứu cũng nêu rõ rằng hệ thống nhận dạng giọng nói hoạt động ngoại tuyến (offline) hiện đã có thể thực hiện một lệnh kiểu như yêu cầu gởi một email đến một ai đó và có thể tái sắp xếp thời gian cho hành động này. Hệ thống chỉ đơn giản là phiên dịch lại lệnh ngay lập tức và thực thi sau đó. Tuy nhiên, để phiên dịch chính xác thì hệ thống cần các thông tin cá nhân tương ứng, chẳng hạn như tên người nhận email. Giải pháp của nhóm nghiên cứu là tích hợp danh bạ trên thiết bị vào hệ thống.

    Để dạy cho mô hình nhận biết âm thanh này, các nhà nghiên cứu đã trích xuất 3 triệu lời nói, tổng dung lượng khoảng 2000 giờ từ hệ thống tìm kiếm bằng âm thanh của Google (Google Voice). Và để khiến hệ thống đáng tin cậy hơn, Google cũng dùng các đoạn âm nhiễu từ các video đăng tải trên YouTube.

    Theo: ZDNet
     

    File đính kèm:

    Chit Lee, Anhtuan73, catlinh_ng903 người khác thích nội dung này.
    #1 bk9sw, 11/3/16
    Sửa lần cuối: 13/3/16
  2. goon102

    Tham gia:
    23/2/10
    Được thích:
    11
    Best Answers:
    0
    goon102
    ĐẠI BÀNG
    chỉ có thể la google
     
  3. Timkelvin

    Tham gia:
    16/3/14
    Được thích:
    6,046
    Best Answers:
    0
  4. Apple Haters 2.01

    Tham gia:
    13/5/14
    Được thích:
    8,894
    Best Answers:
    0
    Apple Haters 2.01
    VIP
    Bạn đã bị ghi âm, những gì bạn nói trước google voice có thể làm bằng chứng chống lại bạn trước tòa :D
     
    Aaron Trần thích nội dung này.
    1. hotletokhonganh1990

      Tham gia:
      7/12/15
      Được thích:
      475
      Best Answers:
      0
      hotletokhonganh1990
      ĐẠI BÀNG
      hotletokhonganh1990 @Apple Haters 2.01 Ghi âm chẳng sợ....chỉ sợ quay Camera thôi. Lúc đó lộ hết hàng...
       
  5. lekry

    Tham gia:
    3/6/12
    Được thích:
    104
    Best Answers:
    0
    lekry
    ĐẠI BÀNG
    Vui khi con nexus 5 ghẻ của mình vẫn còn dc ưu tiên cập nhật :))
     
  6. tuan tuan vu

    Tham gia:
    8/5/14
    Được thích:
    37
    Best Answers:
    0
    tuan tuan vu
    ĐẠI BÀNG
    google,nhắn tin cho mẹ của bạn của bố của bà của anh ông hàng xóm của t
     
  7. bomduc

    Tham gia:
    6/11/12
    Được thích:
    6,297
    Best Answers:
    0
    bomduc
    VIP
    20M 1 dung luợng qua nhỏ
     
    1. hoangvuvking

      Tham gia:
      12/2/15
      Được thích:
      64
      Best Answers:
      0
      hoangvuvking
      ĐẠI BÀNG
      hoangvuvking @bomduc càng nhỏ càng tốt ông êi
       
      bomduc thích nội dung này.
  8. ngoctrai1102

    ngoctrai1102 Thành viên

    Tham gia:
    11/4/15
    Được thích:
    11
    Best Answers:
    0
    ngoctrai1102
    Nhiều ng đã mong chờ ứng dụng này từ lâu. Hehe
     
  9. hotletokhonganh1990

    Tham gia:
    7/12/15
    Được thích:
    475
    Best Answers:
    0
    hotletokhonganh1990
    ĐẠI BÀNG
    Tương lai khỏi cần lấy vợ hay chồng làm chi cho mệt . Smartphone sau này sẽ thay thế hoàn toàn. Nó sẽ là người bạn đời chung tình nhất! Coôn muốn có con ư...quá đơn giản. Đã có ngân hàng tinh trùng và trứng rồi. Muốn Tây có Tây,Ta có Ta....Trung quốc có Trung quốc...

    Đời là bể khổ mà,âu cũng từ phụ nữ mà ra....
     
  10. yokel

    Tham gia:
    19/1/09
    Được thích:
    331
    Best Answers:
    0
    yokel
    TÍCH CỰC
    Smartwatch rất thích điều này. Vì sw nhắn tin phải voice to text mới siêu nhanh vì màn hình quá bé hạn chế được tối đa sử dụng bàn phím mọi lúc mọi nơi.
     
  11. hotatchanh

    hotatchanh Thành viên

    Tham gia:
    22/11/14
    Được thích:
    22
    Best Answers:
    0
    hotatchanh
    Công nghệ càng hngày càng mạnh
     
  12. dihuta

    dihuta Bán rau

    Tham gia:
    27/4/06
    Được thích:
    41,926
    Best Answers:
    1
    dihuta
    VIP
    Hay thật. Vài chục MB dữ liệu đã đủ để nhận dạng.
     
  13. daigianinhbinh

    Tham gia:
    25/4/11
    Được thích:
    836
    Best Answers:
    0
    daigianinhbinh
    TÍCH CỰC
    Tương lai Al sẽ nhỏ như cái móng tay. Hoạt động độc lập ghi nhớ học tập dần như người. Mỗi cái Đt là 1 Al
     
  14. x_chien

    Tham gia:
    10/4/07
    Được thích:
    204
    Best Answers:
    0
    x_chien
    TÍCH CỰC
    e mong chờ cái này từ lâu rồi, mấy cái nhận diện giọng nói qua mạng thật là vô dụng, ra lệnh cho cái điện thoại của mình tìm danh bạ trong máy mà phải bật wifi hay 3g lên phát nản.
     
  15. Triệu Dũng Phú

    Tham gia:
    10/8/12
    Được thích:
    483
    Best Answers:
    0
    Triệu Dũng Phú
    TÍCH CỰC
    Hay, dữ liệu dung lượng như vậy quá ổn ^^
     
  16. casperpas

    Tham gia:
    27/2/09
    Được thích:
    106
    Best Answers:
    0
    casperpas
    ĐẠI BÀNG
    Xin phép đính chính bác chủ thớt là Machine learning dịch là "Học máy" chứ k phải "Máy học". Nghe có vẻ hơi ngược nhưng "Máy học" thì TA nó phải là "Learning machine", là cái máy dùng để học (nó là 1 cái máy). Còn Machine learning là công nghệ làm cho máy có khả năng (tự) học (học theo kiểu của máy) :D
     
Đang tải...