Google Translate lợi hại như thế nào?

TDNC
23/9/2011 10:30Phản hồi: 181
Google Translate lợi hại như thế nào?

Google Translate rất quen thuộc với chúng ta như là một công cụ dịch thuật cực kỳ hữu ích. Mặc dù trong một số trường hợp, nó dịch không chính xác và câu cú có vẻ không hợp lý, dịch không nhuần nhuyễn nhưng dù sao thì nó cũng chỉ là một cỗ máy, một dịch vụ trực tuyến có thể chạy trên những chiếc máy vi tính "cà tàng" nhất. Vậy có khi nào bạn tự hỏi Google Translate (GT) hoạt động ra sao chưa? Nó dịch từng từ một rồi ghép thành một câu hay là có một đội ngũ [TAG]Google[/TAG] ngồi làm việc 24/24 để làm công việc dịch thuật?

Bài viết dưới đây được trích từ trong cuốn sách "Is That A Fish In Your Ear: Translation and the Meaning of Everything" của tác giả David Bellos. Nếu hứng thú bạn có thể tìm mua cuốn sách này để đọc trọn vẹn.

Google đã xây dựng nên GT từ một phần mềm ban đầu được phát triển bởi [TAG]IBM[/TAG] trong những năm 1980 và nó khá khác biệt so với những công cụ dịch thuật lúc bấy giờ. Nó làm việc không dựa trên sự giả định trí óc như những cỗ máy khác, nó cũng không phải là một thuật toán chỉ biết dịch nghĩa từng từ, từng chữ theo cú pháp mà nói chung lại, nếu nhìn sâu vào bên trong cấu trúc của GT thì bạn sẽ thấy, nó không làm những công việc đại loại như dịch nghĩa từng từ đâu. Vậy thì GT làm thế nào mà dịch được "siêu" như vậy?

Câu trả lời là: GT đi lượm lặt những câu nói, những từ ngữ đã được dùng trước đây trên mạng Internet, sau đó tìm tiếp coi có ai dịch nó trước chưa và trả lại kết quả cho người dùng với tốc độ nháy mắt. Ví dụ khi bạn muốn dịch câu "Good morning" sang tiếng Việt, GT sẽ lục lại cơ sở dữ liệu (CSDL) của mình để coi trước đây có ai từng dịch câu "Good morning" này chưa, nếu có thì nó sẽ lấy câu đó ra và trả lời cho bạn, đó chính là "Chào buổi sáng".

Vậy CSDL dịch thuật của GT bao gồm những gì? Đó chính là toàn bộ những văn bản được châu Âu xuất bản từ năm 1957 đến nay trong 24 thứ tiếng, toàn bộ những văn bản, thư từ của Liên Hiệp Quốc cũng như của các cơ quan thuộc Liên Hiệp Quốc đã từng xuất bản bằng 6 ngôn ngữ chính thức, bên cạnh đó là hàng đống tài liệu, ghi chép của những tòa án quốc tế, báo cáo của các công ty và toàn bộ các bài viết, sách vở song ngữ được tải lên mạng bởi các cá nhân, thư viện, người bán sách, tác giả và cả những cơ quan lẫn viện hàn lâm. GT sẽ dựa vào đó để lựa ra những câu, những từ được viết theo dạng song ngữ, rồi dùng các phương pháp thống kê để chọn ra câu dịch hợp lý nhất.

Với phương pháp này, rõ ràng là GT hoạt động được và nó hoạt động khá tốt, đến nỗi có thể làm sửng sốt nhiều người. Vì vậy mà nó cũng tạo ra một ý nghĩ cho rằng thực sự có một cỗ máy dịch thuật hoàn toàn tự động với chất lượng cực kỳ cao. Tuy nhiên, cũng cần biết rằng nếu GT không có bộ CSDL đồ sộ trên thì nó sẽ không thể nào hoạt động được. Và bộ CSDL này là thành quả của hàng triệu giờ lao động của nhiều người khác nhau, những người đã từng dịch trước đó và tải lên mạng để GT gom lại và "tham khảo".

Cho đến nay, GT hỗ trợ dịch qua lại 58 ngôn ngữ khác nhau và điều này tương đương với 3.306 kiểu dịch thuật. Nhưng trong số này có một số ngôn ngữ vừa mới được thêm vào gần đây, ví dụ như dịch từ ngôn ngữ Icelandic sang Farsi (Iran), tiếng Yiddish sang tiếng Việt... và rất nhiều bộ ngôn ngữ khác mà trước đây chưa hề có tài liệu nào dịch những ngôn ngữ đó cả. Do vậy mà chất lượng dịch thuật lúc này sẽ rất kém hoặc không còn chính xác nữa, cũng bởi vì CSDL của ngôn ngữ đó không được phong phú như những ngôn ngữ thông dụng khác.

Một điều nữa cũng cần được nói đến, đó là nếu đôi khi GT không tìm được tài liệu nào để dịch trực tiếp từ ngôn ngữ A sang ngôn ngữ B thì GT có thể dùng một thêm ngôn ngữ C như là ngôn ngữ trung gian để dịch từ A sang B, điều kiện là trong CSDL của GT, phải có tài liệu được dịch giữa A-C và B-C, lúc đó GT mới dịch từ A-B được. Và tiếng Anh từ ngôn ngữ trung gian chính mà GT đang sử dụng. GT chọn tiếng Anh làm ngôn ngữ trung gian không phải vì họ là công ty của Mỹ, mà vì khi cần dịch từ 2 ngôn ngữ "lạ", người ta cần phải dùng đến một ngôn ngữ khác mà trước đây đã từng được dịch sang 2 thứ tiếng này.

Ví dụ, có khá nhiều cuốn sách trinh thám được viết bằng tiếng Anh, sau đó nó được biên dịch thành tiếng Icelandic và Farsi. Chính hành động này đã tạo ra nguồn CSDL dồi dào cho việc dịch qua lại giữa 2 ngôn ngữ này. Nếu không thể dịch trực tiếp giữa Icelandic và Farsi thì GT có thể dựa vào bản dịch giữa tiếng Anh - Icelandic và tiếng Anh - Farsi để dịch một cách gián tiếp từ Icelandic sang Farsi (và ngược lại). Tất nhiên không phải lúc nào GT cũng dịch đúng, đó là lý do tại sao GT cho phép người dùng sữa chữa các bản dịch của mình. Và người dùng cũng cần phải hiểu đôi chút về ngôn ngữ đích để có thể nhận ra khi nào thì GT sai hay dịch không đúng.

Theo Independent
181 bình luận
Chia sẻ

Xu hướng

Google dịch tiếng Việt chưa bao giờ chuẩn cả.
Nó dịch trang web từ tiếng Nhật sang tiếng việt đâu có ngon đâu. Mình gõ 1 câu vào sai tòe loe, nó ko fân biệt được từ và tên Người 😁
Mr.Alone
ĐẠI BÀNG
13 năm
Nhưng cũng đủ để "tạm hiểu" 😁
😃 có thể do từ ngữ bạn đưa ra quá mang tính chất kinh viện. Còn về cơ bản, nhiều sách Tài chính mình dịch bằng Google Translate, vẫn có những đoạn đúng nghĩa và văn phong 100%.
nó có tiến bộ từng ngày đấy bác ạ .tốt hơn thủa ban đầu mới ra nhiều . hi vọng càng ngày càng tốt
nvthanglong
ĐẠI BÀNG
13 năm
Chắc database dịch thuật của VN không nhiều, nen GT dịch thấy buồn cười ghê gớm. Hay tại "phong ba bão táp không bằng ngữ pháp Việt Nam" nên GT chào thua !?
bác này nói đúng. nhưng có còn hơn không. quan trọng là từ vựng. còn cú pháp thì tự bói ra thôi. cảm ơn GT, rất hữu ích.
tinh123456
ĐẠI BÀNG
13 năm
a storm with no grammar Vietnam <-GT;)
nge nói google thêu người về ngồi dịch cho chúng ta 24/24:hot:
Tiền thừa hay sao mà thuê người ngồi dịch như vậy?

Một giờ cho chuyên gia dịch thuật cũng khoảng 30$ x 24h x 3650 ngày = 260.800$/năm

Mà không biết bao nhiêu người ngồi đó cho đủ keke.
người xưa có câu " phong ba bão táp không bằng ngữ pháp việt nam " thì hoi các bạn GT làm được như vậy thì thật sự là cool lém roài đoá........!mình nghĩ trong tương lai nó sẽ hoàn thiện hơn bây h........!
mình thấy google dịch cũng nhanh mà
Oxi
CAO CẤP
13 năm
Chà CSDL của GT đồ sộ thật!
jacubi
TÍCH CỰC
13 năm
hiiii.dịch nhanh như điện mà chưa chính xác lắm
Goole dịch sang tv chưa chuẩn lắm nhưng nếu có nhiều dữ liệu tiếng việt thì cũng sẽ tốt thôi mà..! Ju
phantnang
TÍCH CỰC
13 năm
Google Translate benefits How bad?:eek::eek::eek:
Snake696
TÍCH CỰC
13 năm
gt dịch có lúc rất chuẩn, có lúc sai tùm lum. Có hôm nó dịch cho em ra 1 câu rất ngớ ngẩn : tôi có món quà chú chó cho tôi chúc mừng mẹ sinh nhật của tôi mẹ (cái này em thề là đúng sự thật)😃
Sergey Brin và Larry Page ngồi dịch đó ;)
Hi vọng thời gian tới GT dịch TV ổn hơn nữa
gg dịch tiếng việt ko bao giờ chuẩn cả. Nói chung thì cái máy cuối cùng vẫn chỉ là 1 cái máy.
Chắc cũng cần phải tương lai xa nữa thì cái máy mới gần = con người dc
Mà theo mình, thì có lẽ, sẽ có 1 lúc nào đó, 1 công ty của vietnam sẽ có phần mềm dùng tiếng anh --> việt chuẩn hơn gg. Bởi đơn giản họ hiểu tiếng việt hơn. Baidu của Trung Quốc là 1 ví dụ
bác GT dịch ENG->VI cực kì tệ
Google Translate cho tiếng Việt chưa tốt lắm nhưng cảm giác cũng có cải thiện sau một thời gian thử lại.
lexuanvu
ĐẠI BÀNG
13 năm
nhờ có cái này tôi có thể xem được các trang web nước ngoài dễ dàng hơn do ko rành tiếng anh cho lắm cảm ơn google
Haiz, có mấy bác vào phán dịch chưa chuẩn này nọ, nó là phần mềm dịch tự động chứ có phải phiên dịch viên đâu mà đòi dịch cho chuẩn chứ, chẳng hạn như chữ you nghĩa là gì thì khó nha....
quankt6789
ĐẠI BÀNG
13 năm
mặc dù GT dịch chưa chuẩn lắm nhưng với người kém tiếng anh như mình muốn đọc trang web nước ngoài thì đấy là công cụ đắc lực cho mình rồi. Mong GT sẽ càng hoàn thiện hơn nữa
bodies
ĐẠI BÀNG
13 năm
cũng hữu ích khi dịch các đoạn văn dài, dùng nó tham khảo , chỉnh sữa lại cũng hữu ích mà

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019