Ngôn ngữ Việt trong CNTT

cuhiep
17/4/2007 0:8Phản hồi: 4
Ngôn ngữ Việt trong CNTT
http://www.pcworld.com.vn/pcworld/info/article/2007-4/B0704_TD_16.jpg

Xử lý tiếng Việt trên máy tính là vấn đề trăn trở của các chuyên gia CNTT Việt Nam từ nhiều năm nay. Nhưng việc đưa ngôn ngữ Việt vào CNTT dường như vẫn chưa thu hút được các nhà ngôn ngữ học (NNH). 3 chuyên gia CNTT nhiều năm gắn bó và tâm huyết với vấn đề này sẽ chia sẻ với bạn đọc những suy nghĩ và mong mỏi của họ...


Người dùng thiệt thòi
Ông Nguyễn Việt Hải,
giám đốc công ty Công Nghệ eDT


Trong tiếng Anh, thuật ngữ CNTT thay đổi rất nhanh. Có những từ nguyên gốc tiếng Anh có rất nhiều nghĩa ở những hoàn cảnh khác nhau. Vì vậy, khi tham gia cùng Microssoft Việt hóa hệ điều hành (HĐH) Windows (eDT là một trong những đối tác của Microsoft tham gia Việt hóa hệ điều hành Windows từ phiên bản 95 - PV), chúng tôi rất khó khăn để tìm được từ phù hợp và ngắn gọn. Đối với các thuật ngữ, không phải tất cả mọi người đều thống nhất một cách hiểu. Đây là đặc trưng và cũng chính là khó khăn khi giải quyết các vấn đề về ngôn ngữ. Chẳng hạn, “experience” thường được dịch là kinh nghiệm. Nhưng từ này còn có nghĩa là “trải nghiệm”.

CNTT Việt Nam có một thiệt thòi là 17, 18 năm trở lại đây, chúng ta không còn tập trung chuyên sâu vào nghiên cứu các vấn đề cơ bản. Các ĐH, viện nghiên cứu chỉ tập trung vào ứng dụng trong khi các nghiên cứu về học thuật rất ít. Điều đó khiến thuật ngữ ngày càng nghèo nàn đi. Trong khi với sự phát triển nhanh chóng của ngành này, những từ được đưa vào dùng không phải tất cả đều hợp lý. Chẳng hạn, nhiều người vẫn dịch “server” là máy chủ, nhưng về bản chất “server” là máy dịch vụ, đáp ứng các yêu cầu của máy khách (client) chứ không có khả năng sai khiến máy khách như “host” (máy chủ)- xem từ điển Lạc Việt.

Với những vấn đề về ngôn ngữ như vậy, khi Việt hóa các HĐH Windows, theo tôi Microsoft đã có cách làm hợp lý là tranh thủ ý kiến cộng đồng và lấy ý kiến thống nhất của số đông. Tuy nhiên, ngoại trừ phiên bản Windows 95 được Việt hóa đầy đủ với đúng nghĩa một HĐH tiếng Việt, các phiên bản còn lại chỉ được Việt hóa giao diện. Từ thực tiễn công việc Việt hóa, tôi thấy có nhiều thiệt thòi cho người sử dụng HĐH Windows, nhất là những người không biết ngoại ngữ. Tiềm năng của Microsoft rất lớn nhưng việc họ đầu tư vào các phiên bản tiếng Việt đến mức nào phụ thuộc nhiều yếu tố.

Về bàn phím tiếng Việt, sẽ không còn là vấn đề lớn nếu chúng ta chấp nhận cách gõ giống với VNI (mỗi phím số tương ứng với một thanh hoặc nguyên âm). Khi đó, nhà sản xuất chỉ cần in thêm điều này lên trên bàn phím, rất đơn giản! Tôi đánh giá cách gõ này có nhiều ưu điểm, đặc biệt, rất nhiều công cụ lập trình hỗ trợ kiểu gõ này.



4 bình luận
Chia sẻ

Xu hướng

Những kinh nghiệm thực tế
TS.Quách Tuấn Ngọc,
giám đốc Trung Tâm Tin Học, bộ Giáo Dục Đào Tạo

Ở đây, tôi chỉ đề cập đến NNH thông qua những công việc thực tế đã tham gia.

- Xây dựng từ điển vần: Nếu làm thủ công thì các nhà NNH sẽ mất rất nhiều thời gian. Khoảng 1993, tôi đã trực tiếp giúp đỡ GS Hoàng Phê làm từ điển vần bằng cách lập trình máy tính ra tất cả các vần, sau đó nhặt bỏ đi các vần không phát âm được vì số này chiếm rất ít. Quá trình này chỉ một thời gian ngắn là hoàn thành.

http://www.pcworld.com.vn/pcworld/info/misc/2007/4/B0704_TD_18.jpg
TS. Quách Tuấn Ngọc, người đã xây dựng hệ soạn thảo BKED nhằm hỗ trợ xử lý tiếng Việt trên máy tính trong những năm 1990


- Từ điển tần số tiếng Việt: Trước đây các tác giả phải nghiên cứu cả đời người rất vất vả. Nay nhờ tin học, chuyện này xem như là... chuyện vặt. Tôi đã từng hướng dẫn sinh viên cao đẳng làm việc này trên Word. Có lẽ cần hoàn thiện hơn phần mềm này để giới ngôn ngữ dùng được dễ dàng hàng ngày.

- Mỹ thuật: Cụ thể là các dấu sắc, huyền, hỏi phải đặt vào bên trái hay phải của dấu “^” trên chữ “Ô”. Hoạ sĩ Lê Thanh Đức - một chuyên gia về mẫu chữ - từng cho biết không thể làm việc này một cách tùy tiện.

- Phần âm: Học ngoại ngữ, chúng ta phân 2 loại âm hữu thanh và âm vô thanh. Vậy nhưng cả mấy chục năm sau tôi cũng không hiểu được các cách giải thích và phân loại này. Rồi cả khái niệm nguyên âm và phụ âm nữa. Tôi tạm đưa ra khái niệm dựa trên cơ cấu phát âm và xử lý: Khi phát âm, luồng không khí từ phổi đi qua dây thanh (ở cuống họng) là đôi dây thanh dao động với chu kì To. Khi phát âm, nếu đôi dây thanh dao động thì đó là âm hữu thanh, còn không dao động thì là âm vô thanh. Đồ thị có thể ghi ra bằng máy tính sẽ cho thấy âm hữu thanh có dáng tuần hoàn, âm vô thanh thì không tuần hoàn. Còn nguyên âm là âm khi phát ra có thể kéo dài vô tận nếu... ta lắp thêm cái máy bơm khí vào phổi - đây là cách ví von cho dễ hiểu. Còn phụ âm là âm chỉ có thể phát ra từng nhát một, không kéo dài được.


"Ngành NNH cần có sự quan tâm đặc biệt của CNTT để phục vụ các công việc như nhận dạng tiếng nói, tổng hợp tiếng nói, sửa lỗi chính tả ngữ nghĩa, từ điển đa phương tiện, thiết kế mẫu chữ viết cho dân tộc ít người, cách phát âm, cơ sở dữ liệu từ vựng, âm tiết, phân tích ngắt câu ngắt từ... Ngày nay, một loại ngôn ngữ, văn hoá lại đang hình thành: ngôn ngữ và văn hóa chat (tán gẫu trên mạng Internet). Với tiếng Anh, đám trẻ đã viết ur (you are...), cu (see you). CNTT do đó không chỉ là công cụ mà cũng chính là đối tượng để NNH phải nghiên cứu."
Quách Tuấn Ngọc


- Phần toán: Người học toán đều biết chuỗi Fourier nổi tiếng và sau đó là ứng dụng để phân tích chuỗi xung chữ nhật, tam giác ... Rất ít người biết các âm hữu thanh chính là chuỗi Fourier.

- Bộ chữ viết tiếng Việt truyền thống trong giáo dục là một chủ đề đã được bàn luận khá nhiều. Đơn giản ngay như chuyện dấu chấm câu: liền với chữ cái cuối cùng hay cách ra? Tưởng là đơn giản mà vẫn còn có nơi qui định viết cách ra. Với tôi thì việc này không phải thích mà qui định được vì đó đã là chuẩn quốc tế: phải gõ sát vào chữ cái cuối cùng.

Thực hiện: Tân Khoa - Thu nga

Theo: TGVT
Rất cám ơn TGVT đã có một bài hay thế này. Qua bài này mình mới hiểu được là không chỉ có mình mình và bạn gái mình hihihi là người quan tâm đến cái Tiếng Việt trong thời đại mới.

Chân tình mà nói thì ngôn ngữ của chúng ta quá quá lạc hậu cho thời đại mới rồi. Không từ mới, không từ mới, không từ mới...Nếu không có từ mới thì các nhà NNH phải đi mượn, sáng tác...rồi phổ biến cho dân chúng sài chứ?

Lắm lúc muốn dùng Tiếng Việt lắm nhưng không thể tìm ra từ để nói?

Như tiếng anh phổ biến thế kia mà cũng đi mượn từ rất nhiều? có sao đâu, họ mượn rồi nó thành của họ. Nhưng họ mượn và công nhận cái từ mượn đó, và mọi người cùng dùng. Tiếng Nhật cũng thế họ mượn bao nhiêu là từ tiếng Hoa và họ cũng công nhận đấy... Rồi người Hoa, họ dịch Bluetooth là Răng Xanh, lúc đầu nghe thì có vẻ khó chịu, nhưng nghe mãi cũng thành quen và họ có từ của họ.

Chúng ta cần từ mới: Mượn, Sáng Tác, Thêm Bớt, Viết Tắt...đều được. Hãy cho tôi từ mới..
Tubby
ĐẠI BÀNG
18 năm
Nhưng trước mắt ít nhất bác phải viết và sử dụng đúng chính tả tiếng Việt đi đã. Rồi hẳn bàn những cái xa hơn. Bác là chúa sai chính tả đấy nhé.😁
Mình nhất trí với ý kiến của "cuhiep", theo mình biết thì như Pháp một năm họ cập nhật vào bộ từ điển hàng nghìn từ mới mà năm trước chưa hề có trong từ điển, và không hề ngại là nguồn gốc "từ mượn", từ mang tính chuyên môn hay từ văn hóa và cả những từ địa phương nữa. Và sau 5 năm thì họ lọc lại từ để có thể dùng lâu dài hay là bỏ đi vì đã có từ thay thế. Nói chung là họ chuyên nghiệp hơn và vấn đề này ở nước họ đã gặp phải rồi và được giải quyết triệt để, còn ở mình thì chưa được làm một cách tổng thề và có lẽ là được cho đây không phải "vấn đề thật sự"! Mà cuộc sống là thế luôn có khó khăn thì con người mới sáng tạo ra những cái mới dễ dàng hơn để làm chủ cuộc sống phải không "bác cuhiep"

Xu hướng

Bài mới








  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2025 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019