GuruDic + dữ liệu stardict phong phú = từ điển đa ngôn ngữ tốt nhất trên iOS

dangquybk
14/1/2010 1:19Phản hồi: 1.261
1.261 bình luận
Chia sẻ

Xu hướng

dangquybk
TÍCH CỰC
14 năm
Mình không rõ về phần convert âm thanh này.
Tuy nhiên đúng là nhiều file sound quá sẽ load lâu. Bản thân mình đang dùng phần sound của bộ Longman (Anh và Mỹ), khá ổn.
quyet12b
ĐẠI BÀNG
14 năm
Có nghĩa là từ các file âm thanh trên mình sẽ chuyển chúng sang các dạng dict,idx, info, và coi như chúng sẽ là bộ từ điển. Cái này bên box blackberry có hướng dẫn làm nhưng vì máy tính em cùi quá nên làm không nỗi. Nếu bạn có hứng thú bạn có thể search trên tinhte hoặc google là :" teedict và dữ liệu âm thanh " để vào coi chi tiết và biết cách tạo ra bộ stardict từ các file âm thanh trên.
dangquybk
TÍCH CỰC
14 năm
Okie. Để mình tìm hiểu thêm và có lẽ sẽ tham khảo tác giả của iStardict/GuruDic - anh này rất nhiệt tình 😃
dangkhoivt
ĐẠI BÀNG
14 năm
Tìm thấy vi-wiki trên rapidshare mà file lâu ngày quá đã bị delete, ai có /stardict-wikipedia-viwiki-2.4.2.tar.bz2 làm ơn re-up với.
Còn cái sound sao mình chép cái webster vô thì phát âm rât tốt, còn longman thì thì cũng chép y như vây mà không phát âm được nhỉ? Từ điển này quả là hay hơn wedict pro rất là nhiều vậy mà ko được sticky trong khi wedict thì lại được. Mình cho wedict lên dĩa luôn rồi, vì tính năng ko bằng istardict. Cái touch to search của istardict hay hơn wedict nhiều, wedict touch vô từ đó nhiều khi nó search luôn dấu cộng còn istardict thì search rất tốt
dangquybk
TÍCH CỰC
14 năm
[MENTION=84437]hoduylinhconan[/MENTION]:
Các từ điển tiếng Nhật đã có link mediafire ở trên. Bạn tải về mà dùng.
Post #42 và #70.
dangquybk
TÍCH CỰC
14 năm
[MENTION=11889]dangkhoivt[/MENTION]:
Đúng vậy, từ điển này tốt và nhanh hơn Wedict nhiều.
Dữ liệu phát âm Longman mình đang dùng tốt, cả Anh và Mỹ. Bạn thử xem lại dữ liệu và settings pronunciation xem. Chú ý, không để file từ điển hay sound ở thư mục con (Dictionary=>Thư mục từ điển or sound, bên trong k để thư mục con nữa).
dangquybk
TÍCH CỰC
14 năm
Scan thẻ nhớ lâu là bệnh của BlackBerry, không có vấn đề gì với iPhone - làm gì có thẻ nhớ 😁
Copy dữ liệu bạn cũng chỉ cần làm một lần, dùng iFunbox mất 5-10 phút thôi.

Cách làm của bạn kienthanh ở thread http://www.tinhte.vn/threads/222872-Tu-dien-Teedict-va-bo-du-lieu-am-thanh-giong-doc-tieng-Anh
không áp dụng được với iStardict/Gurudic vì tra ra file wav nhưng không ra âm đọc ở đâu.
Cách export dùng Teedict này hình như cũng không làm được với dữ liệu mp3 (?).





Kiểu export như trên, có tác dụng khi copy dữ liệu vào iPhone sẽ đỡ tốn thời gian. Tuy nhiên dùng iFunbox thì không thành vấn đề lắm, 5-10 phút là copy xong với dữ liệu như Longman.

Về cơ chế load dữ liệu phát âm, đã trao đổi với tác giả GuruDic và được trả lời như sau:

"File phát âm không được load vào bộ nhớ khi khởi động mà load khi tra từ.
GuruDic chỉ biết đến các folder chứa dữ liệu phát âm với chữ cái đầu (chẳng hạn: a, b...); khi nhập từ, chẳng hạn 'area', GuruDic sẽ tìm file 'area.mp3' hoặc 'area.wav' trong thư mục <Chẳng hạn là Longman>/a
Nếu file này tồn tại, GuruDic sẽ cấp link để play file âm thanh đó ở góc trên.
Cơ chế này rất nhanh, tuy nhiên có điểm yếu là chỉ hỗ trợ tiếng Anh, còn các thứ tiếng như Nhật, Hàn, Việt thì không được."


Xét về mặt tiện lợi, mình thấy âm đọc được hiện luôn trong kết quả tra cứu nghĩa, bấm vào cái đọc ra ngay là hay hơn so với âm đọc ở riêng một 'từ điển pronunciation' khác.





Về xây dựng dữ liệu phát âm dạng "Pronunciation dictionary" with .ifo, .idx, .dict, .syn (optional); tác giả cũng nghiên cứu, nhưng khó vì vấn đề database và complier.

Tham khảo: http://code.google.com/p/babiloo/wiki/StarDict_format
Google Code Archive - Long-term storage for Google Code Project Hosting.
code.google.com


Tóm lại, việc sử dụng dữ liệu phát âm trực tiếp từ file mp3, wav... như hiện tại đang có ưu điểm hơn về tốc độ tra cứu. Mỗi lần restore thì bạn mất thời gian một chút copy dữ liệu thôi.
dangkhoivt
ĐẠI BÀNG
14 năm
Mình chịu ko làm longman voice phát âm được trong khi đó webster phát âm rất tốt. Mà webster có vẻ nhiều từ hơn longman, tới 141k, thôi xài webster luôn
dangquybk
TÍCH CỰC
14 năm
Longman chạy tốt mà, bạn thử copy và settings lại xem 😃

Càng ngày càng nhiều từ điển, thích quá 😃

Mình cũng đang build được một lô lốc các từ điển Việt Anh Nhật từ gốc Babylon BGL. Sẽ share cùng anh em....

UP UP UP........
dangkhoivt
ĐẠI BÀNG
14 năm
Bạn chủ thread làm ơn cập nhật tất cả các link từ điển lên trang 1 để cho các bạn khác dễ tìm. Còn mod nào có xài qua dict này rồi thì sticky nó lên thay mdict vì nó hay hơn mdict nhiều
dangquybk
TÍCH CỰC
14 năm
Đã up thêm nhiều từ điển mới; nhất là các dữ liệu convert từ Babylon qua - từ điển Lạc Việt Anh, Pháp, Trung....
Tuyển tập link đã update ở trang 1.

UP UP UP....!
Mod stick giùm cho anh em dễ theo dõi với ạ!
dangquybk
TÍCH CỰC
14 năm
UP tiếp 😃

Đã cập nhật cách convert data Babylon (BGL) sang Stardict format ở trang đầu, mời anh em tham khảo 😃
dangkhoivt
ĐẠI BÀNG
14 năm
hic cái mtbab sao mà dung lượng khủng khiếp vậy
dangquybk
TÍCH CỰC
14 năm
Trong code của nó có nhiều mã html, css nên to. Mình chưa tìm được cách cắt gọt đi 😃
Dung lượng file tương đương file .bdc (bung ra từ bgl) mà Babylon trên PC dùng.
dangkhoivt
ĐẠI BÀNG
14 năm
hehe ko sao, coi như 2 cái dict hơn 300mb, với bộ voice webster hơn 500mb nưa cũng chỉ có gần 1gb 😁

---------- Post added at 06:53 PM ---------- Previous post was at 06:51 PM ----------

Từ lúc có ítardict thì mình xóa hết mấy cái từ điển khác giờ chỉ xài mỗi istardict thấy là số 1 rồi
dangquybk
TÍCH CỰC
14 năm
Vừa biết cách dùng dictzip để chuyển file .dict thành .dict.dz dữ liệu nhỏ đi cực nhiều.

Bản mtBab EV còn có 20MB; VE 11MB :D
Đang cập nhật link ở post đầu, mời anh em tải lại về xài cho nhẹ nhàng.
Sẽ dictzip dần các từ điển cho nhỏ gọn.
dangkhoivt
ĐẠI BÀNG
14 năm
[MENTION=48456]dangquybk[/MENTION] Bạn có thể re-up cho mình mấy file voice.ini, world.idx của 2 bộ phát âm longman ko. Mình đã làm đủ cách nhưng vẫn ko phát âm được trong khi cái webster voice để vô 1 cái là được liền
dangquybk
TÍCH CỰC
14 năm
Ở post #82 phía trên mình đã trình bày về nguyên lý mà iStardict/Gurudic dùng để truy cập dữ liệu âm thanh, bạn thử xem lại.
Bộ Longman pronunciation không cần "voice.ini, world.idx" nào cả 😃
Nếu bạn đã load file phát âm từ post đầu thì OK. Giải nén ra, bỏ bớt các cấp thư mục không cần thiết rồi copy vào thư mục Dictionary trên iPhone.

- Cấu trúc thư mục: <Caches>/Dictionary/Longman_American(chẳng han)/0-9, a, b, c...
Tức là các thư mục có đầu chữ cái và 0~9 nằm ngay trong thư mục dữ liệu phát âm 'Longman_American'; thư mục này lại nằm ngay dưới 'Dictionary'
Nếu cấu trúc thư mục khác đi thì bạn sẽ không add được.




Settings:
Chọn Settings - Pronunciation Settings - Ấn nút + để thêm data, rồi chọn vài bước 😃





dangkhoivt
ĐẠI BÀNG
14 năm
Mình làm thử y chang như vậy rồi mà vẫn ko được, có cái webster thì ok liền ko hiểu sao luôn
dangquybk
TÍCH CỰC
14 năm
Trước mình cũng bị lỗi add bộ Longman vào nhưng k ra âm thanh.
Nguyên nhân thì nói mấy lần ở trên rồi: cấu trúc thư mục.
Bạn giải nén file zip ra nó có folder 'Longman...' ở trong 'Longman...', rồi mới đến a,b,c... => xem và chỉnh lại như hình phía dưới. Không để folder trong folder.
Ngoài ra thì mình không biết nguyên nhân nào khác nữa.

dangkhoivt
ĐẠI BÀNG
14 năm
Chắc bản 1.3.5 nó kị longman hay sao đó, chép đúng y chang đường dẫn là thư mục longman rồi tới các thư mục từ điển (0-9...A-Z) mà vẫn ko được bạn ơi. Cái webster chép y như vậy thì được liền, mới đầu thì tưởng do mấy file word.idx mà bạn nói vậy thì pó hand rồi
dangquybk
TÍCH CỰC
14 năm
Hi, vậy à; nếu có tài khoản iTunes có xiền thì bạn mua bản AppStore 0.99$ xem vậy 😁
bạn ơi có thể cài từ điển qua source nào trên cydia ko? Bản mới nhất nhé.
dangquybk
TÍCH CỰC
14 năm
Trên Cydia hiện tại chỉ có bản iStardict 1.3.3 (Source Modmyi, mặc định có trong Cydia).
Bản 1.3.5 bạn cài bằng file deb vậy. Hoặc mua GuruDic 0.99$ trên AppStore.

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019