GuruDic + dữ liệu stardict phong phú = từ điển đa ngôn ngữ tốt nhất trên iOS

dangquybk
14/1/2010 1:19Phản hồi: 1.262
1.262 bình luận
Chia sẻ

Xu hướng

dangquybk
TÍCH CỰC
12 năm
Các bước mình tạo data wiki thành định dạng stardict như sau:
1) Tải về file ...-latest-pages-articles.xml.bz2
2) Giải nén thành file xml (dung lượng sẽ khá to)
3) Dùng WikiToMDict 2.0.exe chuyển file xml thành file txt - định dạng cho MDict
4) Dùng EMEditor (hoặc txt editor khác hỗ trợ file lớn), Find and Replace chuyển thành dạng tab
5) Dùng tab2bgl chuyển thành dạng babylon
6) Dùng RawURLFix để convert các link chứa dấu cách thành dạng link liên kết được
7) Dùng babylon2stardict để convert thành định dạng stardict (Stardict Editor không đủ sức chạy file to, luôn báo lỗi thiếu bộ nhớ - nên cần công cụ này.

Bạn tham khảo thêm các link sau (có các tools kể ở trên, tiếng Hàn - dùng Google Translate nhé 😁):
http://ybrary.tistory.com/5
http://eu81273.tistory.com/327
http://eu81273.tistory.com/326

---------- Post added at 10:56 AM ---------- Previous post was at 10:53 AM ----------

Cảm ơn bạn. Chúc bạn và gia đình luôn nhiều niềm vui 😃
Mình sẽ xem lúc nào đó làm 😃
Có trục trặc này nhờ bạn giải quyết giùm (trên IP 4S). Tất cả các foder trong hai files phát âm (cả Longman 2005 Package American lẫn Longman 2005 Package British) đều OK. Tuy nhiên khi tra từ có dữ liệu phát âm từ folder 0-9 thì không hiển thị icon phát âm. Tôi tra một từ trùng với phần phát âm trong đó nhưng chỉ hiện text mà không hiện lên icon phát âm. Rất mong bạn giúp đỡ . Thanks
dangquybk
TÍCH CỰC
12 năm
GuruDic dựa trên gốc là Stardict - và do vậy không tìm file phát âm cho các từ bắt đầu khác abc...
Vì vậy các file trong thư mục 0-9 bị bỏ qua. Cũng chỉ gần 20 file thôi nhỉ 😃
Mình thì chỉ dùng bộ Webster (không có các file 0-9).
data từ điển Trung Việt, Việt Trung gốc lạc việt :
http://www.mediafire.com/?ko1o21z77t3c45x CV (plain text)
http://www.mediafire.com/?34uexc7jnles1s3 VC

Anh oi cho em xin data phat am cua 2 cai nay duoc khong ? tim hoai khong thay hichic , dang can gap lam 😔
dangquybk
TÍCH CỰC
12 năm
Anh không có data phát âm Tiếng Trung. Ngoài ra Gurudic chỉ phát âm được tiếng Anh thôi.
tienlbhoc
TÍCH CỰC
12 năm
Chào bạn, tớ là tác giả 1 từ điển bên android, lần trước đã hỏi bạn về cách lấy dữ liệu wiki về làm (ngay page 75 đằng trước ). Sau hơn 1 ngày cuối tuần nghiên cứu và thử nghiệm, tớ đã trích được dữ liệu anh anh wikitionary và build cho từ điển của tớ.

Nay gửi lại cho các bạn bên iphone dữ liệu (dạng dict.tab), tinh thần nguồn mở là luôn chia sẻ mà 😁
http://www.mediafire.com/?rqf7jtkt4gh91el

Một số chú ý:
Dữ liệu này tớ làm theo cái cách của bạn đến bước 3 rồi sau đó tự xử lý, phần url hay entry <-> bword tớ không đổi vì cái của tớ đọc được rồi, cái guru này không biết thế nào, nếu không đọc được thì bạn replace nhé.
cái WikiToMDict convert không chuẩn, thứ phá vỡ định dạng cấu trúc giải nghĩa nhất là các tag numbering nên tớ phải chuyển hết #: #* ##: ##* thành ### hết trước khi cho vào wikitomdict (cần lưu ý). Lược bỏ các phần Etymology, các ngôn ngữ khác tiếng anh, {{quote .. }}, Translations, Categories để cho dung lượng nhỏ (mà vẫn 250 mb) đủ hiển thị nội dung thôi.
Sau này bạn định convert thì nên test trước các từ phức tạp nội dung dài như từ hang :
http://en.wiktionary.org/wiki/hang
Cho vào 1 cái xml con con khoảng chục từ nội dung phức tạp thôi. Nếu giữ được định dạng, bố cục ở mức chấp nhận được thì hẵng build không sau này lại hiển thị tùm lum, build lại rất mệt vì dữ liệu lớn quá.


Về dữ liệu thì có thể mô tả như sau :
- Dữ liệu mở, cập nhật thường xuyên
- Tổng số lượng từ rất lớn (408.019 từ)
- Dung lượng dict.tab là 240 mb nhưng convert ra stardict chắc lên 250 đấy, bạn có thể nén dz
- Nội dung tốt, bổ xung cho anh việt không có như : phiên âm anh anh, anh mỹ, nhiều ví dụ, đồng nghĩa trái nghĩa (từ điển thesarus), các từ liên hệ (như word family của longman), chia từ các dạng bất quy tắc, chú thích các lĩnh vực ... Nói chung là những thứ trước đây ta hay tìm kiếm trong các từ điển như oxford, longman hay cambridge ...

Chúc các bạn ios ăn tết vui vẻ, ôn luyện tiếng anh cho tốt.
dangquybk
TÍCH CỰC
12 năm
Cảm ơn bạn, mình đã chuyển thành dạng startdict rồi đây 😃

Code:
- Chuyển từ tab thành babylon với tab2bgl
- Chuyển link thành dạng của Babylon: Dùng EMEditor find & replace: a href="entry:// => a href="bword://
- Dùng RawURLFix để sửa các link chứa dấu cách
- Build bằng Stardict Editor :-)
Code:
wordcount=408019
idxfilesize=7895766
bookname=En-En-Wiktionary
author=dangquybk & tienlbhoc
description= Từ điển mở En-En Wiktionary.
sametypesequence=h

Link: [URL="http://www.mediafire.com/?ovfbun8kp7rc8fm"]En-En-Wiktionary[/URL] 43MB
En -En Wiktionary chạy rất mượt trong Guru và tra cứu thú vị. Cám ơn hai bạn dangquybk & tienlbhoc nhé
En -En Wiktionary đã làm phong phú thêm dữ liệu cho Guru và đáp ứng nhu cầu đa dạng của người dùng.
Cám ơn hai bạn : dangquybk & tienlbhoc
Chào dangquybk.

Em ơi, anh về VN mới mua Galaxy S2 để dùng mạng ở VN mà search không thấy có từ điển Gurudic cho Android. Anh mới lần đầu dùng cái này nên muốn hỏi em xem có từ điển nào có thể sử dụng dữ liệu như của Gurudic hay Mdict về tiếng Nhật trong Android không để tận dụng những dữ liệu của Gurudic hay Mdict cho Iphone mà hiện nay anh đang có. Vả lại sử dụng quen những từ điển này thấy không cái nào có thể sánh được bằng.

Mong dangquybk giúp đỡ nhé.

Cám ơn em nhiều.
dangquybk
TÍCH CỰC
12 năm
Hi anh,
GuruDic trong tương lai sẽ có bản cho Android nhưng hiện tại thì chưa anh ạ.

Để sử dụng data GuruDic anh có thể cài ColorDict từ Android market(Free)

MDict cho Android thì em không biết 😃
Hi dangquybk.

Cám ơn em nhiều nếu dùng được chung dữ liệu thì quá tốt.
Em ơi có thể chỉ ra cho anh là l
dangquybk
TÍCH CỰC
12 năm
Chắc anh hỏi cách đưa dữ liệu vào ColorDict?

Code:
- Download a file to your PC
- Uncompress downloaded .tar.bz2 file
- Change filename xxx.dz to xxx.gz
- Uncompress xxx.gz
- If there is a res/ folder, change folder name 'res' to dictionary name.
- Copy all uncompressed files(xxx.idx, xxx.ifo, xxx.dict, xxx folder) to sdcard /dictdata directory
Hi dangquybk
Đúng rồi, gomen em hôm qua reply cho em bị thiếu chữ.
Em ơi anh hỏi thêm là sao lại phải giải nén những file .taz.bz2, giải nén cái này thế nào?

Trước kia anh toàn ghép các foldẻr trong đó có các file xxx.dict, xxx.idx, xxx.ifo...thành file nén zip sau đó copy vào trong thư mục Gurudic trong Itune rồi cài đặt. Thế sao cái này lại phải giải nén những file có đuôi .taz.bz2 rồi .gz là như thế nào hả em?

---------- Post added at 10:05 AM ---------- Previous post was at 10:02 AM ----------

Chỉ copy và làm theo hai mục trên thì đã đủ chưa em?
dangquybk
TÍCH CỰC
12 năm
Đoạn "- Uncompress downloaded .tar.bz2 file" có nghĩa là giải nén file zip, hoặc .tar.bz2... thành các file từ điển.
Trong GuruDic thì chép các file zip qua iTunes để cài nhưng ColorDict cần giải nén ra rồi chép trực tiếp vào thẻ nhớ.

Thêm nữa, có một cái khác với GuruDic là GuruDic hỗ trợ file từ điển dạng nén - file chính có đuôi "dict.dz" - một dạng nén đặc biệt - trong khi ColorDict và nhiều app từ điển khác không hỗ trợ.
ColorDict đọc được data đuôi ".dict" - có được khi giải nén file "dict.dz" trên.
- Nếu data của anh đã ở dạng ".dict" rồi thì OK.
- Nếu chưa: đổi đuôi file: ".dict.dz" => ".dict.gz" rồi giải nén bằng 7-zip hoặc WinRAR/ZIP.
- Chép từ điển .dict (cùng với các file .idx, .ifo) vào thư mục dictdata trên thẻ nhớ (không tạo thêm thư mục con, tất cả file ném hết vào thư mục dictdata.
- Nếu có file ảnh trong thư mục res: đổi tên thư mục thành cùng tên với các file dict, ifo... rồi chép vào thư mục dictdata
krei_zie
TÍCH CỰC
12 năm
Mình rất cần bộ từ điển của Oxford (thesaurus, learners, ...) mong chủ topic up lại
thanks
dangquybk
TÍCH CỰC
12 năm
Tặng bạn đây:
OALD8
Thesaurus

Pass: gurudic
Cám ơn em nhiều.

Anh đã copy được các file dữ liệu vào dùng thử rồi, ngon lành hi..hi..

Nhưng anh chưa thử phần ảnh, anh muốn confirm lại em xem có phải là chỉ đổi tên của folder có tên là res thành cùng tên với các file dict, ifo.... rồi chép cả Thư mục đó vào trong thư mục dictdata được không? hay là chỉ có copy những file ảnh ở trong thư mục res đó thôi?

Nếu copy được cả thư mục ảnh đó thì sao lại không copy được thư mục của từng từ điển như Gurudic nhỉ? Tóm lại đang dùng Gurudic rồi vẫn thấy chẳng cái nào bằng. à, anh thấy bảo cái từ điển mspdict trên Android cũng hay, nhưng anh chỉ tín nhiệm giống Gurudic thôi, em đã dùng thử cái mspdict chưa? em thấy cái đó thế nào, dùng song song có cần thiết không?

Xin lỗi đã làm phiền em đợt năm hết Tết đến, em năm nay có về VN ăn Tết không vậy?
xanderxxx
ĐẠI BÀNG
12 năm
chủ topic ơi, có thể cho mình xin data wikipedia tiếng Anh được không?
Thanks bạn nhiều
dangquybk
TÍCH CỰC
12 năm
Thư mục res thì đúng là như vậy anh ạ. Cách quản lý của ColorDict là cứ ném hết cả data vào một chỗ, không chia thành các thư mục từng từ điển như GuruDic 😃
Anh thử xem ạ. MSPDICT do bạn @tienlbhoc làm ra - có vẻ rất tiện lợi, nhưng em đang không dùng Android nên không nắm được hết.
HTC Desire HD nhà em thì chỉ có ColorDict.

Anh tham khảo thread này: http://www.tinhte.vn/f216/mspdict-tu-dien-khong-thieu-cho-nguoi-dung-android-691731/


Cảm ơn anh ạ, Tết này nhà em ở JP ạ.

@ha-huong: Anh ơi, trên Android anh thử dùng GoldenDict nữa nhé. Siêu mạnh luôn 😁
Code:
 
Supported formats

Lingoes .LD2 files
Babylon .BGL files
ABBYY Lingvo .LSD, .DSL, .LSA and .DAT files
StarDict files
Dictd files
Hunspell morphologies
==============
Không có data wiki tiếng Anh bạn ạ. Mình không convert được.
Bạn có thể tìm data wiki Tiếng Anh cho MDict rồi cài MDict vào xem.
Cám ơn em rất nhiều, anh đã dùng ngon lành rồi.

Chúc cả gia đình đón một cái Tết thật vui vẻ và hạnh phúc nhé. Năm nay anh lại được về VN ăn Tết cùng gia đình sau bao năm xa cách, thật là vui. Mong sớm có dịp được gặp gỡ.

Happy new year....!
dangquybk
TÍCH CỰC
12 năm
Chúc mừng năm mới con Rồng 😃
Chúc anh em học tập và làm việc hiệu quả, & luôn vui!

GuruDic sắp 2 tuổi, cảm ơn anh chị em đã và tiếp tục tham gia thread 😃
Chúc chủ topic năm mới tốt lành. Mong Gurudict mỗi ngày có thêm nhiều data , không chỉ tra cứu từ điển mà còn tra cứu Ngữ pháp tiếng Anh, Pháp, Nhật ....và nhiều thứ khác nữa.
Da.em chao anh ah.em ten duy.em dang rat can nhung bo tu dien mtBab-EVE.nhung em dang xai phan mem ireader for learning forgeiner.co ho tro tra tu dien tren phan mem nay.nhung voi dieu kien la du lieu tu dien them vao phan mem nay phai o dang taz.bz2.vi the em nho anh giup em chuyen tu dien mtBab-EVE.zip thanh dang mtBab-EVE.taz.bz2.vi phan mem nay hay vo cung.em mong anh giup em.nam moi chuc anh vui ve.
Xin loi anh em dung ipad nen ko biet go dau
dangquybk
TÍCH CỰC
12 năm
Em tải về ở đây: mtbab-eve.tar.bz2
Pass là gurudic

Kết quả thử trên iReader for Studying Languages
Em cam on anh rat nhieu.san day em hoi anh mot chuyen.em dang hoc y.dang rat can du lieu tu dien chuyen nganh y khoa.a co du lieu do khong.neu co anh chuyen file du lieu qua tar.bz2 gium em nhe.em cam on anh rat nhieu
dữ liệu wiki có mới hơn nữa không hả các bạn? Có ai biết cách lấy dữ liệu wiki hiện tại và tạo ra file sử dụng cho iphone?
dangquybk
TÍCH CỰC
12 năm
Bạn thích có thể tham khảo post#1 có cách tự tạo dữ liệu đấy.
ý là mình nói dữ liệu wikipedia tiếng việt đó bác, vì mình thấy dữ liệu trên diễn đàn là tháng 8/2011
dangquybk
TÍCH CỰC
12 năm
Bạn không hiểu ý. Post#1 mình đã trình bày các bước để làm data wiki, bạn thích thì tự build lấy cho cập nhật mới.
Các bạn ới, giúp mình convert bộ từ điển này sang định dạng của GuruDic-iStardict với: http://www.mediafire.com/?dbgpak5k6xf381l . Cám ơn rất nhiều ....
dangquybk
TÍCH CỰC
12 năm
Data của bạn là từ điển dầu khí.
Mình đã convert và cập nhật link trên post#1.
em muốn cài đặt từ điển tiếng Nhật cho iphone 4S chưa JB. Em đã đọc hết mà ko hiểu phải làm thế nào ạ @@
Mọi người chỉ cho em cách làm tỉ mỉ hơn với ạ 😔
dangquybk
TÍCH CỰC
12 năm
Post#1 có hết rồi, nhưng chắc dài quá nên em không đọc hết. Tóm tắt lại các bước nhé - chi tiết thì em xem thêm post 1.

1. Cài đặt GuruDic
2. Trên máy tính cần có iTunes. Tải về công cụ iTools hỗ trợ chuyển file trực tiếp vào iPhone.
3. Tải về từ tiếng tiếng Nhật từ post#1, giải nén ra thư mục chứa từ điển (gồm các file idx, ifo, dict.dz...)
4. Cắm iPhone vào máy tính, bật iTools lên, chép từ điển vào thư mục Library/Caches/Dictionary của GuruDic (thư mục Dictionary cần tạo nếu chưa có).
5. Chép xong từ điển thì trên iPhone bật GuruDic lên và vào tab từ điển để xem và bật các từ điển lên.



*Dropbox đang block các link public của mình khiến hình ảnh không hiện lên hic
Anh Quý fix hộ em link down data bộ từ điển tiếng Anh và Tiếng Nhật trang đầu dc ko ? e ko down dc , thanks anh 😁
dangquybk
TÍCH CỰC
12 năm
Em xem ở đây

Dropbox của anh đang bị quá tải.

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019