• Hiện tại trang web đang trong quá hình chuyển đổi và tái cấu trúc lại chuyên mục nên có thể một vài chức năng chưa hoàn thiện, một số bài viết và chuyên mục sẽ thay đổi. Nếu sự thay đổi này làm bạn phiền lòng, mong bạn thông cảm. Chúng tôi luôn hoan nghênh mọi ý kiến đóng góp để chúng tôi hoàn thiện và phát triển. Cảm ơn

Mdict v3.0 -TỪ ĐIỂN ĐA NGÔN NGỮ CHO PPC

Status
Không mở trả lời sau này.

lenguyendu

New Member
ah nếu vậy thì lúc nãy em đã thử rồi, replace các dòng đó thành </>
Nhưng khi build bằng MDXBuilder thì nó báo là:
Begining loading source file...
Keyword is longer than 255 at position: 816018 of the source file
Failed to load source file, process cancelled
-------------
Vậy mỗi từ xuất hiện trong database của Mdict là theo kiểu integer chứa 256 kí tự. Anh xem giúp em!

chưa đc bạn ơi,còn rác.xóa tơi mình "cẩm thấy" đã hết rồi MDXBuilder.

bạn tìm kiếm : ^n*
thấy chưa,xem hình để xóa tiếp nhé,dùng bàn phím gõ vào ^nrồi dùng còn chuột copy dấu * (có Space đi theo dấu *,bởi vậy mới dùng còn chuột),rồi bàn phìm viết tiếp *^p* thay thành "không"--> để trống.
rồi bạn sẽ thấy nhiếu rác tập trfung ở chỗ đó,thủ công xóa đi.
 

mrducnt

New Member
position: 815898 là ở đâu hả anh? Em xoá hết cái trong hình của anh rồi, vẫn bị vậy
 

lenguyendu

New Member
Tiếp.bởi txt này lấy từ chm,trong nó sẽ có dấu "Chia trang",phải xóa.
lần này dùng Tìm Kiểm,xem hình,tìm ^b
xóa thủ công nhé,chạy lên và chạy xuống xem kỹ rồi xóa những cái vô dùng.
 
Chỉnh sửa cuối:

mrducnt

New Member
ôi, đã xoá xong những dòng đó. Tìm lỗi thế này mệt thật. Từ điển này ít từ thì tìm vậy chứ từ điển to thì không biết xoay sở thế nào :-s
 

lenguyendu

New Member
position: 815898 là ở đâu hả anh? Em xoá hết cái trong hình của anh rồi, vẫn bị vậy

haha,đã nói chưa tới MdxBuilder ra mật mà.
muốn biết 815898 ở đầu cũng đc,những tìm như vậy sẽ làm tới năm 2012 mà chưa xong đc :D

số 815898 có nghĩa là Bit thú 815898,trong unicode,1 chữ cái là 2 Bit.
xem hình,lượt còn chuột từ mở đầu cứ đi xuống,ko tha ngon tay,UE bảo
chữ cái "n" cuối là vị trí 1410 Bit.còn 815898 thì bạn cứ đi tiếp là thấy,tới chỗ đó bạn sẽ thấy 1 lỗi có thể là:
1 từ mục ấy có cái tên quá là dài,dài hơn 255bit,cho nên MdxBuilder bảo lỗi.
thì ra chỗ đó là tại thiếu bấm 1 lần "Enter" của bàn phím rồi.

note:bjo là 815898,bạn vẫn tìm ra đc,còn cho xíu sẽ bảo là 88815898 mà bạn còn dám tìm ko nhỉ.
 

mrducnt

New Member
Sorting dictionary...
Done!
Begin processing index...
Done!
Original index size = 273KB, compressed size = 80KB, compression ratio = 29%
Begin processing data contents...
Done!
Original text size = 9746KB, compressed size = 2702KB, compression ratio = 27%
Number of entries: 8432
Conversion succeed!
 

mrducnt

New Member
Bây giờ chỉnh màu sắc trong UE rồi save hả anh. Nhưng txt đâu có lưu được màu ?
 

lenguyendu

New Member
Tiếp.
bjo mình nghĩ sắp ok rồi,ko biết còn rác gì nữa.
xóa hàng trống nhé:
^p^p thay thành ^p,bấm THAY TOÀN BỘ 2 lần hơn,cứ tới UE bảo "tìm ko thấy".

Rồi,chính như bạn đã phát hiển lỗi ở VT 815898 bởi tên từ mục dài hơn 255bit(túc là 127 chữ cái,đâu có từ mục gì dài như vậy,ko hợp ly thôi,tại thiếu bấm "Enter" chắc,bạn tìm ra rồi bấm Enter để xuống dòng là đc.

Mình hoài nghì ko chỉ là 1 chỗ 815898 thôi,mà còn chỗ khác nữa,tìm thế nào vậy,Du chắc chắn ko biết cách nào là hay nhất :p,nhưng Du nghĩ ra 1 cách ngốc.:p

Dùng Tìm Kiểm,chọn kiểu Regular Expression.tìm </>^p?????????????????????????????????????????????????????????????????????????????????
ko phải điểm rồi,50 cái dấu hởi đó =))
tìm ra chưa,thấy chưa,ai dài rồi?phải xóa cái nào và phải bấm Enter ở chỗ nào.....tìm ơi là tìm,có lễ hơn 10 chỗ,cứ tới tìm ko thấy.

Rồi Save as utf16(kiểu Thay dòng chọn DOS).
........
 

mrducnt

New Member
Thông thường thì khi convert từ dạng khác sang cũng không bị liền nhau như thế. Em nghĩ do lỗi đánh máy. Lúc nãy em sửa thì có không quá 10 lỗi như vậy
 

lenguyendu

New Member
Bây giờ chỉnh màu sắc trong UE rồi save hả anh. Nhưng txt đâu có lưu được màu ?

làm đc rồi??? chưa!!,còn rác chưa xoa hết! cứ tìm từ mục dài rồi sẽ thấy.
về màu sắc,sao Du thấy bạn ko chịu đọc mấy trước hả!
màu sắc trong txt phải gõ bằng kiểu dạng HTML.
vD:<font color=red>mrducnt</font>
viết vậy thì PPC sẽ hiển ra "mrducnt" là màu đỏ......
 

mrducnt

New Member
ah quên mất. Như vậy muốn cho các đề mục 1. , 2. , bằng hình thì ta cũng dùng mã HTML chèn hình vào phải ko anh :D. Còn một vấn đề nữa em muốn hỏi

Anh làm thế nào để tách riêng được các ví dụ mà cho hiệu ứng khác thế này :-s
Anh có thể cho em file txt của Oxford Advance, Cambridge Advance và Collins Cobuild được không?
 

lenguyendu

New Member
@mrducnt
đúng là nhiêu cái phải dùng mã HTML.
câu "tách riêng được các ví dụ mà cho hiệu ứng khác thế này" y là gì Du chưa hiểu.
còn txt của những cái đó Du ko chắc giữ hết trong máy tính,có lễ còn lại cái nào mà phải tìm xem,bjo ko vào đc trang mediafire mà chưa biết đưa lên đâu cho bạn nữa.
 

lenguyendu

New Member
position: 815898 là ở đâu hả anh? Em xoá hết cái trong hình của anh rồi, vẫn bị vậy

aha,mới nghĩ ra cách hay tìm lỗi này,ko phải dùng "cách ngốc" mà lượt hư còn chuột nữa,cũng ko phải gõ 50 cái dấu hởi mà chẳng có học hành gì cả,xấu hổ quá.:mad:)

Trong Hệ thập lục phần,1 chữ cái đối ứng 1 bit.haha,ai phát mình ra Hệ thập lục phần mà giỏi quá chừng.
UE,bấm Ctrl+H chuyển sang Hệ 16 phần,bấm Ctrl+G,gõ vào số 815898,OK,bấm Ctrl+H trở về,tìm đúng chỗ đó luôn rồi.khoái quá b-)
 
Chỉnh sửa cuối:

mrducnt

New Member
:)) Càng nghĩ càng thấy nhiều cái hay mà anh. Liệu trong UE có kiểu đánh dấu "chỉ cần biết kí tự đầu và cuối, không cần biết nội dung giữa hai kí tự đó" không anh? Nếu có thì ta có thể làm một bộ từ điển gần như giống hệt từ điển giấy :D
Up load thì anh up lên Rapid Share cũng được. Em down đc từ site đấy :D
Ah mà anh ơi sao từ điển em làm xong khi tra từ nó không phát âm ?
 
Chỉnh sửa cuối:

mrducnt

New Member
aha,mới nghĩ ra cách hay tìm lỗi này,ko phải dùng "cách ngốc" mà lượt hư còn chuột nữa,cũng ko phải gõ 50 cái dấu hởi mà chẳng có học hành gì cả,xấu hổ quá.:mad:)

Trong Hệ thập lục phần,1 chữ cái đối ứng 1 bit.haha,ai phát mình ra Hệ thập lục phần mà giỏi quá chừng.
UE,bấm Ctrl+H chuyển sang Hệ 16 phần,bấm Ctrl+G,gõ vào số 815898,OK,bấm Ctrl+H trở về,tìm đúng chỗ đó luôn rồi.khoái quá b-)

Như vậy kết hợp với MDXBuilder ta có một công cụ đắc lực để tìm lỗi :D
 

dangkhoivt

New Member
Hy vọng sớm có dữ liệu wiki mới chứ đem khoe từ điển bách khoa toàn thư mà tra ko thấy dữ liệu của tổng thống thứ 44 Hoa Kì thấy cũng kì :D
 

lenguyendu

New Member
Anh có thể cho em file txt của Oxford Advance, Cambridge Advance và Collins Cobuild được không?

Oxford và Collins,txt,utf8.Cambridge xoa rồi.khuyến mãi cái Wordnet haha.
host này nằm ở Quảng Châu nên Du upload nhanh tới 2-3Mb/s,ko biết bên bạn tải đc ko.
Oxford Advanced Learner's Dictionary:
http://www.rayfile.com/files/a4e86fcf-ab4d-11dd-9b08-0014221b798a/
Collins Cobuild English Dictionary:
http://www.rayfile.com/files/2c677da1-ab4e-11dd-ba15-0014221b798a/
Wordnet
http://www.rayfile.com/files/50a2b230-ab4f-11dd-bca9-0014221b798a/

note:bộ wordnet,Du chưa bjo công khai đưa lên trần gian,bạn convert công bố thiên hạ nhé.
ah,nếu bạn làm ăn tại cty Từ điển gì Du có thể tặng cho bạn rất nhiêu txt,hơn 100Gb.
 
Chỉnh sửa cuối:

lenguyendu

New Member
MDict 3.0 alpha2 for WM2003-WM6.

Bản test thôi,thêm vào chức năng Full Text Search và Fuzzy Search.
Lỗi:Lúc "Chia Khung" không gõ đc tiếng Việt,lỗi cũ rồi.ông Rayman Zhang nói hy vọng bản chính trúc sẽ fix đc,và đang nghĩ cách giải quyết TouchFlo cho.
 

PhongQuang

Super V.I.P
Bản Việt hóa hoàn chỉnh cho MDict 3.0 alpha2
Mình Việt hóa thêm những từ còn thiếu
Tải file đính kèm giải nén chép đè vào thư mục là OK.
 
Chỉnh sửa cuối:
Status
Không mở trả lời sau này.
Top