叕更新:國語辭典簡編本,辨析字頭,歷史詞頭,重編國語第四版166024詞頭,教育部詞典一網打盡2025

mdx在主贴尾部,表格在57楼

1 个赞

好的,谢谢……

还有一些旧版的 mdx, stardict 有用吗?
最早有 20020607 的。

发上来吧,我转存到论坛网盘,
我主要是摸索出从历史表格中单拎出缺失的词条的流程,识别最新的表格,然后从历史表格中拎出最新表格中所缺失的词条,生成表格,然后生成txt,打包就成了订补mdx,三步就ok了,主要是因为词典,近些年增删改比较频繁比较多。
至于从mdx中拎词条没试过,拎词头ok,老词头-新词头=缺失的词头ok,再把缺失的词头带入老mdx,拎出缺失的词条,按道理应该也还好办
来者不拒,来都来了

1 个赞

链接: https://pan.baidu.com/s/1UjKI1Jz4gF_Mx1ij7wGIsg 提取码: 5tgt 复制这段内容后打开百度网盘手机App,操作更方便哦

那个 CDICT.pdb 是 palm kdic 的文件转出来的.
日期是 20040209。

1 个赞

其他格式不会解包,预计从两个mdx中单拎,以wfg最新的第五版为基准来订补



搞好了,以wfg最新的第五版为基准,一个2015,(抽了58)一个2002(抽了524),保留各自自身的样式,放网盘了,
为什么水贴没有上线,自己修改帖子有上限?
为什么文件改名了上传还是原来的名字?

以网盘为准,

cdict.pdb from palm kdic.tab 这个我已经转为文本文档了。
不过要注意一下编码要选 cp950 (big5), unix 换行格式。

刚刚才注意到第一行有写

国语辞典 \n台湾教育部国语辞典 \n 共收录157704个字辞 \n David 20020607 收集分成两个文件 \n FishFish 20040209 合并

应该和 mdx 同来源。

我感觉删掉的词有一定原因的,看到一个"安仗片",解释说是。剃须刀片之类的。我百度完全找不到这个词语,我感觉这个词应该是安全刀片
2002中


0923中

安仗片這詞我也沒聽過。
1981 年的纸本 pdf 也没查到。
我将两个 stardict 的辞头用 GoldenDict 输出。
一个文件日期是 2013 年, GoldenDict 显示有 157700 条
一个文件日期是 2015 年,GoldenDict 显示有 157686 条,反而比较少。
这两个都是第四版的。

第四版的相似词和第五版也不一样。
例如「小心」
v4: 把穩、當心、留心、留神、留意、謹慎、仔細
v5: 1.留心、留神、留意、謹慎

headword.7z (459.7 KB)

我用你给的两个词头,减去重编大全(包含第四版,第五版,0923,订补,昨天两个)分别得出
词头_重编大全.txt (1.6 MB)
2013 157700-词头_重编大全.txt (355 字节)
2015 157686-词头_重编大全.txt (1.5 KB)

我才发现我的第四版,相似词和相反词洗版的时候误删了,还好原网页还保留着,找个时间再重洗一下已修正,都在网盘

爬取网页的第四版修好了,附上和其他版本的对比,


WFG的最新第五版

250923最新版

简编250925

1 个赞

有些数字字母的词头,如图

第四版是从网页上面爬下来的,约有1000左右图片字,但是这些图片网站已佚,我用老版的资源补了几个,0923的修的只剩4个图片字了。

哦看来是没法知道是什么字了部分吧

你把他的意思复制出来,百度一下都出来了,或者全文搜索,应该在第5版或者最新版里面有。

锘。

是的,因为都是以最新版为基准,优先查最新版。有的词语查不到,就可以用其他的订补附录和老版本来补充。

互为补充,才是工具书的最佳用法。

114年第三季修訂內容對照表
發布日期:2025-10-16