我手上有5本日语词典的完整数据库文件,望高手转成欧路词典支持的格式

Me neither.

Please see if it is the style you like. Files are updated at the same folder.

这个连字符不是ascii里的那个,是另外的编码,所以不是ascii字符,字典软件当作是有效字符来处理了(没有忽略)。现在我把这个字符全替换成了ascii字符,这样正文里的词头或词语,复制查询是可以查到的。词头里这些字符已删除。

不懂js, 像这个压缩包里的js文件,您看下目前做的辞典有没有用的到的地方:

我看了一下,三个js中两个是搜索用的,一个(sticky.js)是个函数。似乎用不上。要加的话可以加个图片收放的js,目前这些图片大小不好设,都设成统一大小,有的显示过大有的过小;不设的话有的又太大了。有时间再弄了。

2 个赞

另外小小的更新了旺文社国语词典(所有全角英文字母和数字改为ascii码,“・”改为“·”,“…”改为“…”。

3 个赞

太棒了,只剩标准汉和辞典没做了(词头也有图片字需要处理),汉字典已经有大佬做了。

MDict里输入“人”查询,排版有点乱。

原版是竖排,mdx还没重拍。

希望会日语的老铁们帮帮手,把词头里的图片替换为对应的日本汉字或者中文汉字,这是要在索引栏显示的。共有1280个词头涉及,其中含999个不同汉字。能帮忙的吱一声,下载文件夹里的文件。图片为svg格式,双击打开可在浏览器里显示。可直接修改img.txt ,在图片位置填入对应汉字;或修改img2.txt 把对应汉字填写在行末,没有的留空。如能完成这步工作,一天内可转换为mdx。我不会日语,这部分做不了。

建议统一一下标准和顺序,文件看着好乱,免得后面接力的看不懂。可以试做几个(汉字),举些例子,越方便简洁越好。

文本就是这个样子。觉得乱,只按img2.txt文件填入对应的汉字就可以,kws1.txt为简化的词条,kws0对应行号的文本是原始的词条,可以根据kws0里的词条在shh0文件里找到词条文本。

先等别人做些,我看下例子再决定要不要跟进。毕竟一千多,搞错了容易前功尽弃。

比如C07649.svg对应为“拐”字,那么修改img2.txt,在第二行末加上“拐”,就行了。
C07639.svg
C07649.svg 拐
第一行的这个字


我整不出来。

1 个赞

我先看看。。。

(帖子已被作者删除)

有个standardhh是啥?【拐】右边有两个svg,加在哪?

【拐】[<“M45756.svg”>][<“C07649.svg”>]
M45756.svg 对应一个字,C07649.svg 另一个字。你找到前者对应的汉字就替换<“M45756.svg”>,找到后者对应的汉字就替换 <“C07649.svg”>
standardhh是last_idol转换出来的半成品文本。

意思是直接在img.txt里替换<“C07649.svg”>这种就好了,其他文件不用管,只作为参考是吗?

是的。最简单是加在img2文件里,加好我来替换就行。