我手上有5本日语词典的完整数据库文件,望高手转成欧路词典支持的格式

好的,我是好奇……没学日语。

通过百度网盘分享的文件:obunsha5…
链接:https://pan.baidu.com/s/1PezSzKK2CG5orUj7PHNq_w?pwd=free
复制这段内容打开「百度网盘APP 即可获取」

日语词头里有不同符号,需要先了解下才知道怎么拆分词头。

我先看看英和词典

1 个赞

抛砖引玉,做了其中的英和词典。
(https://cloud.freemdict.com/index.php/s/ZDYNXCQ9KdJSDrK)
对词头进行了清洗、拆分;图片整理;链接调整(一些太长、复杂的词条链接没有保留)。使用了简单的css。需要美化的可以自行调整。



假以时日可以进一步精细。

6 个赞

清晰,漂亮。谢谢。会者不难。大神接着做吧。

有些链接删了挺可惜的,刚想到,像这么处理可行吗:
</>
309100000
@@@LINK=not

输入a/A,不能同时检索到a1, A1,需要进一步切分。

Aaron Judge climbed to the top of the leader board in home runs in the majors.
像这种词头可以直接删了的,基本没人会这么查。

3090这串数字是内部编号不是词条,这样处理没有意义的。

你这个检索方式很独特

</>
not
<link rel="stylesheet" href="style.css"><container data-id="309100000" data-type="1"><div class="dic-item" data-id="309100000" data-rank="400">
这种是可以提取的。

编号可以用正则处理成上面那种形式:
</>
309100000
@@@LINK=not

我想可能是日语词典的特色?所以没动。需要的话可以检索出真正的短语来保留而删除其余可能是例句的词条。

其他暂时没有时间了。有时间的话汉和词典还可以做,和汉没那能力。

汉和有很多图片词头,需要手动输入,不好弄,优先完善英和是上策。

想继续做的话,第二本可以从标准国语开始,比较好处理。

(帖子已被作者删除)

我懂日语。但是不会编程。目前只是能做简单的整页版词典。如果需要做辅助工作,比如复制,粘贴等工作,我可以做。

牛B,大神厉害,加油!有一帮大神们在坛友有福了。

可以考虑写个日语词头的拆分教程,完整说明下各种情况各种符号遇到了怎么拆分,新作者遇到了新情况也可以回贴,这样慢慢会拆的人就多了。

我这里斜杠表示输入a或者A,检索不到a1,a2之类的词头(去掉<sup>标签就会带有数字),要不再加个跳转:
</>
a
@@@LINK=a1
</>
a
@@@LINK=a2

以此类推,如何?