我手上有5本日语词典的完整数据库文件,望高手转成欧路词典支持的格式

显示一大堆就一大堆,这不是什么缺点。在所有对应的词头里用肉眼找到需要的词头就行了。

看这位是怎么处理的词头吧:
【岩波書店】岩波国語辞典 第八版 - 日语 - FreeMdict Forum

好,我先看看。

可以先把英和处理了,剩下的慢慢弄,旺文社国语辞典已经有是十一版了,十二版可有可无。

需要你付出极大的热情,幸苦了:joy::+1:

我只能做到这一步了,大家一起努力吧。

2 个赞

我推荐第一种(“或者处理成”的上面那种)处理方法,你可以观察一下规律。

きゅう‐じ【<sup>△</sup>灸治】
处理成
</>
きゅうじ
@@@LINK=きゅうじ【灸治】
</>
灸治
@@@LINK=きゅうじ【灸治】
</>
或者处理成
</>
きゅうじ
@@@LINK=きゅう‐じ【灸治】
</>
灸治
@@@LINK=きゅう‐じ【灸治】

あか‐ぬ・ける【<sup>△</sup>垢抜ける】
</>
处理成
</>
あかぬける
@@@LINK=あかぬける【垢抜ける】
</>
垢抜ける
@@@LINK=あかぬける【垢抜ける】
或者处理成
</>
あかぬける
@@@LINK=あか‐ぬ・ける【垢抜ける】
</>
垢抜ける
@@@LINK=あか‐ぬ・ける【垢抜ける】

あい‐はん【合〔い〕判】
处理成
</>
あいはん
@@@LINK=あいはん【合〔い〕判】
</>
合い判
@@@LINK=あいはん【合〔い〕判】
</>
合判
@@@LINK=あいはん【合〔い〕判】
或者处理成
</>
あいはん
@@@LINK=あい‐はん【合〔い〕判】
</>
合い判
@@@LINK=あい‐はん【合〔い〕判】
</>
合判
@@@LINK=あい‐はん【合〔い〕判】

这些都容易处理,只需要确定一个方案。

あか‐ぬ・ける
那就去掉这类符号吧,在查询用的词头里删掉,显示用的词头不要删。

【】〈〉〔〕
这些括号在显示用的词头里不要删

主词头即查询用的词头(“@@@LINK=”后面的词头)保留这类括号,跳转用词头(“@@@LINK=”上面的词头, 比如“あかぬける”和“垢抜ける”)要去掉。

请教,・是表示促音吗?

促音是っ和ッ。っ不要看成つ,ッ不要看成ツ。词头如果含促音,全部都要保留。

像这类符号以及它们的标签,只需要在显示用的词头里保留。

这类符号(不带标签)同理。

礼拝堂風に,这个词头不应该拆出来吧,你下一个词条 iced coffee 就没拆,程序上也不太好处理,要么都拆,要么都不拆。

这里的“から”表示“アイス‐コーヒー”来自“iced coffee”,和查询用词头无关,必须删掉。

ア‐カペラ〈a cappella 礼拝堂風に〉
而这里的“礼拝堂風に”和“a cappella”同义,必须拆。

所以我说先处理英和比较好,再处理标准国语,难度越大的辞典就越要放到后面。

大哥晚上好,鞠躬:person_bowing:
手机端什么app可以直接读db格式的词典的吗?

礼拝堂風に更像是解释,不属于词头,我认为不好拆,等 winn 来看看。

这种简短的“解释”能拆更好,实在不能拆就去掉,先处理英和辞典为妙。可以单独把から这种视为特殊情况,依次处理。

1 个赞