补充的「 物理学名词(第三版)」提取完成,详情见一楼的说明,这次提取采用特别的方法:
三个OCR引擎对比+拼写检查+人工校对
将错误率控制到了一个较低水平
别外,数理化大辞典数据全部更新过,可以更新一波
还有,经过日常使用,mdx词典依然繁琐臃肿,可作如下优化:
- 主词头跟词头信息上下间有两个换行符,可删一个
- 页码信息「即右下角跳转到图片的地方」 与 上面的所属内容可合二为一,只单加一个页码就可
如:
>力学和理论力学 >运动学>第5页
合成一条后,放在主词条的上方或下方都可。
note:
- 最新的词头都放在了一楼的「词头文本合集」处
- 物理学名词(第三版)不用合入前面的物理学大辞典,跟数理化一样,独立成一个mdx