古希腊语汉语词典 & 拉丁语汉语词典 - 初步OCR

我是用python代码调用gemini 的 api 自动识别的,速度比较快,1000页的书大概两三个小时内可以完成识别。

至于你说的古希腊语因为注音方式特别而识别不佳,这暂时不好解决。技术上说可以通过 finetune 某个模型来处理,但技术门槛和成本都比较高,对于小批量来说可能还不如手工校对纠正。也可以试试复杂的 prompt,比如给出一些注音符号的示例。

1 个赞