【筹划】汉语成语源流大辞典 修订版 文字版+精准图片版

建议还是选用分栏切分加工后的文档为好,不同栏内容窜乱后续纠正太费力气了。我有年费会员账号,不过扫描王网页端、PC端OCR效率实在感人,光是切分页面分批次“投喂”扫描就得耗费不好时间,如果你可以实现自动化操作可以节省很大一部分时间。我花费两个晚上尝试核校扫描文本,进度的话一个晚上大概7页左右。文字排误倒不是最大的问题,最大的难点在于把编者通过空白符区隔的附注信息、同书句例、相对于出典的后出句例拎出来。白描在空白符的识别上优于扫描王,但也有很多缺漏错误识别情况。