直接用abbyy ocr导出成html文件,然后找个文本编辑器清洗文本,最后转成mdx的格式。清洗这步就是文本替换删除,很需要耐心,如果词典页数少排版简单的话,会容易很多。
2 个赞
直接用abbyy ocr导出成html文件,然后找个文本编辑器清洗文本,最后转成mdx的格式。清洗这步就是文本替换删除,很需要耐心,如果词典页数少排版简单的话,会容易很多。