统计了下,还没开始校正。我发现切成单栏的话,阅读时翻页太多了。现在的三栏很实用。
格式:A~B1|B2|B3
txt.split('\n)
.split('~') A@B
.split('|') B1|B2
.split('#') B1#1 重复的次数,1表示重复了一次,即一共2次。
logs.zip (766.3 KB)
easyOCR的结果,做文字版是不可能的,用来拿词头坐标还行。
- mdd1_pickles.zip (14.3 MB)
- mdd2_pickles.zip (15.9 MB)
这个文本太烂,不然稍微有点umi-ocr的水准,我就直接做文字版自己看了,用来理解成语大意,大段的摘抄典源对我没什么用。