你好,我对于处理这类东西水平很一般也可以说很水的那一档了,所以目前能提出来的绝对不是最优和最合理的方法。至于能发现问题那是只要用了看了谁都能发现,我也爱看这些体量不大只要合理安排时间真的可以拿来阅读的东西。
对于OCR出来的文档这个应该说算是很干净了。
第一个问题 没闭合的目前发现都带有灰色背景的文字那些,这些弄完了标签问题应该就解决了。
在发现问题的地方用鼠标点点有没有高亮标签就能发现问题了。
还有就是没包在标签里的,那些应该一次就搞得定。
第二个问题 没啥不妥当的,按你理解的弄就好了。
第三个问题 没明白。空值用查找???就这个么?