很久之前在论坛就留意到这个帖子,一直想尝试使用一下,今天终于找到机会
整体上来说效果是非常好的 有一个一般使用不会遇到的问题是:我的英文文本在一些不必要的地方有换行 手动给每段去掉换行并打开分句之后就是现在这样的效果
目前看起来还有一些问题:
不知道应该说是分句的问题还是一对多的问题,分号没有被作为断句的符号看待
我有一个设想:出现没有对应句的情况的时候,是否可以拿这一句和上/下句合并,然后计算新句子和上/下句的对应句对齐的置信率,然后选择置信率上升的那一句合并作为结果