Ptextpad + 双语对齐工具网页版 mlbee(任意语言对) + 其他bee系列对齐工具

我稍微研究了一下 NLTK,它的 tokenize 会切到 word 粒度,对这个需求来说过于碎了,这样的话可能要先判断句子成分再按句子成分进行切割。