测测各个词表的覆盖率

嗯,我也发现大部分都是姓名啥的,应该想办法排除掉吧,比如干掉有大写的。你用重复次数是排除不掉的,因为一本书里往往姓名的重复次数反而是最高的。