鸿雁输入法——整句输入法中一颗冉冉升起的新星

  1. 楼主出手,官方发布,造福大众,太好了!

  2. 发现一个问题:二个词表对撞的时候,一些词撞丢失了;之所以会出现这些情况,好像是因为有些词条是一词多音。比如,鸿雁原词库里有:

百凤朝阳 bai feng chao yang 1000
百凤朝阳 bai feng zhao yang 1000

撞后的交集词库,就只剩下:

百凤朝阳 bai feng chao yang 1000

  1. 腾讯的词库,毕竟不是输入法词库,发现有些“常用词汇”它竟然不包含,比如这两个词条:加了/实在是。楼主所举 吓得我 一词,也是同样情况。

或许要制作交集词库,可能要使用:鸿雁词库 VS (腾讯千万词库+其他词库)

  1. 词库中有不雅词。这个问题或许重要性不高。

  2. 天蝎重现江湖。随手发现一个奇怪的词频。输入tian xie,首词是 天蝎,而不是 填写。奇怪的词频太多了。

  3. 楼主这次发布的词库,虽有需要改善之处,但短句广博丰富,芜杂之处已经减除,更加呈现出短句输入词库的样子;窃以为,这次的词库作为短句词库,已能在输入法词库之林称霸一方了。