win 10 和 win 7 输入法架构发生了变化,接口发生了变化
简单一个补丁是没法搞定的。
内嵌技术
《智能狂拼》软件在后台的处理上采用了中文之星公司历经三年开发的CLM(中文语言模型)核心技术。该技术是在分析了覆盖经济、政治、文化、科技、教育、文学、历史、哲学、军事、体育、法律、社会新闻等众多领域100亿汉字(相当于228年《人民日报》的总字数)的基础上开发出来的新型中文语言模型技术。
鸿雁输入法也是基于语料库的分析,目前的语料库有350GB,包含1638亿个字符,有效汉字字符886亿个。
鸿雁输入法的方案是暴力穷举词组,词组最长的有16个汉字
智能狂拼更多的依赖分词,还有三元组技术
鸿雁的方案覆盖的词语更为全面,不过多余的机械词语也增加了,这种方案在技术上实现也比较简单
智能狂拼的技术依赖建立在分词技术上的三元组技术,和前者的作用差别不大。
只能狂拼最大的数据库文件就是词与词字与字之间的关系数据库,是使用专有格式的数据库,移植意义不大,除非熟知内部源代码算法。