最好只对 zh标签里的例句断行, 因为有不少 "英义中义英义中义"这种格式的词头
已经修正了rate
感谢分享,这版的中文释义加标签了,厉害!
在这版基础上,那位大神有能力有精力就 提取词组+词性跳转。呵呵
其他个别的小问题,倒不重要。
辛苦了。谢谢。
当多个人一起修改一份文件的时候,重要的不在于多和快,而是记录自己改动的具体内容changelog,才能避免重复劳动啊。慢慢来,一步一个脚印
测试小白们也迷糊了。。。。
如果atauzki兄还记得自己今天的改动动作,可否在137229这个版本基础上再来一次哈?一定得开个新帖了,这个帖子太太太长了
还是交给其他人改吧。暂时别搞提取词组扩容啥的,标签都没弄好,搞这个白费力气
6 个赞
非常喜欢大咖的排版,很漂亮。
1 个赞
增加了,见其他词的跳转,是其他版本没有的
个人认为基本可以定稿了,词组跳转,词性跳转,有,则锦上添花,没有,也无伤大雅
剩下的是手工修改的磨人的活了,建议以atauzki 的这一最新版重开一贴,汇集潜在缺陷。
蛋疼 , 我把例句也分割了,今天再发一版
2 个赞
@hijack 能把词组和衍生词分开处理下么?也不知道费不费事。
2 个赞
好的今天一块弄下
2 个赞
你上当了,等你把例句(中英文)分割了会发现释义里中英混合的那些有不少地方因为标签会出问题的。
蛋疼是免不了的啦!!!
已经都处理了,还是有规律的
1 个赞
中英文混合的单个例句内容,先用英文版的例句进行匹配,剩下的部分都划为中文例句?
没这样搞,利用: ; 和 x标签做的
英文释义里嵌入的例句不分行就好了
请问下楼主大神把义项的中英文分割思路?
先标记非ascii字符和数字,()等括号用html标签替换,然后程序再处理,正则是搞不定的,有不少分割特殊情况需要处理比如交接处数字,单个字亩,全大写词位于中文还是英文需要人工处理
rate这种是我特意改的,为啥还要改回去