我觉得需要引起大家注意的是这个项目和之前论坛上的其他词典项目的区别——它涉及的绝不仅是把词典数据拔下来这么简单,它还涉及到翻译,这就不是一个下载、整理、编辑的过程,而是一个创作的过程!以前的技术探讨交流局限于能不能实现某个feature,能不能还原官网效果,即,以何种方式呈现的问题,这是一个纯技术的问题,门槛虽然不低,但是投入成本相对不高,现在我们探讨的是一个史无前例的翻译项目,更准确地说是完全依赖AI的项目(不要说什么先用AI初步翻译,之后再人工核对的谎话,有谁会去proofreading这么一个庞然大物,你看哪一本权威的综合性大型双语词典,不是都有一支由来自各领域专家组成的顾问团队),所以,这个问题等同于能否完全用AI翻译一部36年前规模就已达20000多页的基于历史主义原则编写的针对母语人士的足本词典,我个人认为这是徒劳的,首先,认为可以依靠AI翻译OED的,很大概率平常是没有使用过OED的;其次,有人认为可以采取分为化之的方法,先选择词频中前几千或者几万的词来尝试,但我想说的是,这种策略已经有人采取并实施了,还得到了认可,它叫做学习型词典;再次,有人说OED词义解释更加详尽,多有现在市场上面词典不能达到的精微之处,我想说的是,你说的没错,但是这是拿原版的OED来和他们作比较,翻译之后的OED,缺乏proofreading,只怕效果还不如市场上那些你瞧不上的,原本精微之处在AI翻译过程中恐怕会丧失殆尽,这不就是为什么说中高级英语学习者要尽量阅读英文原版词典的缘故吗?最后,任何一个项目,但凡是要花费人力物力的,都应该有一个投入产出测算,能干、去干、说干就干是好,关键还是要善作善成,最红能不能干成才是关键,不然充其量只能算是一个试错,当然这也是有意义的,但是又回到之前的问题,投入和产出的问题,花这么多人力物力才认识到这是徒劳的,这件事本身值得吗?作为项目的发起者和统筹者,更应该把这个作为自己的责任去衡量,因为很多懂技术的人,未必是懂翻译的人,也未必是懂词典编辑的人,他们或许因为听到号召,全凭一腔热血就去付诸实施,因此,我们应该告知那些懂技术但是不是很懂翻译或者词典编辑的人,这个中存在的风险,而不是说个人有一个什么梦想或者执念,在大家近乎不明就里的情况下就号召大家去帮他实现,毕竟人力物力也不是他一人承担,人的生命和激情是有限的。其实王同亿的《英汉词通》就是将W3翻译汉化的产物,人家还罗列了这么多审定的专家学者,但是结果怎样,你问问坛内有多少人至今还知晓这本书就知道了,真的不是泼冷水,OED的编纂初衷就是系统地梳理和架构English heritage and culture,真的不是一个可以拿来翻译的object,更不是简单通过AI就可以粗暴解决的,至于有的人讲,里面的middle English和old English可以暂时不要或者剔除什么的,我想说这何异于将雪碧加入无糖的红酒,人家辛苦梳耙整理那么多语料才得出来的ME和OE,就直接砍掉,其实如果对ME和OE没有特殊需求,也就是阅读近现代英语材料,SOED和W3就完全可以cover了,说了这么多,如果还是非要用AI翻译,不妨从案头型词典动手,一来一般英语学习人士连案头型母语词典也不会触碰,二来学习型词典已经有很多知名权威品牌在做了。