OED人机协作翻译(双解)项目

虽然不想说什么,但感觉实在是离谱,兄应该知道哪里有问题了吧?而且你也应该知道错误率如何了吧?

中间能力层级有对应的中型词典,像ODE和《英汉大词典》都大致是这个定位,如果不足敷用,可以Google搜索,或者询问ai。

我用ai试译过的东西不少,一个原则是如果我自己没有能力核实校对ai的翻译,确保它的错误率在可接受的范围内,我不会用ai翻译,且把它放在网上传播,否则这些ai生成的内容很多不过是slop、垃圾堆,以讹传讹,且因为优先占位,即使未来有后来居上者也很难将之有效清除,可谓流毒无穷了。

类似的做法好比一个人用ai写程序,vibe coding,洋洋洒洒数千行,却没有能力debug,程序错误百出,无法有效运行,但依然把这些ai代码上传到github等处,误人之外,对自己也没啥益处,浪费算力和时间。

即使有人有能力校对当前ai翻译的OED,但因其体量极其庞大(据说英文版总字数是6000万,加上中译可能会有1亿多字),基本不可能由若干业余爱好者全面完成其修正校核,最终的结果可想而知,只能是烂尾工程。这样的烂尾作品专业人士不会用,那些初中级水平者、叶公好龙者贪求便利,实际上不时踩坑踩雷,那还不如去用《英汉大词典》和ODE,我相信它们的坑和雷不如当下ai翻译的词典多。

且不说全面校正核对OED的中文翻译,《汉语大词典》的文字残本在网上流传近20年了,叶公好龙、见猎心喜者不知凡几,按理说OCR补充阙文比校对译文容易多了,可我们迄今也没见过一个文字完整的《汉语大词典》。

这不是说用ai翻译OED不能做,只要自己喜欢,干啥都行。不过我建议如果不能保证品质的话,最好自己做了个人使用,或者私下在同好间共享,谨慎公开传播兜售,网上的垃圾已经太多,就不要推波助澜用ai slop污染毒害互联网了,未来更强大的agi、asi还要继续依靠它呢。

你说的很有道理 OED的词条众多 同样地 英汉大词典词条要少得多了 可是对于我们一般使用者来说 能用到其中的 毕竟是少数内容 比如说 我们经常用得最多的可能是30000以内的 再往上用得自然要少得多 50000以上的 可能见都没见过想都没想过 关于这个 有个COCA做过词频统计 可以参考 我们作为爱好者 精力和时间等都很有限 又想为大家出一份力 所以 我们不大可能把OED中的每个词都搞出来 如果是能从最常用词起步 逐渐向外扩展 延伸到50000戓100000,其余的遇到了 就自己解决 现在正像你说的那样 途径和方法很多 选择更多 没必要一个人做得尽善尽美 就是在有限的范围内 尽量做到满意吧 你如果愿意 也可以参与进来 贡献出自己的一分力量

另外 顺便说一下 其实 对于纯粹的翻译 我觉得吧作用其实是有限的 因为要读懂OED这样的作品 并不是说 你把每个词语都弄明白了 每个释义都搞懂了 这个单词就搞明白了 在我看来 其实不是这样的 看懂词义这只是看词典时最低的 也是最起码的,真正的读懂是从这些词义中读懂、弄明白整个单词的词义逻辑和用法逻辑 要做到这一点 就我个人的经验来说 除OED外 其他词典(暂不考虑W3)都不具备这个条件 而就读者而言 能具备整体思考、领悟能力的 应该是少之又少 所以 就我个人来说 更倾向于做一本在OED的基础上 做进一步加工和深化的东西出来 把高深、隐秘的东西给挖掘出来 让各个层级水平的读者都能从中体验到语言的精髓 感悟到人之思维无所不在 从而激发自我的能动性和创造力 而翻译OED 对于进一步加工OED 应该说是很基础的一步 正如我们现在看到的大部头 无不是从以前的无名小卒开始 代代积累 终成今天煌煌巨著 像无论是汉语大字典还是汉语大词典 无不如此 OED同样也是 翻译OED工程至巨至难 我们是有认识的 不过想想 编OED难吧 他们做了 编汉语大词典难吧 他们做了 编说文解字难吧 许慎做了 天下事 无关难易 如果自己认为有责任有义务 自会勉力去做 如果认为事不关己 自然会躲得远远的 生怕自己惹上什么麻烦 人心大概不过如此 大家看看咱们论坛上有多少人为了他人方便 默默付出 不计个人得失 无论他们的作品如何 他们的自我奉献和牺牲精神以及分享精神 都是令人敬佩的 而我们之所以想着翻译OED 其实也是受大家的精神感召 正因为此事非同小可 我们才公开征求大家的看法意见 希望大家出谋划策 有力出力 尽量把它做好 你说呢

到目前为止 大家的看法总结下来基本上是:赞成的和怀疑的。赞成的,很简单,干就是了。怀疑的,比较复杂,有认为方法不可行的 有认为AI不可靠的,有觉得质量没保证的 正如前面说过的 我们可以把翻译限定在一定范围内 用AI+人工的方式 尽量把它做好 即便如此 我们仍然要突破学力、技术诸难关 我们呼吁各位大佬伸出援手 大家一起把这件好事 大事做成 做好!

我读英文很多年了,阅读范围也比较广泛,可能因为水平低下,学殖浅薄,基本没觉得有什么时候必须查询OED。早年打开光盘文件浏览过若干,此后它就在硬盘的一角落灰吃土了。某些词常用词典查不到,Google一下,看一下例句、别人的用法和解释,基本差不多了,很少觉得还有继续追问研究的必要,词典再牛,不会大于例句和用法。抱着类似的态度,我个人并不看重那些”高大全"的词典,它们因为大,编辑、更新困难,错误难以纠正,也经常过时落后了,跟不上语言自身的快速变化。口碑好的常用词典有几部,如果查不到,就在大型数据库里搜索用例,自己总结提炼语义。

词典很多 大家根据自己的喜好选择就好 英文的嘛 你选牛津高阶 朗文 剑桥都没关系啊 中文的 你自然可以尽管用新华字典 管它啥汉语大字典 对吧 你自己够用就好 每个人都有自己的学习习惯 关注自己的就好 我们当然也不能说我们不用 就说辞海辞源 中国大百科不列颠大百科没用 对吧 如果照这个思路来看 可能地球上99%的东西 都没必要了 其实 语言这东西吧 只要自己能力够 手段够 啥字典不字典的 根本没必要 许慎当年在墓穴中写说文解字 纯粹是吃饭撑的 P用啊 还有那些啥甲骨文 毛用啊 对吧 啥OED 都是闲得蛋蛋疼的一帮东西搞出来的吓唬人的玩意 就是一堆废纸而已

我挖野菜 喝山泉 住山洞 不照样活得好好的嘛 你们何苦辛苦去种地 弄什么海味 建啥高楼 更可恶的是 跑到月亮 火星上去干嘛 影响别人做梦!

喜欢研究语言及其词汇发展历程的,需要看OED。

你吃错药了吧,我在上面说一下自己的词典使用经验。和你扯这么多不相干的有什么关系?OED当然用处很大,但它主要是针对母语使用者中上级水平的,在本论坛,有几个人,有谁母语是中文的可以把英语写得、说得跟妈语一样流利的,我是没见过,我倒看到很多人基本是好高骛远、贪多勿得、叶公好龙。

这些人真的需要现在错误百出的ai翻译slop?

我前面说了 你自己喜欢 够用就好 对吧 每个人都有自己的选择 没关系呀 大家只是平等交流 自由表达自己的看法而已 我没有不尊重你 请你发言也不要人身攻击 注意下措辞 好吗

ai翻译的用处很大,效率高,价格便宜,品质如今也不错,但有适用对象,比如格式简单,内容相对平易通俗的文字,比较专业的文本专业要求自然水涨船高,我的经验是现在的顶级ai也不能胜任。

你说的很对的 如果AI完全可靠可信 随便谁一弄就成了 对吧 而且OUP搞 不是更权威么 那么简单的事 何苦吵来吵去的 何苦呢 对吧 希望多提建设性意见 纯粹的没有根据的怀疑就算了

人家编者的目的其实很明确 是全面展现一个词在历史上发展变化 根本不是咱们在常见的词典里面看到的那样 只是方便查这个词有什么意思 这就决定了 这本词典的读者根本不可能是普通的读者 但是呢 普通读者中可能有的人想往上看 但又似乎够不到 这样 翻译就可以帮上这个忙 有能力有手段的 自然不需要这个

我的意见很有建设性,不要好高骛远,贪求一口吃个胖子,完成不世功业,先从较小、较容易的项目入手,比如用ai翻译一本10万字的书/词典,再自己校对一下试试深浅。经验丰富了,对工具、自己的能力和群众的热情有了一定的把握,赢得了信誉,再振臂一呼从事大项目。

我记得本论坛曾组织过OCR理工科大词典、OCR汉语成语大词典,有些人号称要校正补充《汉语大词典》,我当时都怀疑否定过,有些人也说我是泼冷水,打击别人的热情,这些年过去了,这些大项目干得怎么样了呢?全是虎头蛇尾的烂尾工程。

大工程 大项目能不能成 取决于很多因素 即便有些人做的事 后来不一定成功 但至少人家想了 干了 如果连想都不敢想 那啥事都做不出来 你说的脚踏实地 这也是很重要的 你可能觉得我们这帮人是做白日梦 其实你不知道的是 我从2000年前就着手弄英语词义 最近这10几年天天在想在做 编写的东西也超过1000万字了 你说的好高骛远 确实有 我也反对 但不能因为这样 别人就不能去想去做了 我个人认为 关键是 想了做了 就脚踏实地去干 把它做好 你说 你也学英语很多年了 阅读广泛 有没有让自己进入更高的境界?我是自学的英语 以前有阅读 应该不是很广 我一直关注单词的词义 这是我一直想要着力解决的问题 为了写我的单词论 自己着手从词典中去解读词义 日复一日 年复一年 啥都搭进去了 这难道不是脚踏实地?你与其担心怀疑 不如自己实实在在做点力所能及的事 你说呢

提醒一下各位 咱们在此平等交流 看法做法不一定赞成支持 尽管表达自己的想法就好不要上升到人身攻击 尊重 礼貌 平和 友好 这是我们应该秉持的态度 不要让自己表现影响他人心情就好

古人说 嫦娥奔月 到了明朝 有人 把自己的椅子上绑上炮仗 结果自然是失败了 我们不能因此嘲笑别人 更应该从失败中去寻找教训 所以 随着后来各学科知识的发展 人类不是终于上了月球 进入了深空嘛 某些在某个时间看来是不可能的事 只要坚持去做 且方法得当 相信终会有成功的一天

你说的这些资格和ai翻译OED有什么关系呢,编写过1亿字,于是当下ai翻译专业文本质量就更高了,或者校对翻译就更容易了?

我也来摆一个资格好了,我去年迄今,用ai已经翻译过几百万或者过千万文字了,这些翻译文档,我也大致检查过质量,基本认为是可用的。之所以粗略可用,一个重要因素是我选择的是ai相对容易处理的文本。

我用ai翻译的文本/图书,有一部分已经分享到github, GitHub - mahavivo/Translation: AI 译书试验 ,人人都可以查看。

2 个赞