当前位置: 华文星空 > 心灵

苹果画离线大模型翻译大饼,国货先圆上了

2024-11-16心灵

毕业十几年,在学校学的英语又还回去了。最近因为工作原因再次需要大量翻查英文资料,本想着进入了大模型时代,早就有人说翻译工具已经进化得要淘汰英语专业了,但真的到自己用起来,发现完全不是那么一回事。

这让我想起之前在网上疯传的一张梗图:日本人要提醒大家让厕所保持干净,就贴了个机翻的告示,但又生硬地机翻成中文,成了 「漂亮地请使用厕所」。

就是这种抓狂的感觉。都说是AI翻译时代了,但翻译体验真谈不上好。特别是一些需要比较地道翻译的句子、文学作品,传统的在线翻译,包括苹果手机自带的翻译,都显得错漏百出。比如我在看【哈利波特】原文时,有这么一句话:「Hermione was the last person to do anything against the rules, and here she was,pretending she had, to get them out of trouble.」

这里是常见的网络在线翻译:

只要有一点英语基础,都能看出在线翻译工具翻译的这句话,就是机翻水平,不仅语言不流畅,还有明显的「望文生义」问题。换到苹果手机自带的翻译软件,画风是一样的:

翻译结果不能说是丝毫不能用吧,只能说是和原文毫不关联。 实际上这种带有一些文学性的英语句子,就有点像中文里的文言文,传统的翻译工具是基于NMT(神经网络机器翻译)进行翻译的,也就是我们在一些游戏、影视汉化作品中提到的「机翻」,翻译单词或词组还行,但和上下文紧密联系的句子就会这样不知所云了,有种「每个字都懂,放在一起就看不懂」的感觉。

为了测试,我还专门从英语教材上找了一段话,原句「Mary loves spending her weekends in the garden. She really has a green thumb.」来自初中的课外阅读文段,翻译出来的画风是这样的:

如果说苹果翻译把「has a green thumb」翻译为「绿色的拇指」是望文生义的无奈错误,那么传统在线翻译工具给出的结果「她真是个菜鸟」,就简直是误人子弟了。后面发现这句话如果加上句号「.」,传统在线翻译的效果又会好很多,变成这样:

主打的就是一个差一个字符,答案相差十万八千里,稳定性还是个问题。

究竟上面两个文段翻译的正确答案是什么呢? 都说基于大模型的翻译工具效果会好很多,我们换到最近也上线了大模型能力的有 道翻译看看。从结果来看,逻辑更合理,尤其是后半句,通顺了不少。

再来看下一句「Mary loves spending her weekends in the garden. She really has a green thumb.」,大模型翻译是这样说的:

这下「has a green thumb」的本意,我们终于知道是「有园艺天赋」了。

通过两组对比显而易见,基于大模型的翻译,无论是识别语境、上下文联系,还是翻译的准确性,相比传统的机器翻译,的确可以用「完爆」来形容。

云端大模型翻译虽好,但是…

在理想情况下的大模型翻译的确很强,但在实际使用中又不是这么一回事。

首先,现在常见的大模型翻译工具需要联网,如果网络条件不太好,结果生成会非常慢甚至无法生成,对网络稳定性的依赖程度很高。另外企业也不是慈善家,搭载了大模型的翻译基本都要开会员收费。

对使用翻译功能最频繁的学生群体来说,「需要上网」这件事偏偏就是家长担心的。 家长肯定会担心上网之后跑去浏览五彩缤纷的网络世界耽误了学习,毕竟谁小时候没有打着学习的旗号,玩下电脑,玩下平板什么的呢。 另外如果需要高频率长时间都使用翻译功能,付费、开会员等费用长时间叠加,也会是一笔不少的支出。

翻译工具的未来,在离线大模型中

因此,如果需要高频率、长时间地进行翻译作业, 比如学生们的外语学习,更需要的是一款不依赖网络,但又能调用大模型翻译的翻译工具,所以这个大模型部署在本地当然是最好的。

相比起云端大模型,离线大模型不依赖网络,因此所有和网络相关的问题,比如网速快慢影响速度啦、使用者因网络而分心啦,都与它无关。 而且因为只需要负责翻译这个垂直场景的任务,不像通用大模型要处理的指令纷繁复杂,对算力的要求没有那么高,不需要非常大的规模,就能干好翻译的活。

至于载体,搭载离线大模型的手机会是一个好选择吗? 目前看来手机上的AI翻译功能还是以云端大模型为主,还是要联网;即使能做到离线,翻译出来的结果一股NMT味。 而且,手机这个玩意儿,除了翻译之外能娱乐的事情就太多了,会有家长放心自己的孩子用手机的时候只用来翻译吗?

这样看, 搭载了离线大模型的词典笔,才是最优解。

小小的词典笔,还真的给他做成了

一直以来我都觉得词典笔「哪里不会点哪里」真的很神奇,可以像笔一样划词翻译,更符合日常学习的逻辑。 可惜是联网时词典笔的翻译还算好用,一旦离线了翻译效果直线下降,查单词可还行,涉及长句子或段落就有点尴尬,偏偏词典笔的使用场景,大多数都是教室、课后自习等严格管控上网的场景。

所以如果是词典笔先做出来离线大模型翻译功能,看似意外,又十分合理。 这款我们多次提到过的有道词典笔X7还真干成了!直接来看实测效果:

还是以那两个经典句子为例,「Hermione was the last person to do anything against the rules, and here she was,pretending she had, to get them out of trouble.」有道词典笔X7(搭载子曰教育大模型「离线版」)给出的翻译是:

和在线版一样没有犯望文生义的错误,甚至翻译的句子更加通畅了。 「was the last person to do anything against the rules」在上面的网页版中翻译成「最后一个违反规则的人」虽然也符合愿意,但是理解起来还是有点绕,词典笔上的翻译「最不可能违反规则的人」,就结合了「the last person」的引申义,显得更加自然好懂了。

只看这个句子,有道词典笔X7的离线大模型翻译效果确实不错。

另一个句子「Mary loves spending her weekends in the garden. She really has a green thumb.」也是如此,有道词典笔X7的翻译也相当准确且地道。

前面提到看英文小说还有许多难懂的句式,也拿来试试,这下看起书来真是轻松不少。

而且在有道词典笔X7上,还展现了一款离线产品该有的优势: 笔尖识别区划过文字就能快速识别,不一会儿就能生成了上面这些准确的翻译来。整个过程几乎不需要等待,也不用去找各式各样的翻译网站(工具),翻译结果即见即所得,比手机的先拍照再翻译简单多了。

沉浸感,是使用有道词典笔X7的协助阅读的最大感想, 看完【哈利波特】的整个章节基本没有什么停顿感,遇到不懂的扫过就出结果,看完翻译就拿开继续阅读,整个体验十分顺畅。

要是当年读书的时候有这种神器,不说成绩进步考清华那么夸张,至少去做英文阅读,看一些英文的书本,都会兴趣大增吧!

有道闷声做大事

其实早前有道放出了支持大模型的线上翻译工具时,我心里是没有太大波澜的,毕竟做翻译起家的,而且谷歌Gemini、ChatGPT又不是没用过。 但有道在词典笔X7上推出离线大模型翻译,没有过多的宣传,直接上线,就交出了媲美云端大模型的翻译效果,真的觉得挺佩服的。 手机有着强劲的SoC,内存都拓展到16GB了,搭载离线大模型都还显得费劲,但有道可是将一整个离线大模型,放到了一根小小的词典笔上。

纵观市场,有道应该是首个将离线大模型做到那么小的硬件上的,在产品背后,无论是算法质量还是工程创新,肯定都做了不少努力。

硬件方面,有道词典笔X7用上了定制芯片,运行内存也提升到1GB, 在一款小小的词典笔上就用上了大内存,还卷起了芯片能耗比,属实有点惊人。

词典笔搭载的子曰教育大模型离线版也是一个专为语言翻译和学习准备的大模型,虽然规模肯定和云端大模型没得比,但胜在术业有专攻,专业性比通用模型强太多了。 在翻译这块,据称子曰教育大模型离线版比现有词典笔常用的NMT模型规模大10倍, 从翻译效果来看,无论是信雅达程度还是生成速度,都没什么好挑剔的了。

而且子曰大模型的潜力也是十分强劲,是一个一直进化的大模型。 有道在全学科学习方面造诣颇深,说不定在未来还能可以为离线大模型扩容,围绕科目学习拓展更多能力,比如解释这样翻译的文化背景、相同用法的例句、引经据典等,也不是没有可能呀。

就目前而言,使用体验方面,有道词典笔X7配合他家独有的大笔头进行多行扫描,在遇到一些跨行的句子时一次扫描就可以识别全了,大大提高阅读效率。 而且,不了解词典笔这块儿的人肯定没想到,小小词典笔也是通过OTA来获取新功能。以后,有大模型和没有的词典笔是两个世界了,有道能直接让老用户「鸟枪免费换炮」,说一声厚道不过分吧。

拥抱潮流的产品总能走得更远

在这次翻译工具的体验中,感触最深的是当一些人还将大模型视为翻译行业的洪水猛兽时,更加优秀的品牌却会主动拥抱变化。

词典笔这类产品已经出现很长一段时间了,从最开始的「点读笔」到现在的智能词典笔,翻译始终是核心功能。 而AI的出现,尤其是大模型强大的语言能力、极强的上下文联系能力,刚好打在了传统机器翻译的七寸上。

但AI影响的又何止翻译行业呢。

AI的出现大幅改变了手机摄影的形态,曾经谷歌相机通过强大的AI算法,让不少原本拍照一般的机器实现画质颠覆,给了当时还在执着堆料的「拍照手机」当头一棒 。但现在拍照效果出色的华为、OPPO等国产手机都有AI的深度参与,会利用大模型的力量提高画质,巧妙地将「敌人」的优势归为我用,完全不输苹果、三星。

AI对汽车行业也有颠覆性影响。 新能源车时代在大模型、算法的帮助下,高阶辅助驾驶功能突飞猛进,新势力车型如问界、小鹏等在高阶辅助驾驶方面对传统合资品牌呈现出了碾压姿态,智驾、智能座舱的差距越来越大。 将攻击自己最锋利的矛归为己用,这才是迎接时代洪流的正确态度。

再加上这次率先实现离线大模型翻译的有道词典笔X7,一个个成功的案例告诉我们,好的产品就是需要在不断推进产品进步的同时吸收外部的先进技术。 新事物到底是危机还是转机全看眼光,最终还是那些眼光更加长远、能拥抱潮流的品牌和产品,会在不断进步中成为经典。