外星人登录地球,竟说出这句话
以下文字为音频内容文稿。如有需要,请点击收听。

今日内容焦点
1. 有人几天内掌握28国语言,原因却让你恍然大悟?
2. 与外国人聊天,不会对方语言也别怕,知道这些你依然谈笑风生;
3. 出国旅游,有这个办法搞定所有语言问题。
今天我们来看看AI与翻译的碰撞。早在去年的世界互联网大会上,百度的CEO李彦宏就说过,未来翻译这个职业将会被替代,接替者就是人工智能。
今年六月,正是求职旺季时,几家国内知名招聘网站同时PO出了两份“牛人”简历。这两份简历牛在什么地方呢?两人都是应聘外语口译、国际导游相关的岗位,其自我评价一栏写着:“精通英、俄、日、法、韩、阿拉伯等28国语言,具有极其优秀的听说能力。”
想想我们学了这么长时间英语,不少人被英语虐得体无完肤,咬着牙才勉强过了四六级。除了英语,国内还有很多小语种学习者,但不管怎样,精通3门语言以上已经算是很难的事了,而这两位“求职者”精通28国语言,可怕吗?
有人可能会质疑了,这是人类的简历么?其实这的确不是人的简历,这是人工智能的简历,是一家科技公司搞出来的一个噱头。但简历风波却引发了广大翻译员的思考:我们学语言学得那么痛苦,付出那么多心血,竟还赶不上人工智能?

近年来,人工智能在自然语言处理方面取得突破性进展,特别是去年谷歌推出神经网络翻译系统,部分语种间相互翻译的结果甚至媲美人类。有网友发表评论说“作为翻译,看到这个新闻的时候,我理解了18世纪纺织工人看到蒸汽机时的忧虑与恐惧。”
人工智能正掀起第五次工业革命,翻译员会不会在这场革命中被淘汰呢?今天我们就来仔细剖析一下。
其实机器翻译并不是什么新名词。我们早就用过对谷歌、百度、微软、有道等等翻译软件,早在2006年,谷歌就上线了以统计机器翻译为核心技术的谷歌翻译。

统计翻译系统是将原始句子分成块,在大量语料数据库的对应下,通过寻找数据库中所有人类翻译过的相同词块,把每个词块可能的译法都列出来,进行组合。当然,这种组合可能是无穷的。在所有的翻译组合中,有些译法出现的频率可能会远高于其他译法。根据每种译法出现的频率,我们可以给它们设定一个数值,然后在所有可能的译法中输出分值最高的一种。
这个服务让我们能任意在两种语言间切换,尽管有时它的翻译结果让我们哭笑不得。最经典的段子就是那个“我想下班”,会被它翻译成“I want to work.(我想去上班)”,毕竟汉字太博大精深,系统可能还没搞清楚如何用英文阐释“上”和“下”。要是企业老板出国谈生意,只带个谷歌翻译,那翻错了怎么办,那可就是巨大的商业损失了啊。所以每逢正式的用途,人们仍愿意出高价雇个学英语的学生,甚至是专业的同声传译来确保准确度。而且统计机器翻译系统难于构建和维护,每一对语言之间都需要构建庞大的语料库,其中的语料数据需要经过专门的人划分和标注,耗时耗力。
直到2016年,Google翻译推出了基于神经网络翻译NMT(Neural Machine Translation),将机器学习技术纳入翻译中,还宣布翻译误差较此前被降低了55%-85%以上,特别是翻译一些与英语相近的语言,如西班牙语、法语,机器翻译的结果接近人工翻译的水平。对于难度更大的中—英翻译,它的水平也有明显提升。
神经网络翻译将机器翻译带到一个全新的纪元,其先进之处,在于翻译逻辑模仿了人脑的表达模式,把一句话中所有词汇的语意融合在一起进行综合理解与分析,能处理语言的无限变化。

下面我们来讲讲神经翻译系统的核心RNN——循环神经网络。循环是什么意思呢?简单来说,循环就是倒回去看。想想大家做英语四六级题里的中英翻译时,是怎么做的呢?我相信肯定没有人看一眼句子,就直接写出翻译的吧。我们会来来回回地看,会记住单词所处的位置,看主语是什么、主语是单数还是复数、判断句子所处的时态,像这样理解整个句子的含义后我们才敢下笔。
但是这样一个“倒回去看”的动作对一台机器来说却没有那么简单,为什么呢?因为它没有记忆啊。机器在处理信息时,都是处理单个字词,你输入一个字词,普通的机器翻译会计算并输出结果,你再输入一个,它再出一个结果。它处理完第一个信息后没有进行过的计算的记忆,所以也不会影响对第二个字词的处理。可是大家都知道,一句话中字词不同的排布会产生完全不同的意思,如果机器不会“多瞥几眼”,充分理清各种字词的逻辑关系,它就只能跟着字词的常见意思走,将“hey, man”翻译成生硬的“你好,男人”。
循环神经网络就能解决这个问题,它收到一个输入,也就是一个单词时,不光是考虑这个单词可能会是什么意思,还会充分考虑前面的单词的影响,走一步,回望几步,让本来各自独立进行计算的系统有了前后逻辑关联的能力。
在谷歌神经翻译系统的官方介绍中举了这样一个例子:将“知识就是力量”翻译成英文。翻译结果为“Knowledge is power”。这个过程就涉及到“多看几眼”的机制。当系统翻译“知”时,它会看看输入的其它字符,然后判断出“知”和“识”的翻译结果有非常强的关联程度,于是它会把这两个词连起来翻译成knowledge。接下来它又判断出“就”和“是”有很强的关系,这两个字和前面的“知识”也有较强的关联,实际上这就是人类学习语法规则——单数名词必须接单数形式的谓语动词,于是它输出了“is”。以此类推,每翻译一个字词时,就倒回去看一下。
“倒回去看”的机制能保证每翻一个字时,都包含了对整句话的理解。如果将翻译比作把食物从生变熟,那传统的翻译方式像把一颗白菜切碎了单独烧熟再拼凑起来,而谷歌的神经翻译系统则是将整颗白菜放到锅里煮,变熟后最大程度保持了逻辑原貌。所以神经网络翻译系统的准确度才能那么高,翻译出来的句子才那么像“人话”。现在你在谷歌翻译中输入“小偷偷偷偷东西”,它都能准确翻译出来“Thief secretly steal things.”。

其实谷歌开始研究神经机器翻译最早出现在2014年底,但当时还不具备商用化的条件。为什么呢?因为这种系统很慢,对于一个在线服务,要是一句话的翻译得等个一分钟,用户早就流失了。理论并不算很新,同期也有其它公司在研发,但Google最大的功绩在于,用了许多的算法去改进模型,改进系统,提升速度。
让我们来看看谷歌翻译的另外一款产品。今年10月5日,谷歌在发布大会上展示了一系列新品,我们之前也提到过,包括新的智能音箱、最新的Pixel 2代手机,发布会接近末尾的时候,谷歌展示了一款可能打破人与人交流的语言障碍的耳机。
这副耳机叫做Pixel Buds,它的特点就是在连上手机后,简单地点击右边的耳机后,就可以通过说话向谷歌助理(Google Assistant)发出指令。你可以让它播放音乐,给你指路,帮你打电话等等。我们一直都说“语音为王”,我们在后续的“AI与家居生活”一讲中还会为大家详细介绍,谷歌的这副耳机也是该战略下的产品。但除了语音交互这个特点,它还可以变成实时翻译器。
戴上耳机后,你只要在手机上打开谷歌翻译的应用程序,然后告诉它“帮我说英文”,接下来你就流畅地用中文说话,手机的扬声器会帮你输出相应的英文翻译。这种反应是双向的,当耳机感应部分听到对方的说话,你还通过耳塞听到翻译。目前它支持40种语言的实时翻译。
这听起来像不像是小时候看的科幻小说中的场景:当外星人来到地球,不会说地球上的语言,但靠着一些先进的设备就能和人类对话。谷歌的这款耳机当然听不懂外星语言,但这项技术可能从根本上改变我们在全球范围内的沟通方式。有了它,就相当于你就有了全天工作的个人翻译,走到哪里都可以携带,走到哪儿都可以理解。

想想这个场景,以前一些游客在国外购物时,还需要拿着手机屏幕费劲地向店员展示谷歌翻译上的文字,“这个商品多少钱”,“有什么性能”,店员再在手机屏幕上慢慢敲出文字回复他们。现在这个场景变得简单了,游客只要戴着耳机说着自己的母语,就能自然、轻松地实现交流的目的。不仅如此,以后英语考听力口语的时候,我只要戴着这个耳机,难道不是轻轻松松地就通过考试了,还学什么啊。

看了这些强大的翻译,回到我们开头提出的问题,人工智能到底会不会造成翻译员的失业呢?
我的看法是不会。机器翻译对应的场景是与人交流的生活化场景,比如上面提到的旅游等,翻译精准度要求不高。而人工翻译更多针对的是专业文件、文学作品,要求“信达雅”,具有相当高的整合性和创造性。
即使是生活化场景中,人工翻译暂时也是不可替代的。虽说有谷歌的翻译耳机,这种耳机也会越来越普遍,但对AI来说,还是很难准确地翻译人所说的话,因为对它来说,日常口语比书面语言更难理解。口语本身就是不连贯的,经常会出现重复、次序颠倒、冗余和语句残缺等现象。要是我们说话时多加几个口语词,将句子倒装一下,系统的处理能力立刻就下降,人工智能立马变人工智障。而且现实世界中,翻译的效果肯定会受到网速、背景噪音等因素的干扰。
除此之外,人工智能翻译也是可以增加需求、增加就业的。当人工智能翻译的准确度较低时,我们可能没有看外文的习惯,但现在我们可以借助高效、精准的翻译软件,轻松阅读外语书籍、网站等,养成了阅读其它语言内容的习惯。在对翻译的需求膨胀的情况下,对人工翻译的需求也会上升。

知识清单
1. 统计翻译系统是将原始句子分成块,在大量语料数据库的对应下,通过寻找数据库中所有人类翻译过的相同词块,把每个词块可能的译法都列出来,进行组合。
2. 循环神经网络让本来各自独立进行计算的系统有了前后逻辑关联的能力。
3. 人工智能不会造成翻译员的失业。机器翻译对应的场景要求翻译精准度不高。而人工翻译更多的是要求“信达雅”,具有相当高的整合性和创造性。

今日思考
你如何看待机器翻译和可能出现的翻译人员失业问题呢?如果你是翻译,你会如何应对人工智能带来的职业冲击呢?欢迎你在评论区留言。

相关阅读
- 03-12营口沿海银行助力企业复工复产 打赢
- 03-12企业医院白皮书V1.0 ——ISTPOS白皮
- 03-12BBG纸尿裤助力一线安心战疫,为“医二
- 03-12长沙市侨联致海外侨胞的一封信
- 03-122020中国(吉林)安全与应急产业博览会
- 03-12中国经济传媒协会联系企业向抗疫一线




















