谷歌翻译无法取代人工翻译,这是它的本质决定的

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

谷歌翻译无法取代人工翻译,这是它的本质决定的

腾讯科技编者按】《大西洋月刊》近日发表认知科学家、语言爱好者、翻译家道格拉斯·霍夫萨达特(Douglas Hofstadter)的文章,称谷歌翻译使用的虽然是最先进的人工智能(AI)技术,但测试表明,它翻译语言的水平距离取代人工翻译还差得远。以下为原文内容:

我最初对机器翻译感兴趣是在1970年代中期。近来,由于“深层神经网络”的使用提高了机器翻译的质量,一些人认为,机器翻译在数年内就会取代人工翻译,而翻译人员将会变成质量控制人员和故障修复人员。

谷歌翻译的本质就是绕开对语言的“理解”

谷歌翻译可以很迅速地把A语言翻译为B语言。有人认为,如果一个软件可以如此流畅地对文字进行处理,那么这个软件肯定知道这些文字的意思。这种与AI程序有关的经典幻觉被称为“伊丽莎效应”(eliza effect),因为早在20世纪60年代,就有一个名为伊丽莎的短语生成器假装成心理治疗师,令很多与之互动的人产生了诡异的感觉,好像伊丽莎能深刻地理解了他们内心感受似的。

几十年来,很多聪明人都被伊丽莎效应困住了,就连一些AI研究人员也是如此。谷歌翻译这样的软件其实并不理解词语的意思,不仅如此,谷歌翻译的本质就是绕开对语言的理解。

人类是怎样翻译文章的

对我而言,“翻译”这个词散发着神秘而令人回味的光环。它代表了一种深刻的人性化艺术形式,是将A语言中的思想清晰优雅地转换成B语言中的清晰思想。翻译不仅要做到清晰,还应该保持原作的原汁原味。每当我翻译的时候,我都会先仔细阅读原文,尽可能清晰地理解含义,让它们在我脑海中回荡。让原作中的内容触发各种相关想法的意念,在我脑海中创造出相关场景的丰富“光环”。不用说,这种光环大部分是无意识的。但只有当我的脑海里充满了这种光环时,我才开始尝试用第二种语言来表述它。

简而言之,我并不是简单地把A语言中的单词和短语转换为B语言中的单词和短语。而是在无意识中构建出图像、场景和想法,并用我自己曾经阅读过的,或在电影中看到,或从朋友那里听到的经历来领悟它,只有当这种非语言的、形象的、体验上的、精神上的“光环”出现——只有当原作含义的泡沫飘浮于我的大脑中时——我才开始输出目标语言中的单词和短语,然后修改,修改,再修改。这个以含义为媒介的过程听起来可能不够酷炫,毕竟谷歌翻译每两秒就能翻译一大页,但是任何严肃的翻译人员都是这么做的。

实验用谷歌翻译汉译英

我用谷歌的软件来把几段法文和德文翻译成英文,结果有不少错误。而当我试图用它把中文翻译成英文时,发现效果更糟。我选择的是杨绛在回忆录中写的几段话。

“锺书到清华工作一年后,调任毛选翻译委员会的工作,住在城里,周末回校。 他仍兼管研究生。

毛选翻译委员会的领导是徐永煐同志。介绍锺书做这份工作的是清华同学乔冠华同志。

事定之日,晚饭后,有一位旧友特雇黄包车从城里赶来祝贺。客去后,锺书惶恐地对我说:

他以为我要做“南书房行走”了。这件事不是好做的,不求有功,但求无过。

谷歌翻译成的英文有些怪异,首先没有提到“锺书”这个名字,要么直接使用代词he,要么翻译成book。

而且谷歌翻译说锺书是研究生,明明原文写的是他在兼管研究生。

“毛选翻译委员会”也没有翻译对。

“永煐”则变成了“Yongjian”。

至于“南书房行走”,谷歌翻译把它直接翻译成了 “South study walking.”。

(南书房行走,又称南书房翰林。为中国清朝的官衔之一,不属于正式官职,一般由当时的御用知识份子翰林来担任。)

总而言之,谷歌翻译出来的英文虽然都由英语单词组成的,但却不够真正地传达含义,所以你不能说它是英文,它只是英文词语的大杂烩。

有些人可能会觉得我为了挑刺,故意选了一些非常难懂的段落来做实验,实际在绝大多数的段落中,谷歌翻译的效果更好。虽然这听起来好像是那么回事,但情况并非如此。我把我正在读的书中任何一段输入进去,输出的结果都会有大大小小的翻译错误,包括上面例子中那样莫名奇妙的错误。

当然,我也承认谷歌翻译有时会输出一系列看上去很像样的句子(尽管它们可能是误导性的,或完全是错的)。这给你一种错觉,让你觉得谷歌翻译很厉害。不得不说的是,以机器的标准来衡量,它的翻译效果似乎确实还不错。但与此同时,不要忘记伊丽莎效应。谷歌翻译引擎并不是在“阅读”文本,只是在“处理”文本。这个过程与现实经验是分开的,没有记忆,没有意象,没有理解,没有含义。

扩大数据库并不能解决问题

一位朋友问我:如果把谷歌翻译的数据库扩大一百万甚至十亿倍,它可以基本完美地翻译任何东西吗?我不这么认为。拥有更多的“大数据”不会让你理解内容的含义,这个过程涉及到思想,而缺乏思想是当今机器翻译所有问题的根源。所以我觉得,更大的数据库并不是解决问题的关键。

还有人问,谷歌翻译是否可以使用神经网络,让机器开始真正理解语言。这听起来似乎很有前途,但它仍然不是在尝试超越“单词和短语”这个层面。庞大数据库中的各种统计事实都可以体现在神经网络中,但是这些统计数据仅仅是将一个单词与其他单词联系起来,而不是将一个单词与概念联系起来。各种可以被认为是想法、图像、记忆或经验的心理过程,从计算的角度来说仍然是太难捉摸,因此人们用快速而复杂的统计词汇聚类算法来替代它。但是,这种替代品提供的结果,却无法和真正阅读、理解、创造、修改并判断一篇文章的结果相媲美。

尽管如此,谷歌翻译确实为很多人提供了满意的服务:因为只要它翻译的结果中有一部分是可以看懂的,用户就会感到满意了。我个人并不觉得这算是“翻译”,但是对一些人来说,这真的是很好的服务,对他们来说,这就是翻译。他们的要求是这样的,只要达到这个要求,他们就会满意。

如果机器可以重现人类智能

多年以来,我始终认为人脑是一台机器,是一种非常复杂的机器,而且我强烈反对那些说机器本质上不能处理含义的看法。有一些哲学家声称,计算机永远不会“有语义”,因为它们是由“错误的东西”(硅)构成的。我觉得这么说太轻率了。有些读者可能觉得我在本文中就是这个意思。但其实我的意思是,科技并没有试图重现人类智能,而是试图绕过人类智能,结果不如人愿。

我觉得,机器有朝一日可能会拥有创意、趣味、怀旧感、激动、恐惧、狂喜,因此可能高水平地进行翻译。但是,只有当机器像人一样充满想法、情感和经验时才会出现这样的情况。这一天应该还非常遥远,不过至少我怀有这样的期待。

如果有一天,某个翻译引擎用英语创作出一部文艺小说,充满妙语、情感和声律,那我就真的对它五体投地了。(编译/Kathy)

随意打赏

人工智能取代的职业谷歌翻译软件人工智能本质谷歌翻译翻译谷歌翻译谷歌翻译
提交建议
微信扫一扫,分享给好友吧。