1947年,美国数学家、工程师沃伦·韦弗与英国物理学家、工程师安德鲁·布思提出了以计算机进行翻译(简称“机译”)的设想,机译从此步入历史舞台,并走过了一条曲折而漫长的发展道路。此后65年来,机译成了国际学界、商界甚至军界共同角逐的必争之地。
机译是涉及语言学、数学、计算机科学和人工智能等多种学科和技术的综合性课题,被列为21世纪世界十大科技难题。与此同时,机译技术也拥有巨大的应用需求,随着经济全球化和互联网时代的发展,克服语言障碍,成为国际社会共同面对的挑战。
从上世纪80年代中期开始,基于语料和多引擎机译方法的广泛运用,机译系统的性能和效率有了明显提高,各式各样的翻译软件如雨后春笋般问世,而互联网的普遍应用,则使在线翻译成了当今机译的重头戏。
机译分为文字机译和语音机译。在文字机译方面,谷歌目前处于领先地位。它可提供65种主要语言之间的即时翻译,包括字词、句子、文本和网页翻译。谷歌的文字机译主要是以机器学习为基础,构建统计翻译模型;往计算机内输入大量的文字文本,通过海量统计数据来提高译文的精确度。谷歌的成就主要得益于统计学方法和云计算技术。英国《经济学家》周刊最近刊发的一份报告称,谷歌一天的机译量,相当于全球一年人工翻译的总量。目前,每个月都有两亿多人在使用谷歌的在线翻译。
在语音机译方面,谷歌目前也处于领先地位:它可以通过声音实现自动检索,再将语音交互技术和机译技术结合在一起。时下流行的安卓智能手机就具有这种较强的语音机译功能。据美国《探索频道》报道,微软最近研发的语音翻译软件,可以将用户所说的话快速翻译成其他听者的母语,而且还能保留用户的口音、音色和语调,听上去就像用户亲口说的一样。
机译消除了不同文字和语言间的隔阂,堪称高科技造福人类之举。但机译的质量长期以来一直是个问题。美国发明家、作家、未来学家雷·科兹威尔前不久在接受网络媒体《赫芬顿邮报》采访时说:“到2029年,机译译文质量将达到人工翻译的水准。”不过,也有机译专家表示,按照著名的“图灵测试”和“摩尔定律”,机译译文质量或许下世纪才能达到人工翻译的水准。因为机译的若干理论难题至今都没有从根本上得到解决,某些方法和技术也没有实质性的改进;机译系统的性能还不尽如人意,尤其是译文质量,离理想目标仍相差甚远。中国数学家周海中认为,在人类尚未明了大脑是如何进行语言的模糊识别和逻辑判断的情况下,机译要想达到“信、达、雅”的程度是不可能的。这一观点恐怕道出了制约译文质量的瓶颈所在。