人民网首页

人民网>>国际

机器翻译“山头林立” 还难以取代人力翻译

2014年07月16日17:02 来源：新华网手机看新闻

原标题：机器翻译“山头林立” 还难以取代人力翻译

　　机器翻译出错闹笑话的段子数不胜数，但大数据的应用却令这种技术手段日趋完善。甚至有支持者认为，机器翻译终将取代人力，让人类克服语言障碍交流。然而，技术真能参透人类语言的丰富和微妙之处吗？

　　【大数据优势】

　　初级机器翻译更像一部电子词典，擅长翻译单个字词和简单句子，但对多义词却束手无策。正因如此，尽管发展多年，纯粹的机器翻译仍然错漏百出。大数据时代的来临，可能彻底改写这种局面。

　　如今的机器翻译系统依据统计学原理工作。通常，设计者向机器翻译系统录入优质人工翻译文本。比对源语言和目标语言文本之后，系统能够自动识别，某种语言中的Ｘ在另一种语言中是Ｙ。结合上下文，机器翻译系统还能识别在何种语境之下，Ｘ应该翻译成Ｚ，而不是Ｙ。

　　牛津大学研究机器翻译的专家菲尔·布隆索姆因此认为，机器翻译就是猜。“电脑其实根本不懂这门语言或任何语法，只不过依据统计学原理确定，应该是‘一条狗’而非‘狗一条’，”他说。

　　这意味着，输入的文本资料越多，机器翻译的准确率越高。“各门语言的情况不一样，建立一个机器翻译模式，通常需要３０００万单词或者１００多万个句子，”布隆索姆说。多亏有联合国和欧盟这样的机构存在，其翻译人员历经多年积累起丰富的平行语料库（也称翻译记忆库），为机器翻译研发人员省去不少麻烦。

　　这也解释了，以数据和资料庞大著称的谷歌为何在机器翻译领域表现卓越。谷歌的机器翻译专有系统堪称业界典范，能够实现６３种常用语言的交互翻译。由于擅长摘取、利用网络资源，谷歌翻译还能实现某些罕见小语种的翻译。

　　“网络上有各种人翻译的多种语言文本，有些是高质量的翻译，有些不是，”知名机器翻译专家、谷歌翻译团队负责人弗兰泽·奥赫说，“各种类型我们都会用到，因为获取数据的量至关重要。”

【1】【2】【3】【4】

延伸阅读:

分享到：
(责编：刘融、杨牧)

社区登录

最新评论
热门评论

查看全部留言

>网络聚焦

那些卷入丑闻的性感女星

揭秘毕福剑与前妻离婚内幕

新闻热搜词来源：百度新闻

南京大屠杀公祭习近平谈公祭日李克强亚欧行无人机闯空中禁区呼格案再审结果不动产登记西部冰川萎缩股市年末躁动小年火车票今日开售廊坊幼儿园危房倒塌聂树斌案3大疑问东三省人口流出习近平公祭日讲话李克强谈吃空饷问题中央经济工作会议

精彩新闻|精彩博客

揭秘邓丽君真正死因 39岁韩高恩秀少女蛇腰

24小时排行 | 新闻 频道 留言 热帖