人民网>>国际

机器翻译“山头林立” 还难以取代人力翻译

2014年07月16日17:02    来源:新华网    手机看新闻
原标题:机器翻译“山头林立” 还难以取代人力翻译

   机器翻译出错闹笑话的段子数不胜数,但大数据的应用却令这种技术手段日趋完善。甚至有支持者认为,机器翻译终将取代人力,让人类克服语言障碍交流。然而,技术真能参透人类语言的丰富和微妙之处吗?

  【大数据优势】

  初级机器翻译更像一部电子词典,擅长翻译单个字词和简单句子,但对多义词却束手无策。正因如此,尽管发展多年,纯粹的机器翻译仍然错漏百出。大数据时代的来临,可能彻底改写这种局面。

  如今的机器翻译系统依据统计学原理工作。通常,设计者向机器翻译系统录入优质人工翻译文本。比对源语言和目标语言文本之后,系统能够自动识别,某种语言中的X在另一种语言中是Y。结合上下文,机器翻译系统还能识别在何种语境之下,X应该翻译成Z,而不是Y。

  牛津大学研究机器翻译的专家菲尔·布隆索姆因此认为,机器翻译就是猜。“电脑其实根本不懂这门语言或任何语法,只不过依据统计学原理确定,应该是‘一条狗’而非‘狗一条’,”他说。

  这意味着,输入的文本资料越多,机器翻译的准确率越高。“各门语言的情况不一样,建立一个机器翻译模式,通常需要3000万单词或者100多万个句子,”布隆索姆说。多亏有联合国和欧盟这样的机构存在,其翻译人员历经多年积累起丰富的平行语料库(也称翻译记忆库),为机器翻译研发人员省去不少麻烦。

  这也解释了,以数据和资料庞大著称的谷歌为何在机器翻译领域表现卓越。谷歌的机器翻译专有系统堪称业界典范,能够实现63种常用语言的交互翻译。由于擅长摘取、利用网络资源,谷歌翻译还能实现某些罕见小语种的翻译。

  “网络上有各种人翻译的多种语言文本,有些是高质量的翻译,有些不是,”知名机器翻译专家、谷歌翻译团队负责人弗兰泽·奥赫说,“各种类型我们都会用到,因为获取数据的量至关重要。”

下一页
分享到:
(责编:刘融、杨牧)


注册/登录
发言请遵守新闻跟帖服务协议   

使用其他账号登录: 新浪微博帐号登录 QQ帐号登录 人人帐号登录 百度帐号登录 豆瓣帐号登录 天涯帐号登录 淘宝帐号登录 MSN帐号登录 同步:分享到人民微博  

社区登录
用户名: 立即注册
密  码: 找回密码
  
  • 最新评论
  • 热门评论
查看全部留言

24小时排行 | 新闻频道留言热帖