安徽> 安徽新闻> 正文

机器翻译革命强势来袭 面对“杠精”等网络热词能力有待提高

新华社 2018-09-10 16:27 大字

新华社北京9月10日电,安徽黄山不少出租车司机经常拉“老外”,不会外文也能交流无碍;去年北京的全球机器智能峰会上,各国大咖扎堆演讲,现场却不见同声传译者;更多中国人海外游,面对东京的日文菜单不再一头雾水,漫步在巴黎街头也不再因不懂法语而慌张。

这一切都源于一项近年来不断取得突破的技术——机器翻译。

人工智能推波助澜

全球知名翻译公司“一小时翻译”首席执行官奥弗·绍尚日前警告说,未来1至3年内,基于神经网络翻译技术的机器翻译将会承担价值400亿美元翻译市场上的近一半工作,预计会导致50万名翻译失业。

神经机器翻译(NMT)自2014年在科学论文中首次被提及以来,已使机器翻译领域出现翻天覆地的变化,它开始全面超越以统计模型为基础的统计机器翻译(SMT),快速成为在线翻译系统的主流标配。

神经机器翻译的“神经元”可以学习和收集信息,模仿人类大脑的神经元建立联系。它克服了传统方法将句子分割为不同片段进行翻译的缺点,充分利用上下文信息,对句子进行整体编码和解码,从而生成更为流畅的译文。

市面上的神经机器翻译系统越来越多,国内的阿里巴巴、腾讯、百度、科大讯飞、搜狗,国外的谷歌、脸书、微软等都在布局,这使相关技术发生“质变”。

如今,许多出租车司机都能用手机上的翻译软件,轻松和“老外”沟通。在不少国际会议上,机器翻译干脆直接扮演现场同声传译角色。

语音识别技术发展对这场翻译革命也功不可没。语音识别包括远场识别、噪音识别以及多轮交互,是人工智能的重要切入点。

因此,这场机器翻译技术革命,正是人工智能革命梦想照进现实的重要一环。

应用场景日渐丰富

“两年前,人工智能的翻译质量往好了说,也就是让你能对文本的内容有个大致了解,专业翻译宁愿自己从头开始翻,”“一小时翻译”首席执行官绍尚说,“今天,通过神经机器翻译,人们只要对机器翻译内容进行少量修改,就能获得人性化翻译。”

机器翻译应用量正呈加速增加态势。脸书的用户高达数十亿,为了打破用户之间的沟通瓶颈,该公司去年上线神经机器翻译功能,机器翻译的速度和水平均得到大幅提升。另据官方信息显示,机器翻译在阿里巴巴内部可以每天翻译出几十亿量级的产品信息,每天的在线翻译请求达到数亿次。在电子邮件和网站页面语言转换方面,谷歌公司称,其机器翻译服务每天在全世界被使用超过10亿次。

旅游业对翻译需求更加旺盛。有数据显示,中国已成为世界第一大出境旅游客源国。2017年中国公民出境旅游突破1.3亿人次,花费达1152.9亿美元。解决语言沟通问题正成为越来越多中国出境游客的迫切需求。

许多中国游客借助智能翻译软件和机器,轻松搞定国外道路路牌、餐馆菜单和超市购物,甚至在旅途中认识外国朋友。各大技术企业也在争夺这一巨大市场。

机器翻译的应用场景正不断丰富,越来越多的政府和企业网站需将内容“多语言化”;视频网站可能需要借助机器翻译将视频内容翻译成多语言版本;就连人工翻译服务供应商也会借助机器翻译来提升人工翻译的效率。

人机翻译相辅相成

人类翻译,未来还有需求吗?

人们发现,对于“夫妻肺片”等专有名词以及唐诗宋词,机器翻译能力已有了长足进步,但面对“杠精”等网络热词以及新流行语的翻译能力仍有待提高。

尽管在达沃斯年会等一些国际论坛上,智能同传翻译应用越来越多,但在个别场合,机器翻译也闹过一些令人费解的“乌龙”。

这说明,人工智能翻译要充分考虑复杂性。一些会议现场语言多样,话题专业性强,噪音干扰多,而且讲话者的语言习惯和口音也各不相同,即使能从嘈杂的环境中提取主要音色,语义识别仍充满挑战。

专家认为,人工翻译是一个“阅读-内化-表达”的过程,人类读到文本之后,会联想到相关现实场景,然后给出另一种语言对这种场景的表达。但机器翻译通常只是一个“解码”过程,将原文看成被加密的译文。这样的过程缺乏现实体验,谈不上理解,自然难免出错。

总体而言,人工翻译与纸面翻译供给能力有限,但翻译水准专业、精准,至少目前依然不可缺少;日常交流沟通不需要特别高质量的同声传译,机器翻译在这方面市场前景巨大。

因此,人机应该成为一套耦合的系统,适合机器干的,交给机器;适合人工做的,还是由人完成。不要因为机器翻译的进步,就吆喝着大家都别学外语;也不要因为人工智能翻译的失误,就否定其巨大作用。

(原题为《特稿:机器翻译革命强势来袭》)

新闻推荐

抓住关键环节推深做实“讲严立”专题警示教育———省委常委会及地方、单位党委﹙党组﹚认真开好专题民主生活会综述

—省委常委会及地方、单位党委﹙党组﹚认真开好专题民主生活会综述

安徽新闻,讲述家乡的故事。有观点、有态度,接地气的实时新闻,传播安徽正能量。看家乡事,品故乡情。家的声音,天涯咫尺。

 
相关新闻

新闻推荐