借助人工智能脸书开发出更快更精确翻译方法
脸书(Facebook)的研究人员已经开发出了一种更快、更准确的方法,使用人工智能翻译乌尔都语和缅甸语等低资源语言。
据《福布斯》杂志报道,这项突破将在自然语言处理顶级会议EMNLP上展示。由于Face-book这一社交媒体巨头使用自动语言翻译来帮助世界各地的用户阅读适用他们的语言的帖子,因此这一突破对其可能很重要。
Facebook人工智能研究院(FAIR)部门的团队,从维基百科等公开网站中获取大量不同语言的不同文本,以此来提升机器翻译(MT)。
需要注意的是,这些文本是相互独立的。“建立一个平行语料库很复杂,因为你需要找到精通两种语言的人来创建它。例如,如果你想建立一个葡萄牙语和尼泊尔语的平行语料库,需要找到精通这两种语言的人,这是非常困难的,”研究科学家兼FAIR巴黎研究实验室主任AntoineBordes表示:“另一方面,建立葡萄牙语和尼泊尔语单语语料库非常容易:无论它们是否为平行句子,也不管它们谈论的是否为同一件事,你只需要从葡萄牙语和尼泊尔语网站下载网页就可以了。”
大多数语言翻译计算机系统使用单语语料库和平行语料库来学习。Bordes称:“我们方法的新颖之处在于,只用从单语语料中提升MT系统,我们不需要任何平行语料。理想化来说,如果一本书是用外语写的,我们可以用我们的模型将其翻译成英语。”
新闻推荐
本报讯12月12日,中国中铁电气化局高铁电气公司研制的轨道交通接触网产品,通过了以色列特拉维夫红线轻轨项目建设方、监理、...