据外媒报道,机器翻译技术自诞生以来走过了漫长的道路。虽然像谷歌这样的翻译曾经粗糙、不可靠,而且只对最基本的翻译有用,但如今,由于AI的力量,它们可以实现惊人的准确。然而一些古老的翻译方法仍然存在。 比如在Facebook上,句子首先从一种基础语言翻译成英语,然后再从英语翻译成目标语言。
这由几个原因造成,其中一个是缺乏有用的AI训练数据用于非英语语言到语言的翻译。
许多人将单词和短语从英语翻译成法语或从法语翻译成英语,但将内容从法语翻译成西班牙语或西班牙语翻译成德语的人却要少得多。
这使得训练AI理解复杂的语言到语言的翻译是一个相当困难的过程。然而根据Facebook最近发布的一篇博文,这家社交媒体巨头终于解决了这个问题并想出了一个解决方案。
该解决方案以M2M-100的形式出现,这是第一个“多语言机器翻译模型”。该模型可以在100种语言的任意一对之间进行翻译,而无需依赖任何英语数据集。如果怀疑它的有效性则可以自己检查,因为该模型是完全开源。
Facebook表示,跟它所谓的“以英语为中心”的翻译系统相比,它的多语种翻译模式更有意义。该公司声称,M2M -100在机器翻译评估的BLEU scale上比这类方法高出“10分”。
据Facebook介绍称,这个项目已经酝酿多年,尽管还有很大的改进空间,但该公司对目前所取得的进展感到满意。
目前还不清楚M2M -100何时或是否会直接在Facebook上推出。