10月21日,阿里完成全球首个多语言实时翻译的电商直播,该直播展示了AI无惧嘈杂环境、口音不标准及口语化语言风格等问题,实时将中文直播内容精准翻译成英语、俄语、西班牙语等语言。阿里方面透露,该技术将大规模应用于2020双11。
“语言”问题是不同地域商家和买家之间难以跨越的大山。数据显示,速卖通上约96%的中小企业无小语种翻译能力,而通常一个直播间就覆盖了十多个语种,82%的中国商家因此而放弃跨境直播。
尽管AI能辅助文本翻译,但直播场景的翻译任务更加复杂,它需要先后进行语音识别和翻译两个过程,并要克服口音不标准、口语化表达、直播环境嘈杂、商品专业名词多、新品新词更迭快等问题。例如,“然后我们的话新品大家的评价也看了”是一句口语化的句子,正确的翻译应为“Then we have read everyone's comments on new products”,但传统的翻译引擎很容易错误地翻译成“Then we also looked at our comments on new products”(然后我们也看了我们对新品的评价)。
为解决机器听不清、听不懂的问题,阿里在业界通用方案的基础上自研了更智能的语音模型,可在嘈杂的环境中“听清”直播内容;同时,在AI翻译任务过程中创新性集成了视觉信息的识别结果,可将口语化句子改写成正式表达句子;此外,达摩院将多领域的知识融入翻译模型,能举一反三,无需重新训练便能快速学习不同场景里不断更迭的专业名词。
过去几年,阿里AI翻译技术历经多次迭代升级,目前可提供214种语言的高质量翻译,一天可翻译3000亿个词语。并创造多项世界纪录,曾获2018国际机器翻译大赛(WMT)翻译任务5项语向冠军,质量评估任务6项冠军,30多项相关研究成果被国际AI顶会收录。同时,该技术也逐步应用于阿里巴巴内部及外部企业客户,日均调用量超过13亿次。
达摩院机器翻译团队负责人骆卫华表示,“让机器听清、听懂是实现精准翻译的基础,达摩院希望通过创新的AI算法继续攻克电商、教育、医疗等专业领域的翻译难题,帮助人类跨越语言障碍。”