近日,阿里 AI 开源了新一代人机对话模型 ESIM。该算法模型提出两年多,已被包括谷歌、facebook 在内的国际学术界在200多篇论文中引用,更曾在国际***对话系统评测大赛(DSTC7)上获得双料冠军,将人机对话准确率的世界纪录提升至94.1%。
ESIM 模型最初由达摩院语音实验室内的90后科学家陈谦研发,现在已经成为业界的热门模型和通用标准。这支平均年龄30岁的研发团队宣布,即日起向全世界企业与个人开源ESIM模型,与全球开发者共享这一成果,共同推进人工智能技术发展。
在去年 DSTC 7大赛上,ESIM 横扫 NOESIS 赛道,从麻省理工学院、约翰霍普金斯大学、IBM 研究院等近20支参赛队伍中脱颖而出,拿下该赛道两项比赛的冠军。
DSTC 是学术界权威对话系统评测大赛,由微软研究院、卡耐基梅隆大学的科学家在2013年发起,今年举办到了第八届。NOESIS 赛道考察AI的人机对话能力,要求 AI根据给定的多轮人机对话历史,从成百到上万个句子中选出正确的回复。
人机对话系统及其背后的认知智能,是人机交互中最复杂也最重要的技术,曾被比尔盖茨形容为“人工智能皇冠上的明珠”。为让机器快速准确理解人类的表达,ESIM给 AI 装上一套“雷达”系统,赋予它实时检索对话历史、自动去除干扰信息的能力,使它能够给出人类期待的回复。
这项突破将给智能客服、导航软件、智能音箱等应用场景带去显著变化,阿里基于 ESIM 模型研发的智能语音点餐机、地铁语音售票机等应用已在杭州、上海等地落地。
这不是阿里***次开源前沿技术。2018年达摩院开源了新一代语音识别模型DFSMN,吸引众多研究者在该模型基础上开展工作,甚至再度刷新语音识别世界纪录。