【51CTO.com原创稿件】2018年11月30日-12月1日,WOT2018全球人工智能技术峰会在北京·粤财JW万豪酒店盛大召开。60+国内外人工智能一线精英大咖与千余名业界专业技术人员齐聚现场,分享人工智能的平台工具、算法模型、语音视觉等技术内容,探讨人工智能如何赋予行业新的活力。两天会议涵盖通用技术、应用领域、行业赋能三大章节,开设13大技术专场,如机器学习、数据处理、AI平台与工具、推荐搜索、业务实践、优化硬件等,堪称人工智能技术盛会。
人工智能热潮由深度学习技术推动,如今智能客服、语音识别等领域已经与商业场景应用相结合,赋能各个行业。针对这个话题,本届WOT2018峰会特别设置了《人机智能》分论坛。来自京东、扇贝、苏宁的三位大咖围绕“人机智能如何赋能行业发展”进行了主题分享。
智能对话助力京东客服体验升级
京东智能对话研发部技术总监刘丹,在主题为《智能对话助力京东客服体验升级》的演讲中,分享了京东智能对话是如何通过整体解决方案助力客服咨询体验升级的。
京东智能对话研发部技术总监 刘丹
刘丹表示,人工智能能够解放机械性工作,更好地为人服务。过去,整个客户流程包括排班调控、一线接待、运营管理,需要耗费大量的人力和精力。而现在AI正在助力客服体验全面升级,通过全面的端对端的智能对话解决方案,从智能调度、智能对话、智能坐席、再到智能分析,形成一个完整的闭环。
京东坚持以技术驱动消费者体验升级,致力于将人工智能技术与商业场景应用相结合,实现体验升级和创新。京东发展智能对话具有三大独特优势:
- 优秀的团队:多位海内外人工智能科学家,国内最庞大的自营客服团队做业务支撑;
- 优质的数据:围绕零售、金融、物流等领域的核心业务,拥有海量精准丰富的大数据基础;
- 丰富的场景:拥有智能消费、智能供应、智能物流、金融科技、实体零售科技在内的多元场景布局。
智能对话作为京东布局已久的技术领域,目前已经在京东客服业务上进行了成熟应用。从整体上,京东智能对话产品面向京东用户、京东客服、京东商家、外部企业四方向进行布局。面向京东用户,我们推出智能客服、智能语音导航,能给京东用户带来智能化咨询体验,高效且富有人情温度地解决用户问题。面向京东客服,我们打造智能调度(天枢)、客服智能辅助(天弓)、大数据智能分析平台(天象),能帮助他们提高工作效率,让客服感知更全面、响应更迅速,提供给用户更好的服务体验。面对京东商家和外部企业,我们有商家服务机器人(小智)和智能对话解决方案,助力这些企业伙伴实现一站式智能化。
据介绍,京东正在探索下一代对话式电商体验,基于自然语言处理、深度神经网络和机器学习等AI前沿科技打造的智能客服是业内大规模商用的情感智能AI客服机器人,通过多维技术灵活应用,如首创Action/Business/Scene的方法构建业务知识图谱、通过迁移学习、反向翻译、噪声处理的方法打造情感分析模型等,实现意图识别能力和共情能力的突破与提升。
目前京东智能客服已经承接京东90%以上的消费者咨询,拥有4000+京东客服售后标准化技能。提供给京东客服、京东商家和外部企业伙伴的一系列产品服务也在实践过程中日渐强烈地迸发AI赋能的力量,相信随着AI技术的不断发展,未来智能客服对话系统还将有持续提升,我们也将和业界一道推动这一领域的创新实践。
深度学习在语言学习场景下的技术实践
扇贝算法团队负责人张志博带来了《深度学习在语言学习场景下的技术实践》的主题分享。他以扇贝在谷歌开发者大会中的一个案例项目为例,分享了在语言学习场景下对深度学习的应用,探讨在中小团队中如何实现从基础设施建设到数据收集清洗,再到模型的选择和评估,逐步搭建深度学习落地的开发框架和迭代流程。
扇贝算法团队负责人 张志博
扇贝是一家以全面、有效提升英语学习能力为目标的移动学习平台,产品矩阵涵盖听说读写,拥有包括扇贝单词、扇贝听力、扇贝口语、扇贝阅读。截止2018年12月,用户已突破8000万。对英语学习者词汇水平的深度追踪入选 2018 谷歌开发者大会案例展示。扇贝也与各种优质的内容提供平台有深入的合作。
张志博详细介绍了扇贝在语言学习方面的两个案例:口语评测引擎和智能中英对照文本。
- 口语评测引擎:具有移动端离线实时打分、音频多轨Mix&音量Normalize、音素级别的打分功能、高准确性(人机间皮尔森相关系数超过资深口语老师间均值)等特点;
- 智能中英对照文本:基于深度学习实现句子级双语文本自动对齐,自动对齐准确率可高达93.2%。单本书籍平均人工审校时间可从2周减少到1天。
扇贝通过应用 TensorFlow,在深度知识追踪系统上可以实时地预测用户对词表上每个词回答正确的概率。基于先前大量线上词汇量测试记录,扇贝的总序列数量已经累积到千万级别,这为使用深度学习模型提供了坚实的基础。
模型方面,扇贝选用了斯坦福大学 Piech Chris 等人在 NIPS 2015 发表的 Deep Knowledge Tracing (DKT) 模型,该模型在 Khan Academy Data 上进行了验证,有着比传统 BKT 模型更好的效果。相比 Khan Academy Data,扇贝词汇量测试数据的题目数量和所涉及用户量都要更大,序列长度也更长,这些不同也是扇贝在模型调优过程中面临的挑战。
Baseline 模型结构为单层 LSTM ,输入 xt 是用户当前 action(所答单词和正确与否)的 embedding,可以用 one-hot encodings 或者是 compressed representations。输出 yt 代表模型预测用户对词表中每个词回答正确的概率。
在模型改进方面,按照原论文思路实现的 baseline ,在 Khan Academy Data 上能较好地复现论文结果。针对实际应用场景,扇贝使用 TensorFlow 实现了相应模型,在数据预处理、引入外部特征、长序列依赖、超参数调优等方面做出改进,尝试提升模型性能。
在模型部署方面,扇贝使用 TensorFlow Serving 作为模型部署上线的方案。在上线前我们有利用一些模型压缩技术来减少模型大小,并根据 TensorFlow Serving Batching Guide来找到 batching config 参数。
最终,扇贝通过对一系列论文结果的复现、改进以及调优,成功将 DKT 模型上线,为数千万用户提供了更科学的词汇测试方案。
苏宁智能购物助理机器人平台
苏宁易购搜索算法团队负责人孙鹏飞在《苏宁智能购物助理机器人平台》的分享中,介绍了苏宁智能购物助理机器人平台、智能人机交互构建技术实践、挑战与未来等内容。
苏宁易购搜索算法团队负责人 孙鹏飞
苏宁一直把智慧零售的理念落到产品体验上,作为国内O2O战略的实践者,苏宁积攒了20多年的行业领域知识,通过大数据、机器学习、深度学习等新技术提升产品体验,一直是苏宁努力实践的方向。
苏宁在分析用户搜索行为的时候发现,越来越多的问题是传统搜索引擎无法解决的。围绕着电子商务领域中的导购、服务以及任务助理等几个方面,苏宁搜索团队进行了深入调研,在2015年开始研发智能购物助理机器人平台。
随着第一版的推出,得到了公司以及越来越多用户的广泛认可。但单纯的售前智能导购已经无法满足用户的需求,在公司的支持下,研发了整个智能购物助理机器人平台,加入和丰富了越来越多的场景,为业务线提供良好支持。
整个平台的产品服务体系分为四层,最上层是用户服务前台体系,包括易购自助服务、云信用户端、智能IVR、公众号、小程序等产品和服务。中间是整个平台的大脑部分,即智能调度系统,包括调度路由机器人以及QA机器人、商品推荐机器人、业务搜索机器人等。同时,在中间还有一个大中台,包括场景化服务中台和知识中台两部分。场景化服务中台主要是根据不同业务需要,提供不同的API服务,而知识中台主要是提供相应的数据支撑,构建知识库,为不同的业务提供相应的数据。最后是后台支撑体系,为不同的业务系统提供相应的API服务,以便能够更好的为前台进行相应的服务。
在技术实践上,孙鹏飞介绍说,整个系统的构成可以分为三大模块、四大类机器人。三大模块分别是自然语言处理模块、对话管理模块、自然语言生成模块。四大类机器人包括QA-Bot问答机器人、Task-Bot任务对话机器人、Chitchat-Bot闲聊机器人、Rec-Bot推荐机器人。
不同模块在不同机器人上的应用是不同的。例如,在聊天型机器人中,自然语言理解主要负责一些情感及意图的识别。而到任务型机器人,则主要是负责一些意图分类以及语义槽填充。对话管理模块,在问答型机器人上主要是做文本的检索以及知识库的匹配。而到了推荐型机器人,主要是做用户兴趣的匹配以及推荐内容的排序。自然语言生成模块,在聊天型机器人上主要是进行开放领域的聊天回复,而到了任务型机器人,主要是确认、澄清、完成一些相应的动作。
最后,孙鹏飞认为,未来主要有意图边界划分、数据标注、语料质量优化、对话质量评估、探索端到端任务型对话系统等五大挑战,并且挑战只多不少。
以上内容是51CTO记者根据WOT2018全球人工智能技术峰会的《人机智能》分论坛演讲内容整理,更多关于WOT的内容请关注51cto.com。
【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】