WOT2018算法模型分论坛：数据洪流爆发，如何用算法突破瓶颈

作者：zc 2018-12-18 08:59:41

随着数据洪流的爆发和算法的突破，人工智能在自然语言处理、图像识别、人机交互等领域取得了重大突破，使得几乎所有的机器辅助功能变为可能，例如智能推荐、智能穿戴等应用已经成功落地，无人驾驶汽车、预防性的医疗保健等也即将成为现实。

　　【51CTO.com原创稿件】2018年11月30日-12月1日，由51CTO主办的WOT2018全球人工智能技术峰会在北京粤财JW万豪酒店召开。本届峰会从人工智能技术赋能行业升级的角度出发，紧跟技术潮流，紧抓时事热点，覆盖人工智能平台工具、算法模型、语音视觉等技术主题内容，带来了一场AI前沿理论与***技术激烈碰撞的知识盛宴!

　　众所周知，人工智能离不开计算、算法、数据三大要素。随着数据洪流的爆发和算法的突破，人工智能在自然语言处理、图像识别、人机交互等领域取得了重大突破，使得几乎所有的机器辅助功能变为可能，例如智能推荐、智能穿戴等应用已经成功落地，无人驾驶汽车、预防性的医疗保健等也即将成为现实。

　　那么，企业应该如何利用先进的算法加速人工智能的应用落地呢?本届WOT峰会的《算法模型》分论坛上，来自三角兽技术副总裁陈华荣，捷通华声MT及NLP算法负责人的邢启洲，惟客数据算法负责人李翔，分别从基于语义理解的智能交互、远不止翻译、新零售场景下的AI落地探索三个不同的主题，为到场的听众带来了一场算法模型的饕餮盛宴。

　　三角兽技术副总裁陈华荣：基于语义理解的智能交互

　　三角兽技术副总裁陈华荣主要介绍了自然语言处理(NLP)技术的发展和基于语义理解的对话系统和智能交互系统,并重点介绍了语义理解的场景落地及实战经验。

　　感知智能解决的是看见、听见的问题，更多是接收外面的信息，还做不到听得懂和看得懂，当然也无法进行决策。陈华荣表示，要让系统会理解、会思考，就必须要具备认知智能，让系统去理解语言、掌握语言，利用其掌握的知识去推理。目前，认知智能还处在比较初级的阶段，还做不到推理。所以，人工智能还有很长的路要走。

　　最初的自然语言用的是传统的NLP算法，是通过分析句中结构来理解语义，由于语言千变万化，异常复杂，因此没有办法基于NLP算法搭建比较好的落地产品。深度学习出现之后，在声音和图像的识别上得到了成功应用，也慢慢应用到了自然语言处理方面。陈华荣以擅长捕捉局部和全局特征的CNN 为例，详细介绍了深度学习的优势。他表示，基于深度学习的情绪识别、文本分类、机器翻译、阅读理解、文本摘要等等，成为当前行业的热点。

　　在接下来的演讲中，陈华荣从智能手机、智能IoT和智能客服三个不同的场景应用出发，为大家详细介绍了三角兽从技术到商业化落地应用的过程。据介绍，三角兽的商业化落地不仅包含开放域聊天引擎、通用对话引擎等多种对话引擎在终端设备上的应用，如智能电视、智能音箱、手机、儿童手表等等，而且还提供了辅助功能模块，如情绪分析、语义纠错、客服质检、内容过滤等，为用户提供了强大的内容模糊语义理解能力的算法。

　　捷通华声MT及NLP算法负责人邢启洲：远不止翻译

　　捷通华声MT及NLP算法负责人邢启洲本次演讲主要围绕神经机器翻译相关技术及其应用展开，对机器翻译、灵云机器翻译框架、Transformer模型、翻译中其他设计的算法、业界翻译产品现状、挑战及未来机器翻译发展趋势六大主题进行了细致的讲解。

　　邢启洲表示，随着人工智能、深度学习和神经网络的发展，神经机器翻译迈入了一个新的时代，特别是自从去年谷歌发布《Attention Is All You Need》文章之后，在机器翻译领域取得了长足的进步。从几年前比较流行的统计机器翻译SMT ，到这两年比较火的神经机器翻译NMT ，都是机器翻译的框架。目前，灵云机器翻译的框架，就是将一个有噪音、不规则、有各种复杂符号的文本，通过文本前处理，包括文本清洗、大小写转换、分词等等，把收到的Input转换成一种利于机器去处理的形式。然后，通过命名实体识别，把句子送进翻译模型，最终输出一个目标语言翻译句子。***，再做一次命名实体识别，通过文本后处理进行反向还原，***化还原用户实际输入的格式，最终将翻译结果呈现给大家。

　　接着，邢启洲为大家详细解读了机器翻译各个步骤的技术细节以及捷通华声所采用的技术、遇到的难题和总结的经验。他表示，要想让机器翻译成为一个成熟的产品，肯定不是翻译本身的能力有多强，而是要结合各种人工智能技术，比如ASR技术、TTS语音合成技术、OCR技术等等。因此，多技术融合才是翻译的未来发展趋势。

　　邢启洲强调，多模态翻译和语音识别、多语化翻译、多译文翻译、篇章级翻译、离线端翻译、隐私化翻译等都是未来翻译的发展方向，但都面临着语料缺失的问题，目前可以通过迁移学习、无监督或者半监督的方式去做语料增强等等，但现有的方法还是无法达到满意的程度，这是未来要重要突破的难题。

　　惟客数据算法负责人李翔：新零售场景下的AI落地探索

　　惟客数据算法负责人李翔的演讲围绕新零售场景下的AI落地探索展开，他认为虽然零售场景已经有很多的维度和数量，但惟客数据的***目标，就是唤醒沉睡的数据，让数据物尽其用，让零售商通过数据来经营自己的客户。

　　对于新零售的理解，李翔认为其实就是换一种方式让零售行业做得更好。他表示，如果把新零售比做一个黑盒子，它的输入就是数据，输出就是服务，目的就是让传统零售行业为客户提供更好的、更优质的服务。如果再把这个目标进行拆分，那么***点就是让零售行业的店家更好地去理解自己的客户，第二点就是为客户提供个性化、定制化的优质服务。

　　在接下来的演讲中，李翔围绕数据和服务，为到场的观众详细介绍了惟客数据的做法和经验，并分享了其核心的算法内容，如人脸识别、物品识别等数据模型。李翔表示，AI在新零售行业中的场景应用虽然有很多种，但首先要解决“谁才是你客户”的问题，只有知道了自已的客户是谁，才能有针对性的做出解决方案。

　　在搞清楚了自己的客户是谁之后，接下来就是方案的选型，是选择第三方成熟公司的方案，还是自己设计方案，一是考虑成本，二是不要只选择一个模型。据介绍，如何从视频流中去检测人脸，并把人脸提取后进行识别并分析，惟客数据遇到了难题。他们尝试采用了三种方案，首先是普通摄像头的方案，其***优势就是成本很低。第二是采用了手机摄像头的方案，成本仍旧很低。第三是采用了专业级摄像头的方案，虽然成本高，但取得的效果也是***的。因此，惟客数据最终选择了第三种方案。

　　李翔表示，通过在摄像头端对视频流进行分析，对人脸检测，把人脸抓取出来，之后经过MTCNN对人脸进行更深层次的提取，这样就可以通过很低的计算成本实现了人脸的识别与深度分析。

　　以上内容是51CTO记者根据WOT2018全球人工智能技术峰会的《算法模型》分论坛演讲内容整理，更多关于WOT的内容请关注51cto.com。

【51CTO原创稿件，合作站点转载请注明原文作者和出处为51CTO.com】

责任编辑：张诚来源： 51CTO

WOT2018