【51CTO.com原创稿件】2018年5月18-19日,由51CTO主办的全球软件与运维技术峰会在北京召开。此次峰会围绕人工智能、大数据、物联网、区块链等12大核心热点,汇聚海内外60位一线专家,是一场高端的技术盛宴,也是顶级IT技术人才学习和人脉拓展不容错过的平台。
在5月18日上午“人工智能技术探索”B会场论坛中,美团搜索算法负责人仙云森带来了《O2O服务搜索的智能化》的主题分享,并展示了美团平台搜索技术中心基础算法的一些研究成果和心得。
O2O搜索的价值:连接人与服务
仙云森首先介绍了O2O(即Online To Offline/线上到线下)搜索的整体特点,以及它与网页搜索或者购物搜索的一些差异。他介绍到,美团是一个生活服务电商平台,有几十条业务线,每个业务之间存在非常大的差异。他列举了三个业务做对比,首先是足疗按摩,足疗按摩是一个非常轻决策的业务,用户更多的关注地点,一公里内的消费比例非常高,对体验感受并不重要。与之相比,家装就不同了,因为装修一次会使用多年,用户对距离、优惠的敏感度降低,更多的关注品质,结婚就更侧重品质和用户体验了。这些不同的搜索需求给搜索业务带来非常大的挑战。
搜索的使命是什么?仙云森认为搜索就是要连接人与服务,把用户和商家连接起来。如果只用两个字来形容,那就是“效率”。“这里面有两层含义,一层就是交易效率,另外一层就是决策效率。”他认为搜索对于商家端的价值也有两点:一个就是用户触达,通过搜索让更多的用户到店里来,二是转化效率,让用户在店里消费,在成单的同时优化。
仙云森还从四个层面将O2O与网页搜索、购物电商做一个对比。
第一个区别是移动化。美团移动端的占比在94%以上,淘宝移动化比例也达到了90%,而百度的移动占比就稍弱一些。第二个区别是个性化。这项对比中百度较低,因为百度的理念是“信息是平等的,不需要个性化”。而美团和淘宝的个性化选择则非常高。第三个区别是场景化,例如订酒店,定景点门票往往都是异地达成的,地域空间的影响非常小。第四点是实时化,仙云森认为淘宝的实时化与场景关联较少,但在双十一、反作弊这些具体的场景上实时性是有加强的。
如何让O2O搜索智能化?
在了解O2O搜索的特点和基本特征后,那么如何去实现O2O搜索的智能化呢?仙云森认为智能化目标有两个,一是精准需求一键触达,二是通过优化体验提升决策效率。关键路径也有两点:精准的理解用户意图和智能化的排序算法。
在仙云森列出的搜索技术全景图中,从基础层、策略层到业务层,他分别梳理了通用业务和垂直业务对应的搜索策略和技术。
在现场仙云森还强调了意图理解的作用,即如何理解用户的意图。他介绍到,美团上的用户意图可以被分解成几个关键要素,如地点、时间,地点可以通过查找周边来解决,不同的时间用户的需求也不一样,如工作日的中午,用户可能只对快餐外卖有需求,而到了节假日,可以就会搜索大餐美食。此外像天气,雨雪天气、雾霾天气,都会影响用户的消费行为。
当谈到意图与召回时,仙云森表示,美团是一个结构化的搜索,与网页不同,美团页面上每一个商铺有固定的几个字段,而且都是规范化的异地人工上单。当美团在意图上构建意图体系时,有四点非常重要,一是业务识别要使用多意图识别,二是消费位置需要识别出是本地还是异地,三是消费时间要判断出是即时消费还是延迟消费,看用户是有排队需求还是预订需求。还有一点是成份分析,如果搜索系统能够把它的成份识别清楚,就能够召回得更精准,更有机会准确地满足用户的需求。
例如当用户输的terms是北京南站,那么他的消费品类在酒店上的需求基本是压倒性的优势,而假如用户的terms是三里屯时,对于酒吧搜索的需求量会非常大,搜索望京、五道口时,韩国菜就会有一定的需求比例。“这就是我们根据用户一些真实行为,能够有机会判断出来每一个差别的意图分布。”
深度学习带来效果提升
演讲最后,仙云森还分享了美团在实时化方面的实践。他们首先做特征的实时化,在用户的实时行为、实时库存、实时意图和实时转化上做一些特殊工程,他们的模型其实是基于历史的数据发现规律,从而预测未来。如果仅仅是数据有变化而规律没变,那用特征预测就够了。后来他们开始尝试模型的实时化,并经过了三轮的迭代,首先是基础模型GBDT+LR(Gradient boosting decision/regression tree,LTR中应用较多的非线性模型),这也是Facebook比较经典的结构,在这个基础上他们做了一些改进,把sbas的特征直接加入到LR这一端,效果又得到了提升。
当谈到时下很热门的深度学习时,仙云森表示,深度学习对美团有很大帮助。过去从业务特色看,有很多交叉的搜索因素如用户场景、用户状态,用户查询等等,仅仅依靠人工的力量,拧合力是不够的。后来他们尝试通过深度学习,参考DeepFM模型,部分特征组合加入wide,并将FM部分改为分组product,在基础网络中取得了一个非常正向的效果。此外由于美团是一个关注交易的服务商,因此相关性也非常重要。深度学习是比较适合做多任务学习的,所以他们尝试了两种结构,一个是共享wide,一个是共享deep,最终选择了共享wide,因为不共享wide的成本会更大。
以上内容是51CTO记者根据仙云森在WOT2018全球软件与运维技术峰会的演讲内容整理,更多关于WOT的内容请关注51cto.com。
【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】