猎聘网单艺:迎接机器学习全盛时代

原创
网络
在很多机器学习的会议中,大家讨论交流的主要是算法和模型,其实在实际工作当中,要把机器学习技术应用起来,还需要建设一个好的系统。

   2016年11月25-26日,由51CTO.com主办的WOT 2016大数据技术峰会在北京粤财JW万豪酒店隆重召开。自2012年以来,WOT品牌大会秉承“专注技术、服务技术人员”的理念已成功举办了十二届,不仅积累了大量的专家资源,更获得广大IT从业者和技术爱好者的认可和好评,已成为业界重要的技术分享及人脉拓展平台。

  在本届WOT2016大数据技术峰会的“机器学习”主题专场,来自猎聘网***数据官单艺做了《高效机器学习系统的设计原则和模式》的精彩主题演讲。在会后,记者采访了他,请他聊一聊猎聘网在机器学习方面的经验和体会。

  单艺告诉记者,之所以确定这个发言主题,是因为他发现,在很多机器学习的会议中,大家讨论交流的主要是算法和模型,其实在实际工作当中,要把机器学习技术应用起来,还需要建设一个好的系统。“与一般的信息系统不同,机器学习是数据驱动的系统,在输出方面要做好性能的检测,在输入方面要保证数据的质量,在数据流的处理上要采用良好的设计模式。”单艺概括道,要有一个“全局观”,才能开发出一个高效、稳定可靠的机器学习系统。”

  大数据+人工智能=新思路

  据单艺介绍,猎聘网目前拥有三千多万的注册用户,两年前,CEO戴科彬意识到猎聘网已经积累了大量的用户数据和企业数据,这些数据有很大的社会价值和商业价值。单艺举了一个例子,猎聘网招聘的数据可以反映中国的各个行业的变迁、兴衰,而企业招聘的需求、人才的流动,不仅对企业HR,甚至对政府的工作都有很大的价值。

  不仅如此,猎聘网是一家以招聘为核心业务的网站,招聘中核心的问题就是"人岗匹配“。如何做到人尽其才?显然靠人工费时费力而且效果不佳,但是用大数据+人工智能技术给解决这个难题开辟了新的思路。

  此外,猎聘网还有职业社交的业务。如何给几千万用户精准地推荐他会感兴趣的内容,推荐职场的朋友?这也需要用大数据平台予以解决。

  “基于以上三点,猎聘网就组建了一个大数据团队,用大数据技术解决这些难题。同时也尝试用数据驱动业务,提高猎聘各个产品线和部门的运营效率,支持创新。”单艺表示,他加入猎聘两年多,现在团队已经发展得较为成熟,在这两年里,他们经历了从搭建基础的数据平台到建设业务分析团队、建设机器学习应用开发这三个阶段,算是达到了初步预定的目标,未来还有更高的目标要实现。

  用数据分析支撑运营决策

  在采访中,记者聊到***数据官这个职务在国内非常少见,单艺笑称的确如此,但是他有信心地表示,数据的应用越来越多,他相信随着应用数据的场景和人们对数据价值的认知越来越清晰,以后国内这类的职位也会越来越多。

  单艺和记者详细描述了一下猎聘网***数据官这个职务所做的工作。

  首先要先搭建一个大数据的基础设施,把散落在各地的数据收集、存储起来,然后用分布式的计算进行处理,***才能实现高层的应用。在这基础上,单艺和他的团队还会开发机器学习的各种应用,如职位推荐、人才推荐、职业社交推荐等应用。

  此外,还要利用大数据技术做行业研究、全国中高端人才发展情况的分析,同时猎聘网的各个部门从销售到产品、市场,工作的日常运营都逐步地开始使用数据支持决策,以提高了决策的可靠性和效果。

  “未来我们发力的方向有两个,一是机器学习系统的开发,主要是人才推荐、职位推荐和职业社交这类功能,要持续深入;另一个方向是加强业务分析和产业合作,继续推动全国各行业人才数据的挖掘和共享。”单艺表示。

  保证高质量的数据输入

  对于眼下热门的机器学习,单艺有不少体会愿意分享。他告诉记者,“行内有句话:输入的是垃圾,那系统输出肯定也是垃圾。”他认为机器学习的系统是一个数据驱动的系统,在这个系统里面,首先要保证输入的数据是一个高质量的数据,同时这个系统里面它在运行当中会遇到各种各样的问题,要及时把握系统性能的变化,做到在问题刚出现时就立刻发现,因此输出的监测也很重要。

  他也指出,中间的数据处理开发工作量相当大,这时候有一个高效的进行数据处理的系统和工具,尤其是流式计算系统就变得很重要。

  他还透露,“当在做大数据下模型学习的时候,需要选择一个好的机器学习模型训练的计算模式,或者是找到合适的工具。很多情况下,如果能把握这些方面,这个系统就会比较容易成功。”

  迎接全盛时代

  对于2017年机器学习的发展,单艺认为在通用智能算法方面,尤其是深度学习和强化学习在自然语言处理、推理、问答和图像/语音识别方面的深入,仍将是一个热点。他表示2017年会有更多开源的机器学习工具出现,帮助用户更简单地开发出一个聪明的系统。

  对于机器学习目前所处的阶段,单艺认为已经进入一个全盛的时期。越来越多的人开始接触机器学习,学习人工智能,在各个行业的应用也是全面开花。他告诉记者,机器学习的全盛周期会持续很长时间,因为机器学习的目标是去创造智能的系统,而智能系统则是一个更加久远的目标。

责任编辑:周雪 来源: 51cto
相关推荐

2017-07-25 13:11:00

WOTCIO机器学习

2021-01-08 13:42:28

爱奇艺机器学习深度学习

2022-09-23 09:02:16

数字化转型AIOps

2011-08-05 16:40:56

Informatica大数据

2022-07-08 15:18:24

人工智能智慧安防智能安防

2012-10-17 17:08:09

布线以太网虚拟化技术

2017-02-16 16:12:09

2012-10-16 16:48:28

万兆铜缆综合布线

2013-08-29 11:21:05

大数据

2016-10-19 22:16:30

云计算云技术

2011-09-26 09:52:09

Hyper-V 3微软虚拟化windows8

2014-08-11 13:50:10

交通大数据浪潮

2011-06-28 14:22:22

H3C数据中心虚拟化

2024-04-12 08:32:03

JSAI机器学习

2015-08-07 10:09:54

AWS亚马逊机器学习

2020-12-24 16:17:31

戴尔

2020-08-27 16:42:25

物联网

2010-12-23 15:22:58

点赞
收藏

51CTO技术栈公众号