导读
- 数据科学家为什么这么贵?这篇文章通过一些统计数据告诉你为什么
当你听到“数据科学家”这个头衔时,你会想到什么?可能不是一个衣衫褴褛、表情严肃的白领,对吧?
也许这就是为什么《哈佛商业评论》(Harvard Business Review)将“数据科学家”称为“21世纪最性感的工作”。他们写道,“如果‘性感’意味着拥有非常抢手的稀有品质,那么数据科学家已经在那里了。”他们很难招到,也很贵,而且由于他们的服务市场竞争非常激烈,很难留住他们。
数据科学家是受过训练的专业技术人员,他们对数据世界的发现充满了好奇心。尽管“数据科学家”一词最近在Linkedin上很流行,但这个领域本身并不新鲜。在《哈佛商业评论》发表这篇文章时,已有数千名数据科学家在初创企业和公司工作。此外,使计算机与人类一样智能的目标已经追求了近四分之一个世纪。数据科学家最近如此受欢迎有多种原因。其一,当收集数据成为时髦依赖,公司多年来一直收集越来越多的数据,由大型技术公司的成功很大程度上是得益于他们收集的数据,其次,技术的进步使得这些数据集合成为资产。
现在有大量现成的数据等待分析:
现在所有行业的大多数大公司都可以获得大量的数据,但是许多公司并没有以一种有效和富有成效的方式使用这些数据。然而,企业现在开始意识到,它们需要利用目前通过企业数据库可以访问的大量数据。多少数据?从2013年的4.4万亿gb增加到2020年的44万亿gb。
数据的数量和种类为有能力使用它的人和收集它的企业创造了机会。然而,该行业正面临着技能和专业知识的短缺,而这些技能和专业知识是处理那些寻求利用其丰富数据的公司日益增长的需求所必需的。甚至那些在大学里学习计算机科学和技术的人也被迫在工作场所从事要求很高的数据分析工作。
数据科学人才结构性短缺:
根据加州大学河滨分校的统计数据,1/3的美国新闻与世界报道全球100所顶级大学提供数据科学学位。在这29所大学中,只有6所提供本科水平的数据科学课程,其余的是研究生学位。这些数据科学项目的平均班级规模只有23名学生。加州大学(University of California)预测,在已经为数不多的提供数据科学课程的大学中,小班授课不太可能“在缩小全球数据科学人才缺口方面产生有意义的影响”。在简单的经济术语中,需求超过了供给,在这种情况下,远远超过了供给。2017年,IBM预测,到2020年,每年对新数据科学家、数据开发人员和数据工程师的需求将达到近70万个职位空缺。因此,一所大学仅有23个学生班级,而所有提供数据科学课程的大学大约有700名毕业生,将无法满足快速增长的对数据科学人才的需求。
2018年,初级数据科学家的平均工资为11.5万美元,管理10至15人团队的人可以要求高达35万美元的工资。与此同时,数据科学家的平均工作年限从2014年的9年降至2015年的6年。到2019年,全球对数据科学家的需求预计将超过供应的50%。超过40%的公司认为他们招聘数据科学家的无能阻碍了他们的竞争力,难怪超过60%的公司内部培训他们的员工。
Andrew Ng
有两种方法可以填补这一空白:
有两种主要方法可以帮助缓解这种技能短缺。首先,人工智能超级明星Andrew NG支持的一种方法是使用非传统的方法来培训更多的数据科学家,比如大规模在线开放课程(MOOCs)。虽然这对于当前的开发人员和其他以数据为中心的员工来说是一种“提高技能”的好方法,但它还不是更大问题的解决方案。我说“还没有”,是因为这从根本上要求改变行为。雇主还没有对这种教育给予足够的重视,许多雇主在招聘时仍然只看名牌大学。虽然这种心态正在缓慢地改变,但它来得不够快,不足以在中短期内解决问题。
第二种方法是让更多没有数据科学技能的人能够轻松地将这些复杂的技术应用到公司数据中。本质上,让人工智能和机器学习解决自己的问题。通过使用过去几年开发的技术(包括这里的MindsDB),可以模拟数据科学家,这样即使是非技术人员也可以通过几行代码或几次单击来执行数据分析。
这两种解决方案并不是相互排斥的,它们将协同帮助企业以更有意义的方式使用数据,从而推动成本节约和/或推动增长和收入。为了有效地实现这一目标,企业内部需要进行文化变革,从而制定更好的招聘政策,更好地使用工具和软件,这些工具和软件可以解决企业面临的许多数据问题,而不需要扩大员工数量,也不需要聘请昂贵的数据科学家。