译者 | 赵青窕
审校 | 梁策 孙淑娟
开始学习数据科学时,我以为找到一个对口工作就万事大吉了。然而,工作了几年之后,我开始意识到当初的想法实在是大错特错。
我认识不少数据科学家在入职后的几个月内就离职了,而我本人,因为认为领导分配的任务与自己辛苦所学的技能毫无关系,在数据科学岗实习了一周后也递上了辞呈。
在同我一样在职业生涯早期就离职的业界人士交谈后,我意识到数据科学领域员工流失率如此之高有以下两个主因:
1. 个人期望与公司岗位期望不符
想象一下,你花了数千小时学习统计数据和不同机器学习算法,然后申请了几十个不同的数据科学岗位,接着经历了大量的面试,最终被一家中型公司录用。
当你满心欢喜地以为自己终于可以开始研究现实中的机器学习问题,想着多年所学终于可以付诸实践,结果上班第一天就发现公司的系统中有大量未经处理的非结构化数据。
在领导心里,你就是“搞数据”的人,所以每天收集的大量数据你都要负责分析,以此来帮助他们提高业绩。
最后你发现,自己的工作完全不像期望的那样可以构建负责的算法和模型,而是将所有时间都花在“复习”SQL 和数据准备工作上,以把数据从系统中提取为不同的格式,并将这些数据呈现给领导,让他们可以使用这些数据来做出相应的业务决策。
尽管岗位叫作“数据科学家”,但你却没有扮演自己想象中的角色。你不甘心只做公司里管数据的人,而是希望从事一个可以让自己辛苦习得的技能有用武之地的项目。
最终,你只剩下两个选择 —— 要么在公司待几年并继续执行不喜欢的任务,要么离职去找一个更符合个人发展目标的公司。
可能你并没有碰到这样的情况,但从我周围的数据科学家那里了解到,这几乎是他们最多的抱怨之一。 他们中的许多人对自己的工作范围都有着不同的期望,但最终每天都是执行数据报告和分析的任务。
在这样的公司待了一段时间后,因为多年未从事真正的机器学习项目,许多数据科学家最终丧失了之前掌握的机器学习技能。
在寻找另一份工作时,他们也无法申请中级或高级数据科学职位,因为自己已经不再具有所需的专业知识。这些人通常不得不转换职业发展方向,继续从事着数据或报告的分析工作。
2. 无法增加商业价值
大多数数据科学家不满的另一个常见原因是无法通过他们的机器学习模型增加商业价值。
在我看来,这个问题比上一个问题更普遍, 因为目前具有明确定义的工作范围和合适的数据管道(Data Pipeline)的组织也面临着这个问题。
以下是数据科学家未能构建用来增加商业价值模型的几个原因:
技术与商业之间存在鸿沟
利益相关者和高层管理人员也许不了解技术,也不能意识到什么情况可以引入机器学习模型。 此外,这个领域炒作的太厉害,作为一名数据科学家,你可能会从领导那里听到一些比较有野心的需求。
数据科学家们这种情况下就需要就一个项目能否成功,能否带来期望结果向领导解释,从而确保其预期能与潜在的结果保持一致,这样以后大家对结果都不会太失望。
在从事任何机器学习项目之前,最好先分析其预估成本和效益情况,这样公司就可以集体决定针对该项目来分配时间和资源是否值得。
没有提出正确的问题
作为一名数据科学家,你需要知道自己构建的模型是否会为业务增加价值。
我所见过的大多数数据科学家都会根据得到的指示快速地开始一个项目,可他们却可能没有提出正确的问题,也不会试图去理解经理的思路。
当你仅仅是根据别人的安排而工作,那么你也不会清晰了解对自己可能会带来什么价值,假如这时有人问你的工作价值何在,可能你也很难答出。
如果你一开始就不知道自己的产品为什么要做,你又怎能让别人相信你的产品是可行的呢?
缺乏相应的知识
要正确提出问题,需要先了解业务运作模式。
你的模型构建应该针对特定领域,同时还需要了解它对最终用户可能产生的影响。
例如,如果你正在为一家服装公司构建模型,就必须要知道季节性等因素会影响你给客户的建议。
我从事市场营销工作,大部分专业知识都是通过直接与业务团队合作获得,此外还有一些来自在线课程,而当中很多是基于我与人们的日常互动以及对其行为方式的理解。
根据个人工作领域差异,花些时间来获取特定行业知识是很明智的做法。这些知识在数据科学工作流程中的每一步都可能会用到,包括预处理、特征选择、特征权重,以及在模型部署之后的微调等等。
那要怎样才能成为一个对工作有热情的数据科学家呢?
首先,选择一家可以让自己发挥所长的公司很重要,避开那些在职位描述中列出了很多工具的公司。在申请岗位之前,可以在招聘平台上查一查,看看他们之前是否招聘过数据科学人员。
如果没有,那我建议你远离这类公司,因为这意味着所有与数据相关的工作都可能由你来做。
如果有,可以查查他们数据科学家的个人资料,看看他们为对该职位的描述是否符合你的期望。
其次,在面试中不要只是单方面被问,你需要尽可能多地向面试官询问有关工作范围和工作内容的问题。如果它与期望不符,最好继续找找其他机会。
最后,花些时间来获取从事领域的专业知识。利用这些知识向经理提出正确的问题,并确保他们的期望与潜在的项目成果保持一致。
译者介绍
赵青窕,51CTO社区编辑,从事多年驱动开发。研究兴趣包含安全OS和网络安全领域,发表过网络相关专利。
原文标题:Why Are So Many Data Scientists Quitting Their Jobs?,作者:Natassha Selvaraj