高端大气的“数据科学家”,竟然成了离职率最高的职位之一

大数据
每一份工作都很有趣。但是做到优秀却很难,因为这不仅关于技术本身,也关乎职场的复杂性。本文作者Jonny Brooks-Bartlett在“Here’s why so many data scientists are leaving their jobs”一文中讲述了数据科学家遭遇挫败的4大原因。

每一份工作都很有趣。但是做到优秀却很难,因为这不仅关于技术本身,也关乎职场的复杂性。本文作者Jonny Brooks-Bartlett在“Here’s why so many data scientists are leaving their jobs”一文中讲述了数据科学家遭遇挫败的4大原因。

是的,我就是一名数据科学家。但是,你读的这个标题也没错。总需要有人来说出这些话。我们已经读到过许多关于数据科学的故事,比如“这是21世纪最迷人的工作”以及“作为数据科学家你能赚到一大笔钱”之类,这让这份工作看起来简直***。由于这个领域里有众多高技能人才,他们会努力解决那些复杂的问题(是得,这对于“极客”来说是一件积极的事情),所以没有任何道理不热爱这份工作。

但是事实上,正如英国《金融时报》的这篇文章中所指出的那样,数据科学家每周通常会“花费1-2个小时寻找新工作”。此外,这篇文章还指出,“在开发者中说自己正在找一份新工作的比例在机器学习专家中名列前茅,为14.3%。数据科学家紧随其后,为13.2%”。以上数据是基于Stack Overflow对于64000位开发人员的调查所得出。

我同样也身处在这个岗位上,而且最近刚换了一份工作。

为什么有如此之多的数据科学家在寻找新工作?

在回答这个问题之前,我需要说明一点,我仍然是一名数据科学家。总体而言,我热爱这个职业,而且也不想阻止别人成为数据科学家,因为它充满着趣味、刺激和回报。但是这篇文章的目的是作为消极指导者而做出,为的是揭露这份职业的消极一面。

在我看来,数据科学家对自己工作的不满意之处体现在下面四个方面。

1. 期望值与现实不符

 

[[225464]]

大数据如同青少年的性行为:每个人都在谈论它,没有人真正知道如何去做,每个人都以为别人都这么做,所以每个人都声称自己正在做……—丹·艾瑞里

这个比喻很恰当。许多我所认识的初级数据科学家(包括我在内)之所以进入数据科学领域是因为它能够用新的机器学习算法解决复杂问题,从而对商业产生巨大影响。这会让我们觉得自己所从事的工作比我们之前做的任何事情都要重要。然而,事实往往并非如此。

在我看来,期望值与现实不符是许多数据科学家离开的根本原因。原因众多但是我没有办法提供一个详尽列表,而这篇文章所谈及之处是我实际上遇到的某些情况。

每个公司的情况各有不同之处,因此我的意见不能代表所有公司的情况。但是有许多公司雇佣数据科学家,但是却没有能从人工智能技术中获取价值的基础设施。这就导致了人工智能的遇冷遭遇。与此同时,这些公司在雇佣初级数据从业者之前没有聘请资深或是有经验的数据人员,这又为彼此的失望与不愉快埋下伏笔。数据科学家可能通过编写机器学习算法来增加分析洞察,但是他们并不能这么做,因为他们的***份工作往往是整理数据基础结构或是创建分析报告。公司只是需要一张他们每天可以在董事会会议上进行展示的图表。之后,公司并不能从促使其快速行动中看到足够的价值。而以上的一切导致数据科学家对于自己的角色感到不满。

罗伯特·张在他给初级数据科学家的建议的博客文章中给出了一个很有见地的引用:

对于我们的抱负与此刻身处关键路途的环境的一致性进行评估非常重要。找到那些最适合你的关键路途的项目、团队与公司。

这就突出了雇主与数据科学家之间的双向关系。如果公司并不处于正确位置上,或者是与数据科学家的目标不一致,那么对于数据科学家来说找一份新工作只是时间问题。

胡书宾有一个关于分析团队如何按愿望创建的系列,我觉得说的很有见地。

另一个原因让数据科学家感到失望的原因与我对学术界的幻灭有相似之处:我认为自己有能力对人们产生影响,这种影响不仅仅局限在公司内部。事实上,如果这家公司的核心业务并不在机器学习(我的上一任雇主是一家媒体出版公司),那么你所从事的数据行业只能带来小幅增长获益。这会产生一个非常重要的事情,或者是你会十分幸运的撞上一个金矿项目,但是这并不常见。

2. 政治统治***原则

关于政治议题已经有一篇精彩文章:数据科学中最困难的一件事:政治,我希望你能读一读。这篇文章的前几句话基本上概括了我想说的。

当我早上6点起床去学习支持向量机时,我想:“这真的是太难了。但是,嘿,至少我会为未来的老板带来价值。”如果我拥有DeLorean时光车,我就会回到过去,然后冲自己大喊“笨蛋”。

如果你真的认为了解许多机器学习算法知识会让你成为最有价值的数据科学家,那么看看上文中我提到的***点:期望值与现实不符。

事实是,那些商业中最有影响力的人需要对你有一个良好的印象。这可能意味着你必须经常做一些特别的工作,比如从数据库中提取数据,并在合适的时间给到合适的人,做一些简单的项目,以便让正确的人对你有一个好印象。我的上一份工作必须做许多类似的事情。但是让人沮丧的是,这是工作中必不可少的一部分。

3. 你对数据“全然”了解

而谈到做正确的事取悦正确的人这件事,那些拥有巨大影响力的人往往不理解“数据科学家”的含义。这意味着你将是分析专家,同时也是做报告的人,更不要忘记你也将成为一个数据库专家。

不仅仅是那些非技术高管对你所拥有的技能有太多假设。其他技术同事也会假定你了解所有关于数据的事情。你是了解Spark, Hadoop, Hive, Pig, SQL, Neo4J, MySQL, Python, R, Scala, Tensorflow, A/B Testing, NLP,任何关于机器学习,以及你能想到的其他相关数据的事情。顺便说一句,如果你看到一份工作明细上写了所有上面提到的东西,请保持理智。这表明,这家公司对于自己的数据策略是什么一无所知,以及他们雇佣相关人员是因为他们以为自己雇佣了一个可以解决所有数据问题的数据工作者。

但是事情并不仅仅止于此。因为你了解所有的一切,显然你可以处理所有访问的数据,那么你就应该能够解决所有的问题。

试着告诉人们你真正知道的以及真正掌握的东西,但是做到这件事相当有困难。这并不是因为人们会认为你的能力不行,而且作为一名没有多少行业经验的初级数据科学家来说,你会担心人们对你的想法会变少。这真的是一个两难困境。

4. 在一个孤立团队中工作

当我们看到一款带有智能功能且用户界面设计的很巧妙的成功的数据产品时,更重要的是需要认识到一个有用的外接输出产品至少能被用户用来解决一个相关问题。如今,如果一个数据科学家只花时间学习了如何编写和执行机器学习算法,那么他们只能是一个能够制造出有价值产品的一个项目的所属团队的一颗小螺丝钉,尽管这是必要的。这意味着那些孤立工作的数据科学团队很难提供价值。

尽管如此,许多公司仍然成立数据科学团队,他们提出自己的项目并编写代码来尝试解决问题。在某些情况下,这就足够了。比如,如果仅仅需要在每个季度完成一个静态电子表格,并且能够提供一些价值。但是另一方面,如果目标是在定制网站建设产品中优化所提供的智能建议,那么这将涉及到许多不同的技能,而这对于绝大多数数据科学家来说则不可能做到,只有真正的数据科学独角兽才有能力解决这个问题。因此,如果一个项目由一个孤立的数据科学团队所执行,那么结果很有可能是失败的(或是会耗费掉很长时间。)

因此,想要成为一个有用的数据科学家,仅仅在Kaggle竞赛中取得好成绩并完成一些在线课程是不够的。幸运或不幸运的是,它涉及到理解等级与政治如何在商业中运作,以及你看待它的方式。寻找一个与你的关键路途一致的公司应是你在寻找能满足自己要求的数据科学工作时的一个关键目标。但是,你仍然需要重新调整自己对于数据科学角色的期望。

责任编辑:未丽燕 来源: 网络大数据
相关推荐

2018-09-15 23:38:56

大数据职位数据科学家

2022-04-25 09:48:31

数据科学岗位离职

2017-08-04 15:53:10

大数据真伪数据科学家

2018-04-26 14:08:27

2020-08-23 12:26:59

数据科学家数据科学认证数据科学

2020-05-11 13:46:34

数据科学家数据科学大数据

2016-12-19 10:05:01

数据面试题PCA

2018-02-28 15:03:03

数据科学家数据分析职业

2020-03-20 14:40:48

数据科学Python学习

2015-08-25 13:20:29

数据科学

2016-04-11 14:15:06

数据科学数据挖掘工具

2012-12-26 10:51:20

数据科学家

2018-12-24 08:37:44

数据科学家数据模型

2012-12-06 15:36:55

CIO

2015-06-11 10:27:29

数据科学家

2013-04-11 10:03:55

2016-05-11 10:36:16

数据科学家数据科学大数据

2019-07-05 10:29:17

大数据数据科学家

2019-12-24 13:40:16

数据科学PythonPytorc

2018-12-06 13:08:30

数据科学家大数据数据科学
点赞
收藏

51CTO技术栈公众号