数据科学家是当今科技组织中比较受追捧的角色之一,并且薪酬不断上涨。在一些IT组织中,首席信息官可能只有雇用一名数据科学家的预算。所以在招聘数据科学家的时候,可能会希望他像摇滚明星多才多艺,令人关注。
但是当数据科学家进行面试时,应该具备的一项关键技能可能在提交审查的简历上并不能看到。这不是熟悉Python或R或Spark或其他一些新技术或平台,也不是了解最新的机器学习方法或新算法;也不是从头开始编写人工智能算法,或在几分钟内分析数TB的数据的能力。
虽然这些知识非常重要,但它们不是软技能。事实上,使数据科学家成为摇滚明星的一项技能根本不是技术,而是所谓的软技能:沟通能力。
在创建一些疯狂的机器学习系统来构建推荐引擎时,企业正在面试的数据科学家可能是世界上很聪明的人之一,但如果他们没有这种软技能就很难取得成功。他们将会遇到一些困难,无法充分挖掘他们的潜力。
其“战略”是什么?当企业传达输出/结果时,数据科学家需要能够讨论的不仅仅是标准信息(错误率/指标等)。他们还需要能够达到关键的“W”点:什么,为什么,何时,何地,以及是谁。他们必须能够清楚地定义他们做了什么,为什么这样做,他们的方法何时起作用(或者不起作用),他们的数据来自何处,以及谁将受到他们所做的影响。如果他不能以一个外行能理解的方式简洁地回答这些问题,那么就是一个失败的数据科学家。
两个现实世界的例子
有两个例子可以帮助了解出色的数据科学家(即沟通良好的人)和一个不那么出色的数据科学家之间的区别,例子提供了两者的背景知识,让企业自己决定聘请哪一位数据科学家。并假设这两位数据科学家都在同一个组织工作。
第一位数据科学家:
她从事数据科学工作已经四年。她在数据探索、功能工程、机器学习和数据管理方面拥有丰富的经验。在她的职业生涯中,她实施了多个需要深入研究大型数据集的项目,在分析过程中她使用不同的系统、平台和语言。
对于她所从事的每个项目,她都会在笔记本上留下评论、想法、变化以及她正在做的事情的理由,毕竟她是一名科学家。当她向团队成员和管理层提供更新时,她不仅仅关注数据,还关注数据能够传达的内容。她对自己的所有工作都作了详尽的描述,并详细说明了为什么事情是按自己的方式进行的,以及潜在的变化可能如何影响她工作的结果。
对于项目“总结”文档,她提供了一个执行摘要,其中包含许多直观的描述,简要描述项目、她所做的工作、为什么这么做,做了什么、她认为可以做什么来改进事情,以及如何改进项目。除了执行摘要之外,她还提供了一份详尽的报告,描述了整个过程,其中包含多个附录和解释性陈述,供那些想深入了解项目的人使用。当人们选择人们从事他们的项目时,当他们开始谈论团队成员时,想到的人第一个人就是她。
第二位数据科学家:
他从事数据科学工作已经四年多(比第一个人多了一个月)。他的技术背景非常专业,他是团队中算法和编程语言的“专家”。考虑很全面,能解决很多困难。他在项目上非常成功,并受到全公司人士的青睐。
当他在项目上工作时自行其事,很少记录做了什么,以及为什么选择。例如,如果同事问他为什么在一个项目中选择随机森林而不是支持向量机时,他会告诉,“因为它工作得更好”,但他无法解释其“更好”的含义。虽然很少有人反对他在项目上的选择,他的工作也很少受到质疑,也没有人质疑他的技术,但同事总是在项目中/项目后质疑“他在做什么?”“他做了什么?”这样的问题。
对于结果的记录和呈现,他将预期的基本报告与适当的信息放在一起,而人们总是有问题向他请教。但在考虑新项目时,他通常会排在最后,因为同事评价说,和他一起工作并不知道他在做哪些事情。
那么会选谁?
假设人们知道这两位哪一个是出色的数据科学家。虽然第二人在技术上比第一人更精湛,但他的沟通技巧有点落后。第一个人是每个人在组织中提供“最佳”数据科学成果的人。而沟通就是差别。第一位数据科学家不仅能够完成技术工作,还能以组织可以轻松理解的方式分享成果。
当企业想聘请数据科学家时,通常会招聘擅长沟通或有能力提高沟通技巧的人。此外,作为一个组织,如果想成为一个优秀的数据科学和分析公司,就必须拥有良好的沟通文化。