从人工智能到团队合作:数据科学家的七项关键技能

大数据
美国劳工统计局将数据科学家列为未来增长最快的15个职业之一,随着数据日益成为所有企业的命脉,数据科学家不仅需要具备过硬的知识和技能,还需要具备强大的商业头脑。

[[407813]]

如今的数据科学家具有的技能不仅需要精通人工智能和Python,还需要擅长与企业高管进行沟通。

美国劳工统计局将数据科学家列为未来增长最快的15个职业之一,预计在未来10年的工作岗位增长率将达到31%。随着数据日益成为所有企业的命脉,数据科学家不仅需要具备过硬的知识和技能,还需要具备强大的商业头脑。

1.机器学习/神经网络技能

2021年,机器学习方法(如迁移学习和Transformer)将引起很多关注,因为它们正在迅速推动许多不同领域的创新。对于构建和训练神经网络,PyTorch背后有很大的推动力,Keras和TensorFlow也是常用的。还有丰富的软件库生态系统,其中许多是开源的,可以帮助加速机器学习和数据科学应用程序。

人工智能威胁检测和响应服务提供商Vectra公司数据科学高级主管Matthew Silver说:“数据科学家可以通过对机器学习算法的工作原理和工作方式来展示自己的魅力,这对于克服培训和测试过程中不可避免的挑战非常重要。ONNX是一种神经网络标准,促进了平台、库和语言独立的模型部署,帮助我们简化了生产中人工智能的使用,并加快了建模工作。”

2.编程技能

对于数据科学家来说,为探索性分析、数据预处理和算法训练以及在某些情况下在生产中部署模型编写高质量且可维护的代码非常重要。Python、JavaScript、R和Scala是最适合开发的语言。另一个有用的技能是了解如何从其他人可以部署的模型构建WebAPI。

Silver说,“能够在工作中开始使用通用软件库来构建模型的数据科学家是最具竞争力的,并且在几乎所有情况下,具有强大的软件开发技能都是加分项。”

3.了解云计算

了解云计算工程原理和云计算基础设施的数据科学家对于雇主来说更具吸引力。这意味着需要三大公有云提供商(微软、AWS、谷歌)提供的云计算服务。每个云计算供应商都为数据科学家提供了一套全面的工具,用于数据提取、数据清理、可视化和机器学习目的。

网络资产管理和治理解决方案提供商Jupiter One公司首席架构师Phillip Gates-Idem说,“我们正在寻求熟悉云计算基础设施、持续集成(CI)/持续交付(CD)管道和自动化的数据科学家。数据科学家需要对如何使用云计算基础设施构建和使用工具有着深刻的了解。”

4.统计数据

统计学是一个数学领域,旨在使用给定数据集的模型和表示来收集和解释定量数据,是数据科学的核心,其中包括概率、可变性、回归和集中趋势等概念。

IT咨询机构Netrix公司的首席架构师Lars Kemmann说,“如果没有深入了解统计学(数据科学的核心)以及如何将合理的数学推理应用于正在处理的问题,那么我们不在乎采用多少平台或语言。我认为招聘这样的人才是目前行业面临的一个挑战。”

5.项目管理

由于数据科学项目可能涉及漫长的探索阶段,甚至在后期也存在多个未知因素,因此项目管理是数据科学家需要具备的另一项关键技能。例如采用敏捷方法,可以让数据科学家根据需求和目标确定优先级并创建路线图。

Silver解释说,““通常很难预测开发和训练机器学习模型需要多长时间,,等待更新模型或结果的企业往往会有时间表和计划,因为这种不可预测性而受到影响。数据科学家能够通过从一开始就了解局限性、随着工作的进展传达项目状态,并预测他们何时能够提供下一个有意义的读数,从而掌控主要建模工作,他们将在我们的团队中发挥着重要作用。”

6.数据讲故事/可视化

尽管企业的数据可能具有巨大的潜在价值,但除非能够发现这些见解并将其转化为行动或业务成果,否则无法创造任何价值。Plotly、Tableau和D3是当今需求量最大的数据科学可视化和讲故事的工具。

Kemmann说,“当客户不了解企业在做什么时,他们很容易低估企业所做的工作,尤其是在数据准备阶段。数据科学家以企业的客户可以理解的语言清楚地解释每个步骤的过程和好处,并在可能的情况下通过适当的数据可视化提供支持,这是其工作角色的关键部分。”

7.沟通能力

数据科学家现在比以往任何时候都有更多的机会“亲自动手”处理数据,但这需要对业务目标有很强的理解,并有能力清楚地传达和解释技术术语。能够将数据转化为有用术语的数据科学家能够增加额外价值。

IT人力资源提供商RobertHalf Technology公司区域经理Joshua Drew说,“能够将这些数据转化为清晰、易于理解的业务信息将是一项巨大的技能,而数据科学家并不总是具备这些软技能,或者具备能够向企业高管澄清其决策过程的经验。”

 

责任编辑:姜华 来源: 企业网D1Net
相关推荐

2017-12-18 10:50:14

数据科学家人工智能自动化

2018-05-04 11:30:22

2016-04-11 14:15:06

数据科学数据挖掘工具

2018-02-28 15:03:03

数据科学家数据分析职业

2019-07-05 10:29:17

大数据数据科学家

2017-08-04 15:53:10

大数据真伪数据科学家

2019-11-29 18:03:27

数学R语言算法

2021-03-14 13:49:40

人工智能AI

2023-12-15 15:10:36

OpenAI人工智能ChatGPT

2018-12-05 09:40:19

人工智能AIAGI

2018-05-03 09:11:51

数据科学家职业数据科学

2019-03-25 21:18:41

数据科学家大数据技能

2021-03-15 11:50:31

人工智能

2021-10-08 13:45:23

大数据数据科学家货币

2021-10-19 10:08:39

人工智能机器学习技术

2022-08-01 10:41:03

人工智能认证人工智能

2018-12-24 08:37:44

数据科学家数据模型

2012-12-06 15:36:55

CIO

2023-06-27 11:14:59

人工智能AI

2023-02-28 09:32:18

人工智能物联网
点赞
收藏

51CTO技术栈公众号