数据科学项目失败最常见的4个原因

大数据
大多数失败可以追溯到四个主要的陷阱:从错误的问题开始;使用错误的数据;缺乏利益相关者的认同;以及缺乏多样化的专业知识。预先认识到这些常见的危害,会让首席信息官和IT主管更好地领导数据科学项目,这些项目将推动有价值的洞察力,并为组织的全面成功的数字变革做出贡献。

那些已经完成的项目中,只有8%的公司领导报告对结果完全满意。

数据挖掘专家称2017年为数据扫盲和数字转换年。虽然数据是推动真正数字转换的关键要素,但企业往往以错误的方式处理数据和分析项目。事实上,只有13%的数据和分析项目已经完成,而在那些已经完成的项目中,只有8%的公司领导报告对结果完全满意。

 

[[225342]]

为什么数据科学项目的结果如此惨淡?

大多数失败可以追溯到四个主要的陷阱:从错误的问题开始;使用错误的数据;缺乏利益相关者的认同;以及缺乏多样化的专业知识。

预先认识到这些常见的危害,会让***信息官和IT主管更好地领导数据科学项目,这些项目将推动有价值的洞察力,并为组织的全面成功的数字变革做出贡献。

1. 从错误的问题开始

很多时候,数据科学项目从分析数据开始,期望有趣的洞察力会显露出来,成为商业案例的基础,证明转换是正确的。

这种“探索性分析”方法常常产生数十个潜在的数据项目,这些项目可能产生引人注目的结果。但是他们中的任何一个都能产生一个强有力的商业案例,例如,可以降低成本、鼓励重复的客户或留住员工吗?“探索性”项目的范围太广,无法推动有用的分析,这是对IT资源的浪费。

更好的方法是以直接映射到创建业务价值的既定目标启动项目。遵循“假设检验”方法的项目从一组明确定义的问题开始,这些问题表明哪些数据应该分析。

这种有针对性的方法通过将业务合理性与业务操作结合起来,简化了数据挖掘和分析过程,从而将信息技术资源导向最有可能产生可信和有意义的发现的信息。从正确的问题开始,通过提高准确性和效率,为一个成功的数据科学项目奠定基础,从而产生有目的的洞察力。

2. 使用错误的数据

使用准确的数据是项目成功的根本,但糟糕的数据是最被低估的失败原因。很多时候,公司根本没有花足够的时间清理数据。由于清洁数据十分重要,一个很好的指导方针需要将预计项目时间表的80%分配给数据清理。

虽然这看起来有些过分,但是做一项彻底的工作将成为该项目最重要的节省时间的方法,因为使用干净的数据可以加快后续的所有步骤。考虑一下,即使是一个简单的错误,也会产生一个错误的洞察,有可能使整个项目失败,并导致领导层撤回对未来数字改造计划的支持。

现代云和数据获取工具促进了非结构化数据的合并,然后可以以不同的方式提取、挖掘和关联这些数据,从而使数据更容易管理,同时减少时间、基础设施和错误。

3.缺乏利益相关者的认同

数据科学项目可能会影响整个公司的商业***。如果没有利益相关者的支持和实施变革的承诺,项目可能会陷入停滞或失败。

确保整个组织的业务一致的较佳方法是制定一个可靠的数据策略和路线图,以使每个人都走上正轨。

利益相关者必须相信项目的目的,并在时机成熟时承诺在部门内贯彻执行。当涉众看到由坚实的业务案例支持的计划的价值时,由涉众障碍引起的项目失败的可能性就会大大降低。

4. 缺乏多样化的专业知识

一个常见的误解是,任何涉及数据的项目都应该是IT部门的责任。这种目光短浅的观点对项目的成功再危险不过了。使用正确的数据分析工具很重要,但是产出不能提供有意义和有用的洞察力。让合适的人才参与这个项目是至关重要的,不管他们是哪个部门的。

最成功的数据科学项目雇用具有多种技能的部门的团队成员,包括对定量研究、统计和专题知识的理解,这取决于该倡议的问题和重点。

它们可以一起带来不同的视角、熟练程度和经验,以塑造项目的目标和方向。

数据项目还得益于团队中有一位了解业务内部运作的人,以确保其与最初的业务目标保持一致。更多地关注项目,发现错误的机会,同时充分利用整个团队的集体知识和人才。

责任编辑:未丽燕 来源: 网络大数据
相关推荐

2021-06-29 10:03:45

数据科学机器学习算法

2021-04-26 08:00:00

DevSecOps安全开发

2019-11-12 16:34:12

网络安全软件技术

2018-07-26 05:44:45

物联网项目物联网IOT

2020-07-09 10:26:28

软件项目软件开发CIO

2020-09-09 12:59:26

蓝屏驱动内存

2020-11-10 09:21:29

MySQL数据库SQL

2019-08-14 10:41:42

人工智能系统数据

2015-09-24 16:09:45

软件开发项目原因

2019-02-26 11:35:16

数据科学云端迁移

2018-06-21 08:04:25

数据科学正态分布高斯

2011-03-22 13:23:49

数据库术语

2013-05-17 09:49:24

敏捷开发开发项目项目

2015-07-29 10:46:20

Java错误

2020-05-29 14:30:35

Kubernetes开发错误

2016-02-26 10:20:17

HadoopSpark大数据项目

2023-03-09 09:38:01

数据科学

2011-06-30 09:25:22

软件项目

2020-05-28 11:34:08

互联网数据分析数据

2023-02-09 15:33:48

数据质量数据集
点赞
收藏

51CTO技术栈公众号