七个必定使数据分析失败的方式

大数据 数据分析
数据分析已经成为企业最重要的业务和技术的差异化要素之一,数据分析使企业能够深入了解其运营的方方面面,从而在竞争中获得优势。

数据分析正迅速成为赢得业务战略的关键。但是如果没有正确的方法、技巧和策略,你的数据举措可能永远没有结果。

数据分析已经成为企业最重要的业务和技术的差异化要素之一,数据分析使企业能够深入了解其运营的方方面面,从而在竞争中获得优势。

调研公司Gartner今年早些时候预测,2017年将是数据和分析成为主流的一年,为已经为转型做好准备的组织内外创造价值。Gartner表示,数据分析的方法正在变得更加整体化,涵盖整个业务。

[[211162]]

Gartner的研究报告显示,在主要趋势中,分析将推动现代业务运营,而不仅仅是反映其绩效。企业将创建端到端的架构,这些架构考虑到了组织核心乃至组织边缘的数据管理和分析;高管们将数据和分析作为业务战略的一部分,使数据和分析专业人员能够发挥新的作用并创造业务增长。

公司正在为分析工具投入大量资金。国际数据公司(International Data Corp.)在2017年3月的一份报告中预测,今年全球大数据和业务分析的收入将达到1508亿美元,比2016年增长12%,该公司预计增长会一直持续到2020年,届时收入将超过2100亿美元。

然而在数据分析被反复强调的请况下,很多组织还是陷入了损害或浪费分析的真正价值的陷阱。根据IT领导者和行业专家的说法,以下是七个必定使数据分析失败的方式。

1. 急于试水,却不知道自己在找什么

如果你不知道在数据中需要检查哪些具体的趋势或信号,你怎么能期望从中获得真正的价值呢?

德勤分析(Deloitte Analytics)的高级顾问、《逐鹿分析:新的制胜之道》一书的作者Tom Davenport说:“分析过程中最大的问题是你不知道自己在找什么数据。”

Davenport说:“数据挖掘让系统找出数据中的有趣之处的理念使很多公司误入歧途。即便使用机器学习,从数据关系的角度来了解你正在寻找的东西也是大有裨益的。”

天气网站Weather.com的质量保证经理Todd Eaton说:“Weather.com强调要找到‘知道如何查询数据并能完整而准确地讲述数据要传达的含义的人’。”

Eaton说:“合适的人员对使用数据回答问题充满激情,然后愿意不断质疑他们的发现,确保数据不仅适合叙事,而且能够解释我们所看到的事物并有助于预测未来发展的目标。重要的是,每个人都知道我们正在试图发现数据和我们的总体目标,并收集一致的测量结果和数据。”

启动分析工作时,缺乏重点肯定会导致失败。通用电气公司的首席数据官Christina Clark表示:“当数据团队把重点放在优先考虑的成果上时,他们将是最成功的。团队往往会失败,因为他们希望立即解决很多的业务需求,最终由于精力过分分散而没有产生有意义的影响来保持兴趣或维持资金来源。”

2. 建立(维护)自己的基础设施

建立和维护自己的大数据基础设施可能是一个巨大的诱惑。但这可能会危及你的分析工作的使命。

网络安全公司Vectra的首席技术官Oliver Tavakoli表示:“这往往浪费了数据科学家大量时间,而不是实际开发更好的分析。”

Tavakoli说:“我们知道我们需要大量的数据来进行分析。我们开始做大家都要求做的事情:我们买了一堆有大量磁盘容量的服务器,我们把它们放在托管设施里,我们用Apache Spark创建了自己的Hadoop集群,并让我们的数据科学家编写Scala代码与集群进行交互。”

有时由于硬件故障,集群会中断,更多的时候是由于软件故障。软件包会过时,有时几小时过去了,集群都处在不可用的状态。

Tavakoli说:“我们终于有了足够的资源并决定将这部分问题外包出去。自打Vectra与外部供应商合作之后,它就很少花时间在这些基本问题上,“我们几乎所有的时间都致力于将数据提供给系统并分析其中的数据”,他这样说道。

3. 成为数据分割者,而不是数据统一者

长期以来,企业一直在努力解决阻止各部门共享信息的“数据孤岛”问题,从而使整个机构受益。分析也遇到了同样的挑战。

客户生命周期管理营销公司Zeta Global的首席信息官Jeffry Nimeroff说,统一不同的数据就是一个很好的最佳实践。

Nimeroff表示:“每个数据孤岛都会在能产生价值相互连接之间形成一个障碍。例如,考虑一个丰富的用户配置文件连接或断开网站活动数据。可以互连的数据越多越好,因为在这些互连里才能找到预测能力。”

Nimeroff说,这并不意味着必须将所有数据从初始系统移动到一个整体。他说:“相反,我们使用其中一种现代集成技术来提供统一的数据视图,而这一切都在当前的系统中。”

4. 回避良好的数据卫生

如果你正在分析的数据不准确、不是最新的、且没有条理,那么分析的价值可能会急剧下降。

Nimeroff说:“错进错出(garbage in, garbage out)是原始业务数据的容量和范围扩大的问题,最好的数据分析团队要质量渗透,因此,建立流程并利用技术来执行质量标准是一个必胜的组合。”

Nimeroff说,在流程方面,确保流程的可重复性以及对结果的可审计性是非常重要的。在技术方面,他说,部署包括分析、元数据管理、清理、采购等数据质量工具有助于确保获得更好的高质量数据。

Tavakoli说:组织需要使用工具来“清除碎片”——不完整和破坏的数据——并且从不同的来源获取数据,以使其兼容且易于理解,并尽可能简化分析。尽可能使数据一目了然,以便团队的所有成员都了解各种数据的意义。”

技术服务公司Incedo的首席执行官TP Miglani说,高质量的数据“是产生有用洞察的关键动力”。他说:“你需要建立数据仓库和数据湖泊,把结构化和非结构化的数据汇集在一起。成功的组织会确保他们会用清理、计算缺失值,并准确地标记数据来提高数据的质量。”

良好的数据卫生也意味着保持数据尽可能是最新的。Nimeroff说,数据需要新鲜度,“数据宇宙”要不断膨胀,企业才能从分析中获得价值。

Nimeroff说:“数据新鲜度要求了解当前数据采集过程的时效性。显然,一个系统越实时,新鲜度就越高。也可以通过使用第三方服务来支持新鲜度,以加强你现有的技术和流程。”

5. 放弃分析计划的高管赞助

与其它类型的重大IT项目一样,没有数据分析项目的高级管理人员的领导能力可能对成功不利。

Miglani说:“分析团队的目标是通过将数据与公司的战术和战略决策相结合来产生洞察。一个失败的例子就是如果一个数据科学团队做了大量的数据分析,开发出了准确的预测模型,但是结果并没有被实施,因为它需要组织和文化的变革。”

Clark说,建立数据管理基础需要多年持续不断的努力。他说:“数据和分析团队要促进的一些工作不会有立竿见影的效果,这可能与业务合作伙伴的预期不一致。这需要强有力的领导层支持,以及努力教育业务合作伙伴,以实现更加趋于数据驱动的未来。”

6. 忽略中层和下层管理者

数据科学家在真空中进行的分析和其他那些没有从最亲近分析需求的业务经理得到可靠输入的专家不太可能成功。

服务管理软件供应商Astea International的首席运营官David Giannetto表示:“如果没有中低层管理人员的积极参与,分析团队提供的信息往往不能真正地帮助管理层团队更好地完成工作。”

Giannetto说:“信息将是定向的,信息会指出更大的流程缺陷或可以改进的地方,但是管理层早晚要着手处理——当他们有时间的时候。而大多数管理者从来都没有多余的时间。只有当团队由真正懂业务的人组成,以及业务实际上每天都需要访问信息时,传递的信息才足以对业务产生积极影响。”

Giannetto说,如果分析能够告诉用户真正的问题在哪里——哪里可能会出现问题——他们有足够的时间来阻止问题,他们每天都使用这些信息,那么这一举措将会取得成功。

7. 缺乏支持良好数据分析的文化和技能

这对于组织来说是一个普遍的问题,很大程度上是因为数据科学这样的技术很难获取。但是,如果数据素养不是公司文化的核心,分析失败的可能性更大。

Miglani说:“对于不熟悉分析的人来说,数据科学被认为是解决问题的一种神奇的方式。预测和自学的概念很难让人掌握。要说服你的商业伙伴在不透明的算法上作出决策是很难的。你需要先教育他们。“

而且组织机构在继续努力寻找具有分析技能的数据科学家和其他专业人员。Miglani说:“培养这种能力的最好方法之一是培养这种才能,而不是在组织外物色超级明星。很多项目失败或者推迟,就是因为公司无法按时聘请或大量流失分析人员。”

责任编辑:未丽燕 来源: 企业网D1Net
相关推荐

2022-06-30 15:12:48

数据分析工具大数据

2020-07-27 05:40:13

Python数据分析开发

2022-06-16 13:37:47

RPA机器人流程自动化

2021-08-02 13:45:53

UPS电源数据中心

2022-05-06 08:47:10

Vue 3组件前端

2021-11-22 14:57:35

数据治理CIO数字化转型

2012-06-21 08:56:59

2020-10-16 11:53:52

数据分析PythonSQL

2022-12-09 09:47:02

2023-05-06 15:45:04

物联网IOT

2021-10-18 13:26:15

大数据数据分析技术

2022-03-18 08:23:43

人工智能神经网络失败

2018-05-24 08:47:15

数据存储技巧

2023-12-04 11:57:59

数据中心

2023-11-14 14:25:09

数据湖大数据

2021-07-16 09:55:46

数据工具软件

2020-12-07 09:56:34

GitLinux版本控制系统

2022-09-13 10:13:40

数据管理系统数据管理CIO

2022-11-24 14:03:10

数据战略大数据

2023-09-14 23:17:44

数字化转型数字化
点赞
收藏

51CTO技术栈公众号