数据准备是大数据分析的无名英雄

大数据
随着企业花越来越多的时间来分析数据,清理和准备数据的解决方案将会变得更有价值。

[[147627]]

随着企业花越来越多的时间来分析数据,清理和准备数据的解决方案将会变得更有价值。

现在大数据是热门话题,你在任何地方与任何人交谈很难不提到大数据。事实上,大数据的术语有点被过度使用,它对不同的人意味着不同的东西,但所有这些定义都有一个共同点,那就是数据!

上面我们说大数据依赖于数据,这似乎很明显,但大数据分析的成功需要的不仅仅是原始数据,还需要好的高质量数据。所以,更准确的说法应该是,大数据的成功需要准备好的数据。对于分析,有句古老的格言,“进来是垃圾,出去也是垃圾”,这意味着如果你把大量参差不齐的数据放到分析解决方案,你将会得到不好的结果。

数据的清理和准备历来都是漫长的艰巨的耗时的过程。当笔者还在Yankee Group公司时,他们迁移CRM系统,在迁移工作之前,该公司花了一年时间来清理现有系统中的记录数据,以确保不会迁移不好的数据。虽然他们做了这么多工作,仍然有很多不良信息被迁移过去。

最近,笔者看到一家被称为Paxata的公司,该公司提供的解决方案可以进行所谓的“自助服务自适应数据准备”。在分析或运营报告工作之前,该技术可以整合、清理和形成数据。市面上很多现有的商业智能产品声称可以简化分析过程,但事实是,大多数数据科学家和数据分析师花费大量时间来为分析准备数据。鉴于此,笔者认为,大多数企业宁愿聘请高薪人才找出数据的含义(+微信关注网络世界),而不是清理数据。

Paxata提供数据整个生命周期的准备,包括探索、清理、更换、形成和发布数据以进行分析。该产品还允许不同的数据团队共享相同的数据集,让不同的团队可以同时编辑和访问多个设备的信息。该产品还是一个管理解决方案,它会追踪项目内的每个步骤,并有完全的重放功能来审查已经完成的更改。

Paxata的用户可以提高对大型数据集的分析生产率,同时最小化数据蔓延的危险。该产品既可作为云服务—确保数据准备的灵活性,也可以作为内部部署的解决方案,它可以整合到Hadoop以更快获取价值。

正如上文所述,大数据现在是一个热门话题,但企业和IT***需要明白,分析糟糕的数据意味着糟糕的分析结果,可能会造成错误的商业决策。正因为如此,笔者希望看到数据准备技术会开始像大数据一样热门。

责任编辑:李英杰 来源: 网界网
相关推荐

2009-07-03 08:35:04

职场新人无名英雄

2023-06-20 09:52:03

雾计算云计算

2024-08-06 13:56:39

2014-03-31 15:08:23

机器学习大数据

2017-10-08 10:22:00

大数据王者荣耀词汇

2017-02-27 16:35:00

HDFS大数据分析

2015-03-04 11:01:36

大数据数据分析分析

2011-11-17 08:51:19

互联网

2015-07-29 16:19:54

大数据时代分析

2015-08-14 10:28:09

大数据

2015-07-29 11:27:28

大数据时代数据分析统计学

2021-06-15 14:07:42

Google BigQ大数据大数据分析

2017-07-22 00:41:27

大数据数据存储

2021-08-06 11:01:23

大数据数据分析技术

2013-04-09 09:28:20

大数据大数据全球技术峰会

2015-07-23 09:34:57

大数据数据分析

2019-07-31 14:16:35

大数据人工智能算法

2015-08-11 15:52:52

大数据数据分析

2022-03-29 14:49:14

大数据数据分析

2021-10-12 15:25:08

大数据数据分析
点赞
收藏

51CTO技术栈公众号