如何为大数据项目做好准备:成功制定战略的6个关键要素

大数据
如果没有做好准备,那么项目失败的可能性就更大。人们在准备大数据项目时需要要考虑一些事项。

如果企业没有为获得最佳性能而预先准备数据,那将不会更好地为那些消耗数据的用户提供服务。实际上,不良的数据准备是导致大数据项目失败的主要原因,而管理此类项目的人负担不起,只是出于这个原因,对于企业来说,拥有大数据准备策略和方法并如实执行是至关重要的。

数据准备策略应包含以下元素:

1. 对当前和将来的业务问题有透彻的了解,期望数据能为企业带来答案。

了解要应用大数据分析的业务领域可以为数据建立业务环境,并有助于制定数据收集和执行策略。此阶段的目标是确定企业中哪些数据与关键业务问题相关,哪些无关。企业还可以随着业务需求的变化扩展业务问题和要查找的数据,但是一开始最好还是密切关注数据。

2. 数据集中化。

数据必须规范化以便一致,并且企业中的每个人都使用相同的数据。因此,即使可以选择针对特定业务领域填充此主数据的不同子集,也必须将所有分析数据存储在IT维护的集中式存储库中。

3. 标识必须馈入中央分析信息存储库的数据源。

一旦确定了业务案例和问题,就应确定可用于汇总回答业务中紧迫问题的数据集和源。这些数据源可以来自企业内部或外部。

4. 识别可能相关的未来数据源。

同时,现在开始识别将来业务可能需要的其他数据集或源还为时过早。这些数据源最初不会准备数据,但是它们的标识将为将来的数据准备提供一个路线图。

5. 定义的数据准备方法。

有三个基本步骤可将干净数据移入中央数据存储库。首先,从数据源中提取数据。然后,将其转换为与其要到达的数据目标兼容的格式。最后,将其加载到目标存储库中。重要的部分是转型。如果相同的数据字段将流入新的目的地,但该目的地的格式不同于原始目的地,则必须将数据转换为新格式,以便数据正常工作并在目的地中保持一致。如果人工完成,这是一个繁琐的步骤,因此需要自动化工具。

6.选择有效的数据准备工具。市场上有许多数据准备工具,因此建议企业尝试使用它们,并与提供强大支持和培训的供应商合作。目标应该是准备数据以使其具有最高质量,并选择易于使用的工具,并提供自动执行数据准备步骤的工具。

 

 

责任编辑:赵宁宁 来源: 360机房
相关推荐

2022-10-19 15:00:16

2020-08-10 09:53:30

CIO网络安全数据

2022-08-05 13:38:00

数据中心飓风团队

2020-12-04 11:38:03

5G网络IT

2020-05-22 17:35:56

数据中心天气技术

2023-11-06 14:42:25

2022-12-26 10:28:08

CIO技术领导者

2022-11-15 08:49:15

2020-05-18 21:57:47

物联网项目物联网IOT

2023-10-18 16:04:13

2021-03-14 18:12:22

高级持续威胁APT攻击

2019-11-18 11:55:24

大数据人工智能技术

2023-08-07 15:46:10

2022-12-06 15:27:14

2019-04-03 09:48:49

预测分析IT数据

2020-12-24 11:17:53

5G数据中心云计算

2015-08-31 09:38:33

Linux安装

2013-10-21 09:31:11

OpenStackIPv6IPv4

2013-03-07 10:21:10

大数据策略大数据架构

2024-03-07 14:43:10

人工智能机器学习数据中心
点赞
收藏

51CTO技术栈公众号