人们可能认为每个人现在都知道什么是大数据,但是仍然存在误解。因此需要得到大数据专家的建议。
大数据解释
一段时间以来,大数据一直是企业董事会的流行语。尽管已被广泛使用,但仍可能被人们误解。
技术领导者知道,只有大数据就没有内在的价值。法律技术服务商InCloud Counsel公司的机器学习主管Hadayat Seddiqi说:“人们有时认为他们所需的只是大数据集,但大数据集本质上并没有价值。大数据的真正价值在于可以提取的信息来回答特定的业务问题。”
“大数据”也不是一个非常精确的术语。有些人用它来指代数据本身,而另一些人则用它来指代对数据的分析或从中获得的洞察力。
以下探讨一下与受众进行对话的一些出发点,这些对话涉及讨论什么是大数据,什么不是大数据,在哪里可以为组织带来新的见解或机会以及大数据战略应该具备的内容。
5个大数据定义
Smart Cube公司数据分析副总裁Nitin Aggarwal对大数据的基本解释是:“如果无法在现有数据仓库或存储中有效地存储、访问和处理的数据,则称为大数据。”例如,数据量可能太大,或者数据增长速度将超过企业可以经济地添加的存储速度,或者数据类型无法使用当前技术进行管理。
调查要求其他一些专家提供启动大数据讨论比较好的解释:
- SAS数据管理主管Todd Wright说,“大数据指的是访问和使用数据(过去从未有过的数据)的能力,以便做出更有教育意义的决策和预测。
- Rubicon Global公司首席技术官Phil Rodoni说,“大数据是指可以用于分析、洞察和预测的大量不同数据。”
- Gartner公司的IT术语表提出,“大数据是高容量,高速度和/或多种信息资产,需要经济高效,创新形式的信息处理形式,以增强洞察力,决策和流程自动化。”–
- “Everest集团副总裁Yugal Joshi说,“大数据是一个相对术语,取决于谁在使用它。从广义上讲,它指的是比大多数企业习惯使用的规模大得多的数据,通常比通常的数据变化更快,并且通常需要在更短的时间内进行分析以得出业务价值。”
大数据类比:考虑购物
Inzata公司首席运营官Christopher Rafter说,当所有其他方法都失败时,通常由亚马逊在线购物讲解员来解决。他解释说,“人们点击的每一个产品、阅读的评论、放在购物车里的物品,以及最终购买的东西,都会被捕获。所有这些单独的数据点汇集在一起,描绘出一幅关于发生了什么,购买了什么,浏览了什么,以及最终购买了什么的画面。”企业从成千上万的购物者和数以百万计的购物者身上捕捉到的大量数据被用来分析模式和趋势,以推动有关定价、产品建议等方面的更好决策。
如何消除常见的大数据误解
大多数企业领导者对大数据都有合理的理解,但是仍然存在一些重大误解。首先,也许是很具破坏性的假设是,所有大数据都具有业务价值。
SAS公司的Wright说,“大数据这个术语使许多人认为价值仅来自组织拥有的庞大数据量,而拥有最多数据的组织则获胜,其实并不是这样。真正的价值来自组织如何通过利用不同的、以前未使用的数据源来更广泛地了解其客户和业务。这反过来会导致通过使用分析获得更具教育性和更明智的决策。”
Aggarwal补充说,数量的最终重要性远不如数据的质量、清洁度、可用性和可访问性。而且,并非每个公司都需要大数据。他说,“根据我们的经验,大多数业务问题不需要大数据,而大数据并不能解决所有业务问题。”
有些人还认为大数据就像常规数据一样,但是会产生更详细的见解。EastBan科技公司数据科学家Polina Reshetova说,“这不一定是正确的,大数据通常会带来新的问题。它具有自己的统计属性,并且需要一种思考结果和提出问题的新方式。”
此外,并非所有大数据计划都需要大量输入。EastBanc科技公司董事长WolfRuzicka说,“项目可能小得令人惊讶。我们最小的大数据项目处理1TB的数据。它从千兆字节开始。关键是拥有正确的数据类型:干净、准确、相关、及时和足够的数据。”
这就是大数据工作不必采用巨大投资的原因,但这可能是另一个不正确的假设。Aggarwal说,“组织无需等待数年就可以花费数百万美元来建立企业级大数据平台。在较小的层面上可以做很多事情。”
如何构建智能大数据策略?以下深入研究这个问题:
必备的大数据战略
Everest集团的Joshi说,“大数据的关键支持能力来源于传统的良好数据管理实践,包括清理、存储、验证,最重要的是,利用它来推动业务价值。”
对于寻求利用大数据的组织来说,一些必须具备的条件包括:
- 数据访问。拥有比以往更多的有价值的数据的数据源,比较大的问题是:能做到吗?Wright说:“如果没有访问所有可用数据的能力,组织将永远不会有信心知道自己是否对客户和业务有完整的了解。”
- 领导力支持。Aggarwal说,“如果企业领导者不相信数据分析,并且不采纳和接受数据分析作为公司文化的一部分,那么任何使大数据可用的努力都会失败,或者花费很少,从而导致次优结果和投资回报率。”
- 数据质量。Wright表示,组织必须至少能够确保每个人都使用标准化和准确的数据。
- 数据所有权。Joshi说:“许多企业都有大数据,但没有利用它进行业务,这很奇怪。组织模式可能需要改变,以便这样的大数据计划的指定所有者为业务创造价值并对此负责。”
- 分析工具和策略。Wright解释说:“能够对数据建模,了解正在发生的模式并使组织能够做出有根据的决策和预测的分析是大数据的目标。没有任何一种系统可以神奇地启用大数据。”
Ruzicka说:“企业需要处理许多单独的工具,有时甚至有时非常有规律地必须尝试不同的组合。”由于大数据更多的是一个过程,而不是一个神奇的工具,因此不断进行迭代是关键。”
- 数据技能。Aggarwal说,“企业内部拥有数据工程师和数据科学家变得越来越重要;但是,寻找合适的外部合作伙伴可以提高效率和成本效益。”
开始大数据项目的建议
如果组织正处于使用大数据的早期阶段那么成功的关键将是提出正确的业务问题。许多业务领导者渴望在没有明确目标的情况下直接构建大数据解决方案或项目。Rodoni说:“用来吸引业务领导者的关键问题一直是'想回答什么问题?'”
深入研究这一问题的一种好方法是考虑三个潜在价值领域:
- 组织如何增加收入?
- 如何优化其利润?
- 企业的总体使命是什么?
IT及其利益相关者可以开始考虑在每个领域中可能要携带大数据的地方。Ruzicka说,“然后,必须确定企业内部或外部最小、最准确、最及时的数据源,这些数据源可以提供可转换为与每个决策相关的信息的数据。”
Wright指出,业务领导者应该明白,如果没有计划如何使用数据以及实现大数据要达到的目标,那么从更多来源获得更多数据就没有任何价值。他们是否要预测客户行为?地图制造趋势?通过更好的定位和消息传递来提高销售量?如何成为更好的员工?
Rafter说,“只有这样,他们才能制定大数据战略,其中包括人员、流程和技术,以实现这些目标。最重要的因素不是技术性的,而是战略性的。”