科普篇:什么是大数据

大数据
麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

 对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

[[180358]]

麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。

大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。

到底多少数据量才算大数据?到底是结构化的,还是非结构化的?到底是要精确的真实的?......

如果我们冷静的思考一下,就会发现,大数据与我们息息相关(大数据已经融入了我们衣食住行的每个角落),但同时又会发现,大数据所涉及到的这些特殊技术,离我们又是那么的遥远。

我们还是来看看,大数据到底改变了什么?它其实就是通过海量的数据处理,让我们做决策时变的更轻松,更靠谱。比如我们在网上购物时,它首先会告诉你某个商品有多个人评价,评价越多,也就意味着越多人买;当你点击去之后,就可以看到好评度是95%,还是98%?如果是在360浏览器中打开的话,还有一个价格趋势,告诉你历史价位走势如何,其他电商平台是不是更便宜?除此之外,还有其他同类或同价位商品的推荐与排名等。有了这些信息,你就掌握了做一个购买决策时的几个关键信息:

1、这款商品好不好卖?

2、这款商品口碑好不好?

3、这个价格便不便宜,现在是不是最便宜的时候?

4、有没有其他更好的商品?——这个时候,是否将这个商品改进购物篮并付款,做这个决定变得非常轻松。

那它是怎么做到的呢?就是化繁为简,将海量的数据,归纳整理为几个简单的指标。

责任编辑:赵立京 来源: 51CTO
相关推荐

2016-12-12 16:06:41

BI商业智能

2019-03-22 13:53:07

大数据架构数据源数据质量

2020-12-16 14:10:33

大数据大数据应用

2021-06-18 12:39:12

数据驱动设计设计师收集数据

2015-01-27 14:36:18

2017-12-19 21:29:58

物联网区块链大数据

2021-08-22 15:07:29

大数据信息安全隐私

2018-06-25 11:20:18

LinuxPython大数据

2013-11-12 10:50:02

大数据时代大数据

2019-09-30 08:23:47

Hash表哈希表Java

2018-05-17 17:41:53

大数据

2018-05-14 14:00:15

大数据数据挖掘方法

2021-04-15 09:37:05

大数据Maven

2021-09-29 16:39:23

大数据存储

2023-12-21 21:39:44

2020-12-02 10:32:10

大数据存储

2022-02-27 15:28:53

大数据挑战战略

2019-07-10 13:02:12

大数据智慧城市数据安全

2015-03-04 11:01:36

大数据数据分析分析

2015-07-29 16:19:54

大数据时代分析
点赞
收藏

51CTO技术栈公众号