让人大跌眼镜的10组大数据数字

译文
大数据
人们称之为“大数据”是有原因的,大数据确实很庞大。但是厘清信息数字化的增长并非易事。为此,我们精心整理出了这10组令人震惊的数据,它们从多个侧面反映了数据现状和未来趋势。

[[341950]]

【51CTO.com快译】人们称之为“大数据”是有原因的,大数据确实很庞大。但是厘清信息数字化的增长并非易事。为此,我们精心整理出了这10组令人震惊的数据,它们从多个侧面反映了数据现状和未来趋势。

1. 据IDC公司的《DataAge 2025年》报告显示,到2025年,全球数据圈将从2018年的33 ZB扩大到175 ZB,年复合增长率达到26%。然而,这些数据中只有约9ZB将实际存储起来,而2015年这个数据仅为0.9ZB。这家调研公司称,存储的数据中只有约三分之一将被实际使用。

2. 据Coughlin Associates声称,预计2020年出货的传统硬盘(HDD)、固态硬盘(SSD)和LTO磁带驱动器的年存储容量将达到约1300 EB,到2025年将达到4500 EB,其中HDD在该容量中占有最大的份额。据IDC声称,到2025年,HDD将占企业存储需求的80%以上,传统SSD约占15%,而较新的NVMe-NAND固态设备不到5%。

图1

3. 据Statista声称,HDD出货量在2010年达到峰值,多达6.513亿只,到2019年减少至3.163亿只。然而据几个消息源透露,随着存储需求增加,预计未来几年内HDD的出货量将再次开始增长。(很显然,HDD的容量已大幅增加,使组织能够在数量较少的HDD上存储更多的字节。)

4. 随着组织将数据存储转移到内部和云数据中心,预计到2024年端点设备上的数据存储将急剧下降(尽管出现了速度超快的5G网络)。据IDC的《DataAge 2025年》报告显示,事实上,由使用手机、PC和物联网设备之类的终端来存储数据改为使用核心数据中心完全扭转了2015年的情形,当时大部分数据存储在终端上,企业数据存储相对较少。

5. 据IDC的《DataAge 2025年》报告显示,从2018年到2025年,将需要交付超过22 ZB的存储容量才能满足存储需求,其中约59%的容量将来自交付的HDD。存储在SSD(包括NVMe)上的数据会增加,但不会对HDD存储的增长造成太大影响。

图2

6. 据Domo的第八份一年一度的《数据永不休眠》图显示,消费者每天每一分钟在网上花费100万美元、进行140万次视频和语音通话、在Facebook上共享150000条消息,并在Netflix上播放404000小时的视频。

7. 据IDC在2020年1月发布的《希捷Rethink数据调查》显示,如今每小时创建的数据比20年前全年创建的数据还要多。

8. 据IDC的《DataAge 2025年》报告显示,到2021年,公共云存储的数据将超过企业数据中心。(这个数字是新冠疫情之前的,而新冠疫情加速了许多组织的云迁移计划。)

9. AWS目前在全球范围内有77个可用区(AZ),计划新增3个。据TPM在2014年的数字估计,这可能意味着AWS如今在全球拥有和运营的数据中心在150个至220个(假设每个AZ平均需要2至3个数据中心)。如果每个数据中心含有50000台至80000台服务器(按照AWS工程师James Hamilton在re:Invent大会上的演讲,2014年是这种情况),这意味着AWS运行750万台至1760万台服务器。只有Bezos知道AWS存储了多少数据。

图3. AWS目前有77个可用区,每个AZ通常含有2至3个数据中心。

10. 每个联网的人每18秒至少进行一次数据交互。这些交互中许多归因于全球数十亿个联网的物联网设备,预计到2025年这些设备将生成逾90ZB的数据。据IDC声称,在接下来五年,每天将有约10亿人开始与数据交互。

大数据也许不像2015年那样成为报章头条,但当初使大数据备受瞩目的根本驱动因素仍然适用,实际上在一些情况下还在加速发展。也许这个现象需要一个新名称了。

原文标题:10 Big Data Statistics That Will Blow Your Mind,作者:Alex Woodie

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】

 

责任编辑:庞桂玉 来源: 51CTO
相关推荐

2024-05-29 13:29:47

2019-10-21 08:22:36

丰巢刷脸取件

2023-05-26 14:10:00

模型AI

2019-04-18 10:34:23

三星Galaxy Fold折叠屏手机

2013-08-22 10:59:00

手势操控iOS

2014-07-14 11:47:03

火狐浏览器

2012-05-07 17:39:18

Galaxy

2024-04-07 08:00:00

AIMeta

2023-11-06 10:40:47

GPT-4V大模型

2013-09-24 09:29:38

大数据

2016-10-28 15:05:40

2024-08-12 08:46:23

2015-11-02 17:37:33

GartnerAWS数据库

2022-11-21 16:10:31

奔驰可靠性排名

2011-03-16 09:14:01

网络设备负载均衡

2009-12-24 09:22:30

2017-02-08 10:56:32

光纤产能技术

2012-06-11 14:36:27

周鸿祎小米

2011-06-13 16:21:19

2010-04-20 21:48:48

点赞
收藏

51CTO技术栈公众号