8个现实世界大数据部署实例

云计算
世界上的数据量正在成指数增加,每18个月就增加一倍。现在有很多关于大数据的讨论,主要围绕大数据带来的问题以及大数据带来的潜在价值。本文中,让我们看看8个不同行业的大数据部署实例。

8个现实世界大数据部署实例

世界上的数据量正在成指数增加,每18个月就增加一倍。现在有很多关于大数据的讨论,主要围绕大数据带来的问题以及大数据带来的潜在价值。本文中,让我们看看8个不同行业的大数据部署实例。


 

[[103152]]

点评:世界上的数据量每18个月就增加一倍,下面我们就来看看8个不同行业的大数据部署实例。#p#


 

[[97993]]

美国国家海洋和大气管理局(NOAA)国家气象服务

美国国家海洋和大气管理局(NOAA)从事大数据业务已经长达50年,现在他们每年管理着30PB新数据----每天从卫星、船舶、飞机、浮标和其他传感器收集超过35亿观测数据,然后使用大气、海洋和陆地的直接测量数据连同复杂的高保真预测建模来提供国家气象服务(NWS)。NWS的模型每天产生数以百万计的“产品”(天气警报和指导)提供给公共和私营部门,包括国防部和NASA等政府部门。

点评:气象服务需要精准的、大型的数据计算。#p#

 

AM Biotechnologies DNA序列分析解决方案

AM Biotechnologies生物技术公司专注于开发一个专有新技术,用于产生基于DNA的分子实体—aptamers(核酸适配子)。核酸适配子的应用范围涉及对血液试样中特定分析物的定量分析,以及在体内将药物输送到特定目标。开发这些核酸适配子需要分析几十亿短的DNA序列,它使用基于网络的大数据分析工具(来自CD-HIT和Galaxy)来分析这些数据。

点评:特定分析物的定量分析,需要大数据的帮助。#p#

[[103155]]

NARA电子记录存档

美国国家档案和记录管理局(NARA)是美国官方记录的维护者,它管理142TB的信息,这代表着超过70亿对象,包括来自全国各地联邦机构生态系统、国会和几个总统图书馆的记录。这些被数字化的记录以超过4800种不同的格式存在。此外,NARA还正在数字化超过四百万立方英尺的传统归档信息,到2016年,95%的电子归档信息将需要提供给研究人员,NARA已经建立了电子记录存档(ERA)作为“系统中的系统”来执行各种归档功能和记录管理。

点评:对象数目庞大,联络记录复杂,需要大数据。#p#

[[103156]]

Vestas风能型风力发电机的安置和维护

丹麦公司Vestas使用超级计算机和大数据建模解决方案来为其风力发电机找出最佳位置,以最大限度地提高发电和降低能源成本。它使用的风力库整合了来自全球天气系统的数据,以及通过其现有发电机收集的数据,目前,这个风力库承载的数据约2.8PB,目前的参数包括温度、气压、湿度、降水、风向和风速,以及该公司的历史数据记录等。

点评:Vestas还计划增加全球森林砍伐指标、卫星影像、历史指标、地理空间数据以及月球和潮汐关系的数据。#p#

[[97995]]

IRS合规数据仓库

在1996年,美国国内税务署(IRS)启动了一个项目以上传单一年度的纳税申报资料进行分析,这个项目产生了合规数据仓库(CDW),其中包含超过1PB的信息。大多数传统数据都是结构化数据,但以电子方式提交的纳税申请表中的新数据以及来自国际税务条约合作伙伴和第三方的新数据都是XML或者其他半/非结构化格式。IRS研究小组负责对这些数据进行分析,他们的工作涉及评估美国税收差距、预测身份盗窃、评估纳税人的负担以及模拟纳税政策变化的影响。

点评:非结构式信息,数据量庞大,需要大数据。#p#

[[97996]]

安大略理工大学(UOIT)医疗监控

UOIT与IBM正在进行Artemis项目,旨在努力提高医疗监测技术,以便在生命体征达到临界水平(例如院内感染,这对早产儿是生命威胁)之前发出预警信息。Artemis项目是基于流分析软件,这是一个信息处理架构,可实现近乎实时的决策支持(通过对数据流的持续分析)。#p#

点评:医疗需要。

[[97997]]

TerraEchos外围入侵检测

TerraEchos专注于开发保护和监测关键基础设施的技术,其客户之一是美国能源部能源实验室,该实验室依赖于TerraEchos的科学技术和资源,他们需要一个技术解决方案来检测、分类、定位和跟踪潜在威胁(机械和生物方面的)。要做到这一点,解决方案需要使用传感器、分析软件和高性能计算来不断分析大量运动信息,从人类和动物运动到大气情况等。

点评:这对分析工具和计算等都有严格要求。#p#

[[97998]]

NASA载人航天图像收集、存档和托管

 

美国航空航天局约翰逊航天中心(JSC)是美国宇航员队伍的枢纽,也是国际空间站(ISS)任务操作核心。自1959年以来,该航天中心收集了超过400万静态照片、950万英尺的16mm胶片和85000个录像带和文件(也就是81616小时的视频)。这些收集的数据主要用于科学和工程社区。NASA开发了一个Imagery Online(IO)应用程序,该应用程序链接图像文件名到所有与之相关的元数据。

点评:但在向公众提供这些数据方面,NASA还面临着很大的挑战。感谢观看!

 

责任编辑:王程程 来源: 网界网
相关推荐

2021-08-20 08:00:00

大数据开发技术

2013-11-15 10:25:19

大数据大数据部署

2018-03-07 13:30:09

数据库Redis

2023-09-06 15:27:00

混合现实架构

2018-05-02 13:59:01

大数据数据收集数据科学

2020-01-15 12:43:51

人工智能机器学习工程师

2019-10-08 14:16:08

大数据数据产业

2013-11-11 09:23:31

2024-04-02 07:00:00

大数据

2018-03-01 14:49:53

多云云计算混合云

2009-08-07 08:33:18

魔兽世界玩网瘾

2023-07-27 14:44:03

物联网IOT

2017-07-19 14:40:37

2022-11-21 14:33:53

大数据数据存储机器学习

2013-03-21 09:34:03

世界银行大数据

2018-05-11 15:36:43

数据科学算法数据分析

2012-11-14 09:49:53

大数据财务云计算

2012-12-25 09:36:11

Storm大数据分析

2011-08-30 17:22:50

研究报告大数据时代数据集成

2017-11-27 13:53:01

大数据失控数据平台
点赞
收藏

51CTO技术栈公众号