PaaS领域风云再起,AWS将实时特性打入其云服务

云计算 PaaS
在 一大三小:亚马逊,微软、谷歌、IBM ,IaaS四强争霸中,我们有报道过IaaS领域的硝烟弥漫,而Amazon在市场占有率上有着压倒性的优势——租用的计算资源是象限中其它14个供应商的5倍,IaaS霸主地位毋庸置疑。

在 一大三小:亚马逊,微软、谷歌、IBM ,IaaS四强争霸中,我们有报道过IaaS领域的硝烟弥漫,而Amazon在市场占有率上有着压倒性的优势——租用的计算资源是象限中其它14个供应商的5倍,IaaS霸主地位毋庸置疑。然而,区别于其IaaS的绝对优势,AWS在PaaS领域的日子似乎“没那么好过”,其领先地位受GCE、Azure、Heroku等众多劲敌窥伺。然而AWS之所以为AWS,不仅因为其数量庞大的合作伙伴,还有其独一无二的云服务,就在本个月,Amazon一扫之前在PaaS领域的低调,在宣布EMR支持Impala之后,更推出了流计算服务Kinesis。

EMR支持Impala:AWS军团亮剑流计算之始

本月,Amazon宣布EMR支持Impala,Impala是专为实时、ad-hoc查询设计的开源工具,使用类SQL语言。在AmazonEMR上使用Impala,用户可以在非结构数据上执行快速的交互分析。对于许多类型的查询,比Hive快很多。Impala的性能使它成为迭代查询和许多流行BI工具一个很好的引擎。通过Amazon EMR,用户可以用Impala作一个可靠的数据仓库来执行数据分析、监控和商务智能等任务。这里是三个用例:

取代Hive,在长期运行的集群上使用Impala来执行ad-hoc查询。Impala可以将迭代查询时间减少至秒级,使它非常适合做快速调研。用户可以在同一个集群上进行流计算和批处理,在一个长期运行的Hive和Pig分析集群上使用Impala,或者为Impala查询建立一个经过专门调优的集群。

在短暂的Amazon EMR集群上使用Impala而不是Hive来进行批ETL作业。对于很多查询来说,Impala比Hive快,就像Hive,Impala使用SQL,所以,从Hive到Impala查询修改工作量并不大。

结合使用Impala和第三方商业智能工具。通过给集群连一个客户端ODBC或者JDBC驱动,你可以将Impala作为强大可视化工具及监视面板的查询引擎。

Kinesis的全面可用:AWS之所以为AWS的原因

Kinesis,AWS于11月宣布的流数据服务,现已公开使用。这种服务理论上可以与流行的开源技术(比如Apache Strom)相匹敌,而当下也只有Kinesis能带来完全的管理经验,这种经验成为AWS的进程中的标准。

随着公司(尤其是基于因特网的公司)寻求超越他们倚仗已久的批处理方式,流处理正变得越来越流行。流处理主要利用数据的实时优势,而不是等待几分钟,甚至是数小时来分析收集所有(前一批正在处理之后)的数据,对这项工作而言Storm可能是最流行的工具,在发往其它地方(比如Hadoop)与历史数据进行分析之前,Storm就会在数据传输过程中进行处理。

Twitter通过2011年购买Backtype获得Strom建立者Nathan Marz,因此它应该是个典型的Storm用户。Storm帮助Twitter完成许多事情,比如让用户Timeline保持实时更新,但是该公司同样依靠了许多其他工具(Hadoop,当然名列其中)来做一些长期趋势分析和搜索引擎模型训练。

 

[[92477]]

 

Amazon CTO Werner Vopgels在11月对外公布了Kinesis服务

就像Storm,在将数据运输到另一个数据存储(基于AWS平台的ElasticMapReduce、Redshift或者DynamoDB)之前,Kinesis就能够进行实时处理。但是区别于Storm,Kinesis保存数据的时间可以长达24小时,同时,通过软件开发工作包或者SDK可以自动地扩展到每小时上千个TB 。Kinesis还含一个转移数据到Storm的连接器,AWS数据科学经理Matt Wood解释到,在当现存Storm用户想继续使用它来处理数据时,Kinesis可以实现自动连接。

对Kinesis来说SDK是一项关键,因为这项服务的设计宗旨就是“降低建立响应式应用程序的门槛”,AWS在一次采访中说到。早期访问用户,包括移动游戏开发商Supercell,正在使用Kinesis对游戏服务器和市场平台Bizo中的数据流进行处理,然后供给实时监控面板。 Wood说Bizo有一个异常小的研发团队,能有机会省却管理数据管道的工时,从而转移到更具价值的任务上,这得感谢AWS。

当Amazon首次公开Knesis这个产品时,我们就会发现,AWS的云服务无可比拟,这里我们不妨计算一下其他云供应商提供自己流处理服务的时间。当下企业的计算基础设施一般都包括一个完整的数据管道,用以收集和处理数据,因此如果其他云服务供应商想遏制用于疯狂涌向AWS,那么他们不可以只有一个Hadoop。

原文链接: Amazon’s streaming data service, Kinesis, is now available

责任编辑:王程程 来源: Gigaom
相关推荐

2010-12-14 18:50:23

微软

2013-09-22 09:39:55

Nirvanix云存储

2017-11-30 11:07:21

2014-01-09 09:58:10

SDNOracleCorente

2015-05-27 10:49:59

2012-09-04 14:42:36

2017-08-10 15:52:40

AWSGreengrass领域

2013-07-22 08:36:51

每周新闻回顾

2022-03-07 18:05:29

PaaS云服务

2014-02-20 09:54:52

AWS平台即服务PaaS

2012-11-30 11:00:54

2010-04-28 10:39:43

Webkit浏览器内核

2012-03-28 22:00:40

Android

2015-01-27 09:38:52

IBM BluemixAWSCloud Found

2021-08-14 06:52:03

5G 5G网络5G招标

2021-03-29 16:46:51

加密货币信息技术印度

2013-05-20 10:01:14

亚马逊谷歌AWS云计算服务

2013-01-15 09:52:38

AWS云服务亚马逊

2013-09-09 09:36:34

AzureAWS云服务

2015-03-17 14:58:36

青云QingCloud
点赞
收藏

51CTO技术栈公众号