什么是HBase的?
HBase的是建立在的HadoopApache的开源的NoSQL数据库,它提供了大量的非结构化和半结构化数据的随机存取能力强的一致性。它是仿照谷歌的BigTable,是一个以家庭为中心的列式数据库。数据被存储在一个行内的表和数据的行由列族分组。 HBase的是在这个意义上,无论是列也不存储在其中的数据的类型,需要使用它们之前,定义一个无模式数据库。开放源代码是***发布由Mike Cafarella于2007年,线性扩展处理PB级数据的数千个节点。它可以依赖于数据的冗余,批量处理和通过在的Hadoop生态系统的分布式应用程序中提供的其他功能。
什么是AzureHDInsight HBase的?
HDInsight的HBase提供一个管理的集群集成到Azure环境。该簇被配置为直接在Azure斑点存储,这提供了在性能/成本选择低等待时间和增加的弹性存储数据。这使客户能够构建大型数据集工作的交互式网站,构建存储传感器和遥测数据,从数以百万计的端点的服务,以及分析这些数据与Hadoop作业。 HBase的和的Hadoop都是很好的出发点,在Azure大数据项目,特别是,可以实现实时应用与大型数据集工作。
在HDInsight实现利用HBase的的横向扩展架构,可提供自动分片表,强一致性读取和写入,和自动故障转移。性能提高了内存高速缓存的读取和高通量流式写入。虚拟网络的配置也可用于HDInsight HBase的。有关详细信息,请参阅提供HDInsight群集在Azure上的虚拟网络。
如何在HDInsight HBase的数据管理?
数据可以在HBase的使用创造GET,PUT和扫描从HBase的shell命令进行管理。数据通过表决,并阅读使用get命令写入到数据库中。扫描命令用于获得在一个表中,从多行数据。数据也可以使用HBase的C#的API,它提供了一个客户机库的HBase的REST API的顶端管理。一个HBase的数据库也可以使用Hive查询。的介绍,这些编程模型,请参阅获取使用HBase的用Hadoop在HDInsight开始。协处理器也可以允许在数据库所在的节点数据的处理。
场景:什么是用例HBase的?
BigTable,推而广之,HBase的创建为其典型用例是网页搜索。搜索引擎建立一个映射条款,包含它们的网页索引。但也有很多其他的用例HBase的适用哪几个的,都逐项本节。
用例1:key-value存储
HBase的可作为一个键值存储,适用于管理信息系统。 Facebook的HBase的使用他们的邮件系统,它是理想的存储和管理网络通信。 WebTable使用HBase的搜索和管理从网页中提取表。
用例#2:传感器数据
Hase的是用于捕获是从各种来源的增量收集的数据是有用的。这包括社交分析,时间序列,保持交互式仪表盘了解***的趋势和专柜,以及管理审计日志系统。例子包括彭博交易终端和开放时间序列数据库(OpenTSDB),它存储并提供访问收集了服务器系统的健康指标。
用例3:实时查询
Phoenix是Apache HBase的一个SQL查询引擎。它是作为一个JDBC驱动程序和能使查询和使用SQL管理HBase的表。
用例4:HBase的一个平台
应用程序可以在HBase的顶部使用它作为数据存储上运行。例子包括凤凰城,OpenTSDB,KIJI,和Titan。应用程序还可以整合HBase的。例子包括Hive,Pig,Solr的,风暴,水槽,黑斑羚,星火,神经节和钻孔。
接下来的步骤
得到HDInsight开始使用HBase的用Hadoop
提供HDInsight群集在Azure上的虚拟网络
与HBase的在HDInsight分析微博人气
使用Maven来构建使用HBase的使用HDInsight Java应用程序(的Hadoop)
C#HBase的SDK
另请参阅
Apache的HBase
Bigtable:分布式存储系统的结构化数据
本文翻译自Microsoft Azure官网:http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-overview/
原文出自:http://blog.csdn.net/yangzhenping/article/details/40983023