使用HBase Shell接口的注意事项

数据库 其他数据库
HBase Shell 接口本身没有什么可谈的,网上许多内容都有介绍, 半个小时就可以入门。作者在这里提出了几点他认为新手应该注意的事项。

HBase Shell 接口本身没有什么可谈的,网上许多内容都有介绍, 半个小时就可以入门。同事们要我推荐一下,那就推荐三个如下:

(1) http://wiki.apache.org/hadoop/Hbase/Shell

(2)  ./hbase shell 打开shell, run 'help' to get help information

(3)http://qibaopeng2000.blog.163.com/blog/static/691776952010112444553279/ (这个网上很多相同或者类似的内容)

总结培训当天反馈的问题,新手们需要注意几点:

问题1,  HBase(可以理解为不需要建'name'列,hbase自动建立一个用于存储“行标识”的“列”),举例如下:

例一:

  1. reate 'employees''SN''department''address'   这个employees表的结构将为: 
  2. row_id     SN    department    address 
  3. -------------------------------------------------- 

共有四列,***列用于标识行, 这里你可以当做‘name’来用

插入数据: put 'employees', 'HongKong', 'SN:', '20080501'

注意是put,不是Ruby的puts

对比的情况:

创建表: create 'employees', 'name', 'SN', 'department', 'address'

此时数据为: 除了标识本身外,还有一个name列,下面简单设置为一样的值。

put 'employees', 'HongKong', 'name:', 'HongKong'

例二:

网上流行资料的例子:

一个存储学生成绩的表:

  1. name grad      course:math   course:art 
  2. Tom    1                87                97 
  3. Jerry   2              100                 80 

这里grad对于表来说是一个列,course对于表来说是一个列族,这个列族由两个列组成:math和art,当然我们可以根据我们的需要在 course中建立更多的列族,如computer,physics等相应的列添加入course列族.  建立一个表格 scores 具有两个列族grad 和courese

  1. hbase(main):002:0> create 'scores''grade''course' 
  2. 0 row(s) in 4.1610 seconds 

分析,请注意,为什么创建的表是没有“name”这一列呢? 其实这里的name列就对应例一的row_id,不用显式创建的。

导入数据为:  put 'scores', 'Tom', 'grade:', '1'     , Tom对应name

问题2. 参数的警告说明

很多人开始都碰到类似

  1. hbase(main):034:0> put 'employees''HongKong''name:''Hongkong''SN:''20080501' 
  2. ArgumentError: wrong number of arguments (6 for 5)
  1. hbase(main):033:0> put 'employees''Kong''name:' 'Kong' 
  2. ArgumentError: wrong number of arguments (3 for 4) 

这是参数数量不对的说明, 请尤其注意逗号, 空格不能用来分隔参数的。

以put为例,参数一般为5个, 6个 10个都报错。但为什么又有(3 for 4)呢?  5和4个的时候可以工作呢?  timestamp 是optional的。所以参数多的时候, 按照上限5报警,少的时候按照下限4报警。

  1. put       Put a cell 'value' at specified table/row/column and optionally 
  2.            timestamp coordinates.  To put a cell value into table 't1' at 
  3.            row 'r1' under column 'c1' marked with the time 'ts1', do: 
  4.  
  5.            hbase> put 't1''r1''c1''value', ts1 

问题3.  插入数据

  1. hbase(main):030:0> put 'employees''Tom''name:' 'Tom''SN:''20091101''department:''D&R''address:country''China''address:city''Beijing' 
  2. ArgumentError: wrong number of arguments (11 for 5) 

怎么回事呢?  不要老想着SQL, put插入的Cell数据,  这么多一起来,当然报错咯

问题4.  删除表必须先停,然后再删: To remove the table, you must first disable it before dropping it

  1. hbase(main):025:0> disable 'test' 
  2. 09/04/19 06:40:13 INFO client.HBaseAdmin: Disabled test 
  3. 0 row(s) in 6.0426 seconds 
  4. hbase(main):026:0> drop 'test' 
  5. 09/04/19 06:40:17 INFO client.HBaseAdmin: Deleted test 

问题5.  如何运行脚本文件

  1. ${HBASE_HOME}/bin/hbase shell PATH_TO_SCRIPT 
  2.  
  3.  
  4. 示例: 
  5.  
  6. ./hbase shell /data/automation/create_import.hbase 
  7.  
  8. -------------------------------------------------------------------------------------------- 
  9.  
  10. disable 'employees' 
  11. drop 'employees' 
  12.  
  13. create 'employees''SN''department''address' 
  14. put 'employees''HongKong''SN:''20080501189' 
  15. put 'employees''HongKong''department:''R&D' 
  16. put 'employees''HongKong''address:country''China' 
  17. put 'employees''HongKong''address:city''Beijing' 
  18. put 'employees''Cudynia''SN:''20010807368' 
  19. put 'employees''Cudynia''department:''HR' 
  20. put 'employees''Cudynia''address:country''US' 
  21. put 'employees''Cudynia''address:city''San Francisco' 
  22.  
  23. exit 

原文链接:http://blog.csdn.net/linhx/article/details/6634812

【编辑推荐】

  1. 主流NoSQL数据库评测之HBase
  2. HBase数据库性能调优
  3. Facebook实时信息系统:HBase每月存储1350亿条信息
  4. HBase性能深度分析

 

 

 

 

责任编辑:艾婧 来源: linhx的专栏
相关推荐

2011-07-26 18:43:34

HBase Shell

2010-11-26 16:27:01

MySQL使用变量

2012-03-12 16:46:22

NoSQL数据库

2010-01-21 11:30:10

2011-05-26 11:22:04

SEO

2011-07-19 10:16:58

喷墨打印机注意事项

2010-01-18 14:25:19

使用C++Builde

2013-09-25 10:15:51

闪存存储优势注意事项

2009-08-27 10:40:56

Java路径

2011-08-02 13:08:06

Oracle索引

2010-07-20 13:02:03

SQL Server索

2012-12-27 13:04:17

Android开发SQLite数据库

2011-04-14 11:28:07

光纤

2021-10-08 11:45:33

内存HeapByteBuf堆内

2009-12-15 17:47:17

VSIP

2010-09-16 09:52:49

CSS display

2009-12-22 09:48:58

WCF枚举类型

2011-08-04 15:00:46

AmoebaMySQL

2009-06-12 09:46:40

Java String

2021-11-16 10:35:59

云计算云计算环境云应用
点赞
收藏

51CTO技术栈公众号