漫谈Cassandra客户端的使用

数据库 其他数据库
本文将介绍的是关于NoSQL数据库Cassandra客户端的使用,希望本文能对大家有所帮助。

51CTO数据库频道之前也曾有过《NoSOL:关系型数据库终结者?》专题,希望大家能更深入的了解NoSQL。

最近试用了一段时间Cassandra,将Oracle中的数据导入进来,遇到了问题然后解决问题,收获挺大。在这个过程中,除了设计一个合理的数据模型,再就是使用Cassandra API进行交互了。

Cassandra在设计的时候,就是支持Thrift的,这意味着我们可以使用多种语言开发。

对于Cassandra的开发本身而言,这是使用Thrift的好处:支持多语言。坏处也是显而易见的:Thrift API功能过于简单,不具备在生产环境使用的条件。

在Cassandra Wiki页面上,也有基于Thrift API开发的更加高级的API,各个语言都有,具体信息可以参考:http://wiki.apache.org/cassandra/ClientExamples。

这次只谈谈下面两类Java的客户端:

1 Thrift Java API

2 hector

Thrift Java API

这个是Cassandra自带的最简单的一类API,这个文件在apache-cassandra-0.5.1.jar中包含了。可以直接使用。我们也可以自己安装一个Thrift,然后通过cassandra.thrift文件自动生成。

如果你要使用Cassandra,那么我们必须要了解Thrift API,毕竟所有的其他更加高级的API都是基于这个来包装的。

提供的功能

插入数据

插入数据需要指定keyspace,ColumnFamily, Column,Key,Value,timestamp和数据同步级别。(如何需要了Cassandra的解数据模型,可以参考《大话Cassandra数据模型》)

  1. /** * Insert a Column consisting of (column_path.column, value, timestamp)   
  2. at the given column_path.column_family and optional   
  3. * column_path.super_column. Note that column_path.column is here required,   
  4. since a SuperColumn cannot directly contain binary   
  5. values -- it can only contain sub-Columns.   
  6. *    
  7. * @param keyspace   
  8. * @param key   
  9. * @param column_path   
  10. * @param value   
  11. * @param timestamp   
  12. * @param consistency_level   
  13. */public void insert(String keyspace, String key, ColumnPath column_path, byte[] value, long timestampint consistency_level) throws InvalidRequestException, UnavailableException, TimedOutException, TException;   
  14. /** * Insert Columns or SuperColumns across different Column Families for the same row key. batch_mutation is a   
  15. * map<string, list<ColumnOrSuperColumn>> -- a map which pairs column family names with the relevant ColumnOrSuperColumn   
  16. * objects to insert.   
  17. *    
  18. * @param keyspace   
  19. * @param key   
  20. * @param cfmap   
  21. * @param consistency_level   
  22. */public void batch_insert(String keyspace, String key, Map<String,List<ColumnOrSuperColumn>> cfmap, int consistency_level) throws InvalidRequestException, UnavailableException 

读取数据

获取一个查询条件精确的值。

  1. /** * Get the Column or SuperColumn at the given column_path. If no value is present, NotFoundException is thrown. (This is   
  2. * the only method that can throw an exception under non-failure conditions.)   
  3. *  * @param keyspace   
  4. * @param key   
  5. * @param column_path   
  6. * @param consistency_level   
  7. */public ColumnOrSuperColumn get(String keyspace, String key, ColumnPath column_path,   
  8. int consistency_level) throws InvalidRequestException, NotFoundException, UnavailableException, TimedOutException, TException;   
  9. /** * Perform a get for column_path in parallel on the given list<string> keys. The return value maps keys to the   
  10. * ColumnOrSuperColumn found. If no value corresponding to a key is present, the key will still be in the map, but both   
  11. * the column and super_column references of the ColumnOrSuperColumn object it maps to will be null.   
  12. *  * @param keyspace   
  13. * @param keys * @param column_path   
  14. * @param consistency_level   
  15. */public Map<String,ColumnOrSuperColumn> multiget(String keyspace, List<String> keys,   
  16. ColumnPath column_path, int consistency_level) throws InvalidRequestException 

获取某一个keyspace,Key,ColumnFamily,SuperColumn(如果有的话需要指定)下面的相关数据:只查询Column的name符合条件的相关数据(SlicePredicate)。

  1. /** * Get the group of columns contained by column_parent (either a ColumnFamily name or a ColumnFamily/SuperColumn name   
  2. * pair) specified by the given SlicePredicate. If no matching values are found, an empty list is returned.   
  3. *  * @param keyspace   
  4. * @param key   
  5. * @param column_parent   
  6. * @param predicate   
  7. * @param consistency_level   
  8. */public List<ColumnOrSuperColumn> get_slice(String keyspace, String key, ColumnParent column_parent, SlicePredicate predicate,   
  9. int consistency_level) throws InvalidRequestException, UnavailableException, TimedOutException, TException; /*  
  10. * * Performs a get_slice for column_parent and predicate for the given keys in parallel.   
  11. *    
  12. * @param keyspace   
  13. * @param keys   
  14. * @param column_parent   
  15. * @param predicate   
  16. * @param consistency_level   
  17. */public Map<String,List<ColumnOrSuperColumn>> multiget_slice(String keyspace, List<String> keys, ColumnParent column_parent,   
  18. SlicePredicate predicate, int consistency_level) throws InvalidRequestException, UnavailableException, TimedOutException, TException; 

查询Key的取值范围(使用这个功能需要使用order-preserving partitioner)。

  1. /** * @deprecated; use get_range_slice instead   
  2. *    
  3. * @param keyspace   
  4. * @param column_family   
  5. * @param start   
  6. * @param finish   
  7. * @param count   
  8. * @param consistency_level   
  9. */public List<String> get_key_range(String keyspace, String column_family,   
  10. String start, String finish, int countint consistency_level) 
  11. throws InvalidRequestException, UnavailableException, TimedOutException, TException; /*  
  12. *   
  13. returns a subset of columns for a range of keys.   
  14. *    
  15. * @param keyspace   
  16. * @param column_parent   
  17. * @param predicate   
  18. * @param start_key   
  19. * @param finish_key   
  20. * @param row_count   
  21. * @param consistency_level   
  22. */public List<KeySlice> get_range_slice(String keyspace, ColumnParent column_parent,   
  23. SlicePredicate predicate, String start_key, String finish_key, int row_count 

查询系统的信息。

  1. /**   
  2. * get property whose value is of type string.   
  3. *    
  4. * @param property   
  5. */public String get_string_property(String property) throws TException; /*  
  6. *   
  7. * get property whose value is list of strings.   
  8. *    
  9. * @param property */public List<String> get_string_list_property(String property) throws TException; /*  
  10. *   
  11. * describe specified keyspace   
  12. *    
  13. * @param keyspace   
  14. */public Map<String,Map<String,String>> describe_keyspace(String keyspace)   
  15. throws NotFoundException, TException; 

通过这些操作,我们可以了解到系统的信息。

其中一个比较有意思的查询信息是:token map,通过这个我们可以知道哪些Cassandra Service是可以提供服务的。

删除数据

  1. /**   
  2. * Remove data from the row specified by key at the granularity specified by column_path,   
  3. and the given timestamp. Note   
  4. * that all the values in column_path besides column_path.column_family are truly optional: you can remove the entire   
  5. * row by just specifying the ColumnFamily, or you can remove a SuperColumn   
  6. or a single Column by specifying those levels too.   
  7. *    
  8. * @param keyspace   
  9. * @param key   
  10. * @param column_path   
  11. * @param timestamp   
  12. * @param consistency_level   
  13. */public void remove(String keyspace, String key, ColumnPath column_path,   
  14. long timestampint consistency_level) throws InvalidRequestException, UnavailableException 

这里需要注意的是,由于一致性的问题。这里的删除操作不会立即删除所有机器上的该数据,但是最终会一致。

程序范例

  1. import java.util.List;  
  2. import java.io.UnsupportedEncodingException;   
  3. import org.apache.thrift.transport.TTransport;  
  4. import org.apache.thrift.transport.TSocket;  
  5. import org.apache.thrift.protocol.TProtocol;  
  6. import org.apache.thrift.protocol.TBinaryProtocol;  
  7. import org.apache.thrift.TException;  
  8. import org.apache.cassandra.service.*;   
  9. public class CClient{      
  10. public static void main(String[] args)      
  11. throws TException, InvalidRequestException,   
  12. UnavailableException, UnsupportedEncodingException, NotFoundException      
  13. {          
  14. TTransport tr = new TSocket("localhost", 9160);   
  15.  TProtocol proto = new TBinaryProtocol(tr);          
  16. Cassandra.Client client = new Cassandra.Client(proto);          
  17. tr.open();           
  18. String key_user_id = "逖靖寒的世界";          
  19.  // insert data          
  20. long timestamp = System.currentTimeMillis();       
  21.  client.insert("Keyspace1", key_user_id,                       
  22.  new ColumnPath("Standard1"null"网址".getBytes("UTF-8")),                       
  23.  "http://gpcuster.cnblogs.com".getBytes("UTF-8"), timestamp,ConsistencyLevel.ONE);         
  24.  client.insert("Keyspace1", key_user_id,                        
  25. new ColumnPath("Standard1"null"作者".getBytes("UTF-8")),                        
  26. "逖靖寒".getBytes("UTF-8"), timestamp, ConsistencyLevel.ONE);          
  27.  // read single column          
  28. ColumnPath path = new ColumnPath("Standard1"null"name".getBytes("UTF-8"));     
  29.  System.out.println(client.get("Keyspace1", key_user_id, path, ConsistencyLevel.ONE));           
  30. // read entire row         
  31.  SlicePredicate predicate = new SlicePredicate(nullnew SliceRange(new byte[0], new byte[0], false, 10));   
  32. ColumnParent parent = new ColumnParent("Standard1"null);         
  33.  List<ColumnOrSuperColumn> results = client.get_slice("Keyspace1", key_user_id, parent, predicate, ConsistencyLevel.ONE);         
  34.  for (ColumnOrSuperColumn result : results)        {              
  35. Column column = result.column;              
  36. System.out.println(new String(column.name, "UTF-8") + " -> " + new String(column.value, "UTF-8"));         
  37.  }          
  38.  tr.close();     
  39.  }} 

优点与缺点

优点:简单高效

缺点:功能简单,无法提供连接池,错误处理等功能,不适合直接在生产环境使用。

Hector

Hector是基于Thrift Java API包装的一个Java客户端,提供一个更加高级的一个抽象。

程序范例

  1. package me.prettyprint.cassandra.service;   
  2. import static me.prettyprint.cassandra.utils.StringUtils.bytes;  
  3. import static me.prettyprint.cassandra.utils.StringUtils.string;   
  4. import org.apache.cassandra.service.Column;  
  5. import org.apache.cassandra.service.ColumnPath;   
  6. public class ExampleClient {     
  7. public static void main(String[] args) throws IllegalStateException, PoolExhaustedException,        
  8. Exception {      
  9. CassandraClientPool pool = CassandraClientPoolFactory.INSTANCE.get();    CassandraClient client = pool.borrowClient("localhost", 9160);      
  10. // A load balanced version would look like this:      
  11. // CassandraClient client = pool.borrowClient(new String[] {"cas1:9160", "cas2:9160", "cas3:9160"});       
  12. try {        
  13. Keyspace keyspace = client.getKeyspace("Keyspace1");        
  14. ColumnPath columnPath = new ColumnPath("Standard1"null, bytes("网址"));         
  15. // insert        
  16. keyspace.insert("逖靖寒的世界", columnPath, bytes("http://gpcuster.cnblogs.com"));         
  17. // read        
  18. Column col = keyspace.getColumn("逖靖寒的世界", columnPath);       System.out.println("Read from cassandra: " + string(col.getValue()));       
  19. finally {       
  20.  // return client to pool. do it in a finally block to make sure it's executed        
  21. pool.releaseClient(client);     
  22.  }  }} 

优点

1 提供连接池。

2 提供错误处理:当操作失败的时候,Hector会根据系统信息(token map)自动连接另一个Cassandra Service。

3 编程接口容易使用。

4 支持JMX。

缺点

1 不支持多线程的环境。

2 keyspace封装过多(数据校验和数据重新封装),如果进行大量的数据操作,这里的消耗需要考虑。

3 错误处理不够人性化:如果所有的Cassandra Service都非常繁忙,那么经过多次操作失败后,最终的结果失败。

总结

Hector已经是一个基本足够使用的Java客户端了,但是还是缺乏一些相关的功能,比如:

1 线程安全。

2 支持自动的多线程查询和插入,提高操作效率。

3 人性化的错误处理机制。

4 避免过多的封装。

原文标题:谈谈Cassandra的客户端

链接: http://www.cnblogs.com/gpcuster/archive/2010/03/23/1692794.html

【编辑推荐】
  1. 详解NoSQL数据库Apache Cassandra的配置
  2. 2009年云数据库的开发和应用前景
  3. 关系数据库的末日是否已经来临
  4. 超越关系型数据库 pureXML技术应用及展望
  5. 新兴数据库打破整个旧规则
  6. 探寻关系数据库和ORM的***替代者
责任编辑:彭凡 来源: 博客园
相关推荐

2011-08-17 10:10:59

2011-03-21 14:53:36

Nagios监控Linux

2011-04-06 14:24:20

Nagios监控Linux

2012-10-11 17:02:02

IBMdw

2010-05-12 15:46:51

Subversion客

2021-09-22 15:46:29

虚拟桌面瘦客户端胖客户端

2012-01-13 10:29:37

ibmdw

2010-06-01 13:54:42

TortoiseSVN

2020-04-23 09:32:33

zookeeperCP系统

2011-04-06 14:24:27

Nagios监控Linux

2010-12-17 10:16:33

OpenVAS

2010-06-01 14:11:11

TortoiseSVN

2021-08-01 23:18:21

Redis Golang命令

2009-06-08 20:16:15

Eclipse客户端多线程

2010-05-31 10:11:32

瘦客户端

2010-12-21 11:03:15

获取客户端证书

2011-03-24 13:00:31

配置nagios客户端

2011-03-02 14:36:24

Filezilla客户端

2011-10-26 13:17:05

2010-07-22 12:24:31

Telnet客户端
点赞
收藏

51CTO技术栈公众号