主流NoSQL数据库评测之HandlerSocket

数据库 其他数据库
NoSQL是伴随着web2.0的迅猛发展而在2009年被提出的一个概念,一般可以通俗的理解为高性能的Key Value存储结构的数据库,当然也有其他更广泛的类型。它基于CAP和BASE理论,强调最终一致性,具有数据结构灵活、扩展方便、大数据量下读写性能高效等特点,在互联网行业被广泛采用。

NoSQL是伴随着web2.0的迅猛发展而在2009年被提出的一个概念,一般可以通俗的理解为高性能的Key Value存储结构的数据库,当然也有其他更广泛的类型。它基于CAP和BASE理论,强调最终一致性,具有数据结构灵活、扩展方便、大数据量下读写性能高效等特点,在互联网行业被广泛采用。本系列文章将评测广受关注的几个NoSQL数据库产品。本文关注的是HandlerSocket Plugin for MySQL。

HandlerSocket简介:

HandlerSocket是日本DeNA公司的架构师Yoshinori开发的一个NoSQL产品,以MySQL Plugin的形式运行。其主要的思路是在MySQL的体系架构中绕开SQL解析这层,使得应用程序直接和Innodb存储引擎交互,通过合并写入、协议简单等手段提高了数据访问的性能,在CPU密集型的应用中这一优势尤其明显。

另外,HandlerSocket还帮我们解决了缓存的问题,因为Innodb已经有了成熟的解决方案,通过参数可以配置用于缓存数据的内存大小,这样只要我们分配合理的参数,就能在应用程序无需干涉的情况下实现热点数据的缓存,降低缓存维护的开发成本。

因为HandlerSocket是MySQL的一个Plugin,集成在mysqld进程中,对于NoSQL无法实现的复杂查询等操作,仍然可以使用MySQL自身的关系型数据库功能来实现。在运维层面,原来广泛使用的MySQL主从复制等经验可以继续发挥作用,相比其他或多或少存在一些bug的NoSQL产品,数据安全性更有保障。

可以说这是一个很有创意的产品,因此HandlerSocket的作者在2010年10月在博客上宣称这一产品能达到75K QPS的时候,在业界引起了广泛的关注,包括MySQL官方在新的5.6版本中推出的Memcached API,相信也是受了HandlerSocket的启发。

测试说明:

一、测试环境

Handlersocket部署在一台PC 服务器上,配置如下:

CPU为Xeon 2.80GHz *4

内存为4G

硬盘为一块400G SATA盘

操作系统为64位CentOS 5.3版本

二、测试方法

Handlersocket的客户端几乎涵盖了各种语言,都实现了通过以上两个端口对数据读写的操作,其中查询操作必须通过建立有索引的列来进行。

考虑到NoSQL在互联网行业应用较为广泛,采用PHP实现客户端程序的做法,通过一定的并发去读写数据,观测每秒读写的记录数作为主要的衡量指标。当然也可以利用Java的多线程进行并发测试,但由于篇幅和时间所限,本文不再涉及此方面的内容。

这里采用第三方实现的一个PHP客户端,网址为http://code.google.com/p/php-handlersocket/,可以编译到PHP运行环境中。

为了不对测试服务器产生额外的影响,测试客户端部署在另外一台独立的服务器上,运行的PHP的版本是5.3.5,web server是Nginx 0.8.54,通过fastcgi的方式调用PHP服务。使用apache ab工具实现多个请求和并发操作。

测试分为两个步骤,首先是写操作,通过500个请求,每个请求写入10000条记录,并发度为2来共写入500万条数据,数据的key为数字1到5000000,value大小为100个字节。然后是读操作,也是用500个请求,每个请求随机根据key值读出10000条记录,并发度为10共读出500万条记录,评测的重点是写入和读出数据的时间,以及在此过程中服务器的资源使用情况。

MySQL 数据库安装:

一、安装MySQL

通过编译源码的方式安装MySQL,这里选择的版本是5.5.8版本。由于这不是本文的重点,这里只简单的提及一下要点。

首先到MySQL的官网http://dev.mysql.com/downloads/mysql/下载源码,要注意的是从MySQL 5.5版本开始需要Cmake编译工具和bison。然后开始安装:

安装完成后配置my.cnf文件,最重要的参数是分配给innodb存储引擎的内存大小,也就是innodb_buffer_pool_size参数,这里设置为2G。

  1. [root@localhost mysql558]# vi my.cnf  
  2.  
  3. ……  
  4.  
  5. innodb_buffer_pool_size = 2G  
  6.  
  7. …… 

二、安装HandlerSocket

首先到以下地址下载代码:

https://github.com/ahiguti/HandlerSocket-Plugin-for-MySQL

开始安装HandlerSocket:

  1. [root@localhost handlersocket]# tar -zxvf ahiguti-HandlerSocket-Plugin-for-MySQL-1.0.6-67-g25f4957.tar.gz  
  2.  
  3. [root@localhost handlersocket]# cd handlersocket/  
  4. [root@localhost handlersocket]# ./autogen.sh  
  5.  
  6. [root@localhost handlersocket]# ./configure --with-mysql-source=/home/handlersocket/mysql-5.5.8 --with-mysql-bindir=/home/handlersocket/mysql558/bin --with-mysql-plugindir=/home/handlersocket/mysql558/lib/plugin  
  7.  
  8. [root@localhost handlersocket]# make  
  9.  
  10. [root@localhost handlersocket]# make install 

三、修改MySQL配置

在my.cnf配置文件增加以下内容:

  1. [root@localhost mysql558]# vi my.cnf  
  2.  
  3. [mysqld]  
  4.  
  5. ......  
  6.  
  7. loose_handlersocket_port = 9998 
  8.  
  9. # the port number to bind to (for read requests)  
  10.  
  11. loose_handlersocket_port_wr = 9999 
  12.  
  13. # the port number to bind to (for write requests)  
  14.  
  15. loose_handlersocket_threads = 16 
  16.  
  17. # the number of worker threads (for read requests)  
  18.  
  19. loose_handlersocket_threads_wr = 16 
  20.  
  21. # the number of worker threads (for write requests)  
  22.  
  23. open_files_limit = 65535 
  24.  
  25. # to allow handlersocket accept many concurrent connections  
  26.  
  27. #make open_files_limit as large as possible. 

这里增加的这些主要是针对handlersocket的配置,它有2个端口,9998用来读数据,9999读写均可,但是通过9998来读的效率更高。这里我们设置处理读写的线程数均为16个,另外为了处理更多的并发连接,设置能打开的文件描述符个数为65535。

四、安装MySQL授权表并启动数据库:

  1. [root@localhost mysql558]# scripts/mysql_install_db --user=mysql 
  2.  
  3. [root@localhost mysql558]# bin/mysqld_safe --user=mysql & 

五、登录MySQL安装HandlerSocket Plugin:

  1. [root@localhost mysql558]# bin/mysql -u root -p  
  2.  
  3. mysql> install plugin handlersocket soname 'handlersocket.so';  
  4.  
  5. Query OK, 0 rows affected (0.01 sec) 

通过以下命令查看也可见handlersocket已经成功安装到MySQL中:

  1. mysql> show processlist;  
  2. mysql> show plugins; 

测试结果:

一、写操作

成功写入500万条记录,共耗时4300秒,平均每秒写入数据1163笔。

写入过程中,服务器比较稳定,CPU使用率平稳,Idle值稳定在70到72之间,等待时间稳定在14到19之间。内存分配上的变化较大,free部分从1.3G下降到25M,buffer部分从630M下降到65M,cache部分从1.5G上升到2.9G,虚拟内存从0上升到376K,但是没有交换区到内存的换入换出。磁盘IO表现平稳,每秒写入的块数稳定在10000到12000之间。

二、读操作

成功读出500万条记录,共耗时193秒,平均每秒读出数据25906笔。

读数据过程中没有发生磁盘IO。CPU较繁忙,Idle在39到51之间,等待CPU资源的进程一直在1到6个之间。内存表现平稳没有波动。

通过以上测试结果可以说明,写入的数据完全缓存到了文件系统中,所以cache部分占用的内存大量增加,这也是读取数据的时候没有发生磁盘IO的原因。

总结:

要说明的是,虽然这是一份真实的测试数据,但是并不一定具有普遍意义。因为应用场景是千差万别的,服务器的资源配置、数据记录的多少、单条数据的大小、读写的比例、客户端程序的质量等因素都会影响测试结果,甚至差别会非常大,对我们来说,更重要的是了解这个NoSQL产品的特性,知道它的适用场景,并且能够根据自己实际的应用场景针对性的进行测试,这样才能做到针对性的选型,只有最适合自己需求的产品才是最好的产品。

【编辑推荐】

  1. 数据库日常维护常用的脚本部分收录
  2. SQL与NoSQL——MySQL与NoSQL的融合
  3. MySQL中的NoSQL插件
  4. HandlerSocket是神马
  5. 微软WP7本地数据库之Sterling编程技巧

 

责任编辑:艾婧 来源: it68
相关推荐

2011-07-13 09:58:15

HBase

2011-05-30 09:27:35

NoSQL评测

2011-07-06 16:36:40

Redis

2011-06-14 09:09:13

NoSQLMongoDB

2011-09-21 11:21:00

NoSQL

2019-03-20 15:59:11

NoSQLRedis数据库

2024-02-02 10:51:53

2021-09-28 09:25:05

NoSQL数据库列式数据库

2011-10-09 09:38:03

OracleNoSQL

2019-07-08 10:36:34

数据库WebNoSQL

2010-04-01 09:45:38

NoSQL

2011-07-19 09:08:50

JavaNoSQL

2024-03-28 09:00:00

NoSQL数据库

2011-03-01 09:10:19

开源数据库

2019-07-23 11:41:45

数据库SQLDocker

2011-04-14 11:14:21

OracleNoSQLMySQL

2011-03-25 14:40:29

Trinity数据库

2014-02-27 10:08:33

NoSQL

2023-03-05 16:25:38

NoSQL数据库

2017-11-08 09:22:36

数据库NoSQLArangoDB
点赞
收藏

51CTO技术栈公众号