在现在系统中,海量数据成为软件工程师要面对的主要问题。很多人都把数据库优化集中在编程和数据库的结构,再构建一些索引和视图,但是在编程和表结构都到了极致的时候,数据库优化该何去何从。
Oracle公司现在有一个比较热门的数据库集群技术,叫做rac。rac应该是现在数据库集群中最优化和最热门的技术。但是只是局限于同类型和同构数据库上面。
RAC是一个负载均衡的代表,它的集群主要是面对不是大而复杂的数据库查询,而是面对大量的连接。但是如果我们面对是一个异类异构数据库怎么解决。
近年来,有一种比较热门的数据库进入我们生活,列式数据库。它是一个高查询性能,低插入性能的数据库。现在主要代表是sybaseiq,主要开源的 列式数据库有monetdb 。但是列式数据库问题很多,主要是插入慢、数据库不稳定、数据库传统语法支持不强、稳定性低、线程低和扩展性低。但是达到几百万行以上数据以后,列式数据 库的查询速度是mysql的10倍以上。
在一个大型系统中,行式和列式数据库优势互补,合理使用成为开发人员必须关心的问题。我们今天的集群也是主要面对这个问题。
集群原理:
在dbutil的集群中,我们是用了一个行式数据库和若干个列式数据库组成,每次更新数据的时候,我们是用广播模式,把增删改数据通过广播模式,群 体更新所有的数据。当查询数据时候,我们会通过连接池模式,找出最少人使用的数据,查询数据。并且可以设置每天定时同步数据,把存放在行式数据的数据,定 时同步到所有的节点。
配置方法:
在我们之前几个文章简单见过DBUtil的使用,配置方法和之前的教程大同小异。
1.配置xml
- <!-- 集群测试数据库 -->
- <Resource jndi="jdbc/Cluster1" driverClass="com.mysql.jdbc.Driver"
- dbUserName="root" dbPassWord="root"
- jdbcUrl="jdbc:mysql://127.0.0.1:3306/test?useUnicode=true&characterEncoding=utf-8"
- initSize="2" minPoolSize="1" maxPoolSize="10" maxStatements="50"
- maxIdleTime="60" />
- <Resource jndi="jdbc/Cluster2" driverClass="com.mysql.jdbc.Driver"
- dbUserName="root" dbPassWord="root"
- jdbcUrl="jdbc:mysql://127.0.0.1:3306/test2?useUnicode=true&characterEncoding=utf-8"
- initSize="2" minPoolSize="1" maxPoolSize="10" maxStatements="50"
- maxIdleTime="60" />
- <!-- 集群 -->
- <Cluster jndiCluster="jdbc/Cluster" mainDB="jdbc/Cluster1"
- synchronous="off" synchronousTime="00:00" protect="on">
- <Resource jndi="jdbc/Cluster1" />
- <Resource jndi="jdbc/Cluster2" />
- </Cluster>
配置xml也是首先配置2个数据库节点,然后加入集群。
- jndiCluster:是集群的唯一标识符
- mainDB:集群的主数据库,建议用mysql数据库
- synchronous:同步数据
- synchronousTime:同步时间
- protect:保护模式(查询数据,不用主数据库,只是获取集群数据库的数据)
2.更新数据
- package com.shine.DBUtil;
- import com.shine.DBUtil.manage.DBManager;
- import com.shine.DBUtil.utils.ClusterList;
- public class ClusterUpdateExample {
- /**
- * 集群更新例子
- *
- * @param args
- */
- public static void main(String[] args) {
- System.out.println("ClusterUpdateExample...");
- DBUtil
- .getInstance()
- .init(
- "E:\\workspace\\JavaFramework2.5\\src\\com\\shine\\DBUtil\\config\\dbXml.xml");
- ClusterList list = DBManager.getInstance()
- .getClusterConnectionNameList("jdbc/Cluster");
- System.out.println("主数据库为:" + list.getMainDB());
- String sql = "insert into test1(test) value('test')";
- DBUtil.getInstance().executeClusterUpdate("jdbc/Cluster", sql);
- }
- }
3.查询数据
- package com.shine.DBUtil;
- import com.shine.DBUtil.model.DBModel;
- public class ClusterSelectExample {
- /**
- * 集群查询
- *
- * @param args
- */
- public static void main(String[] args) {
- System.out.println("ClusterSelectExample...");
- DBUtil
- .getInstance()
- .init(
- "E:\\workspace\\JavaFramework2.5\\src\\com\\shine\\DBUtil\\config\\dbXml.xml");
- String sql = "select * from test1";
- String clusterJndi = "jdbc/Cluster";
- DBModel dbmodel1 = DBUtil.getInstance().executeClusterQuery(
- clusterJndi, sql);
- DBModel dbmodel2 = DBUtil.getInstance().executeClusterQuery(
- clusterJndi, sql);
- }
- }
实际上集群数据库的同步最好是不要选择定时同步,除非特殊需要,因为如果用到数据库集群,必然会有海量的数据。而DBUtil的定时同步是整库同步,使用者应该根据业务逻辑分表,部分同步比较实际。
原文链接:http://blog.csdn.net/arjick/article/details/6758872
【编辑推荐】