详解Oracle RAC 的“HA”和“LB”及如何用脚本测试负载均衡-51CTO.COM

概述

今天主要介绍一下ORACLE RAC的“HA”和“LB”概念，以及分享一个脚本测试一下RAC是否两个节点有平均负载到。

1、相关概念

HA:High Availiablity 高可用 
LB:Load balance 负载均衡，把负载均衡的分配到集群中的各个节点，从而提供整体的吞吐能力。

可用性是指一个系统可用时间的比率。

一般使用“平均故障间隔时间(MTTF)” 和 “平均故障修复时间(MTTR)”作为评价可用的度量标准。

公式：

可用性=MTTF/(MTTF+MTTR)

如果一个服务器连续运行6个月出现了一次故障，修复使用了20分钟，那么可用性为：

6个月/(6个月+20分钟)*100=99.92%

2、Rac(Real application cluster)

2.1、Failover(故障转移)

Rac的高可用技术基础是Failover，就是指集群中任何一个节点的故障都不会影响用户使用，可以***程度的解决单节点的故障，接到故障节点的用户会被自动转移到健康节点，用户感知不到这种故障切换。

2.2、SCAN(single client access name)

SCAN-VIP是oracle 11gR2引入的一个非常重要的特性，通过它可以实现负载均衡的连接到数据库实例，scan提供统一的名称来访问集群，不需要像10g那种在每个访问数据库的客户端配置多个vip地址实现负载均衡。

添加和删除节点的情况下也不需要对客户端做任何配置修改，就可以实现所有节点的负载均衡。

PS：SCAN只能实现负载均衡，自动Failover，需要使用service服务。

3、监听及TAF

3.1、监听

本地监听：公有IP和VIPSCAN监听：SCAN VIP

3.2、TAF(Transparent Application Faiover)透明应用程序故障转移

大部分的应用系统(例如Tomcat)都是启动时就建立若干到数据库的长连接，在应用程序调整生命周期内重用这些链接。未提交事务会回滚。

链接建立以后，应用系统运行过程中，如果某个实例发生故障，链接到这个实例上的用户会被自动迁移到其他的健康实例上。

JDBC不支持TAF。

分为：

client-side TAF（10g用的较多） 
server-sid TAF（11g常用）

4、测试服务端的TAF

使用TAF服务名/scan_ip进行连接
查看当前连接的实例是哪个(例如：rtbrac1)
查询select instance_name from v$instance
直接shutdown -h now rtbrac1所在的服务器
sqlplus端不用执行exit退出，再次执行select instance_name from v$instance，如果等会儿有返回，说明已经可以自动进行failover切换。
查看当前scanip在哪个节点(应该漂移到健康节点)

5、脚本测试TAF服务端的负载均衡

1.shell执行脚本(taf_load.sh)

#!/bin/sh 
count=0 
while [ $count -lt $1 ] 
do 
 count=`expr $count + 1` 
 sqlplus -s glogowner/Q5$gEGy4@172.16.10.30:1521/otmdb @/home/oracle/scripts/test.sql 
done

2.SQL执行脚本(test.sql)

col instance_name format a20 
select instance_name from v$instance 
/ 
exit;

3、执行taf_load.sh(./taf_load.sh 1000 >> taf_load.log)

查看log对比两个实力的连接负载情况

[oracle@RFDB1 scripts]$ ./taf_load.sh 1000 >> taf_load.log 
[oracle@RFDB1 scripts]$ cat taf_load.log |grep "RFDB1" |wc -l 
634 
[oracle@RFDB1 scripts]$ cat taf_load.log |grep "RFDB2" |wc -l 
366