概述
今天主要介绍一下ORACLE RAC的“HA”和“LB”概念,以及分享一个脚本测试一下RAC是否两个节点有平均负载到。
1、相关概念
- HA:High Availiablity 高可用
- LB:Load balance 负载均衡,把负载均衡的分配到集群中的各个节点,从而提供整体的吞吐能力。
可用性是指一个系统可用时间的比率。
一般使用“平均故障间隔时间(MTTF)” 和 “平均故障修复时间(MTTR)”作为评价可用的度量标准。
公式:
可用性=MTTF/(MTTF+MTTR)
如果一个服务器连续运行6个月出现了一次故障,修复使用了20分钟,那么可用性为:
6个月/(6个月+20分钟)*100=99.92%
2、Rac(Real application cluster)
2.1、Failover(故障转移)
Rac的高可用技术基础是Failover,就是指集群中任何一个节点的故障都不会影响用户使用,可以***程度的解决单节点的故障,接到故障节点的用户会被自动转移到健康节点,用户感知不到这种故障切换。
2.2、SCAN(single client access name)
SCAN-VIP是oracle 11gR2引入的一个非常重要的特性,通过它可以实现负载均衡的连接到数据库实例,scan提供统一的名称来访问集群,不需要像10g那种在每个访问数据库的客户端配置多个vip地址实现负载均衡。
添加和删除节点的情况下也不需要对客户端做任何配置修改,就可以实现所有节点的负载均衡。
PS:SCAN只能实现负载均衡,自动Failover,需要使用service服务。
3、监听及TAF
3.1、监听
本地监听:公有IP和VIPSCAN监听:SCAN VIP
3.2、TAF(Transparent Application Faiover)透明应用程序故障转移
大部分的应用系统(例如Tomcat)都是启动时就建立若干到数据库的长连接,在应用程序调整生命周期内重用这些链接。未提交事务会回滚。
链接建立以后,应用系统运行过程中,如果某个实例发生故障,链接到这个实例上的用户会被自动迁移到其他的健康实例上。
JDBC不支持TAF。
分为:
- client-side TAF(10g用的较多)
- server-sid TAF(11g常用)
4、测试服务端的TAF
- 使用TAF服务名/scan_ip进行连接
- 查看当前连接的实例是哪个(例如:rtbrac1)
- 查询select instance_name from v$instance
- 直接shutdown -h now rtbrac1所在的服务器
- sqlplus端不用执行exit退出,再次执行select instance_name from v$instance,如果等会儿有返回,说明已经可以自动进行failover切换。
- 查看当前scanip在哪个节点(应该漂移到健康节点)
5、脚本测试TAF服务端的负载均衡
1.shell执行脚本(taf_load.sh)
- #!/bin/sh
- count=0
- while [ $count -lt $1 ]
- do
- count=`expr $count + 1`
- sqlplus -s glogowner/Q5$gEGy4@172.16.10.30:1521/otmdb @/home/oracle/scripts/test.sql
- done
2.SQL执行脚本(test.sql)
- col instance_name format a20
- select instance_name from v$instance
- /
- exit;
3、执行taf_load.sh(./taf_load.sh 1000 >> taf_load.log)
查看log对比两个实力的连接负载情况
- [oracle@RFDB1 scripts]$ ./taf_load.sh 1000 >> taf_load.log
- [oracle@RFDB1 scripts]$ cat taf_load.log |grep "RFDB1" |wc -l
- 634
- [oracle@RFDB1 scripts]$ cat taf_load.log |grep "RFDB2" |wc -l
- 366