越是跟生活息息相关的业务,人民对客户体验的要求越高,对出现故障的容忍度越低。在某种程度上说,未来电信运营商取胜的法则不再是电信资源,而是服务和客户忠诚度,随着企业规模的扩大,业务类型日趋复杂,其运营过程对信息化依赖程度也日渐加深。电信网络不容许存在任何单点故障的隐患。
客户忠诚度取决于什么?产品和商业模式虽然是最基础的需求,但是未来的服务和客户体验,绝对是超越产品本身的决定性因素。三大通信巨头的中国电信,就首当其冲的面临着这一重大问题。
随着企业规模的扩大,业务类型日趋复杂,中国电信的运营过程对信息化依赖程度也日渐加深。这个中国的大型国有通信公司,每次IT系统的升级改造都是天价的投入,只为了系统再稳定一点点,业务反应再迅捷一点点。系统稳定和信息安全重如泰山,不论是主机内存、硬盘、CPU还是系统和应用的一丝一毫隐患,都会对电信业造成致命危机。
电信转型之困 ——如何建立稳定连续的IT架构
电信网络不容许存在任何单点故障的隐患,而就中国电信本身的发展而言,目前阻碍通信网络中的网络系统的几大障碍,包括有主机内存的损坏,主机硬盘的损坏,主机CPU的损坏以及主机系统受病毒影响而导致宕机。从这四点来看,中国电信,为了维持系统稳定性,减少业务中断风险,打造双机互备的共享型集群架构的高可用性方案势在必行。
从2008年开始,中国电信在不同的部门中和不同的产品线上前前后后对这类双机互备解决方案做了近2年多严格测试,基于两年来的通力配合效果显著,在2010年下半年,中国电信与NEC达成了合作,决定采用ExpressCluster解决方案来保护核心网的网管系统,这是在系统连续性上取得的一个重要突破,有别于传统的双机或多机热备方案必须通过磁盘整列共享数据的传统模式。IT系统从原先高成本的人工运营方式向自动化、稳定性更高的容灾运维模式发展。
ExpressCluster X的以下特点受到中国电信的青睐:
1. 支持最多32个节点的集群,这样可以充分利用服务器资源。
2. 基于Web的远程监视能力,能够方便地对服务器集群进行管理。
3. 能够在两台服务器之间做数据镜像,实时保护网管和oracle应用,搭建成Active-Standby的热备结构,通过高可用集群软件ExpressCluster X实时监控服务器运行环境。
4. 一旦发生故障,数据库可以在ExpressCluster X的控制下自动切换到备机运行,避免故障引起的系统停机。
5. 在发生下列故障时可以自动切换服务器:服务器关机/掉电、OS死机/挂起、存储I/O异常、应用程序或oracle服务停止、网卡异常或网络中断 、ExpressCluster X自身进程异常、特定故障(用户自定义监控程序)。
通过磁盘镜像技术,中国电信核心业务系统的高可用性级别达到99.99+%;保证双机或多机系统中的所有节点数据完全同步,避免了宕机之后的巨额损失;这种数据共享的模式在减少磁盘整列采购成本的同时,降低了中国电信整个系统的用电功耗,节省了机房占地面积,大大提高系统集成度,非常符合当前运营商“绿色运维”的环保理念。