01.行业基础架构的发展及面临的威胁
纵观IT行业近些年发展,“云”迅猛来袭、“虚拟化”强势崛起、“分布式”卷土重来、“超融合”黑马杀出,在这些新兴技术革新的冲击下,各行各业数据中心的基础架构也由传统的Server、Network、Stroage三大件逐步向SDC、SDN、SDS演进,最终实现更加开放、友好的SDDC(Software Defined Data Center)。软件在愈来愈灵活IT的基础架构中扮演着重要的角色,软件定义的集成架构将服务与提供提供服务的物理资源中提取并分离出来,带来了更具灵活性、统一性、低成本、高效的数据系统。
在风云变幻的今天,基础架构的演进有条不稳,然而我们也应注意到大型的网络攻击更加肆虐,数据安全举足轻重:在2017年5月WannaCry利用SMB永恒之蓝漏洞在短短的数周之内就感染了超过几十万台电脑;紧接着2017年6月破坏型病毒NotPetya再次侵袭,与WannaCry相比NotPetya更具破坏型,感染之后立刻加密分区、复写分区表,同时还通过病毒组件窃取信息回传;不久前新型勒索病毒Bad Rabbit利用SMB永恒浪漫席卷全球,Bad Rabbit更加智能,病毒特征及漏洞调用极其隐蔽,能够躲避大多安全软件的主动探测和防御……
愈演愈烈的网络攻击、更加智能更具破坏力的病毒侵袭,这一切都在提醒着我们发展的同时数据安全与保护也更加不可忽视。
02.软件定义存储的基础架构
虽然SDDC的概念如火如荼,但追本溯源后会发现至今还未有哪个国际机构组织对SDDC制定详细的标准规划。仅仅在VMware vForum 2012发布会上,VMware全球副总裁、CPD全球研发及中国研发总经理李严冰博士重点介绍了“软件定义的数据中心(Software-Defined Data Center,SDDC)”的新战略规划。这一战略规划在酝酿了多年之后,终于得以全面发展。
SDS作为在VMWARE SDDC蓝图中重要的一环,VMWARE给出了明确的架构体系说明,后续厂商也争相效仿提出了软件定义存储的体系结构。通过SDS软件将各种存储资源整合,虚拟成多个Storage Pool根据不同需求映射给上层系统使用。在整合存储资源的同时,SDS也能借助存储本身的各项功能接口实现复制、快照、虚拟化等多项数据保护技术。下图即为VMWARE SDS体系图:
SDS是一个庞大、复杂的概念,我们熟知的存储虚拟化、ServerSAN、HCI等都可以看做是SDS概念的一部分,或者一种实践方式。目前SDS的层级分类还比较模糊,行业内也有一种普遍分类即把SDS层级分为两类:控制层和数据层。控制层是通过SDS软件或硬件实现存储资源的整合和管理调度,如EMC ViPR等;数据层则侧重于负责数据处理、优化,从而实现数据层的自动化。在上图中,Policy-Driven Control Plane是控制层,用于实现所有存储资源的调度;Virtual Data Plane是数据层,通过数据层实现资源自动化,在存储池内处理数据流、优化数据存储。中间的Virtual Data Service可以看做控制层和数据层之间的桥梁,实现两层级之间的联动。在Storage Pool中,通过不同类型的存储资源形成不同的存储池,池间数据流动通过数据层服务实现,池内数据处理则借助数据层的各种服务合理规划。
03.软件定义存储下的数据备份保护
SDS虽是一个崭新的技术概念,但从其解决方案的发展和技术的实现不难发现:万变不离其宗。SDS带来了存储资源的高效融合,但并未带来数据保护的彻底革新。对于软件定义存储下的数据保护,目前有以下几种主流数据保护技术:
1、 通过SDS软件将多个物理卷合成虚拟卷,实现容错;
2、 通过存储本身特性实现复制、多副本容灾;
3、 通过上层应用的集群、主备架构等容灾技术;
4、 通过大型集中备份软件实现数据保护。
数据保护备份技术,各有优劣,适合各自不同场景。在复杂的数据中心场景下,只有通过合理的选择与搭配,才能形成全面的数据保护。针对以上几种备份保护技术,我们进行重点分析,明确每种技术的适用场景,规避技术的劣势,因地制宜选择最符合预期的数据保护方案。
通过SDS软件实现Virtual volume多写多读,实现容错
技术实现:
此种技术是在云环境下演化的数据保护技术。与以往在虚拟化场景中SDS和虚拟化软件实现的虚拟Lun技术不同,此数据保护技术能够将多个物理卷形成的多个Lun通过合成形成Virtual vloume提供给平台使用。虚拟机仅识别Virtual volume,当有数据写入时,数据会通过Virtual vloume同步写入所有Lun中;当有数据读取时,会从其中选择一个Lun读取数据。数据读写时,即使一个Lun损坏,依旧可以从其他Lun读写,而且上层应用无感知。
适用场景:
云环境下虚拟化技术使用的存储逐步由大Lun模式(多个存储资源汇聚成一个大型存储Lun)向小Lun模式演进(给虚拟机分配资源时,将该虚拟机的存储资源形成一个小Lun), 小Lun模式的运用提高了存储的利用率,同时也使得存储资源的调配更加灵活。通过SDS软件实现Virtual volume多读多写,大幅提高了虚拟机数据的安全性,同时Virtual volume中小Lun的切换对应用无感知,体验友好。
解决方案弊端:
此种技术上虽然实现虚拟机Lun资源物理损坏的全面保护,但仍旧无法提供对数据逻辑错的保护、无法满足历史版本保留的需求。
通过SDS软件和存储本身特性实现复制、多副本容灾
技术实现:
此技术如传统存储的特性功能类似,通过SDS软件和存储的特性功能相结合,利用存储快照或虚拟化功能,对存储资源进行复制、多副本存储。SDS软件和存储结合后,相对于传统的存储复制、副本技术能够实现更小颗粒度、更加灵活的容灾。
适用场景:
SDS软件和存储结合的复制、副本技术,在提供更高精度的数据保护的同时还能大幅降低数据保护时对存储资源的消耗,更低的保护延时、更快的同步速度带来了极低的RPO、RTO。
解决方案弊端:
通过存储复制、副本技术实现数据保护带来的收益非常明显,但相对成本也非常之高,对基础资源的要求门槛也极高,不管是同步时的带宽、延时还是存储本身的性能要求都有严苛的限制。
通过上层应用的集群、主备架构等容灾技术
技术实现:
通过应用的集群、主备架构等技术实现容灾是一种传统的数据保护方式。在多节点上运行应用,即使其中一个节点发生故障,其他节点也能够承载系统压力。该技术在容器、云环境中逐渐演化,现能够通过容器和云技术在线、动态增减节点数目,架构灵活,实现了资源的按需分配。
适用场景:
适用于生产环境的绝大部分业务场景。在云平台和容器化的业务场景中,结合云技术和容器技术能够实现在线、动态增减业务节点数目。
解决方案弊端:
集群、主备架构的容灾技术,在一定程度上以较低成本实现了业务系统高可用性、提高了业务系统的并发性能,但仍旧无法提供对数据逻辑错的保护、无法满足历史版本保留的需求。此外在线、动态增减业务节点数目的功能需要上层应用进行适配并支持。
通过大型集中备份系统实现数据保护
技术实现:
在绝大多数数据中心,都会通过备份软件打造大型备份容灾系统。大型备份容灾系统,可通过传统的SERVER-NODE-CLIENT模式部署,也可集成一体机投入系统。大型备份容灾系统集成了诸多应用、数据库、存储等资源接口,通过这些接口备份服务器与备份客户端交互,通过磁带机、磁盘等备份资源快速备份。大型备份容灾系统可通过增加NODE或一体机数量提高备份并发能力,也可借助重复数据删除技术、快照技术实现更高级的备份手段。
适用场景:
备份软件适用于所有生产环境中绝大部分业务场景,能够实现较低成本针对传统应用、数据库、虚拟化系统等提供全面的数据保护。在数据量较大(TB级别)时,相对于其他备份容灾手段,不仅能够实现快速备份的需求,还能在不影响业务系统的情况下进行备份副本保护、归档等。备份存储介质的多样性(磁带库、磁盘库、光盘库等)能够提供丰富的备份方案,适应数据中心的各种场景。同时重复数据删除技术的崛起,也大幅减少了备份系统的压力,显著提高了备份系统的整体性能。
解决方案弊端:
大型集中备份系统对海量数据的备份性能较低,虽然目前可通过并发备份、消重备份等手段提高备份性能、缩短备份窗口,但海量数据的备份依旧不理想。其次备份系统集中备份时对生产资源的消耗较大,需要合理规划备份窗口,将备份高峰安排在业务系统空闲时段。最后,随着备份系统的日益增长,若无合理规划,备份系统配置越发杂乱,整体性能大幅下降。