怎样更科学的进行数据备份管理中的分类定级?

存储 数据管理
数据备份管理需要建设一套完整的系统,包括备份管理系统、备份存储设备、备份介质等,并定期对数据中心的数据进行转储备份。

1. 数据备份管理工作中的四类难题

数据是企业最重要的数字资产,主要包括企业业务经营所依赖的信息系统所产生的各种业务数据以及支撑信息系统运行的程序、配置数据、日志、操作系统等其他数据。数据备份是数据保护的最后一道防线,可有效抵御外部黑客攻击、内部人员误操作以及各种软硬件故障导致的数据丢失风险,很大程度上保证了数据的完整性和可用性。

由于金融行业对数据的敏感性,重要的业务数据往往需要满足长时间保存、备查的要求。因此,数据备份工作不仅仅关系到企业的业务连续性,还需要满足国家法律、监管机构的合规要求。以笔者所在中小保险公司为例,目前在数据备份管理工作中,普遍存在着以下四类运维管理要素的难题:

1)人员要素问题

在运维管理体系中,人员的管理是第一要素,数据备份工作也不例外。一般来说,公司的研发或业务人员应该根据内外部监管和业务连续性需求提出不同业务系统的数据备份策略,是数据备份的需求提出方;而运维人员按照数据备份策略的需求建立数据备份系统及运维流程,扮演着数据备份的执行和管理角色。由于不同的业务系统对应着不同的需求提出方,备份管理人员不能很好地获取准确的备份需求,会存在很高的沟通成本问题。

2)资源要素问题

数据备份管理需要建设一套完整的系统,包括备份管理系统、备份存储设备、备份介质等,并定期对数据中心的数据进行转储备份。如果只投入较少的资源,导致数据备份不能有效覆盖,在紧急情况下需要采用数据恢复手段、而数据备份又无法提供有效支持时,这是这种严重失职;而为了数据备份能有效覆盖,采取投入过多备份资源的手段,又会增加数据备份管理成本。

3)技术要素问题

数字化转型的冲击下,数据备份工作不能只关注于传统数据库的备份,而数据量更加庞大的非结构化数据也不容忽视,需要结合实际工作需要,制定完善备份方案。

4)过程要素问题

在运维过程管理中,最突出的是没有体现涉及数据备份的需求方和管理执行方的配置管理、变更管理、容量管理等过程。在大多数运维实践中,数据备份管理往往成了 IT 运维部门单方面的工作。

2. 如何应对

随着业务范围、业务渠道、业务内容的变化,企业的 IT 系统数量迅速增加,出现了各种类型的业务系统,必然需要不同的数据备份策略。数据备份策略既不能简单的采用一刀切的方式,也不能过于复杂。一刀切的方式虽然简单,但往往需要投入更多的资源才能有效覆盖,实践过程中也会有诸多技术难点需要解决;而过于复杂的策略会增加运维管理成本,也没有有效解决沟通成本的问题。

数据备份管理的沟通成本问题,关键还是需要建立高效的数据备份策略标准。企业往往已经建立了 IT 系统灾难恢复等级体系,结合业务连续性的需求,将不同的 IT 系统划分为不同灾难恢复等级,并采用不同的灾备恢复方案。数据备份管理一般可参照 IT 系统的灾难恢复等级分类来定级,制定不同的数据恢复方案。

这种基于信息系统的分类定级方法是高效的,比如对于保险行业来说,包含承保、理赔等业务功能的核心系统、财务系统、投资系统是最关键的业务系统,必然需要高级别的数据保护策略。但是信息系统本身是复杂的,信息系统上的数据更是多样的,基于信息系统的分类定级是从业务连续性出发,并不是数据管理层面最科学的方法。例如在某些 IT 系统的非结构化数据中,既大量存在着低价值信息,也存在一些敏感数据或高价值数据。数据备份策略还是需要从数据层面分析其可用性和完整性需求,来制定分类定级的备份策略,主要基于以下两方面的需求 :

1)满足合规需求。 近年来,《数据安全法》、《个人信息保护法》等国家层面的数据安全领域的法律法规陆续出台,数据备份管理与数据安全、数据保护息息相关,需要从数据层面去优化 IT 运维管理;

2)满足企业自身运营要求。 随着企业信息化治理水平的提高,数据资产化理念逐渐深入,精细化的数据管理对数据备份策略提出了更高的要求。

3. 数据备份的分类定级策略

数据分类强调的是根据数据种类的不同,依照数据的属性、特征而进行的划分;定级则侧重于按照特定的一些评价标准,对同类型的数据制定相应的数据备份保护级别;最后是综合运用不同的数据备份的技术手段来实现数据备份策略的分类定级。

3.1 数据分类方法

数据可以从多个维度去分类,不同的分类维度会产生不同数据归类结果,为了统一数据分类结果,一般采用多级分类的方法。数据分类维度也不宜过细,要考虑数据备份的实际颗粒度。

以业务系统一般作为一级子类,该分类比较明确,分别对应于不同的业务系统;电子数据的存在形式主要包括数据库等结构化数据与非结构化数据这两种类型,作为二级子类,该分类也比较明确;再按照数据来源进行分类补充,可分为客户数据、业务数据、运营管理数据以及办公数据,作为三级子类,按照重要性从高到低的顺序如下:

1)客户数据: 在客户保险服务过程中直接(或间接)采集的相关数据;

2)业务数据: 提供保险服务的应用系统产生的业务数据;

3)运营管理数据: 公司经营管理过程中采集或产生的业务数据;

4)办公数据: 员工办公相关的数据或临时业务数据等。

根据上述的分类结果来看,依据业务系统和数据存在形式是非常便于数据备份管理的,而数据来源这样的三级子类往往与数据备份的颗粒度不一致,比如某个 IT 系统的数据库中包含了客户数据和业务数据,这样的情况下则优先记录为重要性更高的客户数据。最终业务系统的备份数据分类可参考如下表:

一级子类

二级子类

三级子类

备份数据信息

XXX系统

结构化数据

客户数据

XXX系统数据库备份

非结构化数据


客户数据

XXX系统客户单据

业务数据

XXX系统交易信息

运营管理数据

XXX系统程序代码

3.2 数据备份定级标准

数据备份重点保障了数据的可用性和完整性,所以定级标准中应该体现可用性和完整性需求的不同。上文的数据分类方法已经提供了部分的定级依据,但是还需要综合考虑数据被破坏后的影响范围、影响客体以及数据自身价值等特点。包括以下的数据特征的定级评估因素:

数据实时性:评估数据的实时性要求,实时性高的数据需要考虑更高的数据保护级别;

数据影响性:评估数据完整性被破坏后,对社会秩序、客户权益以及企业利益的影响程度,一般来说社会秩序和客户权益应高于企业利益,但在备份管理定级中,影响客体区分度不大,更关注影响程度;

数据独有性:业务应用重现数据的完整程度、数据接受补录的难易程度;

数据的审计需求与法律风险:数据是否涉及后期审计的需求,是否存在一定的法律风险,一般来说法律风险是需要特别关注的。

综合上述分析,最终制定如下四个数据备份保护级别:

数据备份保护级别

数据一般特征

4

业务数据或客户数据,数据具有很高的独有性,数据完整性破坏后对社会秩序、客户权益以及企业利益有较大影响,数据具有独有性,或数据的实时性要求较高,或数据丢失存在较大的法律风险

3

其他客户相关对外服务的业务系统数据,数据独有性不高,数据完整性破坏后对社会秩序、客户权益以及企业利益影响较小,数据丢失存在一定的法律风险

2

其他业务系统数据,数据完整性破坏后对社会秩序、客户权益以及企业利益有较小影响,数据具有较小的独有性,实时性要求不高

1

公司运营管理或办公相关的数据,只对该系统可用性有影响

数据备份保护级别最高为 4 级,对于保险行业来说,一般符合第 4 级数据特征的数据可总结为核心系统中的客户、承保、赔付相关业务数据,资金系统中的资金运用数据,财务系统中的财务数据、官网系统销售数据及相关系统日志;第 3 级主要是其他客户相关对外服务的业务系统数据,这类数据往往也具有一定的法律风险;第 2 级一般为其他业务系统数据,有一定的数据价值;第 1 级为公司运营管理或办公相关的数据,往往能承受一定的数据丢失。

3.3 数据备份定级策略

从技术方案层面看,数据备份保护手段主要包括:

1)本地备份:定期数据备份,备份数据保存在本地数据中心,保留多个备份版本,备份频率依据备份管理成本和投入资源来定,个别数据量级高的备份任务可能是每月执行一次;

2)备份同城转储:定期数据备份,备份数据转储到同城数据中心,保留多个备份版本(同城数据容灾);

3)备份异地转储:数据备份转储到异地的数据中心(异地数据容灾);

4)长期归档:设定数据归档保存期限,归档至少会有两份数据,分布在不同的数据中心(最通用的针对数据的长期数据保存和备份的方法);

5)数据异步复制:一般用于重要数据被误删时应急处置措施;

6)数据同步复制或存储同步:基于数据同步复制或存储镜像技术的数据保护,保障数据实时同步。

对于不同的数据保护级别的数据,综合采用上述的数据保护方案,建议如下表:

数据备份保护级别

第1级

本地备份

第2级

同城备份

第3级

异地备份

第4级

重要数据备份

本地备份

备份转储

本地

同城转储

异地转储

异地转储

长期归档

定期归档

定期归档

数据异步复制

存储复制或存储快照

同城范围

同城+异地

RPO

0-4周

0-2天

0-4小时

0

金融行业的重要数据经常会因为业务需要、内外部监管审计或司法相关事件而需要恢复多年前的业务数据。所以需要重点关注数据保护级别为 3-4 的数据,不能随意清理回收存储资源,应制定数据长期归档策略,重要归档数据应至少保存到业务数据失效后的十年或永久存档。

4. 小结

随着数字化转型的深入,除了关注数据备份技术的运用,数据备份管理也需要多关注数据对象本身,在数据分类定级的基础上,采用多种数据备份手段相配合的方式,来制定和完善符合企业发展需要的数据备份策略。

责任编辑:武晓燕 来源: twt企业IT社区
相关推荐

2009-11-03 09:06:14

数据备份数据安全网络安全

2022-11-02 14:45:24

Python数据分析工具

2015-11-13 10:06:27

数据科学大数据入门

2011-03-25 12:57:13

备份Cacti数据

2018-04-16 12:14:34

数据科学机器学习神经网络

2017-10-10 14:20:11

随机森林分类算法

2018-10-28 18:30:51

数据科学数据项目管理

2017-03-07 10:37:05

非数据数据分析

2017-04-05 06:40:32

科技新闻早报

2022-06-02 13:59:57

数据迁移数据

2011-03-29 13:46:56

备份Windows Ser安全

2021-12-10 15:03:20

数字化转型企业技术

2020-06-01 14:11:39

AdaBoost数据科学分类器

2017-02-16 08:41:09

数据Vlookup匹配

2011-03-17 17:27:48

Sybase数据库引擎

2011-05-25 00:00:00

数据库设计

2022-03-28 14:08:02

Python数据清洗数据集

2023-03-13 07:26:35

2016-09-04 15:49:46

科学方法数据中心

2019-08-27 09:34:29

数据科学统计机器学习
点赞
收藏

51CTO技术栈公众号