企业低成本备份和恢复策略探析

原创
安全 网站安全
本文主要向用户们介绍了几种保障企业数据安全存储、能够为将来的数据恢复打下良好基础的存储技术以及恢复手段和工具。希望广大用户在各自的工作岗位上,对这些知识灵活运用,根据自己企业的实际特点选择好数据备份和存储软硬件,从而能够较好地应对各种突发事件和数据灾难,成功地进行数据恢复。

【51CTO.com独家特稿】企业的网络和数据管理员主要职责就是保障企业网络的正常运行,确保网络稳定运转一方面需要网络管理员有深厚的技术知识,另一方面也需要公司内部的规章制度与软硬件环境给予支持。备份与恢复系统承担着事前备份与事后恢复的职能。在当前高速发展的网络环境下,任何一个网络上的信息系统都不可能保证绝对的安全。只要有网络存在,就会有来自网络的形形色色的威胁。为了抵御网络的攻击和入侵,虽然我们引入了日趋成熟的入侵检测系统、防火墙系统等,黑客们的入侵手段也日益高明,他们总能找到这些系统的安全漏洞及不足进行入侵,因而网络入侵所引起的安全事件呈逐年增加之势。在这种情况下,我们难以保证网络中关键系统的绝对安全,因而就需要采用备份及恢复技术。备份及恢复技术就是使用存储介质和一定的策略,定期将系统业务数据备份下来,以保证数据意外丢失时能尽快恢复,将用户的损失降到最低点。本文将首先介绍数据备份和恢复的常用机制和策略,接着介绍Windows和Linux系统下常用的、低成本的数据备份和恢复软件,他们中间很大一部分是共享软件和开源软件;并最后给出如何制定备份和恢复计划。希望使用户深切地体会到:做好了前期相应的数据存储和备份工作,后期数据恢复工作实质上也就有了保障和前提保证,只需要根据情况使用不同存储技术进行恢复即可。

1、数据备份和恢复简介

所谓数据恢复是指由于各种原因导致数据损失时把保留在介质上的数据重新恢复的过程。即使数据被删除或硬盘出现故障,只要在介质没有严重受损的情况下,数据就有可能被完好无损地恢复。格式化或误删除引起的数据损失的情况下,大部分数据仍未损坏,用软件重新恢复连接环节的话,可以重读数据;如果硬盘因硬件损坏而无法访问时,更换发生故障的零件,即可硬盘数据恢复。在介质严重受损或数据被覆盖情况,数据将无法恢复。

当前的数据恢复工作林林总总,有针对硬盘恢复的,有针对文件系统恢复的,也有针对某些具体操作系统的引导记录进行恢复的,这些都属于数据恢复的范畴。然而,由于数据恢复要求和应用的千差万别,在长期的实践中,业界逐渐意识到,数据恢复的本身非常依赖于数据的存储方式,而由于这些方式的不同,则直接影响到了当出现灾难时的数据恢复工作本身。比如说,基于磁盘阵列和SAN存储的数据恢复过程差别是很大的,而对文件系统的恢复和对操作系统引导记录的恢复也是不同的。因此,本文下面将从最一般的硬盘恢复出发,从数据的存储方式入手,向大家介绍数据恢复的相关问题。也就是说,做好了前期相应的数据存储和备份工作,后期数据恢复工作实质上也就有了保障和前提保证,只需要根据情况使用不同存储技术进行恢复即可。

2、常见的数据备份策略

备份不仅是数据的保护,其最终目的是为了在系统遇到人为或自然灾难时,能够通过备份内容对系统进行有效的灾难恢复。备份不是单纯的拷贝,管理也是备份重要的组成部分。管理包括备份的可计划性、磁带机的自动化操作、历史记录的保存以及日志记录等。对于现代企业来说,在正常运作的过程中难免出现如下几种情况的灾难,需要针对他们进行数据的备份和恢复工作: 

◆计算机软硬件故障:对于某一企业,发生可能性最大,也最频繁,是经常发生的一类故障。 

◆人为操作故障:对管理较严、人员素质较高的企业,偶尔发生;对管理较松、人员培训不足的企业,会经常发生。 

◆资源不足引起的计划性停机:对于某一企业,随着业务的快速增长,平均每年均会发生如软、硬件升级、系统资源扩充等事件,业务增长越快的企业,发生亦越频繁。 

◆自然灾害:由于火灾、水灾、地震、雷击等自然灾害引起的企业计算资源和数据的毁灭或者丢失。这种情况对于任何企业来说都是不可避免和抗拒的,当然发生的概率相对上述几种灾害来说通常比较小。

根据目前的应用情况来看,如下的一些分类的备份方法可以提供给企业根据不同的应用情况进行能够选用。

(1) 备份模式  

◆逻辑备份:每个文件都是由不同的逻辑块组成。每一个逻辑的文件块存储在连续的物理磁盘块上,但组成一个文件的不同逻辑块极有可能存储在分散的磁盘块上。备份软件通常既可以进行文件操作,又可以对磁盘块进行操作。基于文件的备份系统能够识别文件结构,并拷贝所有的文件和目录到备份资源上。这样的系统跨越了存储在每个inode上的指针,可顺序的读取每个文件的物理块,然后备份软件连续的将文件写入到备份媒介上。这样的备份使得每个单独文件的恢复变得很快,但连续的存储文件会使得备份速度减慢,因为在对非连续存储磁盘上的文件进行备份时需要额外的查找操作。这些额外的操作增加了磁盘的开销,降低了磁盘的吞吐率。另外,对于文件一个很小的改变,基于文件的逻辑备份也需将整个文件备份。 

◆物理备份:系统在拷贝磁盘块到备份媒介上时忽略文件结构,这会提高备份的性能,因为备份软件在执行过程中,花费在搜索操作上的开销很少。但这种方法使得文件的恢复变得复杂且缓慢,因为文件并不是连续的存储在备份媒介上。为了允许文件恢复,基于设备的备份必须要收集文件和目录是如何在磁盘上组织的信息,才能使备份媒介上的物理块与特定的文件相关联。因而,基于设备的备份适合于指定一个特定的文件系统来实现,并且不易移植。而基于文件的方案则更易移植,因为备份文件包含的是连续文件。另外,基于设备的备份方案可能会导致数据的不一致。

(2) 备份策略  

◆全备份:这种备份方式很直观,容易被人理解。当发生数据丢失的灾难时,只要用一盘磁带(即灾难发生前一天的备份磁带),就可以恢复丢失的数据。但也存在不足之处:首先,每天都对系统进行完全备份,在备份数据中有大量内容是重复的,例如操作系统与应用程序。这些重复的数据占用了大量的磁带空间,意味着增加成本;另外,由于需要备份的数据量相当大,备份所需时间也就较长。 

◆增量备份:该备份的优点是没有重复的备份数据,节省磁带空间,缩短备份时间。缺点在于当发生灾难时,恢复数据比较麻烦。例如,若系统在周四早晨发生故障,那么就需要将系统恢复到周三晚上的状态。管理员需要找出周一的完全备份磁带进行系统恢复,再找出周二的磁带来恢复星期二的数据,最后再找出周三的磁带来恢复星期三的数据。在这种备份下,各磁带间的关系就像链子一样,其中任何一盘磁带出了问题,都会导致整条链子脱节。 

◆差分备份:管理员先在周一进行一次系统完全备份,然后在接下来的几天里,再将当天所有与星期一不同的数据备份到磁带上。差分备份无需每天都做系统完全备份,备份所需时间短,节省磁带空间,灾难恢复也很方便。系统管理员只需两盘磁带,即系统全备份的磁带与发生灾难前一天的备份磁带,就可以将系统完全恢复。

(3) 备份服务器在备份过程中是否可接收用户响应和数据更新角度  

◆冷备份:冷备份很好地解决了在备份选择进行时并发更新带来的数据不一致性问题,缺点是用户需要等待很长的时间,服务器将不能及时响应用户的需求。目前的新技术有LAN-Free、Server-Free等,这种方式的恢复时间比较长,但投资较少。 

◆热备份:由于是同步备份,热备份资源占用比较多,投资较大,但是它的恢复时间非常短。在热备份中有一个很大的问题就是数据的有效性和完整性,如果备份过程中产生了数据不一致性,会导致数据的不可用。解决此问题的方法是对于一些总是处于打开状态的重要数据文件,备份系统可以采取文件的单独写/修改特权,保证在该文件备份期间其他应用不能对它进行更新。

(4) 备份地点  

◆远程备份:在本地将关键数据备份,然后送到异地保存,以防止企业本地备份的数据在灾难终也遭到破坏。灾难发生后,按预定数据恢复程序恢复系统和数据。这种方案可以采用磁带机、磁盘阵列等存储设备进行本地备份同样还可以选择磁带库、光盘库等存储设备。 

◆本地备份:在本地将关键数据进行备份,然后进行保存,主要包括本地双机备份、本地局域网备份等等。

(5) 备份介质  

◆磁带备份:磁带一开始就是储存恢复备份的主要介质。随着容量和速度不断提升,磁带可以让用户以较低的成本存储多重备份或版本。由于它是一种可移动式的介质,磁带也可以作为远程灾难恢复备份用途。磁带备份最大的挑战是,它的备份质量并不稳定。在操作过程中,有可能数据已经全部备份成功,但是,却很难验证磁带内所有数据是否皆可恢复。质量不良的磁带会令恢复操作失败,而这种错误通常察觉不出来,一定要等到执行恢复操作时才会发现,等到那时已经来不及了。当备份数据量非常大时,价格优势十分明显。 

◆磁盘备份:磁盘阵列不需要稳定的数据流。即使采用只存储少量数据的增量备份,也没有“摩擦”效应。第二,磁盘阵列允许管理人员进行较不常做的全部数据备份工作(Full Backup),而不用忍受执行速度变慢的后果或增加恢复资料时损坏的风险,可以简化及加快整体备份的速度。除了缩短备份时间以外,对于时常进行的完整备份,也可以减少恢复时所需的磁带数量,简化恢复过程。以磁带备份来看,恢复时所需的磁带数量会依增量备份的次数而增加。而磁盘阵列允许管理人员简化这样的备份过程。在制作远程恢复备份时,磁盘也比较容易且更有效。利用“磁盘至磁带”复制数据时,不需要同时由一个磁带内处理多位使用者的恢复备份,它可以针对每位使用者直接复制恢复备份,因此加快了恢复的过程。另外,“磁盘至磁带”也比“磁带至磁带”复制方式更有弹性。当正在进行“磁带至磁带”复制时,主要来源磁带和要备份的磁带,两种都没有办法再做其它的备份或恢复操作。相反的,当正在复制数据到磁带时,磁盘允许使用者同时存取数据,接受备份及恢复操作。

灾难恢复措施在整个备份制度中占有相当重要的地位。因为它关系到系统在经历灾难后能否迅速恢复。灾难恢复操作通常可以分为两类。第一类是全盘恢复,第二类是个别文件恢复,还有一种值得一提的是重定向恢复。 

◆全盘恢复:全盘恢复一般应用在服务器发生意外灾难导致数据全部丢失、系统崩溃或是有计划的系统升级、系统重组等,也称为系统恢复。 

◆个别文件恢复:由于操作人员的水平不高,个别文件恢复可能要比全盘恢复常见得多,利用网络备份系统的恢复功能,我们很容易恢复受损的个别文件。只需浏览备份数据库或目录,找到该文件,触动恢复功能,软件将自动驱动存储设备,加载相应的存储媒体,然后恢复指定文件。 

◆重定向恢复:重定向恢复是将备份的文件恢复到另一个不同的位置或系统上去,而不是进行备份操作时它们当时所在的位置。重定向恢复可以是整个系统恢复也可以是个别文件恢复。重定向恢复时需要慎重考虑,要确保系统或文件恢复后的可用性。为了防备数据丢失,我们需要做好详细的灾难恢复计划,同时还要定期进行灾难演练。每过一段时间,应进行一次灾难演习。可以利用淘汰的机器或多余的硬盘进行灾难模拟,以熟练灾难恢复的操作过程,并检验所生成的灾难恢复软盘和灾难恢复备份是否可靠。#p#

3、Windows下的数据备份和恢复软件

常用的硬盘数据恢复软件包括Easyrecovery、Finaldata、R-Studio、Drive Rescue等等,他门大部分都是共享软件。下面就这些软件的功能和特性向大家推荐介绍。

(1)Easyrecovery

◆Easyrecovery是一个非常著名的老牌数据恢复软件。该软件功能可以说是非常强大。无论是误删除/格式化还是重新分区后的数据丢失,其都可以轻松解决,其甚至可以不依靠分区表来按照簇来进行硬盘扫描。但要注意不通过分区表来进行数据扫描,很可能不能完全恢复数据,原因是通常一个大文件被存储在很多不同的区域的簇内,即使我们找到了这个文件的一些簇上的数据,很可能恢复之后的文件是损坏的。所以这种方法并不是万能的,但其提供给我们一个新的数据恢复方法,适合分区表严重损坏使用其他恢复软件不能恢复的情况下使用。Easyrecovery最新版本加入了一整套检测功能,包括驱动器测试、分区测试、磁盘空间管理以及制作安全启动盘等。这些功能对于日常维护硬盘数据来说,非常实用,我们可以通过驱动器和分区检测来发现文件关联错误以及硬盘上的坏道。

具体说来,其支持的数据恢复方案包括: 

◆高级恢复:使用高级选项自定义数据恢复 

◆删除恢复:查找并恢复已删除的文件 

◆格式化恢复:从格式化过的卷中恢复文件 

◆Raw恢复:忽略任何文件系统信息进行恢复 

◆继续恢复:继续一个保存的数据恢复进度 

◆紧急启动盘:创建自引导紧急启动盘

其支持的文件修复类型包括: 

◆Microsoft Access 修复 

◆Microsoft Excel 修复 

◆Microsoft PowerPoint修复 

◆Microsoft Word 修复 

◆Zip压缩文件修复  

 

图1  Easyrecovery主界面

(2)Finaldata

Finaldata2.0是目前Finaldata的最新版本。Finaldata是一个日本人开发的数据恢复软件,Finaldata自身的优势就是恢复速度快,可以免去搜索丢失数据漫长的时间等待。 不仅恢复速度快,而且其在数据恢复方面功能也十分强大,不仅可以按照物理硬盘或者逻辑分区来进行扫描,还可以通过对硬盘的绝对扇区来扫描分区表,找到丢失的分区。Finaldata在对硬盘扫描之后会在其浏览器的左侧显示出文件的各种信息,并且把找到的文件状态进行归类,如果状态是已经被破坏,那么也就是说如果对数据进行恢复也不能完全找回数据。这样方便我们了解恢复数据的可能性。同时此款软件还可以通过扩展名来进行同类文件的搜索,这样就方便我们对同一类型文件进行数据恢复。Finaldata的速度之快不仅表现在对硬盘扫描时迅速,把已经找到要恢复的文件进行保存的速度也非常迅速,Finaldata能充分利用IDE硬盘的ATA133、ATA100等最大接口速度,对数据进行快速保存,在保存数据时间方面,Finaldata比其他同类型软件要快一倍以上。

FinalData是业界唯一的支持网络数据恢复的企业级软件。在使用过程中,我们只需在服务器和客户机端安装TCP/IP,在需要恢复的机器上运行FinalData光盘上的客户端WinSlave程序,服务器端运行FinalData恢复程序,就可以非常迅速地恢复远程机器上的文件,如同本地一样。为了保障远程访问的安全,在运行WinSlave时要求输入口令。对于目前应用还较多的IPX/SPX网络,FinalData提供了DosSlave客户端软件支持它,使用方式与WinSlave相同。由于slave程序非常小,所以可以通过E-mail或者其他方式将slave寄给要恢复数据的用户。  

图2  Finaldata2.0主界面

(3)R-Studio

该款软件是IT专业人士和高级用户理想的文件恢复解决方案,他们仅需要用它来恢复或反删除本地计算机或服务器上丢失的数据。该工具能够恢复本地硬盘上FAT(FAT12、FAT16、FAT32)、NTFS、NTFS5(由 Windows 2000 创建或更新)、Ext2FS/Ext3FS(Linux 文件系统)以及UFS1/UFS2(FreeBSD/OpenBSD/NetBSD 文件系统)分区的文件。它也可以通过网络恢复NTFS、FAT、ExtFS以及UFS分区的64KB以下的文件。

R-Studio运行于本地磁盘和网络磁盘,即使这些分区已被格式化、损坏或删除。对参数进行灵活的设置,可以让您对数据恢复实施绝对控制。

(4)Drive Rescue

Drive Rescue是一款优秀而且免费的磁盘数据拯救程序,它能恢复驱动器(例如硬盘)上误删或遗失的数据,即使已经失去分区表或硬盘已被快速格式化或者遭遇系统崩溃等情况,找回驱动器重要文件系统信息如分区表、引导记录、FAT、文件/目录记录等。当然对于物理损坏的硬盘它也无能为力。Drive Rescue支持FAT 12/16/32分区和Windows全系列操作系统以及双硬盘。

该软件具有如下几个重要功能: 

◆Recover deleted files:恢复被删除的文件应当说这是一个最为实用的功能了,可以通过简单的3个步骤恢复被删除的文件; 

◆Find lost data:查找丢失的数据,这个功能适用于磁盘被快速格式化或系统崩溃的用户; 

◆Find logical drive:查找丢失的分区,假如系统分区表出现什么问题,就可以使用该功能进行恢复。#p#

4、Linux下的开源数据备份和恢复软件

(1)Amanda

Amanda(Advanced Maryland Automatic Network Disk Archiver),马里兰高级自动网络磁盘存档工具)是由马里兰大学的James da Silva在1991年所开发的。它是一个复杂的网络备份系统,能够把LAN中的所有计算机备份到一台服务器的磁带驱动器、磁盘或光盘上。Amanda本身并不是备份程序,它其实只是管理其他备份软件的封装软件。它使用系统上的dump和restore命令作为底层的备份软件,同时也能够使用tar命令,针对于windows计算机,Amanda还能够使用smbtar命令来实现备份。

Amanda支持类型广泛的磁带驱动器,并且能够使用磁带驱动器中的硬件压缩功能,或者也可以在数据通过网络之前使用客户机的compress以及gzip命令来压缩备份。其次,Amanda能够使用临时保存磁盘作为备份存档的中间存储媒介,以优化磁带的写入性能并保证在磁带出错时也能备份数据。

Amanda是当前最流行的免费备份解决方案,目前Amanda最新的稳定版本是2.6.1,是2009年1月26日最新发布的。用户可以通过http://www.amanda.org站点可以免费获得。

(2)BackupPC

BackupPC(参见图3)是一个高效的企业级别的备份系统,可以备份桌面系统,笔记本等。可以从网站上http://backuppc.sourceforge.net/访问并下载。他支持Linux和Windows操作系统的备份,目前常用于Linux操作系统。其最新的版本为3.1.0。它主要具有如下几个显著特点: 

◆最小化使用服务器的磁盘空间和I/O来对数据进行备份和恢复; 

◆采用优化的压缩技术,进一步减少磁盘空间需求量; 

◆具有强大和友好的图形用户界面,方便用户操作使用; 

◆支持多种备份方式和备份选项; 

◆灵活的配置方法。  

图3  backupPC界面

(3)Bacula

bacula采用模块化设计,采用c/s构架,理论上可以把任意多台主机的资料备份到任意多台中,而用户不需要在每台机器上都写一个配置文件控制他们运作,所有主要的工作都在一台主控备份机器上控制。登陆上主控备份用户就可以清楚地知道和监控什么备份正在运行,什么备份成功了,什么备份失败了,所有的备份日志也会集中到用户指定的地方,这样的集中式管理机制让管理工作更简单一点。恢复的时候也很简单,简单运行几个命令用户就可以把指定的备份恢复。支持完全备份、差分备份、增量备份等多种备份机制;支持把备份写到多种备份媒质中,比如写入到硬盘文件中,也支持写到磁带中。支持平台相当多,设置包括win平台(备份win,还不支持备份到win)。其网站为:http://www.bacula.org/en/。目前其最稳定版本为2.4.4(2009年1月发布),而最新版本为bacula-2.5.42-b2,这是一个beta测试版本,于2009年3月份发布。

(4)Xtar

Xtar是Linux系统桌面环境下查看和处理tar的工具。tar工具是Unix备份文件的工具,Linux继承了该工具。因为tar几乎可以工作于任何环境中,所以Linux老用户都信赖它。但是tar是一个命令行的工具,没有图形界面,使用起来不是非常方便。tar命令的参数非常多,常用的包括30多个,初学者往往不易掌握。因此,Xtar是一个图形化的tar工具。Xtar全部兼容tar命令,可以在桌面环境下完成打包整个目录树的任务,这使得它特别适合用于备份。Xtar与文件系统无关,可以使用在ext2、ext3、JFS、Reiser和其它文件系统上,支持各种备份介质:软盘、光盘、可重写的光盘、JazZip、磁带等。

(5)Taper

Taper是一款拥有良好用户界面的磁带备份和恢复软件,并且是开放源代码的。它可以从一台磁带机上备份/恢复软件,支持自动更新备份和恢复,是一个相当好用的工具。Taper可以运行在命令行和KDE、Gonme桌面环境下。在命令行下启动一个终端输入即可启动。Taper最大的优点是支持多种备份介质:磁带、软盘、ZIP驱动器、硬盘等。毕竟磁带机的价格还是比较昂贵的。缺点是Taper最新版本一次备份文件最大容量不能大于4GB。该软件的下载网站为:taper.sourceforge.net/。目前,其最新版本为:6.9b。

(6)Arkeia

Arkeia是一个基于客户/服务模式的备份解决方案。Arkeia使用了独特的多线程技术,因此备份速度很快。如果客户端是选择用图形界面的,需要Java虚拟机(JVM)支持(或者JDK)。作为商业软件Arkeia和Kdat相比最大的优点是备份速度快(在高速网络中Arkeia一个小时可以备份700GB文件)、和广泛应用的平台(通过Samba可以备份Windows主机)。如果使用图形界面需要安装两个软件:arkeiasb-server、arkeiasb-gui。Arkeia有非常详细的在线帮助,很容易上手。其下载网站为:www.arkeia.com/download/

(7)webCDcreator

目前政府和企事业单位改换为Linux用于桌面系统。针对这种情况,如若需要实现备份,可以在安装刻录机的Linux服务器部署webCDcreator共享刻录软件。然后网络中的所有节点(Linux、Windows都可)都可使用这台刻录机进行数据备份。首先在服务器端安装配置软件,然后在客户端通过安装Java的浏览器即可访问服务器上的刻录机。部署webCDcreator刻录软件的优点:节约资金:所有软件都是免费的。所使用的机器只需能够运行内核2.2.x以上的任一Linux发行版。便于管理:集中化的方式有利于管理。其下载网站为:http://joerghaeger.de/webCDcreator/

(8)Ghost for Linux

Ghost for Linux一个出色的硬盘对拷工具,它可以最大限度地减少用户每次安装操作系统的时间。它能适用于不同大小的硬盘,而且空间都被充分利用起来。注意Ghost for Linux不是赛门铁克的Ghost,它是一个开放源代码软件,支持ATA、serial-ATA和SCSI硬盘。使用Ghost for Linux进行Linux系统备份的优点在于:无需购买磁带机设备,使用一个大硬盘就可以为多台系统进行全盘备份(一台磁带机的价格相当于100个硬盘的价格)。可以使用匿名传输的方式把备份文件传输到FTP服务器。缺点在于:备份时间比磁带机长。其下载网站为:https://sourceforge.net/projects/g4l

(9)NeroLINUX

随着Linux内核版本的增加,Linux操作系统越来越大,用DVD刻录机备份操作系统成为必然。NeroLINUX是Nero公司发布的一款桌面环境下的CD/DVD刻录软件,在操作上NeroLINUX与Windows的版本基本相同,它支持2.4/2.6版本内核,并且将采用RPM和Debian包等易安装软件包形式。从备份介质方面NeroLINUX支持所有主流刻录盘片。它有非常容易使用的界面,功能比较齐全。缺点:目前NeroLINUX还只有RPM和Deb两种版本,没有提供源代码,所以只能用于使用以上两种发行版本的Linux。其下载网站为:www.nero.com

(10)mkCDrec

MkCDrec(建立可恢复系统的只读CD)是Linux系统中建立可引导灾难恢复CD的工具。它支持多数文件系统、RAID(廉价冗余磁盘阵列)以及可选的工具,可以用来进行系统故障修复。使用mkCDrec CD进行引导系统,用户还需做其它工作:如果用户选择建立系统备份,那么用户可以执行/etc/recovery/start-restore.sh 命令,该命令运行后将提示用户完整的系统恢复过程。如果您在建立启动CD时没有进行备份,那么系统会提示没有数据可以进行恢复。/etc/recovery目录包含了许多工具可以用来进行系统恢复或者修复崩溃的服务器,在mkCDrec的Web站点上有详细的说明。其下载网站为:http://mkcdrec.ota.be

(11)tar和cpio命令

tar是一个已移植到Linux中的经典Unix命令。tar是tape archive(磁带归档)的缩写,最初设计用于将文件打包到磁带上,现在我们大都使用它来实现备份某个分区或者某些重要的文件目录。我们使用 tar可以打包整个目录树,这使得它特别适合用于备份。归档文件可以全部还原,或从中展开单独的文件和目录。备份可以保存到基于文件的设备或磁带设备上。文件可以在还原时重定向,以便将它们重新放到一个与最初保存它们的目录(或系统)不同的目录(或系统)。tar是与文件系统无关的,因而它的适用范围很广,它可以使用在ext2、ext3、jfs、Reiser和其他文件系统上。

使用tar非常类似于使用诸如Windows环境下的Winzip、WinRAR这样的文件实用工具。只需将它指向一个目的(可以是文件或设备),然后指定想要打包的文件,就可以通过标准的压缩类型来动态压缩归档文件,或指定一个自己选择的外部压缩程序。要通过bzip2压缩或解压缩文件,可使用tar -z命令。

cpio命令可以从tar或者cpio档案文件中拷入或者拷出文件。cpio命令和tar命令兼容,但是这个命令具备一些tar命令没有的功能,如下所示: 

◆支持cpio和tar两种档案文件格式; 

◆支持许多老式磁带数据格式; 

◆能够通过一个管道(pipe-line)读取文件的文件名。

目前看来,只有很少的Linux软件包是以cpio格式发行的。用户如果对cpio命令的详细情况感兴趣,可以通过“man cpio ”命令阅读它的使用手册。

(12)dump和restore命令

dump执行类似tar的功能。然而,dump倾向于考虑文件系统而不是个别的文件。dump检查ext2文件系统上的文件,并确定哪些文件需要备份。这些文件将出于安全保护而被复制到给定的磁盘、磁带或其他存储媒体上。在大多数媒体上,容量是通过一直写入直至返回一个end-of-media标记来确定的。配合dump的程序是restore,它用于从转储映像还原文件。restore命令执行转储的逆向功能。可以首先还原文件系统的完全备份,而后续的增量备份可以在已还原的完全备份之上覆盖。可以从完全或部分备份中还原单独的文件或者目录树。dump和restore都能在网络上运行,因此用户可以通过远程设备进行备份或还原。dump和restore使用磁带驱动器和提供广泛选项的文件设备。然而,两者都仅限用于ext2和ext3文件系统。如果使用的是JFS、Reiser或者其他文件系统,将需要其他的实用工具

dump默认已经安装在Linux中。使用dump命令时,它会建立一份自上次备份操作以来进行修改过的文件列表,然后把这些文件打包成一个单独的文件。在做备份时,需要指定一个备份级别,它是0-9之间的一个整数。级别为m的转储会对从上次进行的级别小于m的转储操作以来修改过的所有文件进行备份,而级别0就是完全备份。通过这种方式,可以很轻松的实现增量备份、差分备份,甚至每日备份。通常情况下,第一次备份时可选择级别0,以后每天做增量备份时就可以每天依次使用级别1,级别2,级别3等等,这样随着级别的增加以后每次做增量备份时才会对以前的各个老版本进行及时地更新;当需要每天做差异备份时,与上述原则也一样。

Dump备份具有如下几个显著的优点: 

◆备份可以跨多卷磁带; 

◆能备份任何类型的文件,甚至是设备; 

◆备份时,文件的权限、用户、用户组、修改时间等都会被一一准确保存; 

◆能够正确处理从未包含任何数据的文件块; 

◆能够做增量、差分备份。

然而,在使用过程中,需要牢记该备份方法的一些缺点,以便在使用中驾轻就熟,扬长避短: 

◆每个文件系统必须单独转储备份; 

◆只有本地计算机的文件系统才能够转储备份; 

◆由于dump可以将备份存储在磁带上。Linux通常用/dev/st0代表倒带设备,而用/dev/nst0代表非倒带设备,使用倒带设备存储时,当磁带用完它会自动倒带并接着存储,所以会覆盖以前的数据,这样就存在以前数据丢失的风险,这点尤其需要注意。#p#

5、硬盘恢复

硬盘中的数据恢复是广大用户碰到的最为常见的一个管理问题,应用软件的频繁安装和卸载、操作系统运行时产生的垃圾文件的增多等等,都使得硬盘中的数据发生错误和灾难的可能性越来越大,而用户的误操作问题也时常危及着磁盘数据。Symantec出品的Norton Ghost一直是广大PC用户备份分区和硬盘恢复的首选软件。Norton Ghost工作的基本方法不同于其他的备份软件,它是将硬盘的一个分区或整个硬盘作为一个对象来操作,可以完整复制对象(包括对象的硬盘分区信息、操作系统的引导区信息等等),并打包压缩成为一个映像文件(IMAGE),在需要的时候又可以把该映像文件恢复到对应的分区或对应的硬盘中。它的功能包括两个硬盘之间的对拷、两个硬盘的分区对拷、两台电脑之间的硬盘对拷、制作硬盘的映像文件等,我们用得比较多的是分区备份功能,它能够将硬盘的一个分区压缩备份成映像文件,然后存储在另一个分区或者硬盘中。万一原来的分区发生问题,就可以将所备件的映像文件拷回去,让或分区恢复正常。基于此,我们就可以利用Ghost来备份系统和完全恢复系统。但是,使用Ghost软件有一定的危险性,稍有不慎就容易误操作,导致数据灾难。在Ghost误操作之后,应该立即停止使用硬盘,寻找专业的数据恢复服务商进行数据恢复。

在进行克隆前,最好为Ghost克隆出的映像文件划分一个独立的分区。把Ghost.exe和克隆出来的映像文件存放在这一分区里,以后这一分区不要做磁盘整理等操作,也不要安装其它软件。因为映像文件在硬盘上占有很多簇,只要一个簇损坏,映像文件就会出错。有很多朋友克隆后的映像文件开始可以正常恢复系统,但过段时间后却发现恢复时出错,其主要原因也就在这里。一般先安装一些常用软件后才作克隆,这样系统恢复后可以免去很多常用软件的安装工作。为节省克隆的时间和空间,最好把它们安装到系统分区外的其它分区,仅让系统分区记录它们的注册信息等,使Ghost真正快速、高效。克隆前用Windows优化大师等软件对系统进行一次优化,对垃圾文件及注册表冗余信息作一次清理,另外再对系统分区进行一次磁盘整理,这样我们克隆出来的实际上已经是一个优化了的系统映像文件,将来如果我们要对系统进行恢复,我们便能一开始就拥有一个优化了的系统。  

图4  Ghost示意图#p#

6、应用磁盘阵列——RAID

数据恢复发展到今天,有很多的工作是进行磁盘阵列的数据恢复工作。在计算机发展初期,硬盘的容量很小,价格却相当高,为了解决数据的安全存储,当时主要用磁带机对数据进行备份。这种方法虽然可以保证数据的安全,但备份和查找数据都是一件很繁琐的事,因为磁带机读写速度很慢,而且查找某一数据还需要来回倒带。

1987年,Patterson、Gibson和Katz这三位工程师在加州大学伯克利分校发表了题为《A Case of Redundant Array of Inexpensive Disks(廉价磁盘冗余阵列方案)》的论文,其基本思想就是将多个容量较小的、相对廉价的硬盘驱动器进行有机组合,使其性能超过一个昂贵的大硬盘,这种思想的英文缩写就叫做RAID。数据恢复。RAID最初的研制目的是为了组合小的廉价硬盘来代替大的昂贵硬盘,以降低大批量数据存储的费用,同时也希望采用冗余信息的方式,使得硬盘失效时不会使对数据的访问受到损失,从而开发出一定水平的数据保护技术,并且能适当的提升数据传输速率。这一设计思想很快被接受,RAID技术得到了广泛应用,数据存储进入了更快速、更安全、吞吐量更大的新时代。虽然RAID包含多块磁盘,但是在操作系统下是作为一个独立的大型存储设备出现的。RAID按照实现原理的不同分为不同的级别,不同的级别之间工作模式是有区别的,分别可以提供不同的速度,安全性和性价比。  

[[9581]]

图5  RAID设备示意图

RAID按照实现原理的不同分为不同的级别,不同的级别之间工作模式是有区别的,分别可以提供不同的速度,安全性和性价比。在业界,常见的几种RAID如下所示:

(1)RAID0:又称为Stripe或Striping(条带),它代表了所有RAID级别中最高的存储性能。RAID0提高存储性能的原理是把连续的数据分散到多个磁盘上存取,这样,系统有数据请求就可以被多个磁盘并行的执行,每个磁盘执行属于它自己的那部分数据请求。这种数据上的并行操作可以充分利用总线的带宽,显著提高磁盘整体存取性能。

(2)RAID1:RAID1通过数据镜像实现数据冗余,在两对分离的磁盘上产生互为备份的数据。RAID1可以提高读的性能,当原始数据繁忙时,可直接从镜像复制中读取数据。RAID1是磁盘阵列中费用最高的,但提供了最高的数据可用率。当一个磁盘失效,系统可以自动地交换到镜像磁盘上,而不需要重组失效的数据。

(3)RAID2:从概念上讲,RAID2同RAID3类似,两者都是将数据条块化分布于不同的硬盘上,条块单位为位或字节。然而RAID2使用称为“加重平均纠错码”的编码技术来提供错误检查及恢复。这种编码技术需要多个磁盘存放检查及恢复信息,使得RAID2技术实施更复杂。因此,在商业环境中很少使用。

(4)RAID3:不同于RAID2,RAID3使用单块磁盘存放奇偶校验信息。如果一块磁盘失效,奇偶盘及其他数据盘可以重新产生数据。如果奇偶盘失效,则不影响数据使用。RAID3对于大量的连续数据可提供很好的传输率,但对于随机数据,奇偶盘会成为写操作的瓶颈。

(5)RAID4:同RAID2、RAID3一样,RAID4也同样将数据条块化并分布于不同的磁盘上,但条块单位为块或记录。RAID4使用一块磁盘作为奇偶校验盘,每次写操作都需要访问奇偶盘,成为写操作的瓶颈。

(6)RAID5:RAID5没有单独指定的奇偶盘,而是交叉地存取数据及奇偶校验信息于所有磁盘上。在RAID5上,读/写指针可同时对阵列设备进行操作,提供了更高的数据流量。RAID5更适合于小数据块,随机读写的数据。RAID3与RAID5相比,重要的区别在于RAID3每进行一次数据传输,需涉及到所有的阵列盘。而对于RAID5来说,大部分数据传输只对一块磁盘操作,可进行并行操作。在RAID5中有“写损失”现象发生,即每一次写操作,将产生四个实际的读/写操作,其中两次读旧的数据及奇偶信息,两次写新的数据及奇偶信息。它可能是目前世界上最常见的RAID产品,最适合于事务性处理应用,如ERP、CRM和E-mail等。

(7)RAID6:RAID6与RAID5相比,增加了第二个独立的奇偶校验信息块。两个独立的奇偶系统使用不同的算法,数据的可靠性非常高。即使两块磁盘同时失效,也不会影响数据的使用。但需要分配给奇偶校验信息更大的磁盘空间,相对于RAID5有更大的“写损失”。RAID6的写性能非常差,较差的性能和复杂的实施,以及实现代价非常昂贵,使得RAID6很少使用。

(8)RAID7:它有一个实时嵌入操作系统用作控制器,一个高速总线用于缓存。它提供快速的I/O,但是价格昂贵,应用性稍差。

(9)RAID10:它由数据条阵列组成,其中每个条都是驱动器的一个RAID1阵列。它与RAID1的容错能力相同,面向需要高性能和冗余,但不需要高容量的数据库服务器。

(10)RAID53:其实施情况同RAID0数据条阵列,其中,每一段都是一个RAID3阵列。它的冗余与容错能力同RAID3。这对需要具有高数据传输率的RAID3配置的IT系统有益,但是它价格昂贵、效率偏低。

表1对各类RAID产品的优缺点进行了详细说明,用户可以在实际的应用中选择使用:

 

表1

值得注意的是:上述介绍的0,1,2等RAID类型并不代表技术的高低(比如RAID2并没有商业产品,相对于RAID1说较差),而只代表不同的技术型号。所以在实际应用中选择某种RAID产品需要根据应用环境和资金等情况而定。

实现RAID可以采用两种方法,硬RAID和软RAID: 

◆硬RAID:采用专门的控制器来完成,也就是常说的RAID卡;通过磁盘阵列控制卡(RAID Controller Card)提供磁盘阵列的功能。要使用硬件的磁盘阵列,必须采购支持Linux的磁盘阵列控制卡,一般需要正确安装驱动程序,才能让Linux系统正常使用设备。 

◆软RAID:采用软件的方法来实现。用户无须安装额外的硬设备,只要保证Linux内核有支持,就可以直接使用。

由于硬件磁盘阵列的功能是由磁盘阵列控制卡提供计算工作的,因而效率大大高于由Linux内核的软件磁盘阵列;但硬件磁盘阵列得购买额外的设备,因此其使用成本比软件磁盘阵列高得多。过去RAID一直是高端服务器才应用的设备,与高档SCSI硬盘配合使用。SCSI RAID稳定性好、速度快,但SCSI硬盘和SCSI接口RAID卡价格高昂,往往只在高档服务器上使用。近来随着技术的发展和产品成本的不断下降,IDE硬盘和SATA硬盘的性能都有了很大提升,加之RAID芯片的普及,使得RAID技术也广泛应用到了IDE硬盘和SATA硬盘上。#p#

7、应用三大存储设备——SAN、DAS和NAS

对于一个企业来说,网络数据的安全性是极为重要的,一旦重要的数据被破坏或丢失,就会对企业造成重大的影响,甚至是难以弥补的损失。在这种背景下,数据存储的方式就显得尤为重要。通常企业数据存储包括三种方式:DAS、NAS和SAN。下面主要为读者详细介绍这三种数据存储方式以及如何根据企业自身的实际情况选择合适的数据存储方式。

在企业刚刚建立初期,用户的数据规模并不大,存储需求也很简单,只是要把相关数据存放在某一地方即可。而存放数据的最终目的不但是为了能够安全保存,还必须保证数据可以随时被调用。我们最早都是采用一种称之为“DAS(Direct Attached Storage,直接外挂存储)”存储方式的一种方案。这种存储方案的服务器结构如同PC机架构,外部数据存储设备(如磁盘阵列、光盘机、磁带机等)都直接挂接在服务器内部总线上,数据存储设备是整个服务器结构的一部分,同样服务器也担负着整个网络的数据存储职责。DAS这种直连方式,能够解决单台服务器的存储空间扩展、高性能传输需求,并且单台外置存储系统的容量,已经从不到1TB,发展到了2TB,随着大容量硬盘的推出,单台外置存储系统容量还会上升。

此外,DAS还可以构成基于上面介绍的磁盘阵列的双机高可用系统,满足数据存储对高可用的要求。从趋势上看,DAS仍然会作为一种存储模式,继续得到应用。DAS直连式存储依赖服务器主机操作系统进行数据的IO读写和存储维护管理,数据备份和恢复要求占用服务器主机资源(包括CPU、系统IO等),数据流需要回流主机再到服务器连接着的磁带机(库),数据备份通常占用服务器主机资源20-30%,因此许多企业用户的日常数据备份常常在深夜或业务系统不繁忙时进行,以免影响正常业务系统的运行。直连式存储的数据量越大,备份和恢复的时间就越长,对服务器硬件的依赖性和影响就越大。这种方案主要在早期的计算机和服务器上使用,由于当时对数据存储的需求并不大,单个服务器需要的存储能力就可以满足日常数据存储需求,因此在低档网络应用中相当普遍。小型企业由于资金问题,可以选择该款经济的存储方案。  

图6 DAS示意图

NAS(Network Attached Storage,网络附加存储)方式则全面改进了以前低效的DAS存储方式,它是采用独立于PC服务器,单独为网络数据存储而开发的一种文件服务器。NAS服务器中集中连接了所有的网络数据存储设备(如各种磁盘阵列、磁带、光盘机等),存储容量可以较好地扩展,同时由于这种网络存储方式是NAS服务器独立承担的,所以,对原来的网络服务器性能基本上没什么影响,以确保整个网络性能不受影响。它提供了一个简单、高性价比、高可用性、高扩展性和低总拥有成本(TCO)的网络存储解决方案。NAS作为一个网络附加存储设备,NAS设备内置优化的独立存储操作系统,可以有效、紧密地释放系统总线资源,全力支持I/O存储,同时NAS设备一般集成本地的备份软件,可以不经过服务器将NAS设备中的重要数据进行本地备份,而且NAS设备提供硬盘RAID、冗余的电源和风扇以及冗余的控制器,可以满足保证NAS的稳定应用。

NAS设备主要用来实现在不同操作系统平台下的文件共享应用,与传统的服务器或DAS存储设备相比,NAS设备的安装、调试、使用和管理非常简单,采用NAS可以节省一定的设备管理与维护费用。NAS设备提供 RJ-45接口和单独的IP地址,可以将其直接挂接在主干网的交换机或其它局域网的Hub上,通过简单的设置(如设置机器的IP地址等)就可以在网络即插即用地使用NAS设备,而且进行网络数据在线扩容时也无需停顿,从而保证数据流畅存储。NAS数据存储方案是基于局域网而设计的,按照传统的TCP/IP协议进行通信,面向消息传递,以文件的I/O方式进行数据传输。在LAN环境下,NAS已经完全可以实现异构平台之间的数据级共享,比如Windows NT、Linux、UNIX等平台的共享。基于这种种原因,NAS存储方案对于企业来说的使用和维护成本就相当低,完全可以由现有网管员担当。 

图7  NAS示意图

SAN(Storage Area Network,存储域网络)与NAS则是完全不同,它不是把所有的存储设备集中安装在一个专门的NAS服务器中,而是将这些存储设备单独通过光纤交换机连接起来,形成一个光纤通道的网络,然后这个网络再与企业现有局域网进行连接,在这种方案中,起着核心作用的当然就是光纤交换机了,它的支撑技术就是Fibre Channel(FC,光纤通道)协议,这是ANSI为网络和通道I/O接口建立的一个标准集成,支持HIPPI,IPI,SCSI,IP,ATM等多种高级协议。在SAN中,数据以集中的方式进行存储,加强了数据的可管理性,同时适应于多操作系统下的数据共享同一存储池,降低了总拥有成本。

由于SAN是通过一个单独的通常是基于光纤通道的SAN网络把存储设备以及服务器相连,如此当有海量数据的存取需求时,数据完全可以通过SAN网络在相关服务器和后台的存储设备之间高速传输,对于LAN的带宽占用几乎为零,而且服务器可以访问SAN上的任何一个存储设备,提高了数据的可用性。在对性能和可靠性要求较高的场合,采用先进的SAN数据存储网络,可以使数据的存储、备份等活动独立在原先的局域网之外,从而将减轻LAN的负载,保证原有网络应用的顺畅进行;同时SAN网采用光纤传输通道,可以得到高速的数据传输率。SAN方案简化了管理和集中控制,这对于全部存储设备都集中在信息中心,是非常有现实意义的。SAN将企业的存储和服务器平台分开,可以实现24 x 7小时不间断的系统可用性和集中管理,在这个平台的基础上,还可以应用一套统一的灾难恢复解决方案,同时可经济高效地扩展存储环境。因此SAN非常适用于非线性编辑、服务器集群、远程灾难恢复、因特网数据服务等多个领域。  

图8  SAN示意图

一个企业存储具有以下几方面的要求:性能、安全性、扩展性、易用性、整体拥有成本、服务等等。由于企业用户的存储系统构建并不是一蹴而就的事情,会经历从单机迈向网络化存储的过程,因此就存在DAS、NAS和SAN三种存储方案供企业用户进行不同的选择。比较而言,DAS直连存储的最大弊病在于,各部分的存储资源相互隔离,容易形成孤岛。NAS具有无人值守、高度职能、性能稳定、功能专一的特点,但NAS技术不能满足可靠度为99.999%的数据存储系统的要求。而SAN的最大优势则在于,可以把异构环境下不同厂商的存储设备整合在一起,实现资源的共享,因此SAN将成为企业存储应用的主流。一方面,为保证数据在不同硬件平台、不同操作系统下流转的畅通,存储架构的开放性、存储硬件的兼容性、存储软件的适应性归结在一起,就表现为存储的融合,SAN与NAS融合是大势所趋;另一方面,虚拟存储使主机操作系统看到的存储与实际物理存储分开,虚拟存储技术可提高存储设备利用率,通过动态地管理磁盘空间,虚拟存储技术可以避免磁盘空间被无效占用。目前虚拟技术已经引起了几乎所有存储系统厂商的关注,采用虚拟存储技术的设备将成为市场的新主流。  

 #p#

8、合理制定备份和恢复计划

对于企业来说,在明确了本文上述的技术之后,如何合理地运用上述技术做好企业的数据备份和恢复工作,就需要制定一个适合自身需求的数据备份和恢复计划。下面就给出一些合理制定企业备份和恢复计划的策略和方法。

一般说来,一个良好的数据备份和恢复计划应当要综合、充分地考虑如下几个要素:

(1)了解要备份和恢复企业的数据

既然是备份数据,首先当然就是要了解企业中有哪些数据需要备份,它们都在企业中的哪些设备当中。还要了解这些数据对企业业务中起什么样的作用。然后根据了解企业数据中的这些信息,就可以知道自己需要什么样的备份软件和备份方式(增量、完全和差异等),以及了解需要多大的存储设备来保存它们,以及需要什么样的方式来备份数据到本地或异地等位置,以及备份的等级和恢复等级等。

(2)确定备份的数据可以保留多久的时间,以及在不使用时如何安全地销毁

决定备份的数据可以保留多久的时间通常需要根据数据本身的重要程度,以及是否需要遵从当地数据保护法案。一些在国外上市的企业,需要同时遵从国内和国外制定的相关数据安全法案,而且,具体的行业,数据保护法案中规定的备份数据保存时间也是不尽相同的。因此,企业在决定备份数据的保留时间时,应当根据自身行业的数据保护法案要求,以及自身的数据备份存储条件和数据的重要程度来决定。当备份数据的存储期限达到规定的要求后,为了节省存储空间,有时就需要将这些过期的数据进行完全销毁。完全销毁的意思就是使这些过期的备份数据不能被各种方式再还原。备份销毁的方式可以对备份的数据进行完全填零处理,也可以将存储备份数据的媒介,例如磁带整个销毁。

(3)确定数据出现故障后应当恢复到什么时间点,以及恢复的速度有什么要求

决定数据应当恢复到什么时间点是决定数据备份策略的一个主要关键因素。因为只有确定了需要恢复到的时间点位置,才能决定进行数据备份的次数和时间点。如果需要将数据恢复到出现故障的前一个小时,那么就需要进行的相应备份方式,例如增量备份,每小时进行一次。同时,我们还必需对数据备份恢复的速度做一个明确的规定,以此来决定需要采取相应的备份存储媒介、存储方式和传输介质。通常,磁盘的存储和读取速度要比磁带快,光纤的传输速度要比铜介质要快。对于绝大部分中小企业来说,以最快的速度恢复数据是最基本的要求。因此,在选择存储媒介是最好选择磁盘,存储方式最好为SAN和NAS方式,传输介质最好的光纤,当然,如果考虑自身的经济条件,也可以选择7类双绞线作为以太网存储方式的传输介质。

(4)确定实施数据备份和恢复的具体负责人

实施数据的备份和恢复不可能没有具体的人去负责,只有在一开始就为此指定了相关的负责人,在进行数据备份和恢复时才有可能做到井然有序地进行,才能使用数据的备份按时按质完成,数据的恢复能及时高速高效地完成。确定数据备份和恢复的具体负责人还有两个好处就是明确具体的数据备份和恢复的培训对象,以及确定数据备份和恢复人承担的责任。

(5)要不间断地检验备份的有效性

数据备份完成后,并不能说明这些备份后的数据就一定能在需要时可以使用。因此,我们必需在数据和备份恢复计划当中明确规定一个具体的备份数据有效性检查时间表,以及明确备份数据有效性检验的方式。只有明确了备份数据的有效性,才能保证当系统或设备发生故障后,保存在其中的数据才能被有效地恢复。我们不能等到当需要备份数据之时,这些备份数据或备份媒介却不能工作。这样,数据备份将没有任何意义。

(6)确定如何防范备份操作过程中的异常的相应对策和策略

当我们实施完某种数据备份解决方案之后,在使用它进行相应的数据备份方案之时,并不能确定每次数据备份过程之中都会一帆风顺。在数据的备份过程中可能会出现备份设备或存储媒介出现机械故障,以及在备份过程中出现停电或其它自然灾害地情况,这些意外的情况就会造成备份任务的中断。因此,我们必需在制定数据备份和恢复计划之时就要充分考虑出现这些情况的机率,以及在出现这种情况时该项如何去应对。现在,一些功能强大的备份设备和软件,提供了一种备份功能,就是当备份任务意外中断后,当恢复备份任务时就直接从备份任务的中断地继续开始剩余的备份任务,我们在选择备份设备和软件时应该尽量选择这类产品。同时,我们还备份提供后备电源及其它的安全措施来保证备份任务的持续进行,以及安装备份任务监控软件来24小时监控备份任务的当前状况,一旦发现出现备份异常状况,就立即通过备份负责人或直接重新开始同一备份任务。

(7)确定数据的生命周期

任何数据都有其存在的生命周期,也就是数据的产生、使用、存储和销毁这完整的周期。由于企业的数据类型和重要性都不完全相同,因此,企业必需确定任何需要备份的数据的生命周期。确定数据的生命周期是为了确定备份存储媒介的容量,以及确定存储媒介的扩展计划。数据的生命周期越长,需要的存储媒介的容量就相对地增加。数据生命周期必需根据数据的重要程度和当地的数据保护法规来确定。

(8)合理、详细地区分每种数据的具体备份方式和备份的内容

每种数据的重要性不同,备份的方式也可以不相同。例如对于一般性重要的数据,我们只需要在某段时间之后重新建立一个完全备份即可,而对于非常重要的数据,不仅需要在一段较长的时间后建立完全备份,还必需在这段时间内进行多次的差异备份,以及每天或每小时建立增量备份。同样,我们还必需确定需要备份的数据的具体内容。备份的内容包括数据当前的位置改变、内容改变、硬链接和指令等,有时还应当备份文件的权限、属主和加密状态等。一些特殊数据还必需使用特殊备份软件来进行,例如一些数据只能由一些专用的备份软件才能备份。

(9)备份的存储方式选择

备份的存储包括备份数据的存储媒介和存储方式的选择。一些中小企业为了节省资金,通常选择磁带作为备份的存储媒介,但是磁带的备份速度和安全性比磁盘低,而且现在磁盘的在容量不断提高的同时,其价格却越来越底,企业现在完全可以使用磁盘来作为主要的数据备份的存储媒介。对于备份的存储方式,一些起步阶段的中小企业,由于数据量比较少,可以选择直接连接数据存储方式,也可以选择网络存储方式作异地备份。对于一些数据量较多的中小企业,可以使用NAS或SAN方式来备份数据。选择哪种备份存储方式完全根据企业自身数据保护的需求来决定的。

(10)备份的后期维护和安全审计跟踪

如果我们使用磁带来作为数据备份的媒介,由于磁带在备份完数据后都是离线保管的,那么,这就需要企业必需按时间或备份数据的名称对这些备份磁带进行妥善保管。而且,为了这些备份磁带上数据的安全,还备份使用数据加密来保护这些数据的机密性,以及将这些备份磁带保存到安全的位置,防止被盗和防止被水灾和火灾等自然灾害损坏它们。对于使用磁盘来进行数据备份,这样的后期维护工作量相对较少,但并不能说完全没有。我们也必需随时了解磁盘备份设备的安全状况和备份数据的有效性。同时,对于备份的使用还要建立一个安全审计策略,以监控这些备份是何时、何人建立的,又是何人、何时保管的,以及是何人同意,何人、何时使用的。良好的备份建立和使用安全审计跟踪能保护备份数据的最大安全。

9、总结

如何有效地进行数据的备份和恢复是企业网络和数据管理员面临的首要问题,“数据就是金钱”用来形容当前企业数据的重要性丝毫不为过。本文主要向用户们介绍了几种保障企业数据安全存储、能够为将来的数据恢复打下良好基础的存储技术以及恢复手段和工具。希望广大用户在各自的工作岗位上,对这些知识灵活运用,根据自己企业的实际特点选择好数据备份和存储软硬件,从而能够较好地应对各种突发事件和数据灾难,成功地进行数据恢复。另外,本文中针对磁盘阵列和存储设备等的具体数据恢复方法没有进行过多的细致论述,只是提出了一些大的方向性策略供参考,相关知识还希望大家在实践过程中通过查阅一些工具书来进行补充和提高。

【51CTO.COM 独家特稿,转载请注明出处及作者!】

【编辑推荐】

  1. 备份重要性数据灾难恢复五大问题
  2. 数据备份安全战略:云安全、加密与数据销毁
责任编辑:许凤丽 来源: 51CTO.com
相关推荐

2013-11-08 09:31:21

数据备份企业安全

2016-05-20 15:21:05

IBMSpectrum Pr

2023-08-03 07:39:10

MongoDB数据备份

2011-04-11 14:56:04

2013-07-02 18:40:55

云通讯电话营销API

2024-04-18 09:20:43

PostgreSQL关系型数据库数据库管理系统

2009-08-04 16:36:21

智慧IBM动态

2010-01-19 09:44:55

戴尔高效企业

2023-12-07 12:38:09

架构低成本开发

2013-05-23 09:24:03

BYODBYOD策略思科BYOD

2021-12-21 23:21:16

DDOS防御安全

2018-05-21 21:29:15

云计算成本互联网

2017-07-28 14:27:36

存储

2010-05-13 23:28:05

部署统一通信

2012-09-03 16:58:45

微软谷歌云计算

2020-03-24 10:15:23

公共云云迁移云计算

2015-10-21 14:07:17

Oracle备份Oracle恢复

2009-03-19 10:00:06

2022-11-22 08:00:34

IT企业降低成本

2018-04-17 08:24:58

点赞
收藏

51CTO技术栈公众号