首页 百科知识 数据备份的概念

数据备份的概念

时间:2022-10-24 百科知识 版权反馈
【摘要】:取回原先备份的文件的过程称为恢复数据。数据备份和数据压缩从信息论的观点上来看是完全相反的两个概念。数据压缩通过减少数据的冗余度来减少数据在存储介质上所占用的存储空间,而数据备份则通过增加数据的冗余度来达到保护数据安全的目的。虽然数据备份和数据压缩在信息论的观点上互不相同,但在实际应用中却常常将它们结合起来使用。在现代计算机常用的备份工具中,绝大多数都结合了数据压缩和数据备份技术。

7.1 数据备份的概念

数据备份是把文件或数据库从原来存储的地方复制到其他地方的活动,其目的是为了在设备发生故障或发生其他威胁数据安全的灾害时保护数据,将数据遭受破坏的程度减到最小。数据备份通常是那些拥有大型机的大部门的日常事务之一,也是中小型部门系统管理员每天必做的工作之一。对于个人计算机用户,数据备份也是非常必要的,只不过通常都被人们忽略了。

取回原先备份的文件的过程称为恢复数据。数据备份和数据压缩从信息论的观点上来看是完全相反的两个概念。数据压缩通过减少数据的冗余度来减少数据在存储介质上所占用的存储空间,而数据备份则通过增加数据的冗余度来达到保护数据安全的目的。

虽然数据备份和数据压缩在信息论的观点上互不相同,但在实际应用中却常常将它们结合起来使用。通常将所要备份的数据先进行压缩处理,然后将压缩后的数据用备份手段进行保护。当原先的数据失效或受损需要恢复数据时,先将备份数据用备份手段相对应的恢复方法进行恢复,然后再将恢复后的数据解压缩。在现代计算机常用的备份工具中,绝大多数都结合了数据压缩和数据备份技术。

传统的观点认为,备份只是一种手段,备份的目的是为了防止数据灾难,缩短停机时间,保证数据安全,服务器硬件升级。备份的最终目的应是能够实现无损恢复。很多系统管理人员对备份的认识有一定的误区。误区之一是用拷贝来代替备份。实际上,备份等于拷贝加管理,备份能实现可计划性以及自动化,以及历史记录的保存和日志记录。在海量数据情况下,如果不对数据进行管理,则会陷入数据汪洋之中。误区之二是用双机、磁盘阵列、镜像等系统冗余替代数据备份。需要指出的是,系统冗余保证了业务的连续性和系统的高可用性,系统冗余不能替代数据备份,因为它避免不了人为破坏、恶意攻击、病毒、天灾人祸,只有备份才能保证数据的万无一失。误区之三是只备份数据文件。在这样的条件下,一旦系统崩溃,那么,恢复时就要重新安装操作系统、重新安装所有的应用程序,需要相当长的时间才能恢复所有的数据,而这是客户不能忍受的。因此,正确的方法是对数据系统进行备份。

总而言之,备份除了拷贝以外,应包括管理,而备份管理包括备份的可计划性、备份设备的自动化操作、历史记录的保存以及日志记录等。不少人也把双机热备份、磁盘阵列备份以及磁盘镜像备份等硬件备份的内容和数据备份相提并论。事实上,所有的硬件备份都不能代替数据存储备份,硬件备份只是拿一个系统或者一个设备作为牺牲来换取另一台系统或设备在短时间之内的安全。若发生人为的错误、自然灾害、电源故障、病毒侵袭等,引起的后果就不堪设想,如造成所有系统瘫痪、所有设备无法运行,由此引起的数据丢失就无法恢复了。

目前,备份的趋势是无人值守的自动化备份、可管理性、灾难性恢复,这三点正是与系统的高效率、数据与业务的高可用性所必需的。

1.数据备份的重要性

计算机中的数据通常是非常宝贵的。一个存储容量为80MB的硬盘可以存放大约28000页用键盘键入的文本。这些文本数据都丢失了将意味着什么呢?按每页大约350个单词计算,这将花费一个打字速度很快的打字员(每分钟键入75个单词)2174个小时来重新键入这些文本。

计算机中的数据是非常脆弱的,在计算机上存放重要数据如同大象在薄冰上行走一样不安全。计算机中的数据每天经受着许许多多不利因素的考验。电脑病毒可能会感染计算机中的文件,并吞噬掉文件中的数据。你安放计算机的机房,可能因不正确使用电而发生火灾,也有可能因水龙头漏水导致一片汪洋。你还可能会遭到恶意电脑黑客的入侵,在你的计算机上执行format命令。你的计算机中的硬盘由于是半导体器件还可能被磁化而不能正常使用。还有可能由于被不太熟悉电脑的人误操作或者你自己不小心的误操作丢失重要数据。所有这些都会导致你的数据损坏甚至完全丢失。你所管理的计算机中可能有一些私人信件、重要的金融信息、你跟朋友交往的通信录、正在工作的文档、辛辛苦苦编写的程序等。显然,这些数据中的任何一个丢失都会让你头痛不已。重新整理这些数据的代价是非常高的,有的时候甚至是不可能完成的任务。在你后悔当初没有备份数据的时候,下一次一定记得将重要的数据备份一下。

数据备份能够用一种增加数据存储代价的方法保护数据的安全。数据备份对于一些拥有重要数据的大公司来说尤为重要。很难想象银行里的计算机中存放的数据在没有备份的情况下丢失将造成什么样的混乱局面。数据备份对于个人计算机用户来说也是必不可少的,当一封经你辛辛苦苦构思的电子邮件,眼看就要发送出去时,计算机突然死机了,你会不会感到非常沮丧呢?

数据备份能在较短的时间内用很小的代价,将有价值的数据存放到与初始创建的存储位置相异的地方,在数据被破坏时,再在较短的时间和非常小的花费下将数据全部恢复或部分恢复。

2.优秀备份系统应满足的原则

不同的应用环境要求不同的解决方案来适应。一般来说,一个完善的备份系统,需要满足以下原则。

(1)稳定性

备份产品的主要作用是为系统提供一个数据保护的方法,于是备份产品本身的稳定性和可靠性就成为最重要的一个方面。首先,备份软件一定要与操作系统100%兼容,其次,当事故发生时,能够快速有效地恢复数据。

(2)全面性

在复杂的计算机网络环境中,可能会包括各种操作平台(如各种厂家的UNIX、NetWare、WindowsNT、VMS等),并安装了各种应用系统(如ERP、数据库、集群系统等)。选用的备份系统,要支持各种操作系统、数据库和典型应用。

(3)自动化

很多单位由于工作性质,对何时备份、用多长时间备份都有一定的限制。在下班时间系统负荷轻,适于备份。可是这会增加系统管理员的负担,也可能会给备份安全带来潜在的隐患。因此,备份方案应能提供定时的自动备份,并利用磁带库等技术进行自动换带。在自动备份过程中,还要有日志记录功能,并在出现异常情况时自动报警。

(4)高性能

随着业务的不断发展,数据越来越多,更新越来越快。在休息时间来不及备份如此多的内容,在工作时间备份又会影响系统性能。这就要求在设计备份时,尽量考虑到提高数据备份的速度,利用多个磁带机并行操作的方法。

(5)操作简单

数据备份应用于不同领域,进行数据备份的操作人员也处于不同的层次。这就需要一个直观的、操作简单的图形化用户界面,缩短操作人员的学习时间,减轻操作人员的工作压力,使备份工作得以轻松地设置和完成。

(6)实时性

有些关键性的任务是要24小时不停机运行的,在备份的时候,有一些文件可能仍然处于打开的状态。那么在进行备份的时候,要采取措施实时地查看文件大小、进行事务跟踪,以保证正确地备份系统中的所有文件。

(7)容错性

数据是备份在磁带上的,对磁带进行保护,并确认备份磁带中数据的可靠性,也是一个至关重要的方面。

3.数据备份的种类

数据备份按照备份时所备份数据的特点可以分为三种:完全备份、增量备份和系统备份。

(1)完全备份(Full Backup)

将系统中所有的数据信息全部备份。其优点是数据备份完整,缺点是备份系统的时间长,备份量大。

(2)增量备份(Incremental Backup)

只备份上次备份以后变化过的数据信息。增量备份是进行备份最有效的办法,通常与完全备份一起使用以提供快速备份。例如,许多单位在从星期五开始的周末运行完全备份,然后在下个星期一到星期四运行增量备份。其优点是数据备份量少、时间短,缺点是恢复系统时间长。

(3)差分备份(Differential Backup)

只备份上次完全备份以后变化过的数据信息。差分备份需在完全备份之后的每一天都备份上次完全备份以后变化过的所有数据信息,因此,在下一次完全备份之前,日常备份工作所需的时间会更多。其优点是备份数据量适中,恢复系统时间短。

各种备份的数据量不同,按从多到少的排序为完全备份>差分备份>增量备份。在恢复数据时需要的备份介质数量也不同。如果使用完全备份方式,只需上次的完全备份磁带就可以恢复所有数据;如果使用完全备份+增量备份方式,则需要上次的完全备份磁带加上次完全备份后的所有增量备份磁带才能恢复所有数据;如果使用完全备份+差分备份方式,只需上次的完全备份磁带+最近的差分备份磁带就可以恢复所有数据。在备份时要根据它们的特点灵活使用。

4.备份的类型

目前,有三种常用的备份类型:冷备份、热备份和逻辑备份。

(1)冷备份

在没有最终用户访问的情况下关闭数据库,并将其备份。这是保持数据完整性的最好办法,但如果数据库太大,无法在备份窗口中完成对它的备份,该方法就不适用了。

(2)热备份

正在写入的数据更新时进行备份。热备份严重依赖日志文件。在进行备份时,日志文件将业务指令“堆起来”,而不是真正将任何数据值写入数据库记录。当这些业务被堆起来时,数据库表并没有被更新,因此数据库被完整地备份。该方法有一些明显的缺点。首先,如果系统在进行备份时崩溃,则堆在日志文件中的所有业务都会被丢失,因此也会造成数据的丢失。其次,它要求DBA仔细地监视系统资源,这样日志文件就不会占满所有的存储空间而不得不停止接受业务。最后,日志文件本身在某种程度上也需要被备份以便重建数据。需要考虑另外的文件并使其与数据库文件协调起来,为备份增加了复杂度。由于数据库的大小和系统可用性的需求,没有对其进行备份的其他办法。在有些情况下,如果日志文件能决定上次备份操作后哪些业务更改了哪些记录的话,那么对数据库进行增量备份是可行的。

(3)逻辑备份

使用软件技术从数据库提取数据并将结果写入一个输出文件。该输出文件不是一个数据库表,但是表中的所有数据是一个映像。不能对此输出文件进行任何真正的数据库操作。在大多数客户机/服务器数据库中,结构化查询语言(Structured Query Language,SQL)就是用来创建输出文件的。该过程有些慢,不适合用于对大型数据库的全盘备份。尽管如此,当仅想备份那些上次备份之后改变了的数据,即增量备份时,该方法非常好。为了从输出文件恢复数据,必须生成逆SQL语句。该过程也相当耗时,但工作的效果相当好。用户可以通过远程磁带库、光盘库、数据库、网络数据镜像、远程镜像磁盘等技术方法将数据定期或不定期的备份。

5.数据备份计划

对于重要数据来说,有一个清楚的数据备份计划非常重要,它能清楚地显示数据备份过程中所做的每一步重要工作。

(1)确定数据将受到的安全威胁

完整考察整个系统所处的物理环境、软件环境,分析可能出现的破坏数据的因素。

(2)确定敏感数据

对系统中的数据进行挑选分类,按重要性和潜在的遭受破坏的可能性划分等级。

(3)对将要进行备份的数据进行评估

确定初始时采用不同的备份方式(完整备份、增量备份和系统备份)备份数据占据存储介质的容量大小,以及随着系统的运行备份数据的增长情况,以此确定将要采取的备份方式。

(4)确定备份所采取的方式及工具

根据第(3)步的评估结果、数据备份的财政预算和数据的重要性,选择一种备份方式和备份工具。

(5)配备相应的硬件设备

配备相应的硬件设备,实施备份工作。

6.备份介质

数据库备份系统使用较多的存储备份介质有磁带、MO(Magneto Optical Disk,磁光盘驱动器)、硬盘、CD-ROM和WORM等。目前被广泛采用的备份介质还是磁带。

(1)磁盘备份介质

它主要包括两种存储技术,即内部的磁盘机制(硬盘)和外部系统(磁盘阵列等)。在速度方面硬盘无疑是存取速度最快的,因此它是备份实时存储和快速读取数据最理想的介质。但是,由于硬盘价格昂贵、无法移动、不便于保管,因此采用内部的磁盘机制作为备份的介质并不是大容量数据备份的最佳选择。

(2)光学备份介质

主要包括CD-ROM、WORM和磁光盘驱动器(MO)等。其中,MO是传统磁盘技术与光技术结合的产物,采用ECMA(欧洲计算机制造协会)标准,具有传送速度快、可靠性高、使用寿命长、可重复使用等特点。光学存储设备具有可持久存储和便于携带数据等特点。与硬盘备份相比,光盘提供了比较经济的存储解决方案,但是它们的访问时间比硬盘要长2~6倍(访问速度受光头重量的影响),容量相对较小。所以,光学介质的存储更适合于数据的永久性归档和小容量数据的备份。在数据库系统日益复杂、数据量日益增大的情况下,磁带是最理想的备份介质。

(3)磁带备份介质

磁带备份介质不仅能提供高容量、高可靠性、易使用以及可管理性,而且价格也便宜很多,并允许备份系统按用户数据的增长而随时扩容。虽然读取速度没有光盘和硬盘快,但它可以在相对较短的时间内(典型的情况是在夜间自动备份)备份大容量的数据,并可十分简单地对原有系统进行恢复。因此,它是真正适合数据库备份领域的最佳选择。作为一种备份设备,磁带机技术也在不断发展。当前市场上的磁带机,按其记录方式来分,可归纳为二大类:一类是数据流磁带机,另一类是螺旋扫描磁带机。数据流技术起源于模拟音频记录技术,类似于录音机磁带的原理。螺旋扫描技术起源于模拟视频记录技术,类似于录像机磁带原理。与数据流技术正好相反,磁带是绕在磁鼓上,磁带非常缓慢地移动,磁鼓则高速转动,在磁鼓两侧的磁头也高速扫描磁带进行记录。当它在一定时间内没有收到移动磁带的命令,就会放松磁带并停止转动磁鼓,以防止不必要的介质磨损和避免介质长期处于张力状态。所以,该技术具有高可靠性、高速度、高容量的特点。目前流行于IT市场的主要有4mm磁带机、8mm磁带机、DLT磁带机、DAT磁带机及LTO磁带机等几种。

①DLT技术

DLT(Digital Linear Tape,数字线性磁带)技术由DEC和Quantum公司联合开发。由于磁带体积庞大,DLT磁带机全部是5.25英寸全高格式。DLT产品由于高容量,主要定位于中、高级的服务器市场与磁带库系统。DLT磁带每盒容量高达35GB,单位容量成本较低。

②4mm技术

4mm又称数字音频磁带(Digital Audio Tape)技术,经历了DDS-1、DDS-2和DDS-3三种技术阶段,容量跨度在1~12GB。

③8mm技术

基于螺旋扫描记录技术的8mm产品由Exabyte公司开发,适合于大容量存储。

④DAT(Digital Audio Tape)技术

DAT技术又可以称为数字音频磁带技术,最初是由惠普公司(HP)与索尼公司(SONY)共同开发出来的。这种技术以螺旋扫描记录为基础,将数据转化为数字后再存储下来,具有很高的性能价格比,所以一直被广泛应用。现以惠普DAT技术为例说明其特点。首先,在性能方面,这种技术生产出的磁带机平均无故障工作时间长达20万~30万小时;在可靠性方面,它所具有的即写即读功能能在数据被写入之后马上进行检测,这不仅确保了数据的可靠性,而且还节省了大量时间。第二,这种技术的磁带机种类繁多,能够满足绝大部分网络系统备份的需要。第三,这种技术所具有的硬件数据压缩功能可大大加快备份速度,而且压缩后的数据安全性更高。第四,由于这种技术在全世界都被广泛应用,所以在全世界都可以得到这种技术产品的持续供货和良好的售后服务。第五,DAT技术产品的价格格外诱人,其价格优势不仅体现在磁带机上,在磁带上也得到充分体现。

⑤LTO技术

LTO(Linear Tape Open,线性磁带开放协议)技术是一种结合了线性多通道双向磁带格式的磁带存储新技术,其优点主要是将服务系统、硬件数据压缩、优化磁道面、高效纠错技术和提高磁带容量性能等结合于一体。LTO第四代标准的容量为800GB,传输速度为80~160Mbps。开发LTO的主要原因有以下几点:一是建立一个开放的磁带机产品标准;二是不断改进磁带机产品的可靠性;三是增强产品的可扩展性,适应数据量激增的现实需求;四是减少备份的时间,提高产品的性能。

目前,LTO技术有两种存储格式,即高速开放磁带格式Ultrium和快速访问开放磁带格式Accelis,可分别满足不同用户对LTO存储系统的要求,其中Ultrium磁带格式除了具有高可靠性的LTO技术外,还具有大容量的特点,既可单独操作,也可适应自动操作环境,非常适合备份、存储和归档应用。Accelis磁带格式则侧重于快速数据存储,此格式能够很好地适用于自动操作环境,可处理广泛的在线数据和恢复应用。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈