首页 理论教育 数据备份和恢复

数据备份和恢复

时间:2022-05-09 理论教育 版权反馈
【摘要】:传统的数据备份主要是采用内置或外置的磁带机进行冷备份。基于DAS的备份系统优点是数据传输速度快,备份管理简单;缺点是不利于备份系统的共享,不适合现在大型的数据备份要求。LAN-Free和Server-Free的备份系统是建立在SAN基础上的2种具有代表性的解决方案。LAN-Free优点是数据备份统一管理、备份速度快、网络传输压力小、磁带库资源共享;缺点是少量文件恢复操作烦琐,并且技术实施复杂,投资较高。

三、数据备份和恢复

数据备份是容灾的基础,是指为防止系统出现操作失误或系统故障导致数据丢失,而将全部或部分数据集合从应用主机的硬盘或阵列复制到其他的存储介质的过程。传统的数据备份主要是采用内置或外置的磁带机进行冷备份。但是这种方式只能防止操作失误等人为故障,而且其恢复时间也很长。随着技术的不断发展,数据的海量增加,不少医院开始采用网络备份。网络备份一般通过专业的数据存储管理软件结合相应的硬件和存储设备来实现。

1.数据存储类型

数据存储类型分为封闭系统的存储和开放系统的存储,封闭系统主要指大型机,开放系统指基于包括Windows、Linux、Mac OS等操作系统的工作站。开放系统的存储分为内置存储和外挂存储。开放系统的外挂存储根据连接的方式分为直连式存储(DAS)和网络化存储(FAS),其中网络化存储根据传输协议又分为网络接入存储(NAS)和存储区域网络(SAN)。

(1)DAS这种存储方式与我们普通的PC存储架构一样,外部存储设备都是直接挂接在服务器内部总线上,数据存储设备是整个服务器结构的一部分。适用于网络规模较小,数据存储量小和特殊应用的环境。

(2)NAS方式则全面改进了以前低效的DAS存储方式。它采用独立于服务器,单独为网络数据存储而开发的一种文件服务器来连接所存储设备,自形成一个网络。这样数据存储就不再是服务器的附属,而是作为独立网络结点而存在于网络之中,可由所有的网络用户共享。NAS不依赖通用的操作系统,而是采用一个面向用户设计的,专门用于数据存储的简化操作系统,内置了与网络连接所需要的协议,因此使整个系统的管理和设置较为简单,管理容易且成本低。其缺点是存储性能较低,可靠度不高。

(3)SAN是一种通过光纤集线器、光纤路由器、光纤交换机等连接设备,将磁盘阵列、磁带等存储设备与相关服务器连接起来的高速专用子网。一方面可以实现大容量存储设备数据共享,另一方面也可以实现高速计算机与高速存储设备的互连,从而提高数据的可靠性和安全性。SAN采用光纤通道技术,通过光纤通道交换机连接存储阵列和服务器、工作站、主机,建立专用于数据存储的区域网络。SAN经过十多年历史的发展,已经相当成熟,存储采用的带宽从1Gbit/s发展到目前最新的10Gbit/s。

(4)SAN是独立于服务器网络系统之外,几乎拥有无限存储能力的高速存储网络。这种网络采用高速的光纤通道作为传输媒体,以光通道应用协议作为存储访问协议,将存储子系统网络化,实现了真正高速共享存储的目标。SAN可以分为FC SAN、IP SAN和IB SAN。

(5)NAS和SAN最本质的不同就是文件管理系统在哪里,在SAN结构中,文件管理系统还是分别在每一个应用工作站上;而NAS则是每个应用工作站通过网络共享协议(如NFS、CIFS)使用同一个文件管理系统。

从实际应用角度分析,随业务数据的增加,对于设备的容量、速度、可靠性、性价比的要求越来越高。因此,采用以存储局域网(SAN)架构为主体技术进行系统集成是一个比较合理的选择。

2.常见的数据备份结构

Host-Base、DAS-Base、LAN-Base和基于SAN机构的LAN-Free、Server-Free等多种结构。

(1)Host-Base是传统的数据备份结构,用磁带库直接接在服务器上,而且只为该服务器提供数据备份服务。通常采用服务器上自带的磁带机,备份操作通常是通过手工操作的方式进行。

(2)DAS-Base是基于网络附加存储系统的备份系统,是最简单的一种数据保护方案。在大多数情况下,这种备份是采用服务器上自带的磁带机或备份硬盘,而备份操作往往也是通过手工操作的方式进行的。基于DAS的备份系统优点是数据传输速度快,备份管理简单;缺点是不利于备份系统的共享,不适合现在大型的数据备份要求。

(3)LAN-Base中数据的传输是以局域网络为基础的,首先预先配置一台服务器作为备份管理服务器,负责整个系统的备份操作。磁带库则接在某台服务器上,当需要数据备份时,备份对象把数据通过网络传输到磁带库中实现备份。备份服务器可以直接接入主局域网内或放在专用的备份局域网内。优点是投资经济、磁带库共享、集中备份管理;缺点是对网络传输压力大。

(4)LAN-Free和Server-Free的备份系统是建立在SAN基础上的2种具有代表性的解决方案。它们采用一种全新的体系结构,将磁带库和磁盘阵列作为独立的光纤结点,多台主机共享磁带库备份时,数据流不再经过网络而直接从磁盘阵列传到磁带库内,是一种无须占用网络带宽的解决方案。

所谓LAN-Free,是指数据无须通过局域网而直接进行备份,即用户只需将磁带机或磁带库等备份设备连接到SAN中,各服务器就可把需要备份的数据直接发送到共享的备份设备上,不必再经过局域网链路。由于服务器到共享存储设备的大量数据传输是通过SAN网络进行的,局域网只承担各服务器之间的通信任务,而无须承担数据传输的任务,从而实现了控制流和数据流分离的目的。LAN-Free优点是数据备份统一管理、备份速度快、网络传输压力小、磁带库资源共享;缺点是少量文件恢复操作烦琐,并且技术实施复杂,投资较高。

Server-Free采用无服务器(Serverless)备份技术,是LAN-Free的一种延伸,是以全面地释放网络和服务器资源为目的的。它的核心是在SAN的交换层实现数据的备份工作,这样备份数据不仅无须经过网络,而且也不经过应用服务器总线,完全保证了网络和应用服务器的高效运行。目前虽有相关产品和解决方案,但比较成熟且开放性好的产品还在进一步发展中。Server-Free的优点是数据备份和恢复时间短,网络传输压力小,便于统一管理和备份资源共享;其缺点是需要特定的备份应用软件进行管理,厂商的类型兼容性问题需要统一,并且实施起来与LAN-Free一样比较复杂,成本也较高。

目前主流的备份软件,如IBM Tivoli、Veritas等,均支持上述备份方案。LAN备份数据量小,对服务器资源占用多,成本低;LAN-Free备份数据量大一些,对服务器资源占用小一些,成本高一些;Serve-Freer方案能够在短时间内备份大量数据,对服务器资源占用最少,但成本最高。

3.常用数据备份模式

(1)定时磁带备份数据。通过磁带机或服务器硬盘定时备份,出现故障时停机处理。修复故障后,从磁带机或硬盘中恢复数据。数据备份通常是在非工作时间进行(如晚上以及周末),仅仅需要很少的人力,因此数据备份经常强调使用过程中的自动化。它通常包括跟踪备份时刻表、定时管理转移数据卷到指定的磁盘或者磁带上、处理压缩和防数据重复功能以减少介质的利用并加速备份过程,甚至包括加密功能来确保备份数据不受损失或防止偷盗。由此,在使用定时磁带备份数据模式时,要多考虑到备份介质的储存空间和定时设置等情况。定时磁带备份数据,只需一台磁带机或一块服务器硬盘,所需投资最少;故障发生后再修复服务器和恢复数据,所需恢复时间最长,恢复的数据未经检验,不能保证可用。

(2)定时双机备份。此种方法须使用两台服务器,一台为主服务器,采用高档机,机内配有RIAD磁盘阵列;另一台为备用服务器,采用低档机,不需配RIAD磁盘阵列,只需能运行HIS服务器端软件。两机通过局域网相连,每天在业务量小的时候将数据导出,并在低档的备用服务器上恢复。在主服务器出现故障时,由备用服务器接替工作。总体所需投资不大;每天恢复并检验数据,可确保恢复的数据是最近的且可用,万一备份数据有问题,通过相关记录文件能及时发现。恢复系统运行所需时间较短。并在备用服务器工作期间,有较充裕的时间维修主服务器;正常运行中使用高档服务器,系统效率高。主服务器维修期间,备用服务器可维持系统的运行,但系统效率不高;在备份点后采集的数据没有被备份,备份服务器不能恢复这部分数据,备用服务器接替工作后,需重新采集这些数据。此方案投资较少,但只适合业务数据量较小的医院,否则无法实现快速的数据备份和恢复。

(3)Active/Active实时双服务器互备份。此法使用两台相同的服务器,双机同时运行。数据库和应用程序在正常状态下分别在两台服务器上运行,各自有自己的资源,如IP地址、磁盘阵列上的卷或者文件系统,但彼此均设为备机。当某一方的系统或者资源出现故障时,就会将应用和相关资源切换到对方上,从而保证了应用的持续性。两台服务器上的数据通过互备份保持一致,服务器之间的转换非常快。两台服务器工作要求相同,需使用相同的机器,为使系统整体达到较高性能,一般选择较高档服务器,并需要加装支持两机同步的硬件和软件,导致成本增加。这种模式的最大优点是不会有服务器的“闲置”,两台服务器在正常情况下都在工作。但如果有故障发生导致切换,应用和数据库将放在同一台服务器上运行,由于服务器的处理能力有可能不能同时满足数据库和应用程序的峰值要求,这将会出现处理能力不够的情况,降低业务响应水平。

(4)Active/Standby实时双服务器备份一般情况下需要有共享的存储设备。在同一时间内只有一台服务器运行,另一台服务器不工作,数据存于独立数据存储器中。当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会通过软件诊测(一般是通过心跳诊断)将Standby机器激活,保证应用在短时间内完全恢复正常使用。Standby服务器在Active服务器正常工作时是处于“闲置”状态,造成服务器资源的浪费。

四种备份模式各有优劣,最重要的是选择最适合于自己的系统环境和系统要求的备份模式,可综合应用上述各种模式,争取做到数据遭受破坏时能及时地恢复数据。

4.数据备份方式

(1)全备份,备份系统中所有的数据。其优点是恢复时间最短,操作最方便,也最可靠;缺点是备份数据量大,数据多时可能做一次全备份需很长时间。全备份也可以称为完全备份。

(2)增量备份,备份上一次备份以后更新的所有数据。其优点是每次备份的数据量少,占用空间少,备份时间短;缺点是恢复时需要全备份及多份增量备份。

(3)差分备份,备份上一次全备份以后更新的所有数据。其优缺点介于全备份和增量备份两者之间。

(4)按需备份,根据临时需要有选择地进行备份。

5.数据备份策略

(1)数据备份策略是指确定需要备份的内容、备份时间以及备份方式。

(2)选择合适的备份频率(如经常备份、有规律备份、及时备份等)。尽量采用定时器、批处理等由计算机自动完成的方式,以减少备份过程中的手工干预,防止操作人员的漏操作或误操作。

(3)根据数据的重要性可选择一种或几种备份交叉的形式制定备份策略。

若数据量比较小或者数据实时性不强或者是只读的,备份的介质可采用磁盘或光盘。在备份策略上可执行每天一次数据库增量备份,每周进行一次完全备份。备份时间尽量选择在晚上等服务器比较空闲的时间段进行,备份数据要妥善保管。

(4)就一般策略来说,当对数据的实时性要求较强,或数据的变化较多且数据需要长期保存时,备份介质可采用磁带或磁盘。在备份策略上可选择每天两次,甚至每小时一次的数据热完全备份或事务日志备份。为了把灾难损失减少到最低,备份数据应保存一个月以上。另外每当存储数据的数据库结构发生变化,或进行批量数据处理前应做一次数据库的完全备份,且这个备份数据要长期保存。数据备份也可以考虑光盘备份。

(5)当实现数据库文件或者文件组备份策略时,应时常备份事务日志。当巨大的数据库分布在多个文件上时,必须采用这种策略。

(6)备份数据的保管和编册记录是防止数据丢失的另一个重要方法。为了避免数据备份进度的混乱,应清楚记录所有步骤,并为实施备份的所有备份人员提供此类信息,以免发生问题时因忙乱找不到应使用的备份数据。数据备份与关键应用服务器最好是分散保管在不同的地方,通过网络进行数据备份。定时清洁及维护磁带机或光盘。把磁带和光盘放在合适的地方,避免将磁带和光盘放置在过热和潮湿的环境中。备份的磁带和光盘最好只允许管理员访问。要完整、清晰地做好备份磁带和光盘的标签。

(7)对需要备份的数据,可以采用完全备份、增量备份、差分备份或按需备份这四种方式中的一种或者几种的组合。

6.数据备份过程中的注意事项

(1)备份不仅包括对数据的复制,也包括备份管理。管理包括备份的可计划性、磁带机等的自动化操作、历史记录的保存以及日志记录等。若只备份应用系统中的特定业务数据而对应用软件和一些重要的数据文件缺乏必要的记录,就会造成备份内容不完整。

(2)硬件备份不能从根本上保证数据安全。理由是硬件备份的最主要目的是保证系统的连续运行,对人为错误导致的数据丢失无能为力,无法有效地防止病毒入侵,对电源故障、天灾人祸等意外事件也无能为力。

(3)数据备份的目的是数据恢复。通常与数据恢复有关的关键测度是时间,原因是当系统不能使用时,数据恢复的快与慢对业务有直接的影响。停机时间越长,造成影响就越大,因此需要考虑恢复时间目标(RTO)和恢复点目标(RPO)。RTO主要指的是所能容忍的业务停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。RPO主要指的是业务系统所能容忍的数据丢失量。根据使用的恢复技术或方法,对恢复时间、恢复点和费用采取合理的折中方案。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈