1、 引言
>如今的数据中心越来越复杂,不仅系统规模每年翻番,系统的复杂性及面临的风险也与日俱增,另一面,业务部门对业务连续运行的要求却是不断提高的,甚至越来越多的系统要求“零数据丢失”。拿中国移动江苏公司的核心业务支撑系统来看,包括BOSS系统、经营分析系统、客服系统、企业信息化系统等子系统,总计近400台服务器(TPCC值超过10000万),近100台高、中、低端存储设备,超过1000TB的重要业务数据,分布于南京和无锡的5个数据中心。为了提高数据的安全性,作为数据保护的最后一道防线-备份的重要性就不言而喻了。但是根据国际知名调研机构对世界五百强大企业的技术主管的回访记录和巡检记录来看,大部分企业用户的平均备份成功率在75%左右。事实上,我们还注意到很多时候的备份成功率小于50%,恢复率就更低。一方面我们面临的实际情况是每天需要备份的数据量在增长,中国移动江苏公司业务支撑系统每年需要备份数据的增长量在50%~75%之间,但备份系统的预算的增长却远远小于这个速度。
>传统的备份系统都是和项目一起采购,造成数据中心多个独立的备份系统,备份的效率差和备份资源的浪费很严重,备份系统架构及其不合理,管理也极其复杂。
>相同的问题也给IT行业的发展带来挑战。因此“虚拟化”、“云备份”、“标准化”和“备份资源整合”等成为目前业界最为热门的技术话题,同样也代表着未来技术发展的方向。近几年来,在业界也涌现出几家在这个领域运营不错的云备份服务的厂商-如赛门铁克的Norton Online Backup, EMC 的Mozy.……作为IT技术、IT系统大量应用的中国移动江苏公司该如何解决自己发展中遇到的问题,如何整合行业先进经验、新技术、解决方案,如何规划IT系统架构科学发展,我们在上述领域做出了一些自己的实践。
>2、 系统建设背景
>中国移动江苏公司拥有一套完整的企业备份产品,在架构设计上基于原来的经验进行了创新,并结合一些云技术的设计理念,为业务支撑系统的数据保驾护航。
>• 虚拟化-以整个数据中心为视角的备份资源部署,而不是基于应用和设备的备份资源管理;
>• SOA-建立跨越整个备份资源的统一兼容的面向业务需求的备份服务,而不是绑定特定的应用或设备的备份软硬件设备;
>• 自动化-以整个数据中心为视角的基于策略的图形化备份资源管理,实现备份任务的灵活调度、实时监控和报告,而不仅仅是僵化的为备份而备份
>[img]http://imgs.ccw.com.cn/resources/2009_12/2009_12_08/200912081451260259503782.jpg[/img]
>图1:中国移动江苏公司业务支撑系统备份云示意
>3、 系统技术实现方案
>系统的技术设计及实现方案分为以下几个层次:
> 备份虚拟化技术引入及部署-建立一个可扩展的基础架构
> SOA-建立跨越整个备份资源的统一兼容的面向业务需求的备份服务
> 自动化管理-提高云备份基础架构管理效率降低复杂度
>3.1虚拟化
> 首先,在云备份架构中将备份SAN从生产SAN分离出来,这一变革,使得原有的四个数据中心中,分散在各个应用系统中的备份设备通过备份SAN虚拟化地呈现给整个数据中心,形成了一个集中的备份资源池。同时备份的SAN可以根据业务的变化,备份任务的变化灵活的扩展和回收,实现了备份资源的灵活调度和灵活的缩放,对生产SAN没有任何影响。
> 在数据中心备份SAN的基础上,建立了跨数据中心的备份SAN连接,使得所有数据中心都能物理共享第五个数据中心(浦口高新机房)的备份设备,这样当任何一个数据中心的备份设备故障时,云备份架构将自动启用第五数据中心的备份设备,保证核心生产系统备份作业,如数据库归档日志备份能够持续进行。这里的关键是第五数据中心的备份设备是共享的而不是其中一个数据中心专享的。
> 对于IP网络的资源虚拟化,则在云备份架构中建立了一个具有负载均衡功能的介质服务器资源池,接入云备份架构的任何一个网络备份客户端的备份任务可以自动计算并分配到一个负载最低的备份介质服务器。所以对于通过网络备份的应用系统来说,备份系统是即插即用式的,备份客户端软件从备份服务器自动下发,同时客户端不需要关心对应哪个介质服务器,或具体使用哪里的备份设备。
> 多层次的备份架构,除了传统的磁带库设备,还采用了新型的磁盘备份技术,如虚拟磁带库技术,数据重复删除技术,这些技术都作为基础架构的形式提供,为接入云备份系统的不同性质数据提供不同类型的存储方式。其中使用的数据重复删除技术是云备份体系中核心组成部分即备份软件自带的功能,在对客服系统中大量的具有冗余性质的VMware虚拟环境的备份有良好的效果。
> 建立面向地市分公司支撑系统的共享备份架构,对于分公司的备份需求,统一提供备份资源池,提供用户透明的集中备份服务,用户不需要考虑备份系统所在的地点和具体结构,同时通过重复数据删除技术,减少本地写入的数据量,相应的减少网络数据流量。
>3.2 SOA 备份服务
> 一个共享的、可伸缩的备份架构是实现一个满足SLA的备份服务投送平台的基础。我们所定义的备份服务基于备份云上的各个关键要素——数据、网络、存储资源,分别细化、组合、封装,最后形成备份服务的SLA。对服务的使用者来说,云服务通过封装底层技术屏蔽了复杂的技术组合,使得一个复杂的备份策略设置操作,变成简单的服务挑选。
> 我们首先通过区分应用系统数据重要性等级,分别定义金,银,铜三个服务等级;数据重要性等级指标有三个,一为是否需要快速恢复,二为是否需要长期保存,三为是否需要异地保存。之后我们将应用系统对应到备份平台的SLA; 从服务等级的角度看,铜牌服务仅提供长期保存(磁带备份),银牌服务则在满足长期保存基础上提供了异地保护(磁带复制等),金牌服务除