重复数据删除将成为企业备份新宠

来源:软件水平考试    发布时间:2012-11-04    软件水平考试视频    评论

  虚拟化的基础架构在各种数据中心中大行其道。Gartner将这种现象评为的2008年主要趋势之一。通过使用这种虚拟基础架构,各种类型的企业都可以有效地提高IT资源利用率,增强灵活性从而适应不断变化的需求与工作量。
  然而,由于长期应用的标准备份技术并未自如转换到虚拟世界,前所未有的虚拟技术同样也给下一代数据保护带来了新问题,例如:保护虚拟机的最佳解决方案是什么?在“主机备份”和“无主机备份”两者中该如何选择?
  美国知名独立调研机构The Info Pro针对这一情况的调查数据显示,从2005年初到2007年春,财富1000强的企业的平均存储容量从362TB增长到1,013TB,复合年增长率达67%。The Info Pro 总经理Robert Stevenson 在2006年12月的报告中表示:“伴随着前端存储增长、政策法规要求以及不断压缩的数据保存期限,一种能实现高水准的数据保护新备份技术成为迫切需要。”
  将重复数据删除纳入企业备份战略
  目前,多数企业需要进行全天候不间断的业务运营,每年30%至50%的持续数据增长使备份流程面临着前所未有的挑战,可用网络带宽在多数情况下已无法满足数据增长的需求。
  企业数据中心内外存储的快速增长以及新型业务的需求迫使传统的数据保护方法发生转变。作为一种新型基于磁盘的备份技术,重复数据删除技术能够有效的应对当前日趋严峻的备份和恢复挑战,帮助用户更经济有效地用磁盘备份取代磁带备份。
  赛门铁克估计,将重复数据删除用于数据中心、虚拟环境以及远程办公室能够降低日常备份带宽500倍左右,降低备份的总存储消耗量10到50倍。
  重复数据删除的技术特点
  从根本上讲,重复数据删除能在子文件夹或拦截层级从所有的备份数据中查找出冗余备份数据,从而帮助企业减少备份所需的存储空间。
  重复数据删除的过程可以通过软件或硬件两种方式完成。通过软件方式,企业使用者能够在数据被发送到备份前删除客户端的重复数据这,节省带宽和存储。硬件方法则可让企业使用者在数据被写入目标磁盘位置前删除重复数据,大幅减少存储占用。
  提高存储利用率
  专家分析,与传统磁带备份相比,重复数据删除可以使整体备份存储利用率降低10到50倍。存储优化程度取决于数据类型、数据变更率以及保存时间。传统办公文件类型是优化的主要对象,压缩数据格式,例如音频、视频以及医疗影像等的优化则相对较少。
  降低带宽
  重复数据删除技术可通过降低在不同站点之间传送大量数据带宽需求增强虚拟系统的灾难恢复能力。
  初始完整整形备份将全部数据通过网络发送到备份应用后,备份应用会把这些数据导向存储介质资源(通常是能够进行压缩或重复数据删除的磁带或磁盘)。凭借客户端重复数据删除,安装在系统上的代理能消除在网络中移动的多余数据。一般来说,通过安装了重复数据删除的系统进行初始完整备份,所需带宽要比原先少4倍左右。
  传统备份方法通常要求进行后继完整备份,这就需要占用大量的带宽。而客户端重复数据删除能够降低后继完整备份的带宽需求,使其大小仅为原先的1%。
  在增量备份中,由于重复数据删除技术仅就发生变化或修改的文件进行备份(传统整形备份对整个文件进行备份),因对带宽利用率的提高达12倍左右。
  与压缩的区别
  尽管这两种技术都能够减少备份数据的大小,但是这两种方法的流程和结果却有很大不同。压缩只能够降低需要处理的数据大小却,而重复数据删除则能够覆盖隐藏数据,辨识不同目录下的相同文件、数据变更并在子文件层级捕获唯一不同的拦截,从而影响到存储这些数据的空间。
  重复数据删除的部署与应用
  重复数据删除部署取决于用户的企业环境和恢复需求。基于软件的重复数据删除能够降低带宽消耗并优化存储利用率,适用于带宽和生产力有限的企业环境,尤其是远程站点、服务器分散的中型站点、或是虚拟服务器环境。如果备份流程中的带宽限制问题不大,与数据中心环境的状况相同,企业会更倾向于选择部署基于目标的重复数据删除系统,因为这种方式需要对现有备份架构做出的改变最少。
  在部署方案上,企业用户需要注意如下两个方面。首先,并非所有类型的数据都适用于重复数据删除,恢复点目标和恢复时间目标应当与数据保护方法相匹配,数据恢复要求应随时间推移而变化。大量恢复点能够更好地进行快照或持续数据保护,而高速恢复则能够更好地进行快照或基于SAN的备份到高速磁盘上。其次,并非所有数据类型能够进行重复数据删除,尤其是音频、图片、或调查等压缩过的文件格式。
  企业考虑采用重复数据删除技术的根本规则在于,将各种方案与恢复点目标以及恢复时间目标比对,根据收益和限制进行评估与筛选。
  PureDisk 重复数据删除技术
  全新的 Veritas NetBackup 6.5平台中体现了赛门铁克的新一代数据保护理念,该平台有助于应对管理挑战,能够提供多种防护服务,跨越广泛的操作系统、数据库、应用程序和供应商存储平台,以端到端的方式对备份环境进行集中式管理并简化最复杂备份环境的管理。与 NetBackup 相集成的NetBackup PureDisk是高度可伸缩的基于软件的存储系统,核心正是灵活的重复数据删除技术,可提供强大功能。
  PureDisk重复数据删除技术可以部署到备份环境中的两个不同环节。在备份流程的开始环节,将 PureDisk 代理安装在服务器,以部署该技术;在备份流程末端,也就是当 NetBackup 介质服务器将数据写入磁盘时,无需使用代理就可以使用该技术。该技术可以将传统基于网络备份所占用的带宽最多减少 500 倍,与基于磁带的传统备份方法相比,将备份存储消耗减少 10 到 50 倍。将 PureDisk重复数据删除技术集成到 NetBacku介质服务器,可以减少与基于磁盘的数据保护相关的存储成本支持灵活的灾难恢复,减少备份映像的大小,并对将存储在 PureDisk中的NetBackup数据复制到其他位置进行管理。NetBackup PureDisk的独立解决方案使用基于客户端的重复数据删除技术,为在远程办室、数据中心和虚拟环境中分布的数据提供带宽使用率高、经过优化存储的数据保护,与 NetBackup 相集成,将数据导出到磁带并对PureDisk环境进行有效的备份。

视频学习

我考网版权与免责声明

① 凡本网注明稿件来源为"原创"的所有文字、图片和音视频稿件,版权均属本网所有。任何媒体、网站或个人转载、链接转贴或以其他方式复制发表时必须注明"稿件来源:我考网",违者本网将依法追究责任;

② 本网部分稿件来源于网络,任何单位或个人认为我考网发布的内容可能涉嫌侵犯其合法权益,应该及时向我考网书面反馈,并提供身份证明、权属证明及详细侵权情况证明,我考网在收到上述法律文件后,将会尽快移除被控侵权内容。

最近更新

社区交流

考试问答