昆腾DXi重复数据删除VTL的两家用户报告称,由于完整性检查流程过长,他们在一次意外停电事故之后花费了数小时甚至数天的时间来恢复他们的系统。
>两家用户的管理员表示,在DXi设备遭遇意外断电之后,一个昆腾称为“Blockpool Verify”的流程被启动。这个流程主要是检查所有块的完整性,只有在发生“不明原因的系统停机”情况下才会被启动。
>加拿大安大略省的AIC公司IT基础架构经理Ben Barnes在大约9个月前配置了昆腾带有重复数据删除功能的DXi5500 Fibre Channel VTL。这家联合投资公司大约有2.6TB的数据,每周对这些数据备份一次,因为可以兼容该公司的磁带基础架构所有他们选择了昆腾的光纤通道VTL。
>AIC在他们的主数据中心和二级灾难恢复站点各配置了一台DXi5500设备,不过这是第一次将在总部安装并测试这些设备。在将二级系统迁移到灾难恢复站点的过程中,发生了一次断电事故,然后设备重新启动,“这些设备用了几天的时间对所有数据进行完整检查,直到完成之后我们才能使用这些设备。 ”Barnes这样说道。
>在经过一次固件升级之后,最近一次的断电事故发生之后AIC的DXi5500大约用了4、5个小时恢复系统。这是很大的改进,但仍然不够。
>Barnes表示:“第二次事故表明系统有很大改善,但是我们需要有更好的表现。在灾难事故发生时你需要启动并运行系统,而你最不希望做的事就是等待半天的时间恢复系统。”
>Steve Stoutner是美国南部一家银行处理服务提供商的IT经理,他也有同样的遭遇。去年九月,IKE飓风袭击德克萨斯州的时候,他们位于休斯敦的二级站点无法转移到二级灾难恢复站点,然后这个二级数据中心的发电器也出现了故障,整个系统陷于瘫痪状态。
>当时一些数据已经丢失,因为主站点的DXi3500阵列是在每天post-process重复数据删除完成之后进行数据复制。在这家功能检查数据是否丢失之前,他们不得不等待完整性检查的完成。
>Stoutner表示:“昆腾方面的回答是,‘你不应该那样关闭系统’。可是我们不可能按照我们希望的那样启动所有系统。”
>幸运的是,客户签订的服务等级协议(SLA)期限足够长,所以丢失数据的损失并不是很大。但是这次意外时间仍然让Stoutner的公司不得不使用另一个重复数据删除设备。当他们购买Data Domain的DD565重复数据删除阵列的时候,他们做的第一件事就是拔出电源线。
>Data Domain表示,他们的完整性检查流程可以经受住Stoutner和Barnes所经历的这些紧急情况。Data Domain公司产品管理总监Ed Reidenbach表示,Data Domain的操作系统是在备份完成之后才对新文件系统元数据和数据完整性进行检查的,然后会在后台对所有数据进行在线持续复查。
>Reidenbach表示:“在第一次端对端检查流程过程中,Data Domain的操作系统会严格计算校验和,在这之后数据被保存在用电池供电的NVRAM和磁盘中。当发生停电事故的时候,不经过磁盘的写入恢复只需要重复发出请求,检查整个ATA缓存的断电故障。直到所有数据都确认完整之后才会启动元数据升级,因此整个过程速度是很快的。”
>去年,美国阿拉斯加Anchorage的IT技术人员也报告了使用Quantum DXi 5500导致数据丢失的情况。DXi 3500和DXi 5500都是昆腾的中端重复数据删除系统。另外昆腾还推出了一个新的企业级平台DXi 7500。
>昆腾新闻发言人表示,昆腾已经意识到了“Blockpool Verify”流程存在的问题。昆腾设备还具有一种被称为“Blockpool Health Checks”的高级数据完整性检查功能,这一流程的速度更快一些。昆腾公司新闻发言人在电子邮件中写道:“Blockpool Verify只有在发生不明原因的系统停机情况下才会被启动,这也是AIC公司的Ben Barnes反复提到的情况,这并不是一个频繁出现的问题。我们已经就这个问题进行了完善,但是基于blockpool的大小,第一次恢复仍然需要几个小时的时间。”
>Barnes表示,目前他们正在与昆腾的工程师共同解决这一问题,而且他们愿意继续使用昆腾的系统,部分原因是在固件升级之后系统有了很大改善。 Barnes在去年购买昆腾设备之前曾经考虑过Data Domain的产品,但是当时他想要购买一款可以支持他们磁带备份的磁盘系统。
>Barnes表示:“最后我们看到昆腾提供的报价,这个价格是包括一切的——系统、磁带、许可和支持。而Data Domain提供的并非这种一站式采购模式。”