6. 什么是“可变长度数据块”重复数据删除?如何获得长度可变的数据块,它们对我又有何帮助?
>考虑一下相反的情形就会让您茅塞顿开。如果将数据流分割成长度固定的多个片段,那么只要某个点发生变化,之后的所有数据块也将随之发生变化。而长度可变的数据块则允许某些数据片段进行伸缩,而同时不会影响后面的数据块,这样有助于提高系统查找重复数据片段的能力,进而达到大幅节省空间的目的。
>7. 将数据分割成多个数据块是否安全?如何进行恢复?
>使用指针引用一系列数据片段这一技术经过几十年的发展已日臻成熟,大家每天都在使用,其安全性有目共睹。将一个大文件写入磁盘后,系统会根据空间占用情况将文件以数据块的形式存储于不同的磁盘扇区。“读取”文件时,实际读取的是文件元数据中的指针,这些指针分别指向按照相应顺序排列的不同扇区。基于数据块的重复数据删除正是采用了类似的技术。另外,重复数据删除解决方案供应商往往还会内置多种数据完整性检查功能,用于验证系统运行是否正常以及数据是否还有可用价值。
>8. 备份过程中,应在何处执行重复数据删除?
>有两个选择。您可以在将所有备份数据发送到备份目标后在备份目标执行重复数据删除;也可以在备份过程中于主机上执行重复数据删除。两种选择各有优势。如果您是在备份过程中于主机上执行重复数据删除,那么通过备份连接发送的数据量将会减少,但是您不得不花时间去管理所有受保护主机上的软件。这会大大降低备份速度,因为重复数据删除作业会增加系统负担,并且还会降低主机服务器上其他应用程序的运行速度。如果您是在备份目标执行重复数据删除,那么通过连接发送的数据量相对较大,但是您可以使用所有备份软件,且只需管理单一目标。由于硬件系统是专门针对重复数据删除技术构建的,所以通常情况下,这种方法的性能要更高一些。
>9. 重复数据删除技术可以用于磁带吗?
>这个问题没有一个明确的答案。为了方便写入和读取,重复数据删除技术需要具备随机访问数据块的功能,因此,您需要将它部署于基于磁盘的系统中。然而,从重复数据删除数据存储区将数据写入磁带也很容易,事实上,这一做法已广为沿用。如果数据只需存储几周或数月,那么大多数重复数据删除技术用户会采用磁盘;但计划的存储时间较长,则磁带是理想之选。使用经重复数据删除处理后的数据创建磁带后,其中的数据已经过再扩展,因此,在磁带机中便可直接读取这些数据,无需先将其写回至磁盘系统。
>10.重复数据删除解决方案的实际价格是多少?
>这点很难说,但有条公认的经验值得您借鉴。假如重复数据删除技术的平均利用率为 20:1(业内普遍采用这一数字),那么市场报价应在 1 美元/GB 左右。也就是说,可存储 20TB 备份数据的系统市场报价在 20,000 美元左右,与使用传统磁盘相比,这个价格非常实惠。请注意:价格并非一成不变:顾客喜好势必提高它的价格,而如果零售商或供应商提供折扣的话,价格就会降低。