Brian Peterson是Forsythe Technology的存储架构师,专门从事存储策略和成本优化的研究。Peterson在IT界的供货方和客户方都曾工作过。
>在2007年的网络存储大会上,IBM负责系统存储的总经理Andy Monshaw在他的主题演讲中表示:”2005年以前,数据还是可以预测的,并且你可以判断存储容量在未来数年的增长情况。”由于数据的急剧增长,合规报告的增加,以及复杂的数据需求(比如纵向数据挖掘),存储需求开始螺旋式上升。
>在21世纪的头几年,通过逐步改进,比如更好的维护合同和容量使用率,IT管理员获得了成本与操作上的好处。从2005年开始,急剧增长的数据使得成本削减更加困难,并推动管理员采用服务器虚拟化和桌面虚拟化。
>服务器–存储缺口
>服务器虚拟化让一个物理服务器可以被多个虚拟机(VM)所使用,每个虚拟机都有自己的20GB操作系统和自己的存储空间、备份需求以及存储I/O。随着更多的VM服务于更多用户所调出的更多的应用程序并进行更多的I/O密集型进程,虚拟服务器也开始变得慢起来。
>改进后的自动化配置系统使得新VM的部署更加容易,可以几分钟之内完成。Gartner Group的《2009年企业存储主要问题》报告中指出,由于”服务器虚拟化移动性工具要求共享的存储,许多企业第一次开始部署SAN和NAS,因此存储适配器突然间变成了应用程序性能的瓶颈,而传统的备份手段也变得尤其问题多多。”其他的结果还包括:
>存储网络空间的大量消耗;
>对旧存储网络的压力;
>备份数据大量增加;
>经常需要增加存储;
>存储架构、存储管理和数据复制的复杂性增加。
>服务器虚拟化让我们把存储于每台服务器中低成本磁盘驱动器的操作系统数据迁移到SAN(或NAS)环境,从每GB存储成本来说,后者往往更加昂贵。VM的存储可以带来–在许多情况下已经带来–非常高昂的成本。由于维持存储的生命周期成本基本上是购买成本的七倍,因此非常有必要采用新技术来优化虚拟服务器环境中的存储。
>重新寻找平衡
>虚拟服务器环境中良好管理的SAN(或NAS)存储设置可以降低数据存储成本,提高性能,或简化操作。像往常一样,你可以在”更便宜–更好–更快”这个三角中选择两个方面进行优化,但是不能同时优化所有三个方面。市场上也没有单一的”灵丹妙药”。
>本文比较了VM存储管理的六个技术,并检验了哪些方式–或方式的组合–可以更好的应对各种数据管理挑战。
>一个虚拟化服务器环境要求服务器、网络和存储团队齐心协力。这些团队可能某种程度上倾向于各干各的,但是要构建一个均衡的服务器-存储策略,每个团队都必须理解其他人的优先任务、流程和要求。将存储规划与虚拟服务器需求整合起来可以使组织更加高效地支持数据增长、成本控制和性能上的要求。
>下面每个存储解决方案都可以节约存储,但是没有一个是完美的:
>对VM OS镜像进行重复数据删除。将几乎相同的OS镜像予以重复数据删除可以大幅减少空间要求。
>实施VM分层存储。根据数据变动性、优先级和访问频率,将不同的数据类型指定到合适的存储层。
>合并SAN。通过本文所描述的几种方法优化SAN存储。
>通过使用针对VM的NFS(网络文件系统)并使用重复数据删除来简化管理。
>从快照进行配置。把VM当做完整大小OS镜像”黄金副本”的空间优化快照进行部署,可以在几个完整OS镜像的空间内存储下很多VM。
>对备份进行重复数据删除。备份重复数据删除在虚拟服务器环境下可以带来特殊好处。
>对OS镜像进行重复数据删除
>在虚拟化环境下,每个OS镜像中80-90%的内容都是相同的。例如,每个用户的Windows开始画面都是一样的,只有系统信息,比如主机名称和注册表数据,可能会不一样。此外,OS镜像不会明显影响磁盘I/O性能。一些厂商现在在提供针对主存储的重复数据删除功能,这样OS镜像所占用的空间可以有效减少70%左右,同时还不会对性能产生明显影响。一家主要存储厂商保证OS重复数据删除最少可以节约50%的存储空间。
>对VM存储的重复数据删除正变得越来越普遍。举例:一家大型保险公司拥有400TB的主存储,并且有200个快速增长中的虚拟服务器,每个虚拟服务器有20GB或更大的OS镜像。通过对VM OS镜像进行重复数据删除,优化SAN,对VM备份进行重复数据删除,这家公司预计未来三年可以节约至少75万美元的成本。
>使用存储分层
>服务器管理员不仅应该告诉存储团队需要多少新存储,而且应该告诉他们应该把哪种类型的数据放在哪种类型的存储上。存储团队可以设置分开的存储池,这样更加静态的和访问频率更少的数据(比如,OS镜像)可以放在速度比较慢的第三层存储(例如,SATA磁盘)–这个存储层的成本往往比第一层存储的成本低五到七倍。访问频率更高的数据,比如应用程序,可以放在第二层存储。最快、最昂贵的第一层存储应该保留给那些最容易变动的页面文件和数据库。
>需要指出的是,一些虚拟化组件,比如VMware Site Recovery Manager(SRM:站点恢复管理器),目前要求恢复单一VM所需的所有数据都应该在单个ESX存储池。基于阵列的分层工具(比如,Compellent、EMC和日立数据系统的工具)。
>举例:一家金融服务公司拥有超过300TB的存储和庞大的VM环境。这家公司将操作系统放在廉价的第三层存储,将经常使用的、容易变动的应用程序和用户数据分配在更加昂贵的第二层和第一层存储。该公司超过70%的存储迁移到第三层存储。比起原来承载所有VM数据的第一层存储,第三层存储的成本要低75%。
>合并存储网络
>大型光纤通道SAN曾经要支持成百上千台物理服务器,并增长到每个光纤架