【IT168 资讯】运用集群技术来扩展服务器的性能、容量、连通性和实用性已经没有什么可好奇的了。然而,集群存储就是另外一回事了。
>什么是集群存储
>在集群里,一组独立的节点或主机可以象一个系统一样步调一致地工作。它们不仅可以共享公用的存储阵列或者SAN,也可以拥有只有一个命名空间的公用文件系统。
>最近的一些案例来自Cluster File Systems、Oracle、Red Hat以及新兴的Panasas和Spinnaker
>Networks公司等。Red Hat公司于去年收购了Sistina公司,该公司发布了适用于开放源码的集群Global File
>System。Network Appliance公司则收购了Spinnaker
>Networks公司,该公司目前正在使用其SpinCluster软件来改进网格战略,即对网络附加存储(NAS)以及SAN存储进行集群整合。
>Oracle公司也在该公司的真正应用集群(Oracle 9i RAC)上使用其Cluster File System。Cluster File
>Systems公司则使用其Lustre File System来建立高性能的集群。
>在一些成功案例里,单独的服务器也是通过元数据服务器或设备与存储连接,元数据服务器或设备可以对数据进行很细的分类,以使这些数据可以很容易地找到。
>更好的性能是一些用户使用集群文件系统的一个关键理由。某用户目前使用Lustre File
>System,他们通过构建的集群来进行科学仿真和模型建立工作,如今把两个1000节点的集群用于生产系统。以前,需要在每一个集群上安装文件系统,而
>且当有人需要数据时,经常需要把一个文件复制到另一个集群上去,文件系统之间频繁的FTP任务对整个系统的性能造成了很大的影响。而现在他们能够随时将数
>据从文件系统中调出来阅读,在不影响正常仿真任务进行的同时查看系统运行结果。
>集群存储的优势
>通常,集群存储总是和高性能计算联系在一起,不过事实上,集群存储正快速被主流的商业环境所采用。这些商业领域被集群存储的优点所吸引。集群存储通过采
>用开放访问方法,如NFS和Windows
>CIFS,以及使用业界标注和第三方存储,对现有的技术和协议加以利用,如以太网、光纤通卡以及InfiniBand协议。
>目前,发展速度最快的集群存储解决方法可能是网络附属存储(NAS)文件服务器。企业需要摆脱单一存储结构的限制,扩展到能够对结构化和非结构化的数据进行管理。这样的需求对集群NAS技术的部署起到一定的推动作用。
>集群NAS系统在许多层面都具有可扩展的优势:
>• 能够提高大型的序列带宽(吞吐量)的性能,或提高小型IOPS,即每秒输入输出次数(事务型)以及元数据查找的性能;
>• 扩展存储容量;
>• 提高基于本地或以分布式的可用性,与设备或站点故障相隔离;
>• 扩展的灵活性,包括同时访问相同或不同的数据以及由于不同的应用需求对数据进行平行访问;
>• 具有提供模块存储增长的扩展能力;
>• 提供了易于管理任务的扩展性,例如存储的精简配置、负荷平衡以及数据保护。
>NAS和文件集群服务的方法
>大多数公司采用的集群技术应用于存储、文件系统和文件服务器。集群技术可以为存储系
>统增加待机或故障接管的能力,而这些能力反过来为大量的控制器、存储节点或处理器,以及集群文件系统提供扩展支持。讨论集群存储时产生困惑的一个原因是,
>既有基于块(iSCSI和光纤通道)和基于文件(NAS NFS和CIFS)的存储,虚拟磁带库,还有各种各样其它的集群存储解决方法。
>集群文件系统能够让管理员跨应用服务器访问同一个存储池。同时,集群文件系统也允许对数据文件的共享访问(读取和写入),这样,无论是直接式存储还是网
>络存储,都有利于保持文件的一致性与完整性。现在的集群文件系统有SGI推出的高度可扩展性文件共享系统(CXFS),美国昆腾公司的归档软件
>(StorNext),Red
>Hat的全球文件系统(GFS),IBM的两种共享文件系统SFS和GPFS。并不是所有的集群NAS都有一个集群文件系统,也不是所有的集群文件系统都
>要依赖集群NAS服务器。有些系统(例如IBRIX公司的提供多用途文件系统解决方案的IBRIX Fusion)可以将这两者结合起来。
>与传统的NAS文件服务器或集群存储系统相比,集群文件服务器的不同之处在于硬件与软件结合起来的方式。集群文件系统可以安装在应用服务器上,或者专门
>的设备或服务器上,将它们转化成为存储服务器(本质上变成一个集群文件服务器)。有的集群文件服务器,如惠普的PolyServe和IBRIX的
>Fusion,都是混合的系统,从而能够使集群式或者平行文件系统在符合业界标准的服务器上部署。
>有的厂商拥有双重或多重存储控制器、
>存储引擎、NAS或者网关,使用主动/主动模式(两个控制器同时工作)还是主动/被动模式(
>其中一个控制器是备用的)。他们声称具有集群存储系统。我想说的是,如果你将一对存储处理器或是控制器等同于一个集群,你就将不得不考虑每一个具有两个节
>点以上的存储系统是一个集群……这样的话,几乎包括了市场上所有的中档存储区域网络(SAN)、直连式存储(DAS)以及NAS存储系统。
>还有更多的厂商能够提供集群NAS存储(换言之,超过基本的故障接管),更为重要的是,他们还可以提供集群文件服务器。NAS,就本质上来说,是一种安
>装在硬件之上的文件服务器的解决方案。有某些情况下,它具有能够将硬件转化成为集群文件服务器的能力。能够提供NAS硬件/软件的解决方案,同时支持集群
>文件系统和底层硬件的产品包括NetApp的GX,BlueArc的Titan以及Isilon和Panasas的集群存储产品.