赛门铁克大集群方案 本文关键词:赛门铁克,集群,方案
赛门铁克大集群方案 本文简介:赛门铁克大集群方案一、前言传统方式的集群系统,通常是1+1的方式(或者成为主备方式),即一台服务器运行正常的业务系统,称为主机;另外一台服务器做为备机,平常不做业务;当主机发生故障的时候,备机接管主机的任务。所以,往往将之称为双机系统(示意图如下)。上述传统的集群系统(或者双机系统),消除了服务器单
赛门铁克大集群方案 本文内容:
赛门铁克大集群方案
一、前言
传统方式的集群系统,通常是1+1的方式(或者成为主备方式),即一台服务器运行正常的业务系统,称为主机;另外一台服务器做为备机,平常不做业务;当主机发生故障的时候,备机接管主机的任务。所以,往往将之称为双机系统(示意图如下)。
上述传统的集群系统(或者双机系统),消除了服务器单点故障,一定程度上提高了系统可用性,但是其不足之处也较明显:
·
可靠性不高。在其中一台发生故障期间,业务将运行在高风险中。
·
服务器资源利用率低。1+1集群方式很有可能使得每个业务系统都需要两台服务器。
·
存储资源利用率低。1+1集群无法利用目前光纤存储网络的共享优势。
·
无法实现节能减排目标。1+1集群方式因为服务器数量和相应的设备数量都很多,功耗和产生热量很高,对于企业实现节能减排目标非常不利。
·
采购费用高。
·
维护困难。管理员需要管理数量众多独立的1+1集群。
随着集群技术水平的提高,多服务器集群(或者称为大集群)方案得到了大多数用户的认可,并在生产中大规模应用。
二、大集群方案简介
多服务器集群,有多种结构,简介如下:
·
N
to
1结构:特点是多台主服务器共用一台专用备机。任何一台主机发生故障,其业务系统都切换到专用备机。主机修复后,在维护时间将备机上的业务系统切换回原主机。示意图如下。
·
N
+
1结构:特点与上述方式类似,但是不使用专用备机。任何一台主机发生故障,其业务系统都切换到备机。主机修复后即作为备机。示意图如下。
·
N
to
N结构:特点是所有的服务器都作为主机,没有备机。当某主机发生故障后,切换到另外一台主机。主机修复后,在维护时间视实际情况将部分业务切换回该主机。前提是每台主机都有一定的计算能力冗余。示意图如下。
举个例子,以往支持15个业务系统,可能需要30台服务器(按照1+1集群方式计算)。使用大集群后,可以采用15+2或者15to2结构,大大减少服务器数量,真正实现了节能减排目标。不光是减少了采购服务器的费用,更重要的是管理员现在只要管理一个集群就可以处理所有的业务系统高可用问题,大大降低了管理难度。
三、赛门铁克大集群方案简介
赛门铁克的VERITAS
Cluster
Server(简称VCS),是一个非常成熟的集群产品。VCS在SUN平台上全球市场份额超过70%,无论在国内还是国外都得到了广泛应用。
VCS支持各种服务器平台,在SOLARIS,HP-UX,AIX,LINUX,WINDOWS上的安装、配置和管理方法完全一致。这在高度异构的企业环境中尤为重要,可以缩短集群产品的实施周期,减少培训费用,降低总体拥有成本。
VCS多服务器集群方案可以完全满足企业对业务高可用的追求,它并可对建立在数量众多的服务器上的集群系统使用用一个控制台、一个控制界面进行统一、集中的管理。
VCS是赛门铁克整个高可用和容灾方案的核心。它作为一个高可用平台,不仅仅能提供本地集群,还提供Oracle并行数据库基础架构,更能结合各种数据复制技术,实现远程容灾中的应用切换。
采用VCS方案,没有特殊的硬件要求和限制,只需要基本的集群切换硬件和网络要求,例如:
·
通过SAN的配置,各台服务器都可以访问到磁盘阵列中对应的数据区,这样才能在发生切换后切换目标服务器能读写对应的数据。
·
每台服务器除了正常提供对外业务网络服务的网口外,还需要两个网口做为心跳网口。具体连接方法是每台服务器的心跳网口1都连接到一个交换机,而每台服务器的心跳网口2都连接另外一台交换机,这样可以最大限度保证心跳的可靠。
通过图形管理界面,并按照应用的性质定义切换所需要的服务组(Service
Group,服务组是VCS切换的单位),以及该服务组中的有关资源(把与一个服务有关的所有软硬件资源定义在一个服务组中)。当一个服务组中任何一个资源发生故障,如果需要进行切换,则将整个服务组切换到备用服务器。例如我们将与一个服务有关的应用程序、Oracle监听进程、Oracle服务、网卡、IP、磁盘组、卷、文件系统等资源定义在一个服务组中,当任何一个资源失效时,VCS即会按照预先定义的规则快速实行相应的硬件或应用切换。图形管理界面如下示意图。
四、赛门铁克集群方案特点
管理界面
VCS支持包括命令行、GUI、WEB在内的多种对集群的监控和管理方式。尤其是通过对WEB管理方式的支持,实现了对集群管理的可移植性。系统管理员无论身在何处,都可以随时通过任意终端上的WEB浏览器了解到自己集群的运行状态。
管理安全性
VCS内置自身的安全管理机制,有其独立的用户认证体系。而且有五种独立的角色,对应着不同的管理权限。例如,在一个多机集群的环境中,可能会有数据库和WEB
SERVER两个应用。在此例中,这五种角色分别为:
·
集群管理员。这个角色拥有所有的权限,可以进行集群中的所有配置、所有应用的切换。
·
集群操作员。这个角色只能做集群所有应用的切换。
·
应用管理员。这个角色只可以做某个应用(数据库或WEB
SERVER)的配置或切换。
·
应用操作员。这个角色只可以做某个应用(数据库或WEB
SERVER)的切换。
·
访客。这个角色可以浏览集群的界面,不能做任何实质性操作,适合授给见习的系统管理员,用于了解集群的配置。
通过VCS中内置的用户认证体系和这五种内置的角色设置,就不会因安全机制的不完善而导致人为的应用停机。
标准化应用和客户化应用的支持
作为业界最成熟的集群技术,VCS对标准化应用和客户化应用的支持都通过相关的AGENT实现。
支持的标准应用包括(但不限于):
Oracle,Oracle
RAC,Sybase,Informix,DB2,SAP,Iplanet,Netscape,Apache,NFS,Netbackup等。
如果是客户自己的应用程序需要VCS管理和切换,VCS支持通过定制客户化AGENT的方式实现。使用VCS提供的API,定制AGENT时可以使用任何脚本语言或其他编程语言。
集群的节点扩充能力
在通常的企业环境中,大多数的集群系统都以双机的形式出现,这种构造非常简单,但系统的计算资源只能利用50%(如果两台机器是同等级的),随着SAN环境的日益普及,多机系统共享存储设备已成为可能,这也就为多机集群创造了条件。因为在多机的集群环境中,可以通过一台备用服务器对N台主服务器实现高可用。例如一台备机,19台主机时,整个集群环境中的计算资源利用率可以达到95%。由此可见,在SAN环境中节点数量的支持能力越强,集群扩展性就越高,企业的计算资源利用率也越高。VCS在SAN环境中能支持到32个节点。
对共享文件系统的支持能力
在集群环境中对文件系统共享的支持非常重要,这不但可以节省存储空间(如对WEB
SERVER等应用,不需要在每台服务器上都部署WEB
CONTENTS),更重要的是,可以应用提升切换的速度。因为在非共享文件系统的集群环境中,应用的切换时间主要由一下几个方面构成:在服务器
A上中止应用,UMOUNT文件系统,DEPORT
VOLUME;然后在服务器
B上IMPORT
VOLUME,MOUNT文件系统,启动应用。由此可见,切换中主要的过程是在做存储设备的逻辑迁移。如果采用了共享文件系统的技术,则切换应用的过程就大大简化了。因为存储本来就已经共享,只需要在服务器
A上中止应用,然后直接在服务器
B上启动应用即可,这样切换的时间大大缩短。
为了实现这样的效果,各家厂商实现的方式不同,赛门铁克做为存储管理领域的领军厂商,通过其产品Storage
Foundation
Cluster
File
System实现了在SAN环境内或SCSI环境内的存储直接共享,即多机可以通过SCSI或SAN环境直接访问同一个文件系统。
切换时的目标服务器选择
在双机集群系统中,应用的切换时的目标服务器无需选择。但正如前文所述,在多机集群环境,应用切换时的目标服务器的选择就很重要。因为,在真实的企业环境中,可能并没有完全的备用服务器,有可能都是主服务器,只是都留有部分计算资源的余量用于在非正常时期接管来自其他失效服务器上的应用。在这种环境下,应用切换时对目标服务器的选择就非常重要。如果对某个应用只能预先指定切换的目标服务器,而当要发生切换时目标服务器正在峰值运行,这时就会造成不可预测的结果(如切换后导致目标服务器也因过载而瘫痪,而该服务器的瘫痪又导致应用级联切换至其他服务器上,如此反复,极端情况下又可能发生整个集群的瘫痪。正因为如此,在集群技术中对应用切换时自动负载均衡的考虑就尤其重要。
VCS不仅仅支持简单的按照事先定义优先级方式选择切换目标服务器,更支持在应用切换时动态地在整个集群内判断哪台服务器的负载最轻,哪台满足所有的切换条件,然后再将其定为切换的目标服务器并触发应用切换。这种应用切换的负载均衡技术,赛门铁克大大领先于任何其他集群软件厂商。
心跳机制与I/O
fencing
VCS采用GAB/LLT作为心跳协议,这种协议不基于IP,效率高。由于默认的心跳通过两个物理网卡实现,所以可靠性也更高。除此以外,还可以通过公用网络实现低优先级心跳。
更进一步的是,利用磁盘阵列的SCSI-3
PR功能,VCS更可以实现I/O
fencing功能,完全保证了共享数据不会因为集群心跳的故障导致损坏。
远程应用切换的支持
VCS的Global
Cluster
Option选件可以实现跨广域网(无距离限制)的应用切换能力。这一功能对核心的企业应用非常重要。在异地容灾中,包括对数据级容灾和应用级容灾。对数据的容灾可以通过软件或硬件的方式实现,但对应用的容灾必须通过专用的城域或广域集群技术来实现。而赛门铁克是全球存储管理和高可用领域的领军厂商,拥有非常完整的城域、广域异地灾备解决方案(包括对数据级容灾和应用级容灾)。因此,如果在系统建立的初期就选用了VCS做为本地集群的技术,就为将来可能规划的容灾系统构筑了技术基础,大大保护了技术投资。
7