某运营商省公司网管中心新数据中心建设方案 本文关键词:数据中心,网管,运营商,方案,建设
某运营商省公司网管中心新数据中心建设方案 本文简介:某运营商省公司网管中心新数据中心建设方案一、项目需求某运营商省公司新大楼落成,需要建设一个新的数据中心。性能容量满足8个运维厂家的现在系统的整体搬迁。原有运行在各服务器的运维平台,采集平台,数据分析平台,管理接入平台统一迁移到虚拟化服务管理平台。应用接入统一部署到虚拟化应用接入平台,实现单点登录,并
某运营商省公司网管中心新数据中心建设方案 本文内容:
某运营商省公司网管中心新数据中心建设方案
一、项目需求
某运营商省公司新大楼落成,需要建设一个新的数据中心。性能容量满足8个运维厂家的现在系统的整体搬迁。原有运行在各服务器的运维平台,采集平台,数据分析平台,管理接入平台统一迁移到虚拟化服务管理平台。
应用接入统一部署到虚拟化应用接入平台,实现单点登录,并且完成4A平台的部署。存储SAN和NAS重新部署,构建统一存储平台
在满足现有平台的性能要求的同时,把服务器虚拟化,应用虚拟化和存储虚拟化统一部署到一个全新的整体架构,实现管理的统一化。
二、项目总体设计方案
服务器、存储、PC、软件、网络设备与日俱增,,企业
IT
架构正在变得庞大且难控,本项目设计总体方案是以一种全新的方式看待
IT
及业务基础架构,从而满足用户对于更高水平服务的期待,并缓解当前经济环境下客户面临的成本压力,同时有效规避各种潜在的风险及威胁。
根据需求该数据中心,设计得总体方案为采取基础架构动态架构策略:
第一,改善服务,在提升现有服务质量及可用性的前提下,满足企业对于实时动态获取创新服务的期望;
第二,降低成本,利用虚拟化、系统优化、能耗管理及资源灵活配置等手段显著提升生产效率并降低企业的投资及运营成本;
第三,管理风险,满足企业业务在安全、弹性及合规性方面的要求,为将来更为互联互通的协作世界做好充分的准备。
第四、能优化工作负载的方法。对特定的任务或服务以性能、扩展性和效率都更佳的订单交付方式来优化工作负载。
第五、集成服务管理。进行可实现业务和
IT
服务之间的可视化、控制和自动化的服务管理,以确保一致的高质量交付。
第六、具有自助服务、弹性扩展和快速供应特性的灵活交付选项可实现最佳性能、降低风险并降低运营成本。
基础架构动态架构将为该企业部署虚拟化基础架构,以使业务更加灵活。具有集成管理的的虚拟化将实现以下目标:
(1)整合并共享资源,释放物理基础架构。
整合新资源和现有资源,以实现更灵活的、以业务为中心的基础架构。
(2)根据需要,随时随地交付低成本的服务,以满足业务目标。(3)为了应对挑战,企业将实施各种不同的虚拟化解决方案,包括服务器、存储产品和应用虚拟化以及
虚拟化环境中的工作站。
虚拟化项目通过实际效益提供实际业务价值:
(1)降低
IT
成本和业务风险
(2)提高效率、利用率和灵活性
(3)简化管理
(4)增强业务弹性
三、统一部署的应用接入平台设计方案
第一、接入平台前台采用PC服务器虚拟化方案
该中心接入平台前台为面向网点的服务,单个应用对资源要求低,但是连接的数量多,因此采用的PC服务器虚拟化方案类型:服务器整合。根据需求设计的架构:
(1)设计思路
PC服务器总体架构规划遵循低成本、高效性、高性能的原则进行设计,具体表现在以下几个方面:
缩短新应用的部署时间。使用PC服务器虚拟化技术,提前购置PC服务器。当新应用系统需要资源时,可以直接从可用的PC服务器上划分资源,部署虚拟机,无需等待服务器采购完成后才进行应用部署,可以大大缩短新应用的部署时间。
提高设备使用效率。每台物理主机可以运行多台虚拟机,将物理主机CPU和内存利用率提高至70%以上。
以较少硬件资源实现应用备份。目前实现PC服务器高可用,必须一对一购置相等的硬件资源,通过HA或群集模式实现,资源浪费严重。引入PC服务器虚拟化技术后,通过对虚拟机建立异机备份,当物理服务器出现故障时,直接在备用服务器上启动虚拟机,以较少的硬件资源,完成一对多的备份。
提高系统管理水平。现有PC服务器没有整合的管理端,很难全面了解各个服务器的运行情况,甚至安装系统需在机房里实行。在实施服务器虚拟化后,对单台服务器通过客户端进行监控,安装系统可以通过客户端完成,无需进入机房,无需刻录安装光盘,提高pc服务器运维管理水平。
实施服务器虚拟化后,延长了应用使用年限。目前大多数新服务器不支持老旧操作系统,采用虚拟化技术后,不同服务器上虚拟出和系统硬件是相同的,当某台物理服务器更新换代后,其上运行的虚拟机可以无缝迁移到新的服务器上而无需重装系统。
(2)
选择VMware的原因
A.利用虚拟化提高了服务器的利用率,从原先的18%提升到现在的70%左右
B.将各支行的柜台前置系统服务器集中到了省行,减少了各支行的技术维护人员。
C.利用节省下来服务器实现了冷备份和交叉备份,提高了柜台前置系统服务器的可靠性。
D.降低了服务器数据中心的空间需求,以满足该行业务系统增长的需要。
E.由于整合了服务器和存储,因此大幅度降低了对数据中心空间和电力的需要,也减轻了近期改造数据中心的压力。
(3)该方案安全性
A.用户、权限和角色
该行虚拟化架构分级管理可以通过建立两级角色,即“管理员”角色和“虚拟机操作员”角色。“管理员”角色具有最高的权限。“虚拟机操作员”角色通过克隆已经存在的“只读”角色生成,并添加查看会话、开关虚拟机、重置虚拟机、控制台交互等有限功能(其它功能视实际情况打开),防止操作员误操作。
B.高可用性ESX主机群组
可以由一个或多个VMware
HA群集组成。通过VMware
HA技术,监控群集中所有ESX主机。虚拟机文件驻留在由光纤存储或iSCSI存储组成的共享存储上。
ESX主机产生故障时,虚拟机自动在备用资源上重新启动。
使用共享存储(推荐使用光纤存储或使用iSCSI存储)存放虚拟机操作系统和应用分区。ESX主机宕机时,通过VMware
HA在其他ESX主机重新启动;克隆(或复制)虚拟机镜像放在ESX本地内置磁盘,共享存储发生故障时,直接从ESX主机上启动该虚拟机镜像。
1)
群集内所有虚拟机的操作系统和应用分区存放在共享存储上(FC/iSCSI/NAS);
2)
克隆(或复制)虚拟机镜像放在ESX主机的内置磁盘;
3)
ESX主机故障,由VMware
HA自动重新启动虚拟机;
4)
存储故障,手工从ESX主机的内置磁盘上启动虚拟机镜像。
5)
克隆(或复制)虚拟机镜像后,检查虚拟机镜像的有效性。使用vCenter克隆时,克隆拷贝的MAC地址会发生改变(源虚拟机不会产生任何变化)。如有问题,及时修复克隆拷贝。
第二、接入平台后台采用
接入平台后台主要运行的是各个应用系统的数据库,这类型的服务需要的资源大
设计思路
A.可行性原则:系统建设要以满足该中心工作的业务需求为首要目标,建设方案以该中心的可接受能力为尺度,避免不计成本地盲目追求最新技术,系统要保证技术的可靠性和经济的可行性。计算机系统、通讯网络系统、数据设计,在技术上必须是成熟的,实践检验是成功的,经济上是可能实现的。
B.适应性原则:系统要保证可扩充性、可维护性。系统软硬件都应留有扩充升级的接口;系统要便于维护,系统对用户的需求发展有较强的适应能力。
C.先进性原则:在实用可靠的前提下,尽可能跟踪国内外先进的计算机软硬件技术、信息技术及网络通信技术,使系统具有较高的性能价格比。采用先进的体系结构和技术发展的主流产品,保证整个系统高效运行。
D.安全性及保密性原则
管理信息系统是一个紧密联系的中枢系统,如果哪一个环节出问题,将会导致整个管理系统混乱,后果不堪设想,因此必须保证信息的安全,有较好的数据安全措施,有较强的数据备份和系统恢复功能。加强对要充分考虑数据的保密措施,各种数据必须受到严格控制,防止非正常渠道的提取、修改。管理系统的数据库必须分层次和级别、保证数据库在各种级别保密程度上的查询访问,防止信息被任意查询和破坏,对各种各样的计算机病毒,系统都应具有高度的免疫力。
设计的策略:
A、高可靠性
主机的高可靠性是系统成功的基础。高可靠性原则是以提高系统部件的连续工作时间来尽量减少系统的非计划停机为目标的。为了实现这一目标,主流厂商如IBM、HP、SUN、COMPAQ等在高档服务器中或自行设计制作、或OEM零件大厂的优质部件。但是OEM产品的质量控制掌握在原制造商手中,有时质量难免参差不齐。因此,要保证主机系统的高可靠性,应最大限度地选择系统部件尤其是关键部件的OEM比例低的产品。
B、高可用性
主机的高可用性是系统成功的关键。主机的可用性是以各个厂商的操作系统支持的高可用性系统热备份软件来保证的。一般来说,当主机的内存、硬盘,网络连接,操作系统,应用软件及供电等出现问题时,高可用性软件应能将失效部分的功能切换到主机热备份的冗余部分上去,保证系统能不间断地提供服务。
C、易维护性
主机的易维护性是系统成功的保证。这一性能与各厂商软硬件设计有很大关系。一般来说,易维护性体现为主机失效部件的热拔插和操作系统允许这种操作而不至于停机。
D、易管理性
主机的易管理性是系统成功的前提。易管理性分为系统硬件和软件两方面。硬件的易管理性体现为主机硬件设计上是否有专用管理电路设计;软件的易管理性体现为是否有网络管理软件支持。
E、高扩充性
在发展迅速的信息领域,应用环境、主机的硬件或软件都会不断地加以更新和升级,因此,主机的扩充能力将决定着系统的发展。
F、开放性与先进性
主机的开放性体现为各种设计规范符合国际和工业标准,并可提供多厂家产品的支持能力。主机要满足相关的国际标准和国家标准,是开放的可兼容系统、能与不同厂商的产品兼容。
G、经济性及投资保护
性能价格比是主机是应充分考虑的因素。而投资保护的思想正是推动开放式技术和产品的初衷,这主要体现在产品的前后一致性,向后兼容性,系统生命周期的总投入费用。
H、高质量服务与支持
及时良好的售后服务支持和顾问咨询,可免去用户的后顾之忧,是系统成功的重要一环。
(2)接入平台后台建议采用LPAR技术实现小型机虚拟化。
可以选择小型机厂商为IBM、HP。建议采用IBM
Power小型机。
采用IBM
Power
服务器业务连续性方案简述:
IBM从三个技术层面实现
Power
服务器的高可用,为您构建一个近乎不停顿的业务环境:
A、按照大型机可用性理念设计的具有高
RAS
特性的系统硬件,以及最大限度减少计划内
B、停机影响的动态分区迁移功能
C、被业界广泛证明的具有极高可靠性的
AIX
系统,以及之上最大限度减少计划内应用停顿的动态应用程序迁移功能
D、PowerHA
高可用性软件实现本地高可用集群以及远程容灾功能
(3)方案价值
实施IBM
Power
服务器业务连续性解决方案,使您能够有效管理风险、保证业务的持续运作、改进服务水平,实现业务增长:
A、提供持续的应用服务,保证业务连续性;
B、消除计划停机的影响、减少非计划停机;
C、规范和稳定的服务器角色切换;
D、
实现应用层面的透明接管与恢复;
E、简化数据恢复与应用恢复的流程;
F、改进服务水平,提升客户满意度。
(4)业务连续性方案介绍
IBM
Power
服务器业务连续性解决方案是从Power
系统硬件、操作系统和Power
系统软件
这三个技术层面实现的。利用按照大型机可用性理念设计的Power
系统硬件的RAS
特性以及Power
服务器的动态分区迁移功能实现高可用。利用AIX
操作系统的动态应用程序迁移功能最大限度减少计划内应用程序停顿,实现高可用。利用IBM
Power
HA
和Power
HA/XD
系统软件,实现本地高可用集群以及远程容灾功能。
1)Power
系统硬件技术实现高可用
Power
服务器硬件所具备的RAS
特性及PowerVM动态分区迁移功能,帮您实现高可用:
RAS(Reliability,Availability,Serviceability
高可靠性、高可用性、高可服务性)是最早用于IBM
大型机的技术,IBM
致力于使每一个新系列的系统比前一代更加可靠。这就使得今天Power
系统变得如此可靠,以至于几乎没听说过有任何因为硬件问题导致的系统灾难。
PowerVM
LPM
(Live
Partition
Mobility
动态分区迁移)功能实现了将一台POWER6服务器上的分区实时地迁移到另外一台POWER6
服务器上。它允许您将正在运行的AIX
和Linux
分区,以及它们所承载的应用程序从一个物理服务器迁移到另一个物理服务器,
而不会对基础服务产生任何影响。这项迁移操作只需要花费几秒钟的时间即
可完成,
可以维护整个系统事务的完整性。这项迁移操作将传输整个系统环境,包括处理器的状态、内存、附加的虚拟设备,以及连接的用户,
从而有助于实现连续、高可用性目标。
2)操作系统的技术实现高可用
首先介绍一个概念WPAR(Workload
Partition
工作负载分区)。WPAR
是AIX6
提供的一种全新的软件虚拟技术,用于隔离用户和应用程序。它不依赖于硬件特性,是多种AIX
核心技术的综合体现。WPAR
是由软件创建的、AIX
6
映像中的虚拟化的操作系统环境。对于所承载的应用程序来说,每个工作负载分区都是一个安全的、隔离的环境。WPAR
中的应用程序认为,它正执行于自己的、专门的
AIX
实例中。对于大多数应用程序来说,WPAR
就好像是一个AIX
的启动实例。通常,在
WPAR
中,应用程序无需修改就可以运行。
动态应用程序迁移是
AIX
6.1
的一项独特创新,是其
WPAR
策略的组成部分,它允许您移动工作负载,而不是整个分区。实际的目标
WPAR
可以是不同的服务器,但并不一定必须是不同的服务器。它比较灵活,因为您可以在一些具备混合物理体系结构(Power5
和
Power6)的环境中使用它。它可以将应用程序从需要计划停机以便进行维护的系统中移动到别处。通过将工作负载从不堪重负的服务器移动到负载较轻的服务器,它还可以用于提高性能。而且,通过采用这种方式移动工作负载以允许物理服务器在非高峰期间进入睡眠状态,它还可以帮助节约电能。
下面的表格介绍了动态应用程序迁移和动态分区迁移之间的一些基本区别。
动态应用程序迁移和分区迁移之间的区别
类型
动态应用程序迁移
动态分区迁移
OS
AIX
6.1
Linux、AIX
5.3、AIX
6.1
硬件
PowerPC?
970、POWER4?、5?、6?
Power6
粒度
WPAR
LPAR
3)Power
系统软件实现高可用
利用IBM
PowerHA
和Power
HA/XD
系统软件,可以实现本地高可用集群以及远程容灾功能,产品要点如下:
有助于保护关键业务应用,避免中断;无论是计划内还是计划外中断
在远程站点使用可选特性PowerHA?
/XD,将故障切换功能扩展到备份资源,支持GLVM异步模式或SAN
Volume
Controller(SVC)上的全局镜像
通过支持IPV6,允许客户访问您的PowerHA
AIX
集群,获得更高的安全性特性和合规性
3.1)
IBM
PowerHA
for
AIX
(HACMP)
IBM
PowerHA
for
AIX?
(原名为High
Availability
Cluster
Multiprocessing
-HACMP?)
是用于IBM
Power
系列服务器上的高可靠集群软件,通过冗余配置,消除单点故障,保证整个系统连续可用性和安全可靠性。HACMP
是利用网络来侦测主机及网卡的状况,搭配AIX
所提供的硬盘镜像等功能,在主机、网卡、硬盘控制卡、硬盘或网络发生故障时,自动切换到另一套备用元件上重新工作;若是主机故障则切换至备份机上继续应用系统的运行。PowerHA
for
AIX
解决方案始终提供可靠的监控、故障检测和业务应用环境向备份资源的自动恢复,为核心数据业务弹性奠定基础。
下图所示为基于AIX
LVM
功能(软件免费)实现的交换磁盘集群(仅限本地),完全冗余,无切换时间,适合7x24
环境。
下图所示为共享磁盘存储高可用集群:
您可以对PowerHA
进行配置,以响应数百个系统事件,其中包括尚未严重到中断正常系统运行的问题(例如,流程故障或系统资源耗尽等)。PowerHA
可以监控、检测和响应这些条件,从而保持在出现计划外软件问题时系统服务的可用性。在一个PowerHA
集群中,最多可以参与32
个运行AIX
操作系统(OS)的节点,或者最多8
个运行Linux?
OS
的节点,提供坚如磐石般的高可用环境。PowerHA
在AIX
环境中运行(也可以在IBM
i
环境中运行),并利用IBMPowerVM?
虚拟化功能,动态增加系统资源,以支持割接工作负载和实时分区移动性。当在一个备份服务器上的小型微分区中运行时,该方案可以在系统资源中自动增加,从而在出现故障切换事件过程中支持主应用。当在一个实时分区移动性环境中运行时,PowerHA
for
AIX
可以与自动迁移环境一起移动!在按计划进行维护时,通过将用户、应用和数据迁移到备份系统,PowerHA
for
AIX
解决方案可以最大限度消除计划内中断。PowerHA
V5.4
支持Linux,可以将其很多强大的功能和传统扩展到Linux
环境。对Linux支持将包括可用于AIX
的可靠监控和故障检测基本功能。
3.2)
PowerHA/XD
for
AIX
(HACMP/XD)
通过PowerHA/XD
可以实施容灾解决方案。PowerHA/XD(Extended
Distance)是PowerHA
for
AIX
的一个可选特性,可以提供GLVM(Geographic
Logical
Volume
Manager)异步模式,并支持SVC
Global
Mirror。这两种选项都可以将应用切换到远程站点的备份资源,
而不会影响生产应用环境中的性能(考虑针对园区级距离专门优化的同步复制方法)。PowerHA/XD
使用自身同步模式LVM
AIX
镜像技术,
通过与对于Enterprise
Storage
Server?
(ESS)、IBM
System
Storage?(DS6000?
和DS8000?)和SAN
Volume
Controller(SVC)Metro-Mirror
对等机的园区级故障切换和对于IP
连接对等机故障切换的透明集成,从而能够提供支持。
当PowerHA
for
AIX
检测到一个故障时,
它可以在一个远程冗余系统上将其重新启动,从而能够快速、自动地采取措施,恢复该应用。
PowerHA/XD
能够在镜像多个站点间的关键任务数据的同时,还能够将故障切换到这些远程站点,这种特性对于必须保护自己避免出现站点间故障或大规模灾难的客户来说,是至关重要的。这种特性可以应用到拥有多个站点、地区运营的任意规模的企业,或者希望分散管理数据的任意地点。PowerHA/XD
提供多种技术,可以实现远距离数据镜像、故障切换和重新同步。
PowerHA/XD
实现的容灾,可基于两种技术实现:Metro
Mirror
和GLVM。
Metro
Mirror(城域镜像):如图所示为带IBM
DS8000
的PowerHA/XD
高可用性集群企
业级解决方案,DS8000
提供Metro
Mirror
功能,数据通过FC
网络进行复制。可以实现随需应变的服务器角色切换、离线磁带备份,最大限度地降低日常管理要求。
GLVM:如图所示为PowerHA
/XD
for
AIX
地理分布式存储镜像集群,通过GLVM
功能,基于IP
网络实现数据复制:
3.3)
Capacity
BackUp
实现业务连续性
对于高端IBM
Power?
595
服务器,可以使用一个专门配置和定价的Capacity
BackUp
系统实现远程站点安装。该服务器包括一个最少数量的活动处理器和大量非激活的随需应变(CoD)处理器,可以在需要进行灾难恢复时临时激活。一个PowerHA
集群可以自动检测生产系统的缺失,从而能够激活Capacity
BackUp
系统,将客户关键应用切换到所需数量的CoD
处理器中,保持业务的正常运行,并将服务损失降至最低。
3.4)
PowerHA
Smart
Assists(智能助手)简化应用部署和配置
简化PowerHA
在
DB2?
、Oracle
和WebSphere?
环境中的实施与配置。通过部署特定应用的知识,扩展PowerHA
标准自动恢复特性,Smart
Assists
产品包可提供所有必要的应用监控器和开始/停止脚本,简化整个配置流程。
PowerHA
解决方案在IBM
Power?
Systems
上的AIX
和Linux
操作系统下运行。通过创新的技术、逻辑分区、开放标准对于应用灵活性的广泛支持、以及管理IT
基础设施的全方位工具,这些服务器可以提供如今需求不断增长的业务环境所需的性能、可用性、可扩展性和基础设施管理。它们将IBM
Power
Architecture?
技术与受大型机启发的RAS(可靠性、可用性和可服务能力)特性与OS
的收益相结合,用于有效管理关键任务应用。
4)IBM
Power
服务器业务连续性技术优势
IBM在方案、技术及支持服务方面也有着其他厂商无法比拟的优势:
Power
Systems
具有一系列独有的RAS(可靠性、可用性和服务性)特性,关键部件动态隔离,FFDC
(首次故障数据捕捉)、计算校验防护技术等等;
AIX
操作系统可靠性远高于竞争对手,POWER6
提供独有的
Live
Partition
Mobility
功能;
PowerHA
稳定可靠,提供业界最全面最强大的集群及容灾功能。
LVM技术是AIX
操作系统中的缺省技术,只需要少量的实施费用。