机房搬迁总体方案
??????信息中心机房
搬迁实施方案
1
目 录
第一章 项目介绍 ............................................................. 2 一. 项目描述 ................................................................ 2 二. 机房主要设备详单 .................................................. 2 第二章 机房搬迁实施方案 ............................................... 6 一(人力安排 ................................................................ 6 二(设备情况调研 ......................................................... 7 二(搬迁准备 ............................... 错误~未定义书签。12
二(搬迁实施 ............................... 错误~未定义书签。14
第三章 系统应急与灾难恢复方案 ................................... 18
第四章 注意事项 ........................................................... 20 第五章 后期维护 ............................ 错误~未定义书签。18
2
第一章 项目介绍
一( 项目描述
??????
计划
项目进度计划表范例计划下载计划下载计划下载课程教学计划下载
将位于原???大厦2楼机房中的所有计算机设备搬迁至新大楼的中心机房,为了确保整个机房搬迁的顺利进行,保证将所有设备安全可靠搬迁到新的机房,并确保所有设备和应用系统及时正常启动,确保业务系统正常开展和数据的安全有效,???电脑科技公司(以下简称???)将承担制定的信息系统设备搬迁任务,提供具体的实施技术方案。
二(机房主要设备详单
1、小型机+磁盘阵列(双机加阵列)
(1)HP rx7620(2台)+日立HDS 9570
主机:8*Intel Itanium 2 CPU,16G PC2100 ECC内存,36.4G SCSI硬盘,10/100/1000BT以太网口,2N+1个冗余热插拔电源。 备机:4*Intel Itanium 2 CPU,8G PC2100 ECC内存,36.4G SCSI硬盘,10/100/1000BT以太网口,2N+1个冗余热插拔电源。 存储:146GB 10RPM磁盘22个。
McDATA4300光纤交换机(2台):4*光纤模块。
(2)IBM P630(2台)+IBM 7133
主/备机:POWER4+1.2G*4,4GRAM,36G*2, 单电源,双网卡。 存储:4*146GB。
2(服务器
(1)IBM x3850 M2(3台)(保内)
3
A(其中2台:2*Xeon 7350,8*1GB,3*HS 146G SAS,2*1440W。 B(其中1台:4*Xeon 7330,8GB,3*HS 146G SAS,2*1440W。 (2)IBM x3650(4台)(保内)
至强MP3.0GHz,4G内存,3*73.4G SCSI热插拔硬盘。 (3)IBM x365(4台)(保外)
4*至强MP2.2GHz,4G内存,3*73.4G SCSI热插拔硬盘,双千兆以太网适配器,双电源。
(4)浪潮英信NF420R(2台)+磁盘阵列(保外)
主/备机:Xeon MP2.2G*2,4GECC DDRRAM,73 G *2,双电源,双网卡。 存储:73 G *4。
(5)浪潮NF560D2(2台)+AS400光纤磁盘阵列(保内) 主/备机:2*四核XeonE7420,8G内存,3*146G 15000转热插拔SAS硬盘,2*千兆网卡,热插拔1200W 1+1冗余电源。
存储:8*300G 15000转SAS硬盘。
(6)曙光I220-XV1塔式服务器(2台)(保外)
X2.4/1G/36G。
(7)曙光R220-MP1机架式服务器(4台)(保外)
2颗XEON MP2.0G CPU,4G ECC DDR内存,2块36G SCSI热插拔硬盘,双1000M RJ—45网卡,冗余双电源
(8)维豪机架式服务器(3台)(保外)
(9)IBM x345(1台)(保外)
(10)IBM x346(1台)(保外)
4
(11)浪潮英信NF360R(1台)(保外)
(12)信产局曙光服务器(2台)(保内)
3(网络设备
(1)华为NE05路由器(1台)(保外)
(2)华为S6506交换机(3台)(保外)
(3)华为S3026C交换机(4台)(保外)
(4)华为S3026E交换机(3台)(保外)
(5)华为AR 28-80路由器(1台)(保外)(省厅设备) (6)华为2600系列路由器(1台)(保外)(省厅设备备份) 4(安全设备
(1)东软NetEyeFW4120防火墙(2台)(1台保外,1台保内) (2)东软NetEyeFW4120 VPN网关(1台)(保外) (3)意源IB-NPS3000网闸(1台)(保外)
(4)华为Eudemon200防火墙(1台)(保外)
(5)天融信NGFW4000-T防火墙(1台)(保外)(未启用) (6)东软NetEye IPS7100(1台)(保内)
(7)H3C SecPath F100-A-SI防火墙(1台)(保内)(信产局) 5(不间断电源
科士达UPS:30KVA,10组电池柜,120节电池,保外。 6(空调
格力空调
7(涉及的软件
5
软件包含了IBM 微码、操作系统和双机软件。HP微码、操作系统和双机软件。所有PC 服务器操作系统和机群软件和所有网络、安全设备的管理配置软件。WEB LOGIC 中间件,ORACLE数据库。容灾软件,山大???应用软件。
6
第二章 机房搬迁实施方案
一、人力安排
工程师 主要负责内容 人数 责任单位 HP小型机工程师 负责HP小型机软硬件系统调研、拆装、维2 ???
修、运行维护;项目负责人
IBM小型机工程师 负责HP小型机软硬件系统调研、拆装、维2 ???
修、运行维护;
网络工程师 负责UPS的调研、拆装、维修、运行维护 2 ??? PC 服务器工程师 负责PC 服务器的调研、拆装、维修、运行2 ???
维护
UPS工程师 负责UPS的调研、拆装、维修、运行维护 1 ??? 空调工程师 负责空凋的调研、拆装、维修、运行维护 1 ??? ORACLE数据库专负责数据库的调研、安全、维修、运行维护 2 当地 家
运输团队 比较专业的运输公司出人力和搬运设备 多人 ??? 商务辅助 提供预防性设备到场; 2 ???
当出现设备损坏及时补充备件到场
灾难恢复专家 确保不出现数据丢失 1 ??? 系统整合 完成硬件的整合和重建,确保系统整体可用2 ???
7
性 山大??
?
用户
二(设备情况调研
1(当前机房摆设配置图
8
2(各个机柜中的机器型号
3(根据现场调研绘制总体网络拓扑结构图
???通过调研原来单位的网络拓扑结构,绘制一份全面网络拓朴图,提出需要对核心交换机、路由器等关键网络设备备份IOS,同时导出一份配置信息。此工作由??经验丰富的网络工程师负责,保
9
证搬迁后系统的正常工作。
总体网络拓扑结构图:
10
4(各个机器的运行软件调研情况:
(1)HP rx7620(2台)+日立HDS 9570 操作系统:hpux 11.23
应用:oracle 10g
(2)IBM P630(2台)+IBM 7133 操作系统:AIX 5.3
应用:oracle 9i
(3)IBM x3850 M2(3台)
操作系统:windows server 2003 应用:weblogic,???自动备份系统
(4)IBM x3650(4台)
操作系统:windows server 2003 应用:weblogic
(5)IBM x365(4台)
操作系统:windows server 2003 应用:weblogic
(6)浪潮英信NF420R(2台)+磁盘阵列
操作系统:windows server 2003 应用:瑞星网络版系统中心,???网络监控,容灾监控,oracle 9i
11
(7)浪潮NF560D2(2台)+AS400光纤磁盘阵列 操作系统:windows server 2003 (8)曙光I220-XV1塔式服务器(2台)
操作系统:windows server 2003 应用:瑞星系统中心
(9)曙光R220-MP1机架式服务器(4台)
操作系统:windows server 2003 应用:weblogic
(10)维豪机架式服务器(3台)
操作系统:linux/unix
应用:安全系统
(11)IBM x345(1台)
操作系统:windows server 2003 (12)IBM x346(1台)
操作系统:windows server 2003 应用:网站服务器
(13)浪潮英信NF360R(1台)
操作系统:windows server 2003 (14)信产局曙光服务器(2台)(保内)
操作系统:windows server 2003
12
5(新机房摆设位置规划图:
新机房摆设具体由搬家当日决定摆放位置。
三、搬迁准备
1(设备迁移前的准备工作(新机房)
1) 新机房内的准备工作主要是对于机房环境的确认,包括:市
电供电系统环境确认,供电系统线路情况确认,各种电压测量,
空调设备的正常运转情况。新场地的环境要达标,电压,,,,,
零地电压小于,,,温度在,,摄氏度正负,摄氏度之内。电源
插座符合小型机的要求。
2)、根据静电地板承重能国规划各个机柜、各个网络设备的摆
13
放位置。可以事先量好机器的具体尺寸,之后到现场规划机器的
具体摆放位置,力争最合理、最充分地利用机房的有效空间。
3)、UPS供电系统,电池供电性能检测,UPS主机参数确认,
UPS供电输出参数测量。这是有一点要注意,关键服务器的电源
插座要参考老机房的插座
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
制作,确保规格和型号保持一致。
提前准备好电源,保证服务器到位能及时上电测试。
4)、网络环境确认
对新机房的外网要提前调试好,测试与远程各点的连通情况,
特别要保证关键医院、药店的联网情况。内网布线调试工作提前
做好,保证核心交换上架后各楼层内网能正常。
新机房的环境准备工作要提前做好,关键的电源、网络准备
充分后,才能进行搬迁,否则一旦某个环节出现问
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
,将影响业
务正常启用。
2( 运输方案确定
(1)运输公司的确定,在当地或就近聘请机房专业的搬家运输公司。运输人力在8人以上,并由升降车,平推车等。
(2)搬运线路的勘查。
(3)木箱、海绵、防震垫、海绵、防静电袋、硬盘专用箱等准备。
(4)阵列硬盘单独包装运输。
(5)主机采用部分整体搬迁模式运输。
3(人力准备
??、运输公司、山大???、用户等相关人员在2周前确定
14
协调一致。
4(备份工作
(1)数据备份
所有关键数据(包括程序,数据库,各服务器的配置参数、操作系统等)的全备份。其中数据库数据备份前1天先做1套备份,一套备份在1TB的移动硬盘上,以套备份在磁带上,备份出来的介质经验证可靠后单独存放,专人保管。
以上工作在搬迁的前几天可以分期完成,系统备份工作平时也是工作内容。
(2)系统软件备份
操作系统除了hp小型机的hpux操作系统和ibm小型机的aix操作系统外,其他与都是windows server 2003,基本应用为weblogic,oracle,???软件系统等都要备份。首先确保极其的系统盘严格有镜像备份,其次要用磁带完成系统备份。
在给主机关机断电之前,需要严格按照顺序来关闭应用软件及进程,等所有应用软件进程全部停止,则关闭操作系统。
四(搬迁实施
1(最后一次完整数据备份工作
所有关键数据(包括程序,数据库,各服务器的配置参数、操作系统等)的全备份。其中数据库数据备份做两套备份,一套备份在1TB的移动硬盘上,以套备份在磁带上,备份出来的介质
15
经验证可靠后单独存放,专人保管。
在搬迁前(服务器关机下电前)要最后做一次完整的全备份。
2(标记线缆和设备
由相关硬件工程师对服务器和存储设备的连接进行打标工
作,在设备的显著位置标记编号,在线缆的两头标记所连接的设
备编号,并在标记过程中对设备和线缆的位置有一个总体上的认
识。
3(机房搬迁步骤(设备至新机房)
如果新、老机房的各项准备工作提前做好做细,机房的整体
搬迁从进场准备到搬迁、测试完毕大概需要三天时间,搬迁工作
建议发布停机3天的通告。大致可以安排在第一天各设备下架搬
迁,第二天各设备上架加电测试,第三天整体测试。
具体的搬迁步骤统计在下面表中:
步骤 时间 主要工作内容 负责方
关键数据的全备份,注意检查确认备
数据备份 停机后 ???、应用方
份有效性。
检查各个设备连线,信号灯,液晶显
小型机、存储巡检 停机后 ??
示屏等,查看是否有错误,检查标签 网络设备检查 停机后 核对各交换机端口,记录配置信息 网络集成商 应用服务器检查 停机后 核对应用服务器配置信息 ???、应用方
说明:以上检查工作在做备份时同步进行
小型机、存储关机 第一天 正常关闭双机、数据库系统后下电 ?? 小型机、存储下架 第一天 将机器下架出机柜,同时做好编号 ?? 其它设备下架 第一天 包括网络、应用服务器等设备的下架 网络工程师、??
16
步骤 时间 主要工作内容 负责方
做好 ?
看需要,关键设备最好包上塑料膜防
下架设备打包 第一天 搬家公司
震
说明:下架工作各司其职,做好自已设备记录,螺丝包装好做上说明
安排一辆货运车,一次性的把与主机和磁盘阵列相关所有
的设备都运输到新机房大楼,准备好一些防雨的油布或塑
料薄膜可以以防万一下雨时挡雨用(了解天气情况,最好装车搬运 第一天
不要安排雨天搬迁)。注意过程中尽量避免剧烈的碰撞。到
达新机房后,将设备按照放置到机柜附近位置并清点设备
清单,避免搬迁过程中有所遗漏。
小型机和机柜到了新机房后,即可安
小型机、存储上架 第一天 排人员上架,同时按原来的位置做好??
连线工作
将小型机及存储阵列上电,并按照磁
盘阵列、小型机的顺序依次开机,注
意的是,要待上一台系统启动完毕后
小型机、存储加电测再开下一台设备。启动后,检查磁盘
第一天 ??
试 阵列,小型机信号灯是否正常,在磁
盘阵列和小型机上检查错误日志,看
其是否正常启动。最后在小型机上检
查阵列上的文件系统是否被正常识别
按照原先记录的位置将所有网络和安
全设备以及应用服务器上架并连接,
网络、服务器等上架并给设备上电开机,检查其参数及规
第一天 网络、应用 加电测试 则设定,检测搬迁过程有没有损坏设
备硬件,以及原有设备规则设定是否
保存良好。
说明:为节省时间,第一天如果能完成搬迁工作,当晚加班将设备先上架加电测试,主要看
17
步骤 时间 主要工作内容 负责方 设备能不能正常启动起来,有无告警灯,这样还有时间及时更换备件。如果搬迁工作一天很难完成,尽量先搬关键设备如主机、存储和其机柜,我们会为您及时检查设备情况
连接好各网络设备的网线,测试内外网络、应用、运营网络连接、调试 第二天
网是否正常,保证网络正常运行 商 双机及数据库启动 第二天 测试数据库是否正常 ??、应用
应用服务器接入网络,测试能否连上
应用服务器启动 第二天 ???、应用
数据库
说明:以上可以同步进行,内外网可以同时连线,内网通了就可以做数据库连接测试
数据检查 第三天 检查数据库中数据是否正常 应用 应用全面测试 第三天 检查应用程序是否正常 应用
测试备份系统能否正常备份,确保数
备份系统测试 第三天 应用
据安全。
容灾系统测试 第三天 测试原有容灾系统是否正常 应用、???
第三章 系统应急与灾难恢复方案
1.应急措施
前提:所有的和数据备份完整无缺,容灾系统正常。
具体内容:
(1)当数据发生丢失的时候,使用备份数据来恢复;
(2)当ORACLE数据丢失时,我公司直接联系ORACLE原厂工程师提供灾难恢复工具并解决问题及数据的恢复。以保证数据的安全可靠性。
(3)当服务器硬件发生故障的时候,立即联系我公司备件中心,尽快更换备件,如果该主机有集群,把应用系统切换到集群
18
系统备机上,如果是非集群主机,暂时调整应用,尽量使应用系统先运行起来。
(4)发生严重灾难主备机都无法正常工作时,启用容灾系统,保证容灾系统网络正常。
(5)如主机有硬件故障,从最近的备件库提取相应设备更换之。
2.提供整机、阵列、易坏件到场,保证系统安全
(1)提供一台小型机以作备份机器使用,事先在备机上安装和现场一样的操作系统和ORACLE,以便及时切换。
(2)针对核心数据存放在HDS存储上的现状,提供一台HDS9500V存储以作备份使用,如果发生阵列损坏的灾难性故障问题,则及时切换使用。
(3)提供IBM pcserver和其他的pcserver的硬盘(曙光,浪潮)各2块。
因为在搬家过程中,硬盘是最容易损坏的硬件,如果有损坏,及时更换。
(4)提供华三交换机模块2个以作备份,如果搬迁过程中出现问题,把备份的配置信息及时恢复。
(5)提供小型机连接的san,switch模块2个,光纤线5根,在插拔光纤的时候容易把光纤线或者模块搞坏,如果出现类似光纤不同状况,急于更换。
(6)提供ibm 7133 存储硬盘2块,存储虽然有raid5 和
19
hotspare的保护措施,但是在损坏硬盘的时候要急时更换。
(7)提供网线及水晶头或成品的网线,在搬运网络柜的交换机
时,避免不了一些网线无法使用等情况。
(8)赠送2个IBM p630电源,由于现在的电源是单电源,
对小机的安全隐患有很大的危险,在搬迁之前升级为冗余电源。
(9)提供P630和RX7620小型机的电源及硬盘1个,在出现
损坏的时候及时更换。
第四章 注意事项
(1)特别注意人身安全:首先注意不要触电;其次由于机柜、机架等都是金属,有较锋利边缘,易划伤手;机器等都很重易砸伤脚,要特别注意。
(2)搬迁前的准备工作一定要细致,对各个设备的布局和线缆的位置要了解清楚,并做详细的标注,包括出具结构拓扑图,位置示意图,设备和线缆的标记,系统重要数据的备份等等。
(3)搬迁时,尽量避免剧烈的碰撞,要做到轻拿轻放,在装车时,各个设备和设备与车厢之间要放置泡沫塑料或纸板来减轻运输途中的碰撞。
(4)搬迁前和搬迁后都要根据设备清单对设备进行清点,避免遗漏。 (5)整个搬迁过程中,和各个应用系统和设备负责人、服务商做好沟通协调工作。
(6)UPS的搬迁可能耗时较长,设备加电测试时可以先用市电进行。
20
单位最好在新机房留用电工及时配合。
(7)搬迁前
通知
关于发布提成方案的通知关于xx通知关于成立公司筹建组的通知关于红头文件的使用公开通知关于计发全勤奖的通知
网络运营商提供线路切割。
第五章 后期维护
机器搬迁重新建立系统,经测试完全正常使用,并维修替换完所有搬迁中的损坏部件后,主要人员需要在现场观察3天以上,项目负责人需要在系统稳定工作1周后撤离。
在系统搬迁稳定后的3个月内维护所有相关设备。维护服务内容和级别按照7*24小时金牌服务级别执行。
附:搬迁后期维护服务
细则
测试细则下载防尘监理实施细则免费下载免费下载地暖施工监理细则公路隧道通风设计细则下载静压桩监理实施细则下载
一( 维护总则
为了确保甲方计算机综合业务系统稳定、可靠的运行,?
21
??保证以高素质的技术人员、快捷的响应和充分的备件支持
向甲方提供优质可靠的系统维护服务。服务内容包括系统硬件
维护和软件维护服务;协助甲方进行系统管理、软硬件升级并
提供相应的的系统培训与技术咨询。
本方案所涉及的甲方硬件及软件系统除特别说明以外均以
列在方案附件中双方所确认的清单为准.
二( 系统维护的范围
???承担甲方机房系统范围包括:
在维护期内所有发生故障不能正常工作的硬件设备的免费替
换;
严格履行本甲方案所规定的响应时间内的上门服务或远程技术
支持;
系统定期预防性软硬件检查维护;
系统故障排除响应服务;
协助甲方进行系统软硬件升级;
协助甲方业务系统的正常运行维护。
1( 硬件系统维护
当系统硬件发生故障时,乙方工程师将携带备件以最快速度赶
到故障现场进行故障检测、维护,恢复甲方系统正常运行。如
果故障在短时间内无法排除,我公司将为贵单位提供替代整机,
恢复贵单位业务系统正常工作。
1) 乙方根据甲方所列之设备清单,严格执行年度维护工作。
22
2) 维护期内定期巡检服务:
乙方提供月度巡检的目的在于通过巡检及时发现和纠正可能出
现的硬件问题, 从而在最大程度上为设备的连续稳定运行提供
了保证, 巡检内容主要包括:
A. 系统检测运行诊断;
B. 检查主要设备备件运行和外围设备运行情况; C. 检查所有连接接口, CABLE, 电源稳定性等可能容易导致设备
出现问题的敏感备件;
D. 检查系统 Error Log File, 和清理 Error Log File; E. 协助用户机房技术人员, 解决和分析日常设备运行中出现的未
解决问题。
F. 维护期内对所有维护设备的故障备件均给予免费替换和安装服
务,并确保所有替换备件为HP原厂备件且均经过乙方严格的原
机检验测试,以保证备件的性能和质量。更换的设备自更换日起
保修3年。
2( 软件系统维护
1) 操作系统
乙方将定期检查操作系统中的系统设置和系统日志,以确认系
统是否在正常的状态下运行,同时对系统运行过程中所产生的
垃圾文件和日益膨胀的日志文件进行清理。如果系统运行出现
异常,乙方将协助甲方对在HP-UNIX进行系统性能调整和系统
优化,提高系统效率和安全性。
23
2) 双机热备份软件
在每季度预防性检查维护中,我公司会对HP-UNIX系统进行详细检查,并进行模拟故障测试,以确保在发生故障的情况下保证备份机能够正常接管生产机的工作.
3) ORACLE数据库系统
对于主机内数据库出现的问题,马上热线电话支持。指定专门技术人员支持甲方有关技术人员工作.
(提供专业的软件系统日常维护和管理使用建议; A
B(提供定期的系统健康检查,消除潜在问题的发生;
C(软件系统出现问题时提供及时、专业的技术支持;
D(系统崩溃时完成软件系统的重新安装、配置; E(完成客户软件打补丁的需求,使打完补丁后的软件环境能够正常运作,发挥软件应有的功能。
F(对软件系统进行性能方面的分析、评估、调整,以提高软件系统的整体性能。
G(完备的软件系统备份和恢复解决方案,满足系统自动、快速的备份和恢复要求,使得应用系统能更好的满足7天24小时的业务要求。
24
H(系统软件安装好或需要重装其它软件的基础上,乙方负责对
客户的设备进行软件的安装、调试支持。
I(对软件进行性能方面的分析、评估、调整,以提高系统的整
体性能。
J(软件升级时乙方提供免费技术服务,但若涉及到软件版本的LICENSE费用时由甲方承担。
4)应用系统软件
对于主机内应用系统软件出现的问题,我公司将主动配合贵公司
从系统层面上分析故障的原因,同时在需要的情况下,积极配合用户
或有关应用软件开发商,及时找出设备故障原因,尽快恢复贵公司的
业务运行。
5)网络系统
a) 网络设备故障诊断及恢复
b) 现有网络系统的优化策略实施
c) 与其它厂商产品的互联技术支持
d) 提供甲方系统建议升级方案
e) 对甲方设备进行质保管理,保修期内合同涉及的设备如果
已经超过原免费保修期的将由乙方购买安装。
f)针对用户的其他特殊要求,也将根据具体情况提出利于用户
25
业务发展的建设性意见。
g)甲方购买备件后,由应用集成商进行系统集成。同时乙方
也要进行辅助技术支持。
三、系统服务方式及内容
1(单独技术支持服务小组服务
为了确保甲方的主机系统能在维护期内正常运行,乙方将针对甲方主机系统维护项目成立维护小组,由一名HP认证工程师负责组织和协调甲方的系统维护工作,这名工程师将配备手机,保证在7×24小时内能全天候答复用户提问,对于甲方主机软件系统发生的一切问题,这名工程师都将负责安排有效的维护工作。
项目组长:
2(热线电话
乙方提供7×24小时服务热线电话,在甲方发现系统故障或遇到难以解决的疑难问题时给予立即响应。
乙方服务热线电话:
3( 系统预防性检查维护
系统预防性检查维护是指每隔一定的时间,乙方工程师对甲方的主机系统进行全面检测,确认设备运行状态,检查系统错误记录,排除潜在隐患,以确保业务系统能正常稳定的运行。具体维护计划为:
26
1) 由乙方提供系统性能侦测软件,每个月定期运行一次,然后由甲方工程师通过E,Mail将运行结果发送给乙方,乙方维护小组的工程师将对收集的系统信息进行分析,并提供相应的结果分析报告。
2) 乙方每个月派经验丰富的主机工程师和数据库管理工程师到甲方主机系统进行预防性检查维护。
主要工作包括:
a) 检查机房环境
内容包括:检查机房内的温、湿度,空调数量及状况,UPS电源的状态及输出电压,保护地电阻及零地电压,检查电源线及接线插座是否安全可靠。
b) 检查主机的运行状况
内容包括:主机的配置情况及序列号,主机是否存在硬件故障,安装操作系统类型及版本,集群软件及版本,填写主机检查表。 c) 检查磁盘柜运行状况
内容包括:磁盘柜配置情况及序列号,磁盘柜是否存在故障,RAID组的配置情况,填写磁盘柜检查表。
d) 清洗工作
内容包括:清扫主机、磁盘柜、磁带库内部的灰尘,清扫设备周围包括地面的灰尘。同时检查主机、磁盘柜、磁带库内的通风状况是否良好,检查各风扇是否良好。
e) 检查软件运行状况
27
内容包括:文件系统磁盘空间使用率是否超过85%,CPU的使用率是否超过80%,内存的使用情况,及内存的交换区(paging space)使用率是否超过70%,系统运行是否正常,系统及数据盘是否做过近期的备份,双机切换是否正常。
f) 检查数据库运行状况
内容包括:检查数据库日志使用情况,是否有报错,数据库设备空间使用情况,是否需要碎片整理。
g) 预防性工作
内容包括:为系统及数据盘进行全盘的备份,数据盘的备份可考虑在磁盘柜内部及本地盘双备份的方案,尤其是在HP-UNIX系统下的应用数据及数据库。检查、调整更换不安全的电源插座,电源线。检查主机内部电源及接线是否安装良好。检查、阅读日志文件,察看是否有错误报告,并分析原因。询问值班人员或察看值班记录有无以往的错误报警。
1. 乙方工程师将会经常性主动打电话给甲方工程师,及时了
解甲方系统的运行状况。
4(软硬件系统安装、升级服务
5.1 OS版本升级安装
当OS操作系统有新的版本或补丁,服务商应及时通知客户,并根据实际情况讨论是否需要升级安装,需要升级时服务商应及时派工程师上门升级。
28
a) 对OS版本升级的计划及准备提供建议 b) 安装新版本的OS
c) 在新版本OS上调试系统配置并合成用户资料 d) 对已安装的新版本OS进行测试及确定其基本功能
四( 维护服务流程图
专家现场支
美国HP及美国合作持持持
伙伴技术支持
请求技术支培 持 训
及
技
术
否 支
持
是 是否远图技术专家组 解决
故障
维技 护术请求技术支持 文跟
否 档 踪
远图维护项目组 是否
解决
故障 培 是 故巡检 训
障、
解决故障 报技巡检发现故障及 修 术隐患 交
流
故障29 HP 小型机 服务报告文档 甲方 发 生
响
应
支 持
一旦用户与我公司技术支持中心或维护项目组取得联系后,或巡检发现故障,公司内部的技术或备件的协调将立即展开,确保工程师在第一时间和用户联系并处理安排工作,获取备件并赶赴用户现场解决问题。服务结束后,公司接线生将征求用户意见,并填写技术服务报告。
五(故障处理流程图
故障报告或服务请求
记录时间及现场信息
故障初步诊断
系统软件故障 硬件故障
电话解决故障
非关键故障 关键故障
30 Y 故障 是否影响 N 是否解决 系统运行
贵行指定时间 N Y
现场服务或
六. 服务档案
1( 建立系统维护档案
对甲方的所有服务范围内的主机系统,乙方将建立相应的系统维护档案,均根
据每次故障维修报告和预防性维护报告建立技术档案,记录每次故障响应服务
和预防性维护的详细信息。
2( 维护报告
乙方每个月派经验丰富的系统工程师到甲方主机系统进行预防性检查维护。并
在两周内提供季度维护报告。
七、系统出现故障的响应速度及处理预案
1(紧急故障响应和故障排除服务模式
1(800专线电话
乙方应提供7×24小时技术支持专线电话,当甲方发现系统故障或遇到疑难问题不能解决时,乙方将给予认真及时的响应。甲方也可以随时通过电话向乙方技术人员要求提供协助以解决与需要维护的硬件、软件系统有关的日常运作、安装和使用(怎样用)等简短问题。
2 .故障响应时间 7*24小时
乙方提供的故障服务是7×24小时故障响应服务,具体响应方式及响应时间将根据主机的故障严重程度而定(见下表)。
对于不影响业务工作的一般性非系统崩溃故障,乙方工程师将在接到电话、传真、E-mail等任何形式的故障通知后,10分钟内提供故障热线支持服务。其方式包括通过电话进行技术支持或远程
31
登录ORACLE。并根据用户要求和实际情况提供现场维修服务,如
果系统崩溃或系统故障已导致正常业务工作已不能正常进行,乙方
工程师将在接到电话、传真、E-mail等任何形式的故障通知后,
立即提供电话支持服务,并同时以最快的速度提供现场技术支持。 3.故障解决保证预案
A、备件保障
乙方在上海备件库有备件库存,在上海备件库有充足的小型
机备件。
乙方从美国IBM/HP备件中心获取备件,48小时内到客户处。
B、技术保障
指派一名于HP从事维护工作多年的技术工程师为专职工程师;
指派一名于IBM从事维护工作多年的技术工程师为专职工程师;
指派一名于ORACLE从事维护工作多年的技术工程师为专职工程师;
指派一名于从事网络维护工作多年的技术工程师为专职工程师;
C、故障解决方式(7*24小时服务)
乙方技术人员接到甲方电话、传真、E-mail等任何形式的故
障通知后,立即提供电话支持服务,并通过服务方工程师的情况
描述和Error Report,迅速做出故障初步判断。
32
第一步、电话支持,首先保证应用业务的正常运行。若主机
故障停机,则确保备机能替代主机运行,若双机软件没损坏则是
自动的,否则工程师将通过电话支持方式,支持甲方系统管理员
手动方式启动备机,恢复应用。2小时确保实现。若出现备机也
损坏的情况,则立即从上海备件库中紧急运送(18小时内)一台
小型机到场,到场后4小时内实现系统的恢复。即24小时内解决
故障,恢复系统。
第二步、在乙方工程师电话支持下,甲方系统管理员解决排除简
单非硬件性故障。
第三步、在乙方工程师电话支持下,甲方系统管理员不能自行解决排除故障,乙方则紧急排除工程师到场处理。如初步判断硬件损坏,技术人员同时携带相关配件赶往现场。到现场经过检测确实需要更换配件,若乙方技术人员携带有相应的备件,则立即予以无条件更换;若乙方技术人员没有携带相应的备件,乙方则紧急协调备件,保证在24小时内更换配件,恢复设备正常运行。
第四步、在硬件出现故障,短时间内无法恢复也无法提供配件的情况下,乙方则为服务方提供一台备机,确保客户业务应用不中断。在服务方提供有效的系统、数据备份条件下,除去4小时备机应急安装时间,要使备机达到正常工作状态,以保证业务的正常运行。如故障排除牵涉到数据恢复,乙方则根据数据的备份记录将数据恢复到原始状态,同时根据恢复的情况,提出日常的备份建议和恢复计划。对于特别复杂的系统综合性故障,则和应用开发商一起协调处理,48小
33
时解决故障,恢复系统应用。
34