首页 硬件运维项目系统运维方案

硬件运维项目系统运维方案

举报
开通vip

硬件运维项目系统运维方案硬件运维项目系统运维方案硬件运维项目系统运维方案PAGE/NUMPAGES硬件运维项目系统运维方案软件系统运维方案2016年08月目录XX系统的服务内容1.1服务目标可为供给的运行保护服务包含,信息系统有关的主机设施、操作系统、数据库和储存设施的运行保护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。同时依据平时保护的数据和记录,供给用户信息系统的整体建设规划和建议,更好的为用户的信息化发展供给有力的保障。用户信息系统的构成主要可分为两类:硬件设施和软件系统。硬...

硬件运维项目系统运维方案
硬件运维项目系统运维 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 硬件运维项目系统运维方案PAGE/NUMPAGES硬件运维项目系统运维方案软件系统运维方案2016年08月目录XX系统的服务内容1.1服务目标可为供给的运行保护服务包含,信息系统有关的主机设施、操作系统、数据库和储存设施的运行保护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。同时依据平时保护的数据和记录,供给用户信息系统的整体建设规划和建议,更好的为用户的信息化发展供给有力的保障。用户信息系统的构成主要可分为两类:硬件设施和软件系统。硬件设施包含网络设施、安全设施、主机设施、储存设施等;软件设施可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等。经过运行保护服务的有效管理来提高用户信息系统的服务效率,协调各业务应用系统的内部运作,改良网络信息系统部门与业务部门的交流,提高服务质量。结适用户现有的环境、组织构造、IT资源和管理流程的特色,从流程、人员和技术三方面来规划用户的网络信息系统的构造。将用户的运行目标、业务需求与IT服务的相协调一致。XX供给的信息系统服务的目标是,对用户现有的信息系统基础资源进行监控和管理,及时掌握网络信息系统资源现状和配置信息,反映信息系统资源的可用性状况和健康状况,创立一个可知可控的IT环境,进而保证用户信息系统的各种业务应用系统的靠谱、高效、连续、安全运行。服务项目范围覆盖的信息系统资源以下方面的要点状态及参数指标:运行状态、故障状况配置信息可用性状况及健康状况性能指标1.2信息财产统计服务此项服务为基本服务,包含在运行保护服务中,帮助我们对用户现有的信息财产状况进行认识,更好的供给系统的运行保护服务。服务内容包含:硬件设施型号、数目、版本等信息统计记录软件产品型号、版本和补丁等信息统计记录网络构造、网络路由、网络IP地址统计记录综合布线系统构造图的绘制其余隶属设施的统计记录硬件设施清单以下表统计:1.3网络、安全系统运维服务从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。网络、安全系统基本服务内容:序号服务模块内容描绘配适用户进行,按备1现场备件安装件抵达现场时间工程师抵达现场第一剖析软件升级2现场软件升级的必需性微风险,配适用户进行软件升级按服务级别:7×243现场故障诊疗小时5×8小时4电话远程技术支持7×24小时供给方XXXXXXXX对碰到的问题进行XX问题管理系统汇总和公布网络核心互换机巡视典型作业计划书系统管理单位:维保单位:设施名:设施型号:管理IP:检查内容参照标准检查巡视方巡检周检查结论期结果法描绘电源运□正常□异样行状态风扇运□正常□异样硬件运行状态行状态模块运□正常□异样行状态VLAN□正常□异样状态配置□正常□异样系统运行状态检查状态OSPF□正常□异样状态日志□正常□异样日记检查状态□正常□异样其余检查内容□正常□异样□正常□异样用户现场技术人员值守可依据用户的需求供给长久的用户现场技术人员值守服务,保证网络的及时连通和可用,保障接入互换机、汇聚互换机和核心互换机的正常运行。现场值守的技术人员每日记录网络互换机的端口能否能够正常使用,网络的转发和路由能否正常进行,互换机的性能检测,进行整体网络性能评估,针对网络的利用率进行优化并提出网络扩容和优化的建议。现场值守人员还进行安全设施的平时运行状态的监控,对各种安全设施的日记检查,对要点事件进行记录,对安全事件的产生原由进行判断和解决,及时发现问题,防患于已然。同时能够对设施的运行数据进行记录,形成报表进行统计剖析,便于进行网络系统的剖析和故障的提早预知。详细记录的数据包含:配置数据性能数据故障数据现场巡检服务现场巡检服务是XX对客户的设施及网络进行全面检查的服务项目,经过该服务可使客户获取设施运行的第一手资料,最大可能地发现存在的隐患,保障设施稳固运行。同时,XX将有针对性地提出预警及解决建议,使客户能够提早预防,最大限度降低营运风险。巡检包含的内容以下:编号巡检内容硬件运行状态检查项目单板状态检查电源模块状态检查电扇状态检查1整机指示灯状态检查机框防尘网检查机房温度、湿度检查设施地线检查软件运行状况检查项目2设施运行状况检查网络报文剖析设施对接运行状况检查路由运行状况检查3网络整体运行状况检查网络运行问题检查网络更改状况检查网络历史故障检查网络运行剖析与管理服务网络运行剖析与管理服务是指XX工程师经过对网络运行状况、网络问题进行周期性检查、剖析后,为客户提出指导性建议的一种综合性高级服务,其内容包含:服务内容服务长处向客户供给网络专家电话号码。保证重要问题第一连线至网络专家。网络专家组每周与客户进行许多于2小时的以最小成本保证及时解答客户关怀的技术问电话技术交流题,并就某一领域技术问题睁开深层次交流。每个月向客户提交CASE汇总剖析报告,并可使客户认识网络历史故障状况以及故障预防扩展到每年17次(月度、季度、年度)建议,最大程度减少网络故障隐患,更高效的进行网络管理。重要时辰专人值守服务深刻知道保证重要时辰设施稳固运行对客户成功尤其要点,所以,XX可对客户供给重要时辰的专人现场值守支持,包含政府客户的重要会议时期、金融客户的年关结算日、营运商客户的生产网重要割接或其余任何客户以为可能对其业务营运产生重要影响的时辰。如需专人值守,客户需起码提早3周与受权服务商客户服务经理联系。对每位合约客户,受权服务商均需按预先 合同 劳动合同范本免费下载装修合同范本免费下载租赁合同免费下载房屋买卖合同下载劳务合同范本下载 商定供给专人值守服务。客户如需高出合同商定范围的更多值守支持,需额外支付相应人力和差旅花费。1.4主机、储存系统运维服务XX供给的主机、储存系统的运维服务包含:主机、储存设施的日常监控,设施的运行状态监控,故障办理,操作系统保护,补丁升级等内容。主机储存系统基本服务内容:序号服务模块内容描绘供给方配适用户进行。按备件抵达现场时间工程设施厂商、1现场备件安装xxxxxxxx公师抵达现场司除去软件破绽给系统带来的安全隐患,并xxxxxxxx公2补丁服务对安装补丁所惹起的系统连锁反响进行司合理的均衡。3升级服务对系统进行软件或硬件的升级,以改良、xxxxxxxx公序号服务模块内容描绘供给方完美现有系统或除去现有系统的破绽。司4现场故障诊疗按服务级别:7×24小时xxxxxxxx公5×8小时司5电话远程技术支持7×24小时xxxxxxxx公司6问题管理系统对碰到的问题进行汇总和公布xxxxxxxx公司7系统优化对客户系统的括主机、储存设施、操作系统、供给优化服务。现场值守人员可进行监控管理的内容包含:CPU性能管理;内存使用状况管理;硬盘利用状况管理;系统进度管理;主机性能管理;及时监控主机电源、电扇的使用状况及主机机箱内部温度;监控主机硬盘运行状态;监控主机网卡、阵列卡等硬件状态;监控主机HA运行状况;主机系统文件系统管理;监控储存互换机设施状态、端口状态、传输速度;监控备份服务进度、备份状况(起止时间、能否成功、犯错告警);监控记录磁盘阵列、磁带库等储存硬件故障提示和告警,并及时解决故障问题;对储存的性能(如高速缓存、光纤通道等)进行监控。小型机系统巡检典型作业计划书(HP服务器部分)系统管理单位:XX供电企业设施名:设施型号设施序列号管理IP:检查内容参照标准检查结果状态能否正常巡检方法描绘巡检周期电源指示灯▅正常□异样面板指示灯▅正常□异样内置磁带机▅正常□异样硬件CPU状态▅正常□异样运行状态内存状态▅正常□异样磁盘状态▅正常□异样网卡状态▅正常□异样HBA卡运行状态▅正常□异样系统日记▅正常□异样Mail▅正常□异样文件系统,包含磁盘▅正常□异样卷节余空间硬件检测▅正常□异样互换分区▅正常□异样系统固件版本▅正常□异样检查补丁包版本▅正常□异样系统镜像▅正常□异样储存磁盘▅正常□异样储存驱动▅正常□异样进度状态▅正常□异样CPU利用率▅正常□异样系统性能内存利用率▅正常□异样检查磁盘I/O性能▅正常□异样小型机系统巡检典型作业计划书(HP服务器部分)系统管理单位:XX供电企业设施名:设施型号设施序列号管理IP:检查内容参照标准检查结果状态能否正常巡检方法描绘巡检周期数据数据库安装目录▅正常□异样库运行状数据库进度状态▅正常□异样态集群集群进度状态▅正常□异样检查集群日记▅正常□异样储存设施故障灯状▅正常□异样态储存SAN互换机端口状态▅正常□异样检查储存互换机环境状▅正常□异样态系统故障报告▅正常□异样1.5数据库系统运维服务供给的数据库运行保护服务是包含主动数据库性能管理,数据库的主动性能管理对系统运维特别重要。经过主动式性能管理可认识数据库的平时运行状态,辨别数据库的性能问题发生在什么地方,有针对性地进行性能优化。同时,亲密注意数据库系统的变化,主动地预防可能发生的问题。供给的数据库运行保护服务还包含迅速发现、诊疗和解决性能问题,在出现问题时,及时找出性能瓶颈,解决数据库性能问题,保护高效的应用系统。的数据库运行保护服务,主要工作是使用技术手段来达到管理的目标,以系统最后的运行保护为目标,提高用户的工作效率。详细数据库运行保护监控的基本服务内容包含:序号服务模块内容描绘供给方1Oracle数据库每周7天,每日24小时支持中心电话,电子邮件xxxxxxxx序号服务模块内容描绘7*24电话支持服务答询,以知足业务发展的需要。Oracle产品技术专家直接同客户对话,帮助解决客户提出的疑难问题。依据问题的严重程度,将优先解决客户以为是关键而紧迫的任务。对客户提出的一般性问题进行技术咨询、指导。按期的客户管理报告,防止问题再度发生。数据库宕机Oracle数据库产品数据坏块2影响业务不可以进行的产品问题现场服务响应软件产品的更新及保护。对系统的配置及运作框架提出建议,以帮助您得到一个更坚毅靠谱的运作环境降低系统潜伏的风险,包含数据丢掉、安全破绽、系统崩溃、性能降低及资源紧张检查并剖析系统日记及追踪文件,发现并清除数据库系统错误隐患检查数据库系统能否需要应用最新的补丁集Oracle数据库产品检查数据库空间的使用状况3系统健康检查辅助进行数据库空间的规划管理检查数据库备份的完好性监控数据库性能确认系统的资源需求明确您系统的能力及不足优化OracleServer的表现经过改良系统环境的稳固性来降低潜伏的系统宕机时间剖析用户的应用种类和用户行为Oracle数据库产品评论并改正ORACLE数据库的参数设置评论并调整ORACLE数据库的数据散布4性能调优评论应用对硬件和系统的使用状况,并提出建议利用先进的性能调整工具实行数据库的性能调整供给方企业xxxxxxxx企业xxxxxxxx企业xxxxxxxx企业序号服务模块内容描绘供给方培训用户有关性能调整的观点供给用户完好的性能调整报告和解决方法1.6中间件运维服务中间件管理是指对BEAWeblogic、MQ等中间件的平时保护管理和监控工作,提高对中间件平台事件的剖析解决能力,保证中间件平台连续稳固运行。中间件监控指标包含配置信息管理、故障监控、性能监控。履行线程:监控WebLogic配置履行线程的安闲数目。JVM内存:JVM内存曲线正常,能够及时的进行内存空间回收。JDBC连结池:连结池的初始容量和最大容量应当设置为相等,并且起码等于履行线程的数目,以防止在运行过程中创立数据库连接所带来的性能耗费。检查WEBLOG日记文件能否有异样报错假如有WEBLOG集群配置,需要检查集群的配置能否正常。运维服务流程建议用户采纳的服务方式为两种:一种为技术人员现场值守,另一种是按期巡检联合故障现场服务。技术人员现场值守运行保护服务的基本操作流程以下列图所示:按期巡检联合故障现场运行保护服务的基本操作流程以下列图所示:服务 管理制度 档案管理制度下载食品安全管理制度下载三类维修管理制度下载财务管理制度免费下载安全设施管理制度下载 规范3.1服务时间接收伏务恳乞降咨询:在5*8小时工作时间内设置由专人职责的热线电话,接听内部的服务恳求,并记录服务台事件办理结果。在非工作时间设置有专人7*24小时接听的挪动电话热线,用于解决内部的技术问题以及接听7*24小机遇房监控人员的机房突发状况报告。服务响应时间:故障级别响应时间故障解决时间I级:属于紧迫问题;其详细现象为:系统30分钟,2小时内12小时之内崩溃致使业务停止、数据丢掉。提交故障办理方案II级:属于严重问题;其详细现象为:出现30分钟,2小时内部分零件无效、系统性能降落但能正常运行,24小时之内提交故障办理方案不影响正常业务运作。III级:属于较严重问题;其详细现象为:30分钟,2小时内出现系统报错或警示,但业务系统能连续运48小时之内提交故障办理方案行且性能不受影响。IV级:属于一般问题;其详细现象为:系统30分钟,2小时内技术功能、安装或配置咨询,或其余明显不5天内提交故障办理方案影响业务的预定服务。技术支持人员在解决故障时,会最大限度保护好数据,做好故障恢复的文档,力求恢复到故障点前的业务状态。关于“系统瘫痪,业务系统不可以运行”的故障级别,假如不可以于12小时内解决故障,XX将在16小时内提出应急方案,保证业务系统的运行。故障解决后24小时内,提交故障办理报告。说明故障种类、故障原由、故障解决中使用的方法及故障损失等状况。3.2行为规范恪守用户的各项规章 制度 关于办公室下班关闭电源制度矿山事故隐患举报和奖励制度制度下载人事管理制度doc盘点制度下载 ,严格依据用户相应的 规章制度 食品安全规章制度下载关于安全生产规章制度关于行政管理规章制度保证食品安全的规章制度范本关于公司规章制度 做事。与用户运行保护系统其余部门和环节共同工作,亲密配合,共同睁开技术支持工作。出现疑难技术、业务问题和重要紧迫状况时,及时向负责人报告。现场技术支持时要精神饱满,衣着得体,辞吐文明,举止隆重。接听电话时要文明礼貌,语言清楚了然,语气和蔼。恪守保密原则。对被支持单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得任意复制和流传。3.3现场服务支持规范运维服务人员要做到耐心、仔细、热情的服务。工作要做到事事有记录、事事有反应、重要问题及时报告。严格恪守工作作息时间,严格依据服务工作流程操作。现场支持工程师应着装整齐、言行礼貌大方,技术专业,操作娴熟、谨慎、规范;现场支持时一定恪守用户单位的有关规章制度。现场支持工程师在进行现场支持工作时一定在保证数据和系统安全的前提下睁开工作。现场支持时出现暂时没法解决的故障或其余新的故障时,应见告用户并及时上报负责人,找寻其余解决门路。故障解决后,现场支持工程师要详细记录问题的发生时间、地址、提出人和问题描绘,并形成书面文档,必需时应向用户介绍故障出现的原由及预防方法和解决技巧。3.4问题记录规范依据使用人员提出问题的类型,将问题分为咨询类问题和系统缺点类问题二类:咨询类问题是指经过服务热线或现场解疑等方式能够就地解决用户提出的问题,拥有问题解答直接、迅速和及时的特色,该问题到现场支持人员处即可中断,关于该类问题的记录可使用咨询类问题记录模版进行记录。系统缺点类问题是指派用人员提出的问题波及到系统相应环节确实认改正,需要经过逐级提交、诊疗、确认、办理和答复等环节,办理解决需要XX项目组的剖析确认,问题有解决方案后,将解决方案反应给用户。详细提交流程以下:问题提交。应用信息系统的用户发现属于系统缺点类的问题时,填写系统缺点类问题提交单,提交服务支持中心。问题剖析。服务中心接到用户提交的问题单,要组织相应人员对问题单中描绘的问题进行剖析研判,确立问题的种类(技术问题、业务问题或许操作问题)。属于技术问题,提交服务中心技术人员对存在的问题提出详细的办理建议和建议;属于业务问题,提交服务中心业务人员进行办理;属于操作问题,可安排有关人员对问题提出人进行解说,并将系统缺点类问题提交单转为系统咨询类问题提交单。问题确认、解决。服务中心的技术人员和业务人员收到系统缺点类问题提交单后,对提交的问题进行归类汇总和剖析、确认。能够解决的,明确问题解决的详细办理建讲和举措,经主管领导署名赞同后,交实行人员进行解决方案的实行。服务人员确认能否解决,并将解决方法附在系统缺点类问题提交单上反应给问题提出人员。问题上报。服务人员收到经业务或技术人员确认的系统缺点类问题提交单后,上报服务中心。问题答复。服务中心依据提交问题的进行剖析,拟订解决方案并进行实行的解决,同时做好更改记录。将解决方案汇总后及时向问题提交单位或问题交办单位作出答复,并将剖析过程和问题产生原由一并提交。应急服务响应举措已经针对本项目拟订了详细的设计、应急办理方案,整个流程谨慎而有序。可是,在服务保护过程中,不测状况将难以完好防止。下边,我们将对项目实行的突发风险进行详细剖析,并且针对各种突发事件,设计了相应的预防与解决举措,同时供给了完好的应急办理流程。4.1应急基本流程保护服务应急办理流程4.2预防举措针对上门服务过程中可能碰到的各种各种的风险,XX总结多年维护服务经验,针对一些可能出现的状况,拟订了一系列预防办理举措,举比以下:种类事件预防举措办理没法启动软件可履行文上门人员提早准备好各将应用软件数据文件备件类需保护软件安装程序份后,从头安装应用软件软件翻开过程中或运行上门人员准备好安装程判断犯错原由,备份数序,操作系统优化和修理中异样错误封闭据,采纳有关修复举措软件,查杀病毒软件准备好系统检查程序及见告使用者错误原由可使用者本机操作系统异能种类,提出解决方案,修理程序,以及查杀病毒常或系统资源占用严重经使用者认同后采纳相软件操作系统应举措B/S构造系统,IE阅读器准备流氓软件清理程序、检查IE阅读器选项设修复阅读器软件、查杀病异样或没法下载控件置,剖析原由进行修复毒软件B/S构造系统网络流量异判断服务器能否异样,否检查网络流量,流量异网络或服常小则报修网络服务务器常或服务器登录异样则准备杀毒软件商,流量异样大则查杀种类事件预防举措办理病毒4.3突发事件应急策略系统运维应急方案是对中断或严重影响业务的故障,如宕机、数据丢掉、业务中断等,进行迅速响应和办理,在最短时间内恢复业务系统,将损失降到最低。在系统保护过程中,突发事件的出现将是很难完好防止的,针对这类状况,XX设计了完美的突发事件应急策略。系统巡检人员要按期规范检查各硬件设施的运行状况和应用软件运行状况,同时做好平时的数据增量备份和按期全备份。对发现的问题在报各级负责人的同时,要协调有关资源剖析问题本源,确立解决方案和暂时解决举措,防止造成更大的影响。问题获取稳固或完全解决后,要形成问题报告,防止此后近似重要紧迫状况的发生。对发现的问题在报负责人的同时,要协调有关资源剖析问题本源,确立解决方案和暂时解决举措,防止造成更大的影响。问题获取稳固或完全解决后,要形成问题报告,防止此后近似重要紧迫状况的发生。不只拥有经验丰富的技术支持工程师,并且依据长久以来的客户服务工作经验,成立了常用知识库,此中包含多种常有技术故障和突发事件的应急策略。当获悉出现突发事件时,技术支持人员能够立刻从知识库中获取相应的应急策略,并综适用户方的详细状况,给出有关解决方案,而后在第一时间以电话、邮件支持或现场服务的方式帮助用户解决问题,尽最大努力减小突发事件对用户平时应用的影响。紧迫状况预防举措应急策略在磁盘数据未丢掉状况下,保证数据安全硬件破坏项目单位操作用电脑硬件破坏性,建议项目单位替代有关硬件。操作失误增强培训力度,掌握培训成效,查验操作失误未造成即成结果或数据未丢掉情操作人员操作水平,提示注意事项。况下,保障数据安全,反之,协调有关部门,进行挽救。对操作人员重申注意事项配置丢掉培训时重申使用前配置方法和步骤,派出上门保护、培训人员从头配置,并耐心并特别提示需在使用前按要求操作解说。培训时重申使用过程中注意按期备份协调有关部门,进行挽救,没法挽救,提交数据丢掉重要数据,平时保护过程中,上门服报告说明原由。务人员及时备份数据并见告用户突发事件应急策略服务流程图以下:
本文档为【硬件运维项目系统运维方案】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
春天花园
从事护理工作多年,经验丰富。
格式:doc
大小:137KB
软件:Word
页数:20
分类:
上传时间:2022-05-29
浏览量:0