首页 数据中心IT服务管理手册

数据中心IT服务管理手册

举报
开通vip

数据中心IT服务管理手册 数据中心 IT 服务管理手册 数据中心 IT 服务管理手册 Page 2 of 34 数据中心 IT 服务管理手册 在构建“发动机”的过程中,IT 服务管理(ITSM)成为企业数据中心追求卓...

数据中心IT服务管理手册
数据中心 IT 服务管理手册 数据中心 IT 服务管理手册 Page 2 of 34 数据中心 IT 服务管理手册 在构建“发动机”的过程中,IT 服务管理(ITSM)成为企业数据中心追求卓越运营的 指南。IT 服务管理是一种以流程为导向、以客户为中心的方法,它通过整合 IT 服务与企 业业务,提高了企业的 IT 服务交付与服务支持的能力和水平。而在企业将 ITSM 思想付诸 实践时,英国商务部开发的 IT 服务管理的最佳实践——ITIL(IT 基础架构库,IT Infrastructure Library),则成为这一领域事实上的标准。ITIL 的支持模块主要包括服 务台、事件管理、问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 管理、变更管理和发布管理;服务交付模块主要包括服务水平管 理、可用性管理、能力管理、服务财务管理以及服务连续性管理。而对数据中心而言,主 要的流程还必须加上安全管理、以及业务关系管理模块的关系管理和 ICT 基础架构模块的 运作管理流程。 ITIL 与 ITSM 的概念及其关系 对于数据中心管理者而言,ITIL 最基本的改进之一就是可以使 IT 经理对他们所支配 的资产和资源有一个全面的了解。掌握了这些信息,他们就随时可以了解到有什么变更事 项在发生,这对于技术方面的改进是非常重要的。简而言之,如果你当前都不知道如何去 做一件事,那你怎么知道将来能不能把它做好?  ITIL 与 DCML 如何影响数据中心?  如何利用 ITIL 来提高数据中心效率?  ITIL:管理变更 打破束缚  利用 ITIL 要从遵从性管理出发 ITSM(IT 服务器管理)的执行 数据中心 IT 服务管理手册 Page 3 of 34 当前的经济正在衰退,所有组织和机构都在苦苦挣扎,这是毫无疑问的。所造成的结 果就是,IT 预算被削减,非关键项目被暂停或取消。在这种环境下,人们推选了一些管理 团队来改进业务流程(包括 IT 服务管理 ITSM)从而削减开支,不管是在经济衰退还是复 苏阶段,这对他们来说都不是很容易。  金融危机下选择 ITSM 来改进业务(上)  金融危机下选择 ITSM 来改进业务(下)  ITSM 基础:执行变更管理过程  如何修复执行失败的 ITSM 项目 利用 CMDB 来进行 IT 服务管理 每个企业和公司都需要一个配置管理数据库(CMDB)。当前架构配置的精确 记录 混凝土 养护记录下载土方回填监理旁站记录免费下载集备记录下载集备记录下载集备记录下载 对每 步 IT 操作和过程来说都是至关重要的。如今,故障排查速度越来越快了、资源分配的分 析也比以前容易了、基础设施的更改给服务带来的影响也越来越小,这些都可以说是头版 新闻。  如何判断企业需要 CMDB 项目决策?  利用 CMDB 来对数据中心进行变更管理  决定一个新 CMDB 项目成功与否的五大要素 数据中心 IT 服务管理手册 Page 4 of 34 ITIL 与 DCML 如何影响数据中心? 在构建“发动机”的过程中,IT 服务管理(ITSM)成为企业数据中心追求卓越运营的 指南。IT 服务管理是一种以流程为导向、以客户为中心的方法,它通过整合 IT 服务与企 业业务,提高了企业的 IT 服务交付与服务支持的能力和水平。而在企业将 ITSM 思想付 诸实践时,英国商务部开发的 IT 服务管理的最佳实践——ITIL(IT 基础架构库,IT Infrastructure Library),则成为这一领域事实上的标准。 1980 年以来,ITIL 经历了两个主要的版本,其中 ITIL 1.0 版本在 1986 年到 1999 年间开发了 40 多卷图书,主要是基于职能型的实践;ITIL 2.0 版本在 1999 年到 2006 年基于流程型实践总结为 10 本图书,并成为 ITSM 全球认可的最佳实践框架。 ITIL 2.0 主要包括了业务管理、ICT 基础架构管理、应用管理、服务管理、安全管理和服 务管理实施规划六大模块,其中的核心模块为服务管理模块,它包含服务支持和服务交付 两个子模块。而在 2007 年 5 月 30 日,ITIL 最新的 3.0 版本的核心读物正式出版发 布,此举标志 ITIL 的演进进入了一个全新的阶段。 数据中心服务管理模型 ITIL 的支持模块主要包括服务台、事件管理、问题管理、变更管理和发布管理;服务 交付模块主要包括服务水平管理、可用性管理、能力管理、服务财务管理以及服务连续性 管理。而对数据中心而言,主要的流程还必须加上安全管理、以及业务关系管理模块的关 系管理和 ICT 基础架构模块的运作管理流程(具体流程模型如图 1 所示)。 数据中心 IT 服务管理手册 Page 5 of 34 图 1 中的每个流程都针对了数据中心基础设施 IT 运营的不同方面。上半部分主要将 企业数据中心的服务提供给客户,下半部分主要围绕支持企业数据中心的服务运营,而安 全管理则介于两者之间,因为它既面向内部,又面向外部的用户。服务台并非一个管理流 程,而是一个功能部门,与服务支持和服务交付两部分同时关联。 ITIL 由 10 个核心管理流程及一系列的辅助流程所构成,下面我们对数据中心服务管 理模型中所设计的相关流程进行简单的介绍。 服务台/事件管理 事件管理流程通常与服务台职能相结合,因为主要实施事件管理的部门就是服务台。 两者结合以确保事件发生以后,客户的业务可以尽快恢复。它是事件驱动的。服务台应该 数据中心 IT 服务管理手册 Page 6 of 34 是数据中心电话呼进与电话呼出的唯一联系点,也是获得服务、可用性、问题、变更方面 信息的唯一联系点。另外,服务台的另一项职能是监控系统变化。 问题管理 问题管理的目标是减少系统错误导致的事件和问题对业务运行的影响,并且防止相关 错误导致的事件复发。它的任务是消除数据中心 IT 基础架构中的已知错误。 变更管理 变更管理必须了解每一个变更的全部内容,这样才能对 IT 基础架构的变更保持完全 的控制。变更管理并不是要使变更没有风险,而是要减小变更所带来的风险。 发布管理 发布管理的目的是确保每一个新发布的所有技术和非技术问题都得到协调解决。它包 括对软硬件的规划、设计、构造、配置和测试以创建一系列新发布。由于主要处理重大发 布变更,发布管理直接关联于变更管理,将变更采纳进新的发布中。 配置管理 通过确认配置记录更正错误,为事件管理、问题管理、变更管理和版本管理提供坚实 的基础。.配置管理负责管理组织和服务内的所有 IT 资产及其配置。它提供精确的配置信 息和文档记录,为其他服务管理流程提供支持。 运作管理 运作管理负责所有设备、网络、服务和应用的启动、停止、重启与状态监测,提供持 续运行能力。基于安全的环境,使用一个小而精确的工具集,提供单一管理接口和对所有 信息事件的一些支持,管理磁性存储介质,包括磁带的 标识 采样口标识规范化 下载危险废物标识 下载医疗器械外包装标识图下载科目一标识图大全免费下载产品包装标识下载 、存储、装填、取出。 服务水平管理 数据中心 IT 服务管理手册 Page 7 of 34 该流程确保数据中心明确提供的服务类型,就提供的服务水平和客户达成一致。它也 确保数据中心能通过主动监控服务进程中关键点的服务指标,确保为客户提供的服务水 准。 IT 财务管理 通过财务管理中的预算、会计核算流程来确定数据中心要花多少钱和如何花的这笔 钱。另外,还可以通过计费政策使数据中心像运营业务一样执行更加积极的财务管理策 略。 可用性管理 可用性管理保证服务和流程达到和客户约定的可用性水准。它不是保证可用性的最高 水平,也不是以单独确保服务器设备的可用性。这个流程最终把所有的 IT 流程联接到一 起,管理 IT 流程和 IT 部门之间的连接和弱点,确保提供给客户的服务可用性。 能力管理 能力管理是确保企业拥有适当能力的资源,从而能够成本经济地满足企业业务总体需 求的一系列流程。而“适当”意味着不多不少,不早不晚,在适当的地点,适当的时间,以 适当的价格,向适当的客户提供适当的服务。 IT 服务持续性管理 IT 服务持续性管理为数据中心提供在灾难发生时的恢复方法。数据中心内放置着企 业业务运作的重要 IT 资产,因此为了保持业务连续性,数据中心的 IT 服务连续性管理则 尤为重要。灾难的定义必须和客户一起商讨,不同机构定义可能会不一样。最终由客户决 定选择哪种 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 ,并在服务水平协议中标明。 关系管理 关系管理流程负责管理信息部门和第三方供应商、客户的关系。该流程的最大好处 是,帮助 IT 部门获得良好的客户与服务提供商关系,这将提高对客户的关怀和服务水 准。 数据中心 IT 服务管理手册 Page 8 of 34 安全管理 安全管理的目标是保护有价值的信息,而这种价值基于三个方面,即保密性、完整性 和可用性。 DCML 与 ITIL 在实施每个 ITIL 流程时,经常需要进行多个 IT 管理系统与组织之间互相通信,ITIL 流程之间也需要彼此联系,以发挥其效用。然而,ITIL 定义了流程和相应的信息流,但却 没有定义信息流的流向,以及通过何种方式表达这些信息。如何促进这些信息之间交互的 标准化和便捷化则成为企业数据中心提高 ITSM 运营水平的一个难题。而在这一领域,结 构化信息标准促进组织(OASIS)管理的数据中心标记语言(DCML,Data Center Markup Language)有望填补这一技术空白,并最终推动 DCML 与 ITIL 走向融合。 数据中心 IT 服务管理手册 Page 9 of 34 DCML 是描述数据中心运行的各种组件、以及这些组件如何互操作的基于 XML 的建 议标准,DCML 的建议蓝图如图 2 所示。DCML 希望提供一个对数据中心的通用描述, 包括服务器、工作站、计算机外设、存储系统、操作系统,以及应用程序,还有企业有可 能选择使用的各种管理系统所需的其他信息。 根据其 规范 编程规范下载gsp规范下载钢格栅规范下载警徽规范下载建设厅规范下载 ,DCML 允许企业描述数据中心环境的状态,开发一个自动化系统来管理 环境的“蓝图”,以及建立管理环境时使用的政策、规则以及标准集合。在理想状态下, DCML 可以允许企业参与并实现数据中心的管理自动化,而不是像传统要求的那样进行持 续的手工干预。基于 DCML 的对 ITIL 流程间数据的格式化,ITIL 在数据中心的实施将变 得更为简便。 数据中心 IT 服务管理手册 Page 10 of 34 其中最直接的好处是,流程与外部系统以及流程间的数据交换更加简单易行。ITIL 要 求变更流程与负责监控数据中心环境的监控系统交互信息。监控系统的任务是确保数据中 心的基础设施运营及性能良好,如果是由服务器或应用程序引起的问题,那么,监控系统 需要识别出该问题,并报告给网络运营中心。IT 员工需要判断出事件的原因和需要修复 的环节。 该流程中一个重要的步骤就是判断事件的根本原因,并通过系统性变更阻止事件的再 次发生。DCML 可以使得数据中心的员工在变更管理流程与监控系统之间数据的交换处于 一个开放的基于标准的环境之中,这大大降低了数据中心选取供应商时产品集成方面的成 本。同时,网络运营中心的员工根据变更管理系统提供的 DCML 信息,能够更快速地推 断出造成中断的可能原因,这些信息包括应用服务的责任人、上一次变更的日期和时间、 安装的操作系统和应用程序的版本等。 数据中心需要 ITIL,但 DCML 也需要更多的帮手。尽管 OASIS 认为,DCML 通过 定义支持 ITIL 流程的应用系统的语法和语义,极大地方便了 ITIL 在数据中心的实施,管 理系统标准化地数据格式促进 ITIL 流程的集成,也为那些支持 DCML 的系统带来了强有 力地竞争。ITIL 成为全球事实上的标准主要是它得到了几乎所有 IT 巨头们的广泛支持, 然而,DCML 的推广则多少显得有些力不从心。目前,支持 DCML 的厂商包括 CA、 Electronic Data Systems、Mercury Interactive 和 Opsware 等。然而,该标准目前 仍然没有得到一些主要数据中心和数据中心产品供应商的支持,其中包括戴尔、惠普、 IBM、微软和 Sun。 (作者:McFarlane 译者:滕晓龙 来源:TechTarget 中国) 数据中心 IT 服务管理手册 Page 11 of 34 如何利用 ITIL 来提高数据中心效率? 乍一看,把 ITIL(信息技术基础设施库)和能量效率放在一起讨论好像有点荒谬。 ITIL 是一套关于 IT 管理以及变更管理、问题管理、资产和容量管理等的最佳做法。企业 在推出新应用、进行维护、安装服务器、虚拟化以及对故障和威胁做出响应时,ITIL 为企 业提供了一系列确保高可用性和高可靠性的方法。 从另外一个方面来看,ITIL 还是 IT 文化的门道。它提供了一种员工可以使用的 IT 语言。这就是 ITIL 的意义之所在。如果能够将 ITIL 语言和框架应用到数据中心的各个方 面,包括 IT 部门和设备部门,那么它将有助于 IT 部门与设备部门的沟通,消除 IT 与设 备之间的隔膜。 IT 注重的是旧应用的维护和新应用的推出,确保变更和问题不会中断服务。所以, IT 部门可能不会意识到耗电功率、冷却或房屋空间已达到最大限制,除非问题已经出现 了。另一方面,设备组通常会非常注意电力、空间和冷却等方面的问题。 对于一个 IT 部门与设备部门沟通不够的企业,通常会出现二者相互抱怨的情况。供 电不足了 IT 部门抱怨设备组,设备组则回击说 IT 组从来都懒得过问一下。如果两个团队 都不相互沟通一些最最重要的资源问题,数据中心效率又从何谈起呢? IT 组与设备组的隔膜一而再、再而三地被称作是实现数据中心高效率的绊脚石。据 McKinsey 报告(《数据中心效率的变革》)称,只有将设备划分到 CIO 的管辖范围, 让 IT 部门直接负责数据中心的能耗账单,数据中心效率问题才可能得以解决。目前,IT 设备的能耗问题根本不是 CIO 考虑的最首要问题。 ITIL 最佳做法为数据中心提供了一个框架体系,这个框架体系可以拉近 IT 组与设备 组的距离,促进它们有效沟通、齐心协力提高数据中心效率。下面,我们将具体地讨论 ITIL 中的变更管理和容量管理这两个部分。 基于 ITIL 的变更管理与设备 变更管理过程是关乎 IT 部门的生死存亡的事情。如果这些过程运作的不好,导致的 冲突和停机将可能结束 IT 经理们的职业生涯。 数据中心 IT 服务管理手册 Page 12 of 34 其实,设备组也会用到变更管理。在 ITIL 变更管理最佳做法体系内,这些共用的经 验技能可以收到很大效果。例如,大多数 IT 部门通常会召开变更会议以确保请求的变更 不会引起故障或停机。在这样的会议中通常不会提及设备。但是,试想一下,如果设备组 也有人参加,会有什么好处呢?如下是设备组可以在会议中提上桌面的一些问题:  提议的变更是否与 UPS 设备、继电器或冷却设备等的维护有重叠部分?风险会不会 太大?  有没有足够的空间和电源来支持提议中需要安装的设备?供电和冷却会不会受到影 响?  以目前的消耗速度,机房空间、冷却能力或供电能力何时会达到极限? 这些实实在在的变更管理问题只有通过共同的语言和清楚的度量才能得到有效的沟 通。设备组应该利用这门共同的语言来提出这些重要但经常被忽略的问题。 设备维护日程安排  可用的电能、空间和冷却能力  IT 消耗电能、空间和冷却能力的速度  以目前的消耗速度,容量使用的极限  以目前的消耗速度,电能、空间和冷却成本(总体拥有成本) 这些度量不仅有利于更清晰全面的认识变更问题,还可以让大家更全面的了解数据中 心操作和成本的总体情况。 基于 ITIL 的容量管理与设备 容量管理是 ITIL 中的一个重要部分,它确保了计算能力能够满足未来的业务需求, 而且保证了成本利用的高效性。容量管理需要对资源消耗速度有所了解,分析可能发生的 需求和服务变更,以及计算能力、内存、网络和存储等可能出现的变更。此外,容量管理 还涉及到容量扩展的投资规划和说明。 在 IT 组来看,容量往往是指吞吐量、每分钟事务处理、IT 负载等等。IT 设备能够完 成多少任务?完成速度有多快呢?系统如何有效地迁移到新应用中以便添加新的服务?IT 如何安装大量新服务器(可能密度比以往更大)以维持需求的服务等级?如果从 X 厂商的 数据中心 IT 服务管理手册 Page 13 of 34 硬件迁移到 Y 厂商的硬件上,会不会有一些的成本节省?所有这些 IT 容量问题(通常也 称作 IT 架构)都需要足够的关键设备基础设施作为保障,即数据中心的能源、冷却和空 间。 这是 IT 组与设备组可以沟通的另一个方面。通过这些问题的沟通,可以更全面地了 解数据中心运行情况,寻求提高数据中心效率的契机。说的直白一些,就是设备组要提供 IT 组需要的电源功率。由于设备组管理的是数据中心的机械系统,所以拥有关于数据中 心容量的关键信息。而数据中心容量又会直接影响到 IT 设备的容量。更换硬件厂商会不 会加快 IT 消耗速度?新服务器是否适合机架?同样,设备组的参与会有很大的好处。 设备组参与 ITIL 的实用步骤 对于大多数企业来说,最好的办法是设备组通过 ITIL 最佳做法主动与 IT 组进行沟 通。 设备人员如何参与到与 IT 组的讨论中呢?下面是介绍了一些实用步骤:  了解 IT 组支持的主要业务应用(POS、在线销售、在线预定等)以及 IT 与设备交叉 的地方。  利用 ITIL 术语与 IT 进行每周沟通。  参与变更会议并提出自己期望的变更安排,以便避免冲突。  制定一些度量标准,将设备服务转化称可用性和可靠性指标。  了解是谁掌管 IT 的容量规划以及如何与他接洽。  利用 ITIL 最佳做法构建共同点。变更管理与容量管理是相似的,都可以与能量效率 措施挂上联系。  为变更管理流程提供关于数据中心容量的信息(IT 消耗空间、电能和冷却容量的速 度、可用容量、扩展极限)。了解如何为变更管理数据库贡献一份力量。 通过设备记录卡,设备组可以记录性能,然后在与 IT 交流时可以谈它对数据中心总 体可用性和可靠性的贡献。设备记录卡可以涵盖如下一些方面: 财务状况  年度开支对比 数据中心 IT 服务管理手册 Page 14 of 34  每月费用  UPS/冷却成本  特定成本 流程  严重问题数量  根本原因分析  容量更新表,包括 IT 消耗速度 性能  平均修理时间(MTTR)  平均谷中时间  可用性  节省和最近丢失、效用失败、泵故障和天气 项目/规划  UPS 维护(注明具体时间)  uCode 更新(注明具体时间)  AC 季度维护  定期的继电器测试(注明具体时间) 记录卡上与 IT 有直接联系的所有信息都能增进 IT 组的信息了解情况,提高深入讨论 的可能性。这些信息还有可能提高讨论效率,扩展容量。 (作者:Dave Rosenberg, Tony Ulichnie 译者:涂凡才 来源:TechTarget 中国) 数据中心 IT 服务管理手册 Page 15 of 34 ITIL:管理变更 打破束缚 对于数据中心管理者而言,ITIL 最基本的改进之一就是可以使 IT 经理对他们所支配 的资产和资源有一个全面的了解。掌握了这些信息,他们就随时可以了解到有什么变更事 项在发生,这对于技术方面的改进是非常重要的。简而言之,如果你当前都不知道如何去 做一件事,那你怎么知道将来能不能把它做好? ITIL 将现代架构引入数据中心 Va. McLean Managed Objects 软件公司服务主管 Michelle Hudnall 表示,虚拟 化和 SOA 等工具可以提高数据中心实施性能管理和容量管理的能力。“ITIL 进程是数据 中心监控和规划服务的一种方式。”她说。 虚拟化的一个卖点是其可以按照业务需求迅速分配服务器的容量。而 SOA 则可以使 用户在多种应用环境下对软件实现重复利用。无论是采用哪种方法,IT 部门都不得不对 业务需求迅速做出反应,在匆匆忙忙中对基础设施部件进行变更,但前提是无法看到这些 部件的实体,这对 IT 部门来说是一个很困难的任务。 在 Colo. Broomfield Corporate Express 办公服务公司,数据中心经理 Dave Hines 希望 ITIL 能够帮助他们对混乱而又频繁的业务变动就行追踪,在 1986 年, Office Express 公司靠 100 美元投资起家。如今,在经历了数次并购之后,它已经是一 家年销售额超过 45 亿美元的企业。 Hines 负责着公司的数据中心,其中放置着 600 台 HP 和 Dell 的服务器,上边运行 有 AIX、Linux 及红帽操作系统,他第一次尝试 ITIL 是“为了更好地将员工组织起来”。 他表示:“在 IT 行业,所有的东西都是独立存放的,它们之间存在太多的重复和彼此的沟 通,这是一个不小的障碍。” ITIL 可以改进帮助台的工作 IT 部门经常强调的是对帮助台的支持。每个应用都有其自己的帮助台,网络和数据 中心也一样。当问题发生时,这种业务的重叠会使情况变得更糟。IT 部门往往会重复地 处理同样的问题,而不是对事件类型进行辨认和坚定,也不是去寻找问题的根本原因来解 数据中心 IT 服务管理手册 Page 16 of 34 决这一问题。通常的状况是:终端用户不停地打电话给帮助台寻求支援,原因是他们忘了 密码。ITIL 要求对帮助台进程进行集中处理,IT 部门将会逐渐接受这种趋势,通过部署 自动密码重置工具来应对这一问题。 Mich.州 Pontiac Oakland County 公司 CIO Phil Bertolini 曾经强调过这些问题。 他所在的 IT 部门就负责对服务中心的所有问题进行维护处理,提供所有与事故相关的数 据的核心位置、问题所在及变更顺序,从而减轻了大量的工作。 部署 ITIL 的另一个原因是知识管理的需求,这对于数据中心员工来说这个越来越重 要的问题,就像拥有多年大型机管理经验的员工要选择退休似的。 “许多进程和配置诀窍都掌握在高级技术人员的手中,”N.C. Lexington IT 服务管理咨 询公司的 itSM 解决方案 CTO 及管理成员 Hank Marquis 说,“ITIL 可以改进文本记录 进程,CMDB 及其它软件则可以将此流程自动化。” (作者:Megan Santosus 译者:王霆 来源:TechTarget中国) 数据中心 IT 服务管理手册 Page 17 of 34 利用 ITIL 要从遵从性管理出发 对于 Sallie Mae Inc.这家金融服务公司来说,他们在相关法规遵从性发面的努力实 际上就是开始进入 ITIL 的一个先兆。 “Sarbanes-Oxley 颁布之后,我们不得不在组织内部采取一些严格的变更控制标 准,”担任着这家 Va.州 Reston 公司技术副总裁的 JoLee Hayes 说。尽管说 Sallie Mae 公司已创建了一些标准,但他们缺乏的是一些连贯的进程。因此,他们最终选择了 ITIL,来对自己的事件管理、变更管理、及发布管理等进程进行标准化处理。 为了对各种各样的 ITIL 进程实现自动化运行,Sallie Mae 引入了 CA 公司生产的一 套工具:Unicenter Service Desk 变更管理工具、CA Harvest 应用研发变更管理工 具、以及 CA Endevor 大型机软件配置管理工具。Hayes 承认,与经常求助于 IT 顾问相 比,布署和整合这些工具要容易的多。 “我们开始与一些独立的团队进行接触,”Hayes 说,“告诉他们我们需要什么,然后 通过相应平台发布一些测试项目。” Hayes 还表示,任何 ITIL 项目的部署要想取得成功都必须要有大多数 IT 员工的积 极参与。对 Sallie Mae 公司而言,就意味着要得到数据中心、应用研发部门及架构团队 高级 IT 人员的认可和参与。 至于好处,Hayes 表示,业务管理标准化可以简化审计和追踪、使维护文件记录的 存放更为容易,就像 ITIL 所规定的一样,它使 Sallie Mae 公司对业务环境中所有应用及 组件的变更有了更密切的掌控。“ITIL 是你企业 IT 战略的一个框架,”Hayes 说。(需求 管理和证券管理师 Sallie MaeIT 战略的另两个方面)最终,Sallie Mae 是为了围绕整个 IT 系统的生命周期实现更为广阔的 IT 战略,从前后端的项目管理到客户信息反馈、再到 未来的 IT 服务。 (作者:Megan Santosus 译者:王霆 来源:TechTarget 中国) 数据中心 IT 服务管理手册 Page 18 of 34 金融危机下选择 ITSM 来改进业务(上) 当前的经济正在衰退,所有组织和机构都在苦苦挣扎,这是毫无疑问的。所造成的结 果就是,IT 预算被削减,非关键项目被暂停或取消。在这种环境下,人们推选了一些管 理团队来改进业务流程(包括 IT 服务管理 ITSM)从而削减开支,不管是在经济衰退还 是复苏阶段,这对他们来说都不是很容易。 管理层需要做的就是在经济衰退期间制定高效的 IT 流程,并帮助所在组织为经济复 苏做好准备。高效的流程所需要的不仅仅是对成本和风险的控制,还需要为 IT 提供服 务,满足业务当前和未来的需求。 ITSM 和质量管理 虽然有些人可能认为信息技术基础架构库(ITIL)和它的 ITSM 理念只是另一种官僚主 义的管理时尚,但如果能得到正确的实施,效果可能远好于此。ITSM 的目的是提供信息 服务以满足所有组织在业务目标追求和保护方面的需求。了解需求并提供相应的解决方 案,这就是质量管理的真正内涵。尽管要强调质量,但我们看到 ITSM 实际实施时,许多 人要么彻底失败要么无法获得期望的效果。许多组织做的不够全面——他们不能理解,也 不遵循 ITSM 质量改进的真正内涵。这是一个最基本的问题! IT 部门要做两件事——创造和保护价值——这是通过为满足企业需求的业务提供服 务来实现的。企业必须靠 IT 部门来开发或获取所需的服务,一旦进入生产领域,这些服 务必须持续满足数据保密、业务完整性、可用性及性能等需求。 可持续 IT 服务这个概念包含两个要素。首先,服务必须是可以持续运营——更不用 说安全了——那是必须要考虑的。汽车工业花了很大精力才学会生产能接受配套服务的小 汽车和卡车。在那之前,工程师只设计满足消费者需求的交通工具,但当交通工具需要维 修服务时,费用会很高,难度也很大。这使大家都很郁闷。作为汽车工业质量改进的执行 者,人们对交通工具的认识经历了一个周期,他们终于认识到要让客户真正满意,并不只 是卖给他一辆车。 数据中心 IT 服务管理手册 Page 19 of 34 这同样适用于 IT 行业。在进行研发时必须把业务和其它组织操作和安全等方面的需 求考虑到,从而交付可靠的服务。注意,我一直在说“服务”,因为这是 ITSM 传授的一种 理念,也是为何公司必须接受服务开发生命周期(SDLC)这种超越旧系统开发生命周期概 念的原因。这是因为 IT 提供给企业的不只是一个单一的应用软件或“系统”,而是一个包 括硬件、软件、文档、人力、设施等系统,该系统需要提供可用安全的服务以满足业务的 需求。在生产中要考虑材料清单或资源清单。这是自下而上的分层组合,其中包括机器的 核心部件。如果你以同样的方式来看待 IT 服务,你就已经走上了正轨。 当服务完成研发并投入生产后,IT 部门必须继续对其进行维护以满足业务需求。IT 业务流程中那些粗放的模式要及时废止,取而代之的是可以预测结果的正式流程。在本文 的下半部分中,我们将为大家介绍如何对 ITIL 流程进行排序。 (作者:George Spafford 译者:喻英 来源:TechTarget 中国) 数据中心 IT 服务管理手册 Page 20 of 34 金融危机下选择 ITSM 来改进业务(下) 在本文的上半部分中,我们为大家介绍了 ITSM 对于改进 IT 业务进程和削减开支的 重要意义,接下来我们将为大家介绍如何对 ITIL 进程进行排序。当服务完成研发并投入 生产后,IT 部门必须继续对其进行维护以满足业务需求。IT 业务流程中那些粗放的模式 要及时废止,取而代之的是可以预测结果的正式流程。 ITIL 流程排序 以下是一份在产品数据中心环境中很关键的 ITIL 流程清单。制定序列表的理由是其 对稳定性的要求更为严格。 首先,IT 运营团队,特别是数据中心运营团队需要有固定的流程来管理生产中的变 更。无论其环境是由 20 年之久的传统系统组成还是由尖端的高密度刀片服务器组成,一 旦发生一个错误变更所有的设备都会面临崩溃。此外,很多小的、计划不周的变更可能引 发很多不易察觉的错误,如果它们发生在最为糟糕的时段,会引发许多保密性、完整性和 可靠性相关问题。精心设计和实施变更管理流程可以保证业务的稳定性,并允许组织针对 是否实施变更制定有效的风险权衡措施。借用一个朋友的观点,如果不将变更管理作为改 革的第一步,你的 ITIL 项目可能会成为停机等安全事故的借口。 第二,必须有一个配置管理系统(CMS),来存储每个系统及其与创建服务相关的数 据。和我合作的机构总是对构成彼此关联服务的各种配置项目(Cis)缺乏足够认识。这 导致计划、发展、测试、操作和安全方面的考虑不够周全。相反,如果有一个 CMS 系 统,就能够及时掌握与变更管理相关的数据更新。实施和采纳 CMS 是为了尽可能地了解 系统并提升其性能。 第三,总会有事件由于这样或那样的原因而不符合标准操作。一个 IT 机构如何应对 突发事件,对于用户、顾客和整体业务而言关系重大。从业务运营角度来看,事件和事件 管理这两个进程同等重要。ITIL v3 包含了“事件”的概念。这是一个关键的进程,涵盖研 发、测试和生产领域,旨在了解各种运营环境标准之间的关系以及 IT 部门对其的反应。 某些情况下,它会自动反应,如在非高峰时段控制一台服务器重起并从已知的内存泄漏中 恢复。它也可以通过用于持续恢复的 IT 知识管理(ITKM)来收集应用所学的经验教训。 数据中心 IT 服务管理手册 Page 21 of 34 第四,了解问题的根本原因,彻底解决问题或在业务开展时阻止问题的出现是很有必 要的。这属于问题管理领域。如果问题是可解决的,那就不要让它继续存在下去。 变更管理和配置管理能在整个服务生命周期内提高业务的稳定性和规划性,同时也验 证了以上排序的合理性。突发事件和预知事件在本质上是相反的,这有助于 IT 部门制定 相应对策。问题管理在处理事件时反应要快,这样对于找不根本原因的事件可以通过一定 的前瞻性在初始阶段就避免事件和问题的发生。而究竟是否应该遵循这个过程? 这取决于 你如何去实现它们。 对一些组织机构来说,变更管理和配置管理需要同时执行,其次是突发事件和预知事 件管理,接着才是问题管理。在其他面临大范围稳定性挑战的机构中,要做的第一件事是 用基础变更管理来 “止血 ”。在 Kevin Behr、Gene Kim 和我编著 Visible Ops Handbook 时,我们才开始对此有所了解。通常来讲,那些彼此冲突的资源才能够真正 推动企业的发展。 有一个概念你需要仔细考虑——IT 部门中最宝贵的资源是人,我们不能浪费他们的 时间去彼此争夺资源。他们得努力工作并定制工作计划以推进组织机构的发展。因此,我 们需要制定一个进程为他们创造稳定的环境。 那么,这就是全部吗?当然不是。研发部门创造了稳定的服务,运营部门维持了服务 的稳定,必须有其他部门来进一步促进 IT 业务的发展,这是其他 ITSM 进程,如服务水 平管理、可用性、容量规划等进程发挥作用的地方。我不是一名 ITIL 狂热爱好者,但我 相信如果你在追求组织目标时可以采用务实的进程,ITIL 可以给你提供很多东西。ITSM 并不意味着结束——它只是实现目标的手段。在当前的经济形下,IT 部门需要弄清业务需 求及其实现手段,以及如何保护其价值的存在。 总之,IT 部门需要有效的过程预测业务结果。业务无法承受任何资源浪费,包括时 间、金钱和管理注意力。此外,IT 部门必须能以一种可持续满足需求的方式持续地提供 服务,否则业务可能会遭遇极大的风险。对于 IT 业务的需求是不变的,而且这种需求必 须以为整个机构创造和保护价值的方式来实现。 (作者:George Spafford 译者:喻英 来源:TechTarget 中国) 数据中心 IT 服务管理手册 Page 22 of 34 ITSM 基础:执行变更管理过程 当 IT 组织努力提高效率和效果之时,他们必需在提高商业 IT 服务质量的同时减少无 计划的反馈性工作。来自管理方面的压力如此之大,IT 前辈面对这种局面也很无奈,关 于管理有无数的陈词滥调,听起来不错,但投资收益却毫无改善。而变更管理却是一个能 真正起作用的关键 IT 服务管理(ITSM)过程。 有一点很清楚,变更管理并不是一个能解决所有问题的神奇药剂。然而它在提高可用 性、安全性和灵活性的同时的确可以大大减少无计划的工作,这样能使更多的员工从事有 计划的项目。有可靠的证据证实,这绝不是一个仅仅听起来不错而不能被实现的的陈词滥 调。 人为误差在设计、编码和操作中蔓延。任何对系统的变更都会造成某种程度的风险, 并将产生一个消极的结果。 据 IDC 的最新研究表明,近 80%的网络可用性事故来源于人为误差。一些组织甚至 超过了这个数字。不管怎样,当事件发生时,项目被搁置、资源被调换,直到危机得以缓 解。这会导致项目积压和管理失败。 所有的事情都是一样的,一个系统事故很可能起源于一个变化。是的,环境问题和硬 件故障可能是一种原因,但是其概率要低一些。人们往往将百分之八十的维修时间花在试 图寻找究竟发生了什么变化。如果能够尽快解决,你数据中心的可用性会变得更高,IT 职员将会有更多的时间去关注计划性工作。 尽管证据表明变更管理和规范的流程是有效的,但在 IT 行业里有一个很普遍的“牛 仔”心态,即员工不喜欢被告知他们必须遵循一个过程。要执行变更管理,或关于它的任 何过程,必须有意识地去改变这种文化。 执行变更管理需要考虑的内容 数据中心 IT 服务管理手册 Page 23 of 34 在这里我就不重复《ITIL 服务转变》中提到的有关变更管理的内容了,我想回顾一下 我们真正遇到的一些问题,并对那些在设计和执行变更操作过程中经常出现的问题进行解 释。  促进文化变革。文化变革的需求并没有得到太多的重视。事实上,正种心态往往也导 致了失败。在一个进程的设计和执行期间,要注意寻找合适的人选。对其进行培训, 提供交流和预警机制。要及时对工作描述和补偿计划进行更新,使其适合整个进程。 最后但同样重要的是,IT 管理、ITSM 管理和变更管理过程中用户和经理必须努力学 习,不断增强对变更管理的需求。  为什么要有一位变更经理?必须有一个人来为平衡风险或规避风险负责。这个人必须 具有大局观,确保在局部层面看起来不错但更高层面可能出问题的变更不被执行。例 如,某个网络管理人员可能认为升级一台交换机是低风险的,因为他没有意识到这个 改变发生在周末的账户统计期间,这也就暗藏了一份风险。  要有重点!最好是设计一个过程并在一个特定的 IT 层面执行,在这一层面业务和 IT 部门都愿意以该过程为原型并对它进行调试。在一个小范围内变更一个过程比追求一 个全有或全无的方法更容易且政治风险更小。  从点滴做起。随着复杂性的增加,文化转换的难度和长期持续的变更管理风险也增加 了。此时,需要对持续过程改进进行规划,同时要制定发展蓝图以确定过程将随着新 版本进行演变。但是,一定要确保从简单做起逐步改进。有时侯变更管理的开始可能 是最艰难的。  多模式。ITIL 的变更管理过程可识别多模式的用途:标准的、紧急的、次要的、正规 的和主要的。这些仅仅是适当平衡风险、成本和时间的工作流程。事实上,一个组织 可以有多种模式,只要这些模式有实际意义且它们清楚何时遵循何种模式。实施变更 管理的组织要适应他们的各种模式,从而具备适当的灵活性和风险管理能力。  标准的变更模式是至关重要的。谈到模式,标准的模式使低风险、可预测的变更得以 被记录和实施。这些变更不需要提交变更顾问委员会(CAB),这样 IT 部门就有了 更高的灵活性。它们仍然需要仅在授权变更窗口被执行,同时必须被记录以便人们能 轻易地回答这个问题“有什么改变吗?” 随着时间的推移,符合必要标准的变更应该经 过正式审核并遵循这个模式。组织中的大多数变更应该遵循这个模式。备注:如果变 更因为任何原因出现明显的问题,那么必须有一种方式来正式撤销变更的标准等级。  注意紧急变更。对组织而言,紧急变更所承担的风险是最大的。特别注意不要让 IT 人员认为紧急变更是一个为了弥补计划缺乏而对生产做匆促变更的好方法。紧急变更 数据中心 IT 服务管理手册 Page 24 of 34 应该是一个为紧急事件,随后会被 CAB、相关副主席或 CIO 所检测和调查,从而确 定为什么企业会陷入危险当中。  判定变更失败的标准。许多人经常争论是什么导致了一次失败的变更,他们经常将个 人、团队行为目标和报酬联系在一起。如果发生偶然事件或变更无法按计划完成,就 将一个变更应被视为失败。注意这两个因素——如果一个 IT 服务产生负面的影响,这 种变更是失败的。当变更发生,但不能严格地按计划去执行,它被标记为一个失败的 变更,同时会执行相反的计划。失败一定不能被糖衣所包裹。变更的能力必须随着时 间的流逝不断提高。如果变更结果是不可预知的,就说明有些事情是常错误的,必须 立即改正。  变更探测。自动化工具可以帮助检测并与一项配置中核准配置的变更进行通信。利用 这些工具,一个团体可以从字面上保证系统未被以任何方式修改,且变更管理过程正 在被跟踪。这是非常重要的,因为业务运营和信息安全需要及时了解是否有变更发 生。  责任。IT 人员必须遵循变更管理过程,如果他们没有遵循,则必须有明确的处理办 法。质量专家 W. Edwards Deming 说在一个过程中你只能做两件事——或者遵循 它或者正式变更它,没有其他的选项。并且人们不能自发地偏离过程,管理上对过程 的确认是很有必要的,这可以降低风险。 变更管理对 IT 行业而言是一个关键的控制过程。它绝不是一个用于满足监管机构官 僚控制的程序,事实证明对所有组织而言它都是有好处的,包括提高可用性、降低成本、 服从管理、减少安全漏洞等。
本文档为【数据中心IT服务管理手册】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_258357
暂无简介~
格式:pdf
大小:778KB
软件:PDF阅读器
页数:34
分类:互联网
上传时间:2010-08-27
浏览量:56