首页 基于ip承载网的告警采集分析与转发模块的设计与实现论文论文

基于ip承载网的告警采集分析与转发模块的设计与实现论文论文

举报
开通vip

基于ip承载网的告警采集分析与转发模块的设计与实现论文论文基于ip承载网的告警采集分析与转发模块的设计与实现论文论文 国内图书分类号:TP311 国际图书分类号:621.3 工程硕士学位论文 基于 IP 承载网的告警采集分析与转发模 块的设计与实现 THE DESIGN AND IMPLEMENTATION OF ALARM COLLECTION ANALYSIS AND TRANSMIT SUBSYSTEM BASED ON IP NET 硕 士 研 究 生:邓雪松 导 师:李海峰教授 副 导 师:刘正云工程师 申 请 学 位:工程硕士 学 ...

基于ip承载网的告警采集分析与转发模块的设计与实现论文论文
基于ip承载网的告警采集分析与转发模块的设计与实现论文论文 国内图书分类号:TP311 国际图书分类号:621.3 工程硕士学位论文 基于 IP 承载网的告警采集分析与转发模 块的设计与实现 THE DESIGN AND IMPLEMENTATION OF ALARM COLLECTION ANALYSIS AND TRANSMIT SUBSYSTEM BASED ON IP NET 硕 士 研 究 生:邓雪松 导 师:李海峰教授 副 导 师:刘正云工程师 申 请 学 位:工程硕士 学 科 、 专 业:软件工程 所 在 单 位:软件学院 答 辩 日 期:2008 年 6 月 授予学位单位:哈尔滨工业大学 Classified Index:TP311 U.D.C.: 621.3 Dissertation for the Master?s Degree in Engineering THE DESIGN AND IMPLEMENTATION OF ALARM COLLECTION ANALYSIS AND TRANSMIT SUBSYSTEM BASED ON IP NET Candidate: Deng Xuesong Supervisor: Professor Li Haifeng Associate Supervisor: Senior Engineer Liu Zhengyun Academic Degree Applied for: Master of Engineering Speciality: Software Engineering School of Software Affiliation: June, 2008 Date of Defence: Degree-Conferring-Institution: Harbin Institute of Technology 哈尔滨工业大学工程硕士学位论文 摘 要 随着因特网的飞速发展,数据业务变得越来越重要。以软交换为核心 的 NGN(Next Generation Net)网络体系基于包交换数据网络,直接面向多业 务融合,业务提供上满足综合化和个性化等要求,技术体系上满足层次化、 标准化、开放性要求,可以提供数据、语音、多媒体等综合业务,体现了 当今电信业务的要求,代表网络技术发展的方向。 NGN 网络相比目前的 TDM(Time Divided Multiplex)网络具有部署快速、经济高效、可扩展性高、 市场拓展快、业务创新和业务推广快、高可靠性、可用性、多业务能力、 统一的多业务网络等优势。 本论文是以上海国信朗讯公司为背景,通过研究 NGN 告警采集接口 继而实现新一代 设计, NGN 告警关联性分析以及 NGN 告警转发功能需求, 网络 架构 酒店人事架构图下载公司架构图下载企业应用架构模式pdf监理组织架构图免费下载银行管理与it架构pdf 下的告警业务处理和管理模式。 本文研究了 NGN 网络综合故障管理的需求,对实时告警的采集、存 储、呈现、处理、分析以及历史告警的处理等需求进行了分析,保证了数 据的准确性、一致性、完整性。 告警采集接口处于整个系统的最底层,本文研究和分析了告警采集接 口主要接口方式和常用接口标准等,针对二期需求中 NGN 告警的技术特 点和安全、稳定性能的要求,本系统的接口采用 CORBA 标准实现,在解 决 NGN 告警的网络传输问题上有重要的意义和实用价值。 根据集中式告警系统数据量大、实时性要求高的特点,本文采用内存 数据库技术进行相关研究,在传统数据存储的基础上,进行技术改进,加 快了查询 NGN 告警响应时间,同时也加速了上海集中告警的统一平台的 建立与实现。本文设计中实现对 NGN 告警事件相关性分析方法的研究, 提出了一种基于规则引擎和案例推理相结合的分析方法,为综合告警库后 续发展提供必要的技术支持,完善了告警分析领域的技术思想。 最后,应用以上关键技术,本文设计和实现了上海电信综合集中式告 警系统 NGN 告警采集、分析与转发环节主要功能。现在本文的工作已经 在综合化告警系统中实施应用,且正常运行,效果良好。 关键词 告警采集;关联性分析;内存数据库;告警分发 -I- 哈尔滨工业大学工程硕士学位论文 Abstract With the rapid development of Internet, data communication becomes more and more important. In exchange for the soft core of the NGN (Next Generation Network) network based on packet-switched data networks, direst more business-oriented integration, business to provide comprehensive and meet the indivual requirements, technical-level meeting on the system, standardization and openness requirements, can provide data, voice and multimedia integrated services, reluects the representative of the direction of network technology development. NGN network compared to the current TDM (Time Divided Multiplex) network with the deployment of rapid and cost-efficient, high scalability, rapid market expansion, business innovation and business promotion fast, end-to-end, high reliability, availability, multi-service capabilities, A unified multi - service networks, and other dvantages. a This paper is according to the build of concentrative alarm system of Shanghai Guoxin Lucent telecommunication as the background, through research NGN warning acquisition interface design, NGN alarm correlation analysis and NGN alarm forwarding demand, then a new generation of network infrastructure to achieve the alarm business processes and management models. The article on the NGN network integrated fault management of the demand for real-time warning of the acquisition, storage, showing, processing, analysis and alarm history of the treatment needs analysis, ensuring the accuracy of the data, consistency and completeness. Alarm acquisition interface in the bottom of the system as a whole, this research and analysis of the main interface warning acquisition interface and common interface standards, demand for two of the technical characteristics of NGN alarm and security, stability, performance requirements, The system interface using CORBA standards achieved in resolving the NGN warning network transmission on the issue of great importance and practical value. According to a centralized alarm system large amount of data, real-time - II - 哈尔滨工业大学工程硕士学位论文 high requirements to the characteristics of this paper, memory database technology related research, in the traditional data storage on the basis of technological improvements, warning NGN solution for the response time, but also accelerated the Shanghai Alarm on the unified platform for the establishment and implementation. In this paper, the design of the NGN warning to achieve event-related analysis of the study, a rule-based case-based reasoning engine and a combination of analysis, follow-up to the integrated development of the alarm to provide the necessary technical support to improve the warning of the field of technology thinking. Finally, the application of the above key technologies, the paper design and implementation of the Shanghai Telecom integrated centralized alarm warning system NGN collection, analysis and forwarding part of the main features. Now research has been part of the comprehensive warning system in the implementation of applications, and normal operation, the results were very good. Keywords Alarm collection; Analytical method of alarm; Memory database; Alarm transmit - III - 哈尔滨工业大学工程硕士学位论文 目录 摘 要 ...............................................................................................................I Abstract .......................................................................................................... II 绪论 .................................................................................................. 1 第 1 章 1.1 课题的背景及研究目的 ....................................................................... 1 1.2 与课题相关的国内外研究综述 ........................................................... 2 1.2.1 国外研究简述 ................................................................................ 2 1.2.2 国内研究简述 ................................................................................ 3 1.3 本论文的主要工作内容 ....................................................................... 4 第 2 章 NGN综合告警系统关键技术的研究 ................................................ 6 2.1 告警采集网管接口方式研究 ................................................................ 6 2.2 基于内存数据库的告警事件处理策略 ................................................ 8 2.2.1 数据采集层 .................................................................................... 8 2.2.2 事件处理核心层 ............................................................................ 9 2.2.3 呈现层 ......................................................................................... 10 2.3 本章 小结 学校三防设施建设情况幼儿园教研工作小结高血压知识讲座小结防范电信网络诈骗宣传幼儿园师德小结 ............................................................................................ 11 第 3 章 NGN告警采集分析与转发模块的设计 .......................................... 12 3.1 本项目的需求分析 ............................................................................ 12 3.1.1 NGN告警采集业务 ....................................................................... 12 3.1.2 NGN告警事件相关性分析业务 ................................................... 12 3.1.3 NGN告警转发业务 ....................................................................... 13 3.1.4 NGN告警业务模块性能需求 ....................................................... 14 3.2 NGN告警模块总体功能结构设计 ...................................................... 14 3.2.1 NGN告警模块需求建设方案 ....................................................... 14 3.2.2 NGN告警各子功能模块的设计 ................................................... 16 3.3 内存数据库在NGN告警系统中的应用 ............................................. 30 3.4 NGN告警资源数据库设计 ................................................................. 31 3.5 本章小结 ............................................................................................ 32 第 4 章 NGN告警采集分析与转发模块的实现 .......................................... 33 4.1 NGN告警功能模块的实现技术 ......................................................... 33 4.1.1 NGN告警采集的过程实现 ........................................................... 33 - IV - 哈尔滨工业大学工程硕士学位论文 4.1.2NGN告警同步MD的实现 ............................................................. 37 4.1.3 NGN告警关联性分析过程实现 ................................................... 42 4.1.4 NGN告警转发过程环境配置说明 ................................................ 44 4.2 NGN告警模块开发环境 ..................................................................... 47 4.3 NGN资源数据库的实现 ..................................................................... 48 4.4 综合集中告警系统中NGN告警界面与应用验证 .............................. 53 4.5 本章小结 ............................................................................................. 55 结 论 ............................................................................................................ 56 参考文献 ........................................................................................................ 57 哈尔滨工业大学硕士学位论文原创性声明 .................................................. 60 哈尔滨工业大学硕士学位论文使用授权书 .................................................. 60 致 谢 ............................................................................................................ 61 个人简历 ........................................................................................................ 62 -V- 哈尔滨工业大学工程硕士学位论文 绪论 第 1 章 1.1 课题的背景及研究目的 随着电信重组和中国加入WTO,国内各电信企业面临着严峻的市场竞争 形势,如何提高运营效率、降低运维成本、改善服务质量、保证网络高效稳 定地为客户提供服务、提高为客户服务的水平,是每个电信企业迫切需要解 决的问题 [1]。 上海电信圆满完成了综合化集中告警系统一期项目建设。通过一期的建 设,已经实现市区传输网、数字数据网(DDN)、传统交换网、个人手持电 话系统(PHS)、光缆监测五部分主要网络告警的收集、呈现与管理,初步建 成了统一的全网告警监视平台,实现了告警呈现、告警处理、部分告警影响 分析、告警查询与统计、故障单生成、配置管理和系统自身管理等功能,并 在有限范围内开始实施跨域关联分析,减轻了系统维护人员的告警分析处理 量,缩短了故障处理时间,在实际的生产应用中产生良好效用 [2]。 NGN是“下一代网络(Next Generation Network)”的缩写。下一代网络 以软交换为核心。目前,传统的基于分组复用( TDM)的公共交换电话网 (PSTN),虽然可以提供速率为 64k bit/s的业务,但业务和控制都是有交换 机来完成的。这种技术虽然保证语音有优良的品质,但对新的业务提供需要 较长的周期,面对日益竞争的市场显得力不从心 [3]。与此同时目前信令网、 下一代网络(NGN)、异步传输模式(ATM)等网络还没有统一的告警监视 平台,无法在一个平台完成对全网告警的处理及故障派单,更无法做到各网 之间的关联分析。随着NGN等网络的建设,如何以全网的角度将IP网与其它 网络管控融合将对业务支撑,保证重要客户业务,支持市场前端启到重要作 用 [4]。 上海电信二期项目将开发重点主要放在NGN告警采集、告警分析和转发 设计与实现上,通过已有的IP网络覆盖区域,将市区各网管系统集中到综合 告警库上,综合告警库不但可以接受到各个专业网管系统发送的各地区告警 信息,也可以接收到综合告警库下发的指令信息,实现告警传送实时的特性。 随着电信业务需求的增加,接入专业范围的扩大、接入区域的延伸,提高系 统性能及功能是满足现阶段的需求的首要任务 [5]。 -1- 哈尔滨工业大学工程硕士学位论文 1.2 与课题相关的国内外研究综述 1.2.1 国外研究简述 近几年下一代网络在国际上的应用发展很快,真正意义上的下一代网络 部署始于 1999 年 5 月,英国的BT利用北电网络的Succession解决方案,在西 班牙建立了世界上第一个大规模的、基于分布式下一代网络结构的电信级第 二长途网,并投入商业运营,正式揭开了电信界向下一代网络演进的序幕。 目前,BT西班牙已经拥有近 2000 个大型企业、67000 个中小企业、15000 个 居民用户以及大约 900,000 个通过其它运营商PSTN网络间接接入的客户群。 计划用十年的时间完成现有PSTN网络的整体迁移,采用下一代网络实现语 音、数据、多媒体业务,采用ITU-T2004 最新网络架构,实现有线、无线统 一接入与控制 [6]。 2000 年 7 月和 10 月,澳大利亚的Telstra和英国的Cable&Wireless分别宣 布利用北电网络解决方案将他们现有的TDM网络开始向下一代网络过渡,其 中Cable&Wireless的 合同 劳动合同范本免费下载装修合同范本免费下载租赁合同免费下载房屋买卖合同下载劳务合同范本下载 金额超过 14 亿美金,网络逐步覆盖全球 140 个节点 [7] 。2001 年 2 月,德国最大的有线电视网络商Kable NRW宣布开始同北电网 络合作,将现有的有线电视网络升级为下一代网络,为有线电视网络用户提 供基于IP的话音、视频和数据业务 [8]。2001 年 10 月,美国的Qwest国际通迅 公司宣布将已在美国 Idaho州 Boise市承载网话务基于 Succession的下一代网 络扩展到其服务的所有 14 个州,以取代传统的电路交换网络,成为美国第一 个向下一代网络过渡的传统本地网络运营商(ILEC) [9]。 2001 年 11 月 5 日,美国的Sprint公司本地电信业务部(LTD)宣布开始利 用Succession解决方案将其整个电话网络改造为基于分组的下一代网络,合同 金额达 11 亿美元,成为美国第一个将整个现有电话网络(包括本地和汇接)分 组化的运营商,目前该网络已经成功实现了 72 小时*42,000,000 次大话务量 呼叫测试,并支持 12 万用户线 [10]。2002 年 6 月 22 日,美国最大的全球性固 定和无线运营商Verizon宣布采用北电网络先进的Succession解决方案,不断 改进服务,提供集成的话音和数据业务,截至 2002 年 6 月底,已经成功地处 理了 180 多万次话音呼叫 [11]。2002 年 11 月,加拿大最大的电信运营商之一 Telus也表明了其向NGN方面演进的决心,宣布采用北电网络的Succession解 决方案实现其全国TDM电路交换网络向分组中继的演进 [12]。 -2- 哈尔滨工业大学工程硕士学位论文 1.2.2 国内研究简述 国内NGN的发展获得了信息产业部相关部门的大力支持,其中,电信传 输研究所牵头的网络与交换标准研究组和IP与多媒体研究组早在 2000 年就 开始制定并颁布了中国NGN体系框架、组网设备、组网 协议 离婚协议模板下载合伙人协议 下载渠道分销协议免费下载敬业协议下载授课协议下载 等方面的技术规 范以及测试规范 [7]。在入网检测方面,信息产业部电信设备入网检测中心也 于 2002 年中陆续完成了部分厂家软交换设备的入网测试,北电网络、中兴通 讯等公司率先取得了入网认证 [13]。 自 2000 年起,国内的电信运营商纷纷成立内部项目组,展开对NGN网 年陆续完 络技术和业务能力的调研。其中,中国电信更是捷足先登,在 2001成对北电网络、朗讯科技、爱立信等公司的NGN解决方案的实验室测试,并 于 2002 年 3 月,开展了《中国电信集团NGN试验网》工程,其中,北电网 络获得了在广州、深圳、上海、杭州等 4 个城市建设NGN试验网络的合同。 其它参与中国电信NGN试验网项目的厂家还有阿尔卡特、西门子、爱立信和 中兴通讯公司 [14]。 除中国电信之外,中国铁通也于 2001 年中完成了北京、上海、广州三地 的NGN分组中继长途话音试验网的测试,并随后在重庆开展了NGN本地话音 商用试验网的测试和部署。中国联通也于 2002 年底完成了《中国联通NGN 试验网络测试规范》,启动全国范围内 6 城市的NGN试验网工程 [15]。 中国移动介入下一代网络的时间虽然比较晚,但对下一代网络的应用速 度却十分迅速,继其在两年采用下一代网络提供部分省长途业务外,目前扩 大其下一代网络的网络覆盖规模并暂时提供同样的业务 [16]。 与大陆主要运营商在NGN方面的进展相比,香港的电信运营商为了抢占 市场,取得竞争优势,在NGN方面的步伐较快。其中,2002 年 6 月,香港的 新兴电信运营商香港宽频宣布采用北电网络Succession本地接入分组话音解 决方案,在香港本地开展话音业务。迄今,用户数已激增至 7 万 [17]。 2002 年 12 月,香港另外一家电信运营商新世界电信 (New World Telecom) 也宣布 采用北电网络的Succession本地话音解决方案,加入香港本地话音业务的角 逐,提供分组话音、数据和未来的多媒体新业务 [18]。 纵观全球运营商在NGN方面的试验和应用情况,充分验证了NGN网络的 发展趋势是不可逆转的,它不仅为竞争环境下的电信运营商提供正确的网络 发展建设框架,而且满足了运营商在业务发展创新方面的需求。下一代网络 是一个剧烈的革命性的演变,随着技术的进步它是一个逐渐成熟、走向基本 -3- 哈尔滨工业大学工程硕士学位论文 稳定的技术,下一代网络的发展非常乐观。目前,下一代网络主要是由企业 来推动。中国电信在此方面不断进行测试、不断提出改进意见,现在基本达 到了实际应用的水平 [19]。 1.3 本论文的主要工作内容 综合告警系统 NGN 市区告警转发体系结构图,如图 1-1 所示。 ZTE ALCATEL NGN 专业网管 告警通道 命令通道 资源库 同步 MD Impact 综合告警库 Netcool 平台 Webtop 呈现 Gateway 转发 MD 八大市区告警库 图 1-1 NGN 网络综合告警系统体系结构图 上海综合告警系统 NGN 专业网管分别由中兴、阿尔卡特两家公司独立 建设,并在此次二期建设中将告警集中接入到上海电信综合告警系统,这样 综合告警系统就集中了所有的 NGN 告警。 根据电信的二期项目建设需求,综合告警二期 NGN 建设的目标是:从 专业 NGN 网管中收集 NGN 告警到上海综合告警库中,做相应的告警关联, -4- 哈尔滨工业大学工程硕士学位论文 同时将综合告警库涉及各个郊县自己设备的 NGN 告警要实时发送到各个郊 县自己的告警系统中,实现上海电信 NGN 告警集中监控、集中维护和集中 管理。本设计包含三个子模块的设计操作:NGN 告警的采集子模块,NGN 告警的关联分析子模块,NGN 告警市区转发子模块。 电信开发二期 NGN告警项目采用中间件的设计方案,确保 NGN告警准 确、实时地发送和接收。NGN专业网管的传输采用CORBA(Common Object Request Broker Architecture 公共对象请求代理体系)标准协议,而现有的综 合告警库无法与专业网管直连,所以在设计上我们增加了两个中间媒介,它 们分别是:同步MD和转发MD[20]。同步MD负责向专业网管收集NGN告警并 实现告警同步功能。转发MD负责对下发告警信息的过滤分发。通过这两个 交互软件确保应用系统间信息转送的安全性和准确性。 MD是Mediation Device的缩写名字,意为:协调、调解。在这里我们可 以理解为对NGN告警的协调管理。MD设计在二期NGN建设过程中有扮演重 要角色,且必不可少 [21]。 本论文的写作主要分为以下几个部分: 论文第 1 章绪论,简要描述该课题的背景来源、研究目的以及 NGN 技 术的发展现状等。 论文第 2 章,简要介绍了该项目在电信二期建设中的需要完成的目标以 及对 NGN 告警采集、告警分析和转发的基本实现架构。 论文第 3 章,对 NGN 告警模块功能实现进行了整体设计,包括 NGN 告 警三个功能的需求分析,总体功能设计,系统的业务 流程 快递问题件怎么处理流程河南自建厂房流程下载关于规范招聘需求审批流程制作流程表下载邮件下载流程设计 设计,NGN 资源告 警数据库设计,阐述了各个开发模块间的关系。 论文第 4 章,描述了 NGN 告警模块具体的实现方法及应用到系统中的 相应验证结果,同时给出了模块在系统中部分实现效果界面截图。 -5- 哈尔滨工业大学工程硕士学位论文 第 2 章 NGN 综合告警系统关键技术的研究 2.1 告警采集网管接口方式研究 当前主要的网络管理接口技术有 SNMP/SMI、CORBA/IDL、HTTP/HTML (XML)和通信协议站采用 TCP/IP 的其他网络管理接口,下面分别介绍。 SNMP/SMI网络管理接口 此种网络管理接口的通信协议栈采用 (1)基于 的是UDP/IP。这种通信协议有两个优点:一是它不需要保持连接,因而占用 的系统资源很少,便于嵌入实现设备代理。二是它传输的数据有明显的边界, 便于接收端对数据进行处理。此种网络管理接口的管理信息模型采用来描述, 它采用的语法是的一个子集,为了扩展语法的语义特性,采用文本约定来定 义新的数据类型。但SMI中只有整数和字符串两种原子数据类型,不能定义 复杂的数据类型。从语义信息结构来看,SMI中有标量对象和表格对象两种 信息对象,标量对象用来表示网络设备的单个属性如设备序列号,表格对象 用来表示网络设备中可以增减或批量的属性。SMI可以赋以某个对象的特定 语义来让网络设备执行特定的操作,从而完成对网络设备的控制。此种网络 管理接口的管理操作协议是,它是在网管接口之后发展起来的,现在己被广 泛应用。这种管理操作协议也很简单,它只有对管理对象属性的存取和修改 功能,对于表格对象中行的增加与删除也是通过对管理对象的存取和修改来 完成的 [22]。 (2)基于 CORBA/IDL 的网络管理接口 CORBA/IDL 使用的通信协议栈 目前最多的是 TCP/IP,不过 CORBA 规范中对通信协议栈没有做出限制,只 是对通信协议栈做出了一些假设,而 TCP/IP 满足了这些假设。 此种网络管理接口的管理信息模型采用IDL语言来描述,IDL语言是C++ 语言的一个子集,它采用interface(接口)来定义管理对象类和管理对象类 的继承,每个接口都有属性和操作,对于属性和操作的参数采用类似于C++ 语言中数据结构的定义方法进行准确的描述。管理信息模型由接口的对象构 成,通过管理操作协议可以查询和修改管理对象属性,可以执行管理对象的 操作,从而完成对网络设备的控制 [23]。 (3)基于 HTTP/HTML(XML)的网络管理接口 此种网络管理接口的通 信协议栈还是 TCP/IP,其管理信息模型采用 XML 来描述,XML 是 HTML 的扩展,它采用带标志的纯文本来描述信息,其特点是可读性好,抗破坏能 -6- 哈尔滨工业大学工程硕士学位论文 力强,便于应用程序处理和交换。但单纯的 XML 并不能用来描述管理信息 模型,必须定义一些能够描述管理信息模型的新标志。对于管理信息模型的 管理操作方面,需要在 HTTP 上做出一些额外的规定,即定义一些更详细的 协议才行。 (4)采用TCP/IP的其他网络管理接口 这种网管接口采用TCP/IP,管理操 作协议和管理信息模型采用设备厂商和网管开发商自定义的方式,这种网络 管理接口自由度最高,开发的网络管理接口可能最高效。这种网络管理接口 需要设备厂商和网管开发商友好协商,在两者达成一致意见的基础上进行开 发,如果设备厂家比较多,可能的网络管理接口就会很多,给网管系统的开 发带来的难度就会很大 [24]。 (5)四种网管接口的比较 见表 2-1 所示。 表 2-1 四种网管接口的性能比较 比较项目 CORBA SNMP HTTP/XML TCP/IP 标准化程度 高 一般 低 低 语义描述能力 较高 一般 一般 一般 运行效率 较高 较高 较高 高 价格 较高 一般 一般 一般 综合以上各专业网管接口的比对分析,本项目是电信开发二期主要研发 现内容,系统整体运行采用中间件的设计方案,为确保 NGN 告警准确、实 时地发送和接收。NGN 专业网管的传输采用 CORBA(Common Object Request Broker Architecture 公共对象请求代理体系)标准协议。CORBA 接口是目前 比较成熟的分布式面向对象技术,它提供在异构分布环境下不同机器不同应 用的互操作能力,更适用于开放的电信市场环境下业务和资源有效的管理 CORBA 协议接口,主要用于管理系统间数据的通信与管理功能集成。 自动恢复信息人工恢复 新告警信息入库操作插 删除操作 入操作 Gj_whgj_shgj_delete Tr_Gj_whgj_shgj_delete Tr_Gj_whgj_shgj_insert 本地网管告警恢复 3 信息接口表 Tr_Gj_whgj_shgj_update Gj_whgj_shgj_insert 1 本地网管告警上 2 传接口表 更新告警消息告警操作 Gj_whgj 集中式告警系统本地网管告警信息 图 2-1 本地告警传送流程图 -7- 哈尔滨工业大学工程硕士学位论文 数据流 1 表示当新告警入库到专业网管 Gj_whgj 表的时候,触发器 tr_Gj_whgj_to_shgj_insert 同时将数据入到专业网管告警上传接口表 gj_Whgj_to_shgj_insert 数据流 2 表示当更新告警更新到 Gj_whgj 表的时候,触发器 tr_Gj_whgj_to_shgj_update 同时将更新数据入到专业网管上传接口表 gj_Whgj_to_shgj_insert 数据流 3 表示当产生自动恢复信息,人工恢复信息或进行删除操作时, 触发器 tr_Gj_whgj_to_shgj_defete 同时将自动恢复的信息,人工恢复的信息 以及删除操作关联的数据输入到专业网管的告警恢复信息接口表 gj_Whgj_to_shgj_delete 2.2 基于内存数据库的告警事件处理策略 上海电信集中式告警系统Micromuse公司的Netcool平台上实现。Netcool 平台是一个采用内存数据库技术进行告警采集与处理的平台,从整体架构来 看,可以分为三个层次数据采集层、事件处理核心层、呈现层 [25]。 2.2.1 数据采集层 主要采用 Micromuse 现有的 Probe 对各网元和网元管理器进行告警采集, 但对于不具有普遍性的网元和网元管理器需要自行开发采集探针。数据采集 从底层往上分为三个层面:特定网管系统告警采集程序,Mediation 组件, Micromuse Netcool CORBA Probe。 (1)特定网管系统告警采集程序 针对不同网管系统接口开发的告警采集 程序,负责从各个网管系统中获取告警数据简单处理后的告警数据将通过 Mediation 组件。 Socket 方式提交到 (2)Mediation 组件 将从各个“特定网管系统告警采集程序”采集到的告 警数据,通过 Corba 接口发送到 Micromuse Netcool CORBA Probe。中介技术 的成为管理应用和网络元素共同的交会点。 (3)Micromuse Netcool CORBA Probe 收集从“Mediation 组件”发送过 来的告警数据,再经过预定义的 Rlue File 规则将告警进行基本处理,最后通 过 Netcool 的私有通讯协议上传到告警核心存储处理组件 Ominbus,进行后 续处理。 网络告警采集三层结构,如图 2-2 所示。 -8- 哈尔滨工业大学工程硕士学位论文 图 2-2 告警采集的分层结构图 与各业务关联的探针是基于软件的采集器,它们与事件源相连,听取和 获取事件,然后进行归整成统一的事件格式送到 ObjectServer。 2.2.2 事件处理核心层 这一层主要包括三个部件:ObjectServer、Impact、SnTDB Package。 (1)ObjectServer 事件处理是网络管理的核心功能,因为维护人员的日常 操作即是根据收到的事件报警进行相应的处理,而网络突发事件管理是以事 件的方式进行报警。因此网络事件处理核心的功能将很大程度上影响管理的 效率。 在这一层,ObjectServer 进行统一的网络事件管理,对事件进行压缩、 自动化处理、报警升级等工作。ObjectServer 数据库是系统的核心,其中所 有事件都能实时存储、查看和管理。ObjectServer属于驻留在内存中的实时主 动数据库服务器,以保证高性能的事件处理能力,每秒可以处理 500 多个事 件处理能力,这对于大型网络的故障管理来说是非常重要的 [26]。 (2)Impact 各专业网络的事件在这一层次进行汇总,压缩,业务关联, 事件性关联。在这一层,Impact 作为与外部数据源的桥梁为网络管理人员提 -9- 哈尔滨工业大学工程硕士学位论文 供事件与业务关联的功能,帮助网络管理人员解决网络支撑的重要业务出现 的故障,通过 Impact 实现跨专业的告警关联,客户业务影响分析,重要告警 对维护人员的通知,以及与现有系统的对接。 (3)SnTDB Package SnTDB 是由一个开放型数据模型,此模型在 TMF 605 CASMIM 模型的基础上进行了扩展,包括客户业务订单和物理光缆的模型, 其附加功能包含网络和业务的管理。 SnTDB 数据模型覆盖的实体种类很多,主要有局(Region)、站(Site)、 Rack)、机框(Subne)、板卡(Package)、 机房(Room)、设备(Device)、机架( 端口(Port)等 告警数据放在 ObjectServer 内存数据库中,资源数据放在 Oracle SnTDB 数据库中。Netcool Impact 由 ObjectServer 中的告警驱动,来访问 SnTDB 中 的数据。 Netcool Impact Oracle Data Source Adapter(DSA)模块提供 Impact 和外 部数据库的连接,DSA 简化了与特定数据库接口的复杂性,数据库直接面向 Impact 中的统一的数据格式。在 Impact 中,我们可以定义包含外部数据模型 的 Data Type 使用策略,我们通过 Data Type 变量访问数据。这些变量包含外 部数据库的数据关系。 Impact 通过和 Netcool Gateway 和 ObjectServer 连接,这些 Gateway 定期 检查 ObjectServer 中新的告警,并执行每条告警的定义好的策略。通过这些 策略,进行外部数据的告警丰富,然后将丰富过的告警返回给 ObjectServer。 基于SnTDB资源数据库模型的告警关联和客户影响分析的具体实现思路 为:Netcool Impact将告警信息和资源数据库模型进行关联,通过告警的时间 信息完成告警关联和客户影响性分析 [27]。 2.2.3 呈现层 在呈现层,网运中心的运维人员对全网设备以及大客户业务进行实时监 控和派障处理。在这一层,包含网管权限的控制,每一个操作员只看与自己 相关的事件集合。可以根据专业、设备厂商、告警级别等,定义操作人员的 权限 [28]。 告警事件呈现有两种方式:基于列表方式的 EventList 和基于 Web 的 Webtop 显示。基于列表方式的 EventList 可以让维护人员员看到以不同颜色 级别标注的事件信息,例如红色代表“Critical”严重故障。管理员可以定义 - 10 - 哈尔滨工业大学工程硕士学位论文 事件的显示内容和排列方式,并且可以方便进行调整。事件列表可以使管理 员方便的查看事件信息。 基于Web方式的Webtop允许管理员通过浏览器方式查看事件信息。对于 不同的用户访问,可以设置不同的安全接入口令,并根据其需要定制其管理 界面显示的具体内容。在Webtop中维护人员可以通过搜索引擎进入经验知识 库 [29]。 Webtop做为Micromuse比较成熟一款产品,对于告警数据的访问,依旧通 AEL(告警事件列表)实现,即在主界面中,通过打开AEL实现 过Webtop的 对告警事件的访问和进行相关的操作 [30]。 2.3 本章小结 本章 NGN 综合告警系统进行了研究。详细研究了当今比较流行的四种 网管接口并进行对比,并结合本项目需求和实现能力,确定了 NGN 告警采 集的接口设计方案。同时讨论了综合告警系统中内存数据库的核心实现机制, 针对 NGN 网络告警的传输特点,从实用技术角度阐述了在综合告警系统应 用内存数据库系统的必要性和可行性。 - 11 - 哈尔滨工业大学工程硕士学位论文 第 3 章 NGN 告警采集分析与转发模块的设计 3.1 本项目的需求分析 3.1.1NGN 告警采集业务 随着电信业务和网络的发展,网络规模、层次和复杂性越来越大。电信 运营商的通信网络已经发展成为一个由交换、传输、管线、数据、无线、NGN、 智能网等多专业组成的多层次的复杂网络,而每个专业网络实际上又可以包 含多种网络,基于这样的发展现状综合告警系统必须具有高质量的对外接口。 一般说来,由于各厂商网管或专业集中式网管的实现技术和协议不同, 集中式网管系统必须通过适配器将各网络设备或者各网管系统提供的信息通 过软总线接入。这些适配器可能需要支持的协议包括SNMP(简单网络管理 协议)、CMIP(通用管理信息协议)、CORBA(公共对象请求代理体系结构)、 API(应用系统程序接口)等 [31]。各个适配器与综合网管系统之间通过软总 线进行通信。国际上一些重要的标准化组织也在为综合网络管理问题进行着 不断深化的研究工作,而且各个组织的研究重点也有所不同。随着IP技术的 不断发展,IP网络在当前以及下一代网络(NGN)中都占据着重要的地位。 本项目设计方案采用中间件的设计思想,由于现有综合告警库无法实现 于专业网管的直接连接,所以增添一个中间媒介:同步 MD——负责向专业 网管收集 NGN 告警并实现告警同步功能。规定以较小的时间间隔从专业 NGN 网管采集原始告警数据。采用较小的时间间隔的目的是为了实时地获取 NGN 告警数据。MD 是 Mediation Device 的缩写名字,意为:协调、调解。 在这里我们可以理解为对 NGN 告警的协调管理。MD 设计在二期 NGN 建设 过程中有扮演重要角色,且必不可少。 3.1.2 NGN 告警事件相关性分析业务 当网络出现故障时会产生告警,这些告警是由网络设备上的代理发出的 消息。它表现了系统状态的改变,是故障的外在表现。告警消息中一般包括 故障的时间、产生告警的网络设备名称和故障的严重程度,然而这些并不能 为故障诊断提供精确的信息。其次由于网络的传输问题,可能会造成告警丢 - 12 - 哈尔滨工业大学工程硕士学位论文 失、延迟和重复,进一步增加了故障诊断的难度。再次,由于电信网络的相 关性,一个故障的发生可能影响多个、多种设备的运行,从而产生多个告警, 而这些告警存在实际上的相关性。而且,目前网络规模和关联性的复杂性的 日益增加也可能会造成瞬时的大量网络告警事件 [32]。因此,告警事件的压缩 以及相关性分析成为网络管理中的一个研究热点,人们纷纷将智能技术和信 息处理技术引入进来以期解决网络故障诊断问题。 本文将告警的相关性分析分为狭义的和广义的告警相关性分析。 狭义的告警相关性分析是指对告警进行合并和转化,将多个告警合并成 一条具有更多信息量的告警,这样可以通过发送一条告警来代替多条告警。 广义的告警相关性分析,还包括告警与业务和客户的相关性分析,从而 发现告警对业务和客户的影响。 对于告警相关性的知识,从原则上讲可以从设备设计人员或有丰富操作 经验的工程师获得。然而,这一过程相当繁琐。并且,仅仅从工程师那里获 取告警相关性知识,已经无法满足网络维护的需要。因此,迫切需要新的方 法分析网络中的告警相关性,辅助网络管理员查明产生故障的原因。所以, 告警相关性吸引了越来越多的研究人员在技术上、理论上进行探索 [33]。 3.1.3 NGN 告警转发业务 经过分析、处理、丰富后的 NGN 告警信息需转发的下级各区域网管系 统中,转发的概念实际上是维护一个网管中心和基站的隶属关系。其间设计 一个中间媒介:转发 MD——负责对下发到各区域的 NGN 告警信息过滤分 发。过滤 NGN 告警过滤部分我们采用 IBM 研发的第三软件 Gateway 来协助 我们对 NGN 告警的过滤。Gateway 与转发 MD 之间实现 SOCKET 传输协议, 在设计上要考虑支持多种协议的接口问题,使得 MD 成为忽略平台的应用开 发程序。 这里所说的转发实际上包括两个过程: NGN 告警的过滤和 NGN 告警 的转发。 (1)NGN告警事件过滤功能 由于综合告警库数据库中存在各式各样的告 警字段,但转发到各地NGN网元的NGN告警信息只需要接收部分NGN告警信 息,所以添加告警信息过滤功能十分必要。实现过滤的关键就是在转发MD 中添加一个各地NGN网元告警字段资源列表,将各地区NGN网元的告警需求 信息汇总在一个NGN告警配置文件当中,过滤的条件和原则我们可以根据下 - 13 - 哈尔滨工业大学工程硕士学位论文 一级网管的需求而设定和安排当有 NGN告警信息发送过来,我们启动读取 NGN告警配置文件命令,把发送的NGN告警按照各地NGN网元需要的信息格 式发送出去。这样设计的可以使我们现行网络资源的利用率提高,工作效率 达到最优化的模式。 (2)NGN告警转发功能 NGN网络是基于IP的网络发展起来的,因此它可 以将话音、数据、视频等一律用数字化并打成IP包传送的方式,这样我们就 可以在网络传输中利用Socket协议,把告警库中指定发送对象准确无误地发 送到市区各网管中的告警库当中。综合告警库中传输告警的原则遵循IP地址 访问,运用唯一标记来区别下级各地NGN网元信息 [34]。 3.1.4 NGN 告警业务模块性能需求 (1)系统操作响应时间 系统操作响应时间依赖于系统的硬件配置、系统 的容量和同时访问本系统的会话数目。系统的操作响应时间总体指标如下: 90%的操作响应时间小于等于 3 秒;7%的操作响应时间在 3 秒和 6 秒之间; 3%的操作响应时间在 6 秒以上。 (2)告警响应时间 网络设备运行正常情况下,告警处理时延 3 秒钟(即 本系统接口收到告警到 ObjectServer 送往 Webtop 的时延)。在系统满负荷情 况下,告警响应时间应不大于以上指标的 150%。 (3)存储能力 系统需要保存所有原始告警数据,原始告警应与网元网管 系统或网元管理终端所获告警保持一致,告警数据一致性应能达到 100%; 各种日志文件、历史告警文件应至少保存 6 个月 [35]。 3.2 NGN 告警模块总体功能结构设计 3.2.1 NGN 告警模块需求建设方案 依据综合告警系统二期需求可研究报告,二期建设的重点是将 NGN 网 络告警与其他专业网管告警集中统一在综合告警系统,下图为综合告警系统 二期系统架构,如图 3-1 所示。 - 14 - 哈尔滨工业大学工程硕士学位论文 图 3-1 综合化集中告警系统二期业务示意图 图 3-2 综合化集中告警系统二期功能架构图 - 15 - 哈尔滨工业大学工程硕士学位论文 上海综合化集中告警系统应具有半自动化或自动化收集、分析、处理跨 专业告警的能力,具体的业务需求,如图 3-2 所示。其中底色为白色为一期 已经实现的功能模块,灰色底为二期新增功能模块。 上海电信综合化集中告警系统工程计划在现有PSTN网络的基础上,叠加 一张NGN网络。两个网络虽然承载的媒体流格式和信令方式不一样,但通过 的媒体网关和信令网关可以实现格式转换 [36]。 图 3-3 综合化集中告警系统 NGN 网络组织图 3.2.2 NGN 告警各子功能模块的设计 依据综合告警二期的项目需求分析,在设计可以分为三个子模块,即: NGN 告警采集子模块、NGN 告警关联分析子模块、NGN 告警转发子模块。 通过对 NGN 告警信息自身特点的分析,结合电信业比较流行的告警传输技 术,来实现 NGN 告警的采集分析与转发的实现。 NGN 告警采集子模块 NGN 告警模块 NGN 告警关联分析子模块 NGN 告警转发子模块 图 3-4 NGN 告警功能模块图 3.2.2.1 NGN 告警采集子模块的设计 NGN 告警接入统一资源库的实施方案采 用 CORBA 这一目前比较成熟的分布式面向对象技术,CORBA 提供在异构 - 16 - 哈尔滨工业大学工程硕士学位论文 分布环境下不同机器不同应用的互操作能力,更适用于开放的电信市场环境 下业务和资源有效的管理 CORBA 协议接口,主要用于管理系统间数据的通 信与管理功能集成,在设计同步 MD 对外业务接口时要考虑到不同厂商的网 管系统采用的 CORBA 接口的版本,通过 CORBA 接口将 NGN 告警专业网管 的告警信息采集到同步 MD 当中,并对采集到的 NGN 告警信息进行初步汇 总和分析。 CORBA协议接口,主要用于管理系统间数据的通信与管理功能集成,在 设计同步MD对外业务接口时要考虑到不同厂商的网管系统采用的CORBA接 口的版本,通过CORBA接口将NGN告警专业网管的告警信息采集到我们的 同步MD当中,并对采集到的NGN告警信息进行初步汇总和分析。此外同步 MD也实现NGN告警的同步功能,从某种意义上可以理解为告警信息“零漏 采”率 [37]。 二期项目的设计关键就是中间件 MD 的设计与实现,MD 完成的主要任 务是 NGN 告警同步,NGN 告警中断存贮,NGN 告警断点续传,NGN 告警 -5 所示。 市区转发四项功能。如图 3 NGN 告警同步 NGN 告警中断存贮 MD NGN 告警断点续传 NGN 告警市区转发 图 3-5 NGN 告警系统中 MD 实现功能图 (1)同步 MD 的详细设计 上海电信综合化集中告警系统是覆盖多专业的 集中告警系统,各个专业网管系统需要向其上报告警信息,同时也要接收综 合告警系统下发的告警同步命令,同步告警的目的在于告警信息不会丢失, 确保网络信息的完整性和准确性。 二期 NGN 告警采集、分析与转发项目的实现需要在系统间分别添加同 步 MD 和转发 MD。同步 MD 的主要作用就是在综合告警系统与各个专业网 管之间作用就是建立同步告警通道,这样可以保证从专业告警库中发送出来 的告警信息的准确而及时,综合告警系统与专业网管系统间工作流程,如图 3-6 所示。 - 17 - 哈尔滨工业大学工程硕士学位论文 综合告警系统 命令 告警 专业网管系统 图 3-6 综合告警系统与专业网管系统间工作流程图 但是由于综合告警系统所用平台中和 NGN专业网管系统交互的探针没 -5 中虚线表示,无法实现告警同步等功能,所以 有下发命令的功能,故在图 3 拟在综合告警系统和专业网管系统中间增加接口转换软件 MD[38], MD是 Mediation Device的缩写,本项目将其称作同步MD。 将同步 MD 接入到综合告警系统与 NGN 专业网管系统间,这样 NGN 专 业网管系统就可以接受到来自综合告警系统下发的同步时间命令,从而实现 告警传输的同步方式。同步 MD 的设计理念就是在综合告警库与 NGN 专业 网管之间建立双向通道,综合告警库不但可以收集从各 NGN 专业网管中心 上报的告警信息,同时也可向下同步 NGN 告警信息,实时的获取告警时间 命令相关信息,基于这样的设计思想实现了综合告警系统在 NGN 告警接收 和 NGN 告警同步,如图 3-7 所示。 综合告警系统 MD 命令 告警 NGN 专业网管 图 3-7 增加告警分发器 MD 后系统间信息的发送流程图 命令通道由 MD 发起连接,MD 可选择保持该连接,也可选择在命令执 行后中断,等下次需要时再发起连接。NGN 专业网管不允许主动中断命令通 道。 - 18 - 哈尔滨工业大学工程硕士学位论文 启动同步 MD 监视告警接口,如果接收到专业网管发送的连接信息,立 即建立通信通道接收专业网管上报的 NGN 告警信息。一旦发现与 NGN 专业 网管断开连接,将未发送都综合告警系统的 NGN 告警存入缓冲池,待连接 恢复后向专业 NGN 网管发送同步告警的命令信息,要求同步告警时间,确 保整个系统在断开连接时不丢失 NGN 告警信息。定期向 NGN 专业网管发送 时间命令,取得发送 NGN 告警的具体时间信息,如图 3-8 所示。 向综合告警系统传送告警 新增一个专业网管的通信 接收专业网管上报告警 与专业网管的连接恢复后建 启动MD接口 立与专业网管的命令通道 User 读取远程控制台发来的命令 网络恢复后建立与综合告警 系统的网络连接 停止MD接口 与专业网管的网络连接断开 时向综合告警系统发送告警 定期向专业网管发送取得专 业网管时间的命令 向专业网管发送同步告警的 命令 向专业网管发送一般命令 图 3-8 NGN 专业网管与综合告警库之间同步 MD 的工作原理用例图 启动 MD 的同时,读取告警连接配置文件,初始化连接列表。记录下综 合告警系统的地址和端口,MD 接收 NGN 专业网管连接的监听端口,专业网 管连接上限,连接时限阀值,告警缓存大小,告警缓存阀值,各个专业网管 的地址和端口等信息。 建立MD内部告警通道和命令缓冲池,同时对读取的各个专业NGN网管 的地址和端口、综合告警系统的地址和端口进行连接。经过以上操作MD完 成启动过程 [39] ,如图 3-9 所示。 - 19 - 哈尔滨工业大学工程硕士学位论文 MD开始启动 初始化,读取配置 文件设置运行参数 建立告警通道和命 令缓冲池 建立和专业网管的命 令通道 新建线程负责建立和综合 告警系统的上报通道 MD启动完毕 图 3-9 MD 启动过程活动图 收到NGN网管上 报的告警信息 计算收到NGN告警的 时间 保存到缓冲区, 以便同步时使用 激活上报告警系 统的线程 图 3-10 MD 接收专业网管上报的 NGN 告警信息活动图 - 20 - 哈尔滨工业大学工程硕士学位论文 图 3-10 所示,MD 启动之后,接收专业 NGN 网管发送的告警信息时间 进行计算、保存。例如将某一条 NGN 告警信息首次发生的时间纪录到缓冲 区内,等该告警再次发生时,则将第一次纪录的时间覆盖,保存新的纪录在 缓冲区内,以便同步时使用,综合告警库中数据库系统纪录该条告警的发生 的次数、位置等详细信息。在一定时间间隔内向 NGN 专业网管发送同步时 间命令,获得 NGN 告警同步信息。 启动连接线程 检查是否有NGN 告警信息 是 把NGN退回告警 池 否 取NGN告警信息 检查是否有NGN 告警信息 是 休眠一下 否 设置综合告警库 状态为连接 判断是否成功 是 否 设置综合告警库 状态为连接 图 3-11 MD 向综合告警库发送 NGN 告警活动图 - 21 - 哈尔滨工业大学工程硕士学位论文 在接收 NGN 告警时,确定综合告警库为连接状态。向综合告警库上报 NGN 告警线程有自己的缓冲队列,当缓冲队列没有 NGN 告警可提供时自动 去缓冲池取队列取相应的告警信息。 向专业NGN网管 发送同步命令 失败 进入重连专业 NGN网管处理 成功 保存NGN告警序 列到缓存池 图 3-12 MD 向专业 NGN 网管发送同步命令活动图 连接专业NGN网 管 失败 更新连接间隔 成功 设置内存中专业NGN网 管的状态为已连接 激活同步操作 图 3-13 断开后 MD 重新连接专业 NGN 网管活动图 - 22 - 哈尔滨工业大学工程硕士学位论文 MD运行中 中断与专业网管的连 接 发送剩余的告警 保存未能发送的 告警 保存同步时间 中断与综合告警 系统的连接 MD已停止 图 3-14 MD 停止与专业 NGN 网管连接活动图 设定 MD 的停止状态可以在一定程度上缓解综合告警系统的数据压力与 分析处理效率。更重要的是在承载 NGN 告警接收和发送过程中一旦出现告 警异常发送,可以有效地控制 NGN 告警对综合告警库的冲击,保证综合告 警库正常有序地进行工作,待一切恢复正常状态之后,启动 MD 向专业 NGN 告警库发送同步时间命令,从而保证了 NGN 告警的“零漏采”率。 (2)专业 NGN 告警格式 专业 NGN 网管发送到综合告警库告警格式,系 统 采 用 StructuredEvent 作 为 传 递 告 警 事 件 的 对 象 , StructuredEvent 由 header_body,filter_body,remain_body 三部分组成,如图 3-15 所示。 - 23 - 哈尔滨工业大学工程硕士学位论文 图 3-15 专业 NGN 网管向综合告警发送的告警格式 综合告警库接收到 NGN 告警的字段名及类型,见表 3-1 所示。 表 3-1 告警显示内容对照表 告警字段 字段类型 说 明 告警唯一标示 ENTITY_ID String ALARM_ID String 告警 id 设备类型 NETYPE String 设备地址 NEIP String 告 警 时 间 格 式 为 YYYY-MM-DD EVENT_TIME String HH:mm:ss 告警级别 PERCEIVED_SEVERITY String 告警确认状态 ACK_STATE String 告警确认时间 ACK_TIME String 告警确认用户标示 ACK_USER_ID String 告警确认系统标示 ACK_ SYSTEM_ID String 清除告警用户标示 CLEAR_USER_ID String 清除告警系统标示 CLEAR_ SYSTEM_ID String 3.2.2.2 NGN 告警相关性分析子模块的设计 在 NGN 综合活告警系统项目建 设中,我们采用 Micromuse 内置的规则引擎来进行告警预处理和根告警分析。 (1)告警相关性分析的定义 在网络管理领域,故障被定义为产生功能异 常的原因。故障是产生告警事件的原因。告警是由在特定事件发生时,故障 对象发出的通报(notifications)构成的一种事件报告,用于传递告警信息。 但它只是表明可能但不一定有故障发生。 被管对象可以发出告警事件作为对当前发生异常的响应。告警事件包含 被管对象状态异常的信息。当网络中出现故障时,会引发一系列告警。但并 - 24 - 哈尔滨工业大学工程硕士学位论文 不是所有告警都表明故障原因,所以需要对网络中发生的告警事件进行相关 性分析,确定产生故障的根本原因 [40]。 告警相关性分析是指对告警进行合并和转化,将多个告警合并成一条具 有更多信息量的告警,确定能反应故障根本原因的告警,准确定位。告警相 关性可用多个告警事件进行解释,这给最初定义的告警事件增加了新含义。 告警相关性的形式化定义:告警事件 n 与告警事件集合{a1,a2, ……an}相 关表示为 n=>{a1,a2, ……an},告警相关性可以用于网络故障定位和告警过 滤。 (2)NGN告警故障的处理方式 NGN告警故障处理过程可以分为三个处 理阶段:告警相关性分析(alarm correlation)、故障定位(fault identification)、 故障验证(fault verification)。前两个阶段通常认为是故障定位的处理过程。 通过对告警相关性进行分析,提出各种对故障情况的假设。最后一个阶段是 验证各种故障假设是否正确。例如:在网络监测方面,接收到两个告警事件 服务器连接失败(SCI)客户端连接失败(CCI)。故障的原因可能是路由器故 障(R1)或者交换机故障(S1),这可以表示为:R1 or S1=>{SC1,CC1}。此时网络 管理员无法判断是路由器还是交换机的故障。如果知道告警相关性规则 R1=>{SC1,CC1},就可以直接判断是路由器的故障。网络管理员直接检查路 由器的工作情况,不需要再对交换机进行检查。这样减少了网络管理员的劳 动强度,同时提高工作效率 [41]。 (3)初步 NGN 告警过滤设计 告警过滤是用来把非故障性告警过滤掉。保 留主要的、根本性原因告警。例如上例,如知道告警相关性规则 R1=>{SC1,CC1},就可以直接过滤掉 SC1 和 CC1 告警,直接报告告警事件。 (4)告警相关性分析的类型 NGN 告警关联性分析的七条规则如下: 告警压缩(Compression):将发生的多个同一告警压缩到一个告警中,如 图 3-16 所示。 A 告警压缩 … A A 图 3-16 NGN 告警压缩示意图 告警过滤(filtering):如果告警 A 的 P(A)值不属于合法值集合,则过滤掉 告警 A,如图 3-17 所示。 - 25 - 哈尔滨工业大学工程硕士学位论文 告警过滤 检验 A 告警 符合规则保留 A 告警, 否则过滤掉 属性值 P(A) 图 3-17 NGN 告警过滤示意图 告警抑制(suppression):在高优先级 C 告警发生的前提下,抑制低优先 级的告警 A 发生,如图 3-18 所示。 告警抑制 告警 C 优先级 告警 A 不发生,只保留 高于告警 A 告警 C 图 3-18 NGN 告警抑制示意图 告警计数(count):对重复到达同样的告警进行统计和设定门限值。例如, n 次重复出现的告警 A,如图 3-19 所示。 用一个告警 B 代替 告警计数 若干条 A 告警 显示一条 B 告警 产生 产生 图 3-19 NGN 告警计数示意图 告警泛化(Generalization):用告警的超类(父类)来代替该告警发生或 者显示,如图 3-20 所示。 告警泛化 假使告警 B 是告 当告警 B 产生用 警 A 的衍生告警 告警 A 代替 图 3-20 NGN 告警泛化示意图 告警特化( Specialization):用告警的特定子集告警代替该告警,此规则 与告警泛化恰好相反,如图 3-21 所示。 告警特化 假使告警 B 是告 当告警 A 产生用 警 A 的衍生告警 告警 B 代替 图 3-21 NGN 告警特化示意图 告警时序关系(Temporal relation):具有相关性的告警依赖于告警发生时 间顺序, 当告警 A,告警 B,依次发生时,可以推断告警 C 的发生,如图 3-22 所示。 - 26 - 哈尔滨工业大学工程硕士学位论文 告警时序关系 推断必然会产生 告警 A、告警 B 按 时间依次产生 告警 C 图 3-22 NGN 告警时序关系示意图 3.2.2.3 NGN 告警转发子模块的设计 NGN 告警转发的原理是综合告警库通 过 Socket Writer Gateway 这一第三方软件接收综合告警库下发的专业 NGN 告警,NGN 告警的过滤作用由此体现。对专业网管下发的 NGN 告警我们需 要专业厂商提供的探针(PROBE),再经过转发 MD 准确无误地转发到各地 区的 NGN 告警网元中去。 (1)转发MD的详细设计 转发MD的设计思想是在综合告警库与各地域网 管之间建立一个连接,通过专业SocketWriter插件过滤我们所需要的NGN告警 信息。通信双方采用的是socket通信连接,综合告警库主动发送NGN告警到 郊区各地域NGN网管告警系统的监听端口,郊区各地域NGN网管告警系统只 负责被动接收告警,通过长连接方式,在发送完NGN告警后,不断开socket 通信连接,通信双方仅保留一个告警通道 [42]。 转发 MD 与同步 MD 的设计区别主要是在转发告警动作上不用考虑告警 自身的属性的特点。由于第三方软件 SockerWriter 已经将 NGN 告警库中的 告警信息进行了过滤处理,所以转发 MD 只是接收的 SockerWriter 下发的 NGN 告警信息,不需要其他操作过程处理。值得注意的是在 SockerWriter 的 配置环境里已经声明了告警过滤的特征值,即 Domain,7,经过 Domain 特 征值的限定后,转发 MD 得到告警信息全部为 NGN 告警。在设计下发接口 中,设计的重点就是如何对接收告警的各地网管建立连接和转发 NGN 告警 转发策略。 从专业 NGN 网管上报的告警内容信息模糊,且不具有鲜明的告警特征, 在经过资源库、SockerWriter 等一系列流程操作之后极大丰富了 NGN 告警的 告警特点,极大方便我们对 NGN 告警的分析处理操作。 - 27 - 哈尔滨工业大学工程硕士学位论文 读取配置文件 接收告警信息 User 解析告警信息 继续监听告警通道 监听告警信息发送端口 图 3-23 Gateway 与各节点间 MD 的工作原理用例图 监听端口从综合告警 库读取告警信息 读取配置文件 成功 失败 MD发送 告警缓冲池 告警信息 连接中断 连接正常 唤醒告警 线程 图 3-24 转发 MD 与网元断开链接后告警事件处理活动图 - 28 - 哈尔滨工业大学工程硕士学位论文 MD线程启动 监听线程 1: 检查监听条件 启动告警发 送线程 2: 监听到告警信息 3: 监听端口信息 4: 等待触发 图 3-25 转发 MD 平衡负荷实时告警分发时序图 (2)NGN 转发的告警格式 每个告警包含多个字段用一行 ASCII(包括扩 展 ASCII)字符串传送,每行用 CRLF(ASCII 码 13,ASCII 码 10)结尾。 各个字段间用分隔符分开,若字段没有值,用空字符串或者单个空格表示该 字段的值。 告警字段间的分隔符号用单个 ASCII 字符,缺省为“ |”。每条告警前面 都有一个前缀,新增告警为 insert ,更新告警为 update 。 时间采用 24 小时制,格式为 YYYY-MM-DD HH:mm:ss(四位年-两位月 -两位日 两位小时:两位分钟:两位秒),精度为秒。 双方采用 socket 通信,综合告警主动发送告警到郊区告警系统的监听端 口,郊区告警系统只负责被动接收告警,通过长连接方式,双方仅保留一个 告警通道。 NGN告警对照表中所有字段为String类型,与综合告警接收的字段进行 匹配,在结合NGN告警的收集和转发两个过程中,应注意告警名称的转换和 映射关系,不难看出NGN告警经过综合告警库、SOCKET_WRITER以及转发 MD后告警内容有了较大的变化,NGN告警信息经过一系列的丰富和优化, 转发给下一级网管中能够得到充分的理解和分析,对于监控网络运行和各地 设备NGN专业告警传输都起到的良性推动作用 [43]。 - 29 - 哈尔滨工业大学工程硕士学位论文 表 3-2 告警显示内容对照表 告警标号 告警字段 说 明 告警 id,告警唯一标示,同一条告警新增和更新该值 1 Identifier 相同 告警所属专业,NGN 取值为 7 2 Domain 告警所属子专业 3 SubDomain 告警所在的 EMS 名称,取值范围 :Alcater:ems1、 4 EMSName Zet:ems2 告警所在网管名称 5 Node 6 NodeAlias 网管的 ip 或者别名 Clear(0)、Indeterminate(1)、Warning(2)、Minor 7 Severity (3)、Major(4)、Critical(5) 告警名称 8 AlertName 告警类型 9 AlertType 告警源类型 10 AlertSourceType 告警系统类型 11 AlertInfo1 告警产生位置 12 AlertInfo2 3.3 内存数据库在 NGN 告警系统中的应用 影响故障实时性的一个重大因素就是故障平台的事件吞吐能力,电信网 络网络结构复杂,设备多,数据量大,实时监控产生的事件信息量是相当巨 大。因此事件管理服务器的处理能力是非常关键的。 根据统计,全省需要处理的告警条数日平均为 25 万,峰值为 200,300 条/秒,而电信网络中,告警风暴的发生也存在可能而作为电信网络的告警监 视系统,对网络异常状态的反应速度是衡量系统好坏的首要标准,这就对系 统的设计和使用的处理技术提出了严格的要求。为了选择合适的技术,我们 对磁盘数据库和内存数据库两种技术方案都搭建了测试平台,利用告警事件 模拟发生器对测试平台的性能进行了测试 [44]。 测试平台中,告警模拟发生器生成大量的告警信息,数据库服务器按照 设定的关联分析规则对告警进行分析。测试结果表明,磁盘数据库的处理模 式,每秒最多只能采集和处理 20-30 条事件信息。而 Micromuse 的 netcool - 30 - 哈尔滨工业大学工程硕士学位论文 告警处理平台采用了驻留内存的实时数据库处理技术,每秒最多能够采集和 处理的事件信息达到 500 条以上,足以满足集中式告警中关联分析的需要。 根据以上的测试和分析,在节约投资、满足需要、硬件配置不宜过高的 前提下,在上海电信集中式告警系统中使用内存数据库已是势在必行。 虽然内存数据库具有磁盘数据库无法比拟的优势,但其缺陷也十分明显 内存数据库需要大量消耗系统内存,而内存本身存在价格昂贵、异常情况下 丢失数据等缺点。为了解决这一难题,在集中式告警的实现过程中,需要将 传统的磁盘数据库与内存数据库进行有机的结合。 集中式告警系统将需要进行实时分析的告警数据从专业网管系统采集以 后,首先保存在内存数据库中。然后按照预定的分析方法进行相关性分析和 处理。它通过两种途径来保证告警数据的完整性和处理的高效性: (1)通过实时复制机制将数据保存在永久性存储介质如硬盘中,保证在内 存数据库在停止工作时,数据不会大量丢失,这也是基于内存数据库普遍采 取的数据保存机制。 (2)数据网关的方式,将一些已经恢复的告警保存到外部的磁盘数据库 中。这个同步机制是通过系统管理员定义好一定的规则后,系统后台自动完 成的。同时,内存数据库中将删除这些已经恢复的告警,这位样做的好处是 将最大量的减少内存数据库数据的存放量,减少系统需要消耗的内存,提高 系统的处理性能。在系统需要查询历史告警信息时,系统将通过数据网关的 方式去调取磁盘数据库,进行处理和呈现。 3.4 NGN 告警资源数据库设计 综合化集中告警系统系统资源数据库设计的主要目的是维护 NGN 专业 告警信息,为维护操作人员业务处理提供高效、准确的定位信息,同时也对 上海电信在专业 NGN 告警在未来较长一段时间的发展战略提供有利的重要 决策依据。 上海综合化集中告警系统中告警资源关联分析及呈现,依赖综合告警平 台 Netcool 的 webtop 模块为入口,但又独立于 webtop,采用 Java Applet 运 行方式展现给用户。资源入库在整个告警系统的运行及业务实现上都有较高 的要求,告警资源的关联分析依赖于资源库的各项告警信息,本项目的有大 量的数据库的设计工作,同时充分利用 Oracle 稳定的开发环境和强大的功能 做支持,使项目在 NGN 告警的分析和转发上都有及时、准确、稳定的运行 - 31 - 哈尔滨工业大学工程硕士学位论文 环境。 考虑到 NGN 基于 IP 技术,采用业务曾和传送层相互分离、应用与业务 控制相互分离、传送控制与传送相互分离的思想,能够支持现有的各种接入 技术,提供话音、数据、视频、流媒体等业务,并且支持现有移动网络上的 各种业务,实现固定网络和移动网络的融合,此外还能够根据用户的需求, 保证用户业务的服务质量等特点,在资源告警库的设计和管理需建立严格的 对应策略。综合告警库中映射规则必须依赖 IP 承载网的告警传输特点。 NGN 告警资源数据库涉及九个数据库资源表,分别是 NGN 告警区局表 NGNDRegion)、 NGN 告警站点表 ( NGNRRegion)、 NGN 告警分局表( (NGNSite)、NGN 告警机房表(NGNRoom)、NGN 告警设备表(NGNDevice)、 NGN 告警机架表(NGNRack)、NGN 告警机框表(NGNSubne)、NGN 告警 板卡表(NGNPackage)、NGN 告警端口表(NGNPort),系统维护人员可以 从一条预处理过的 NGN 告警信息,查找到根告警信息以及相应告警源。这 些资源数据表之间遵循一对多的数据库结构关系。通过设定外键属性值,确 定 NGN 告警信息的所属范围,一步步精确到 NGN 告警源,快速而准确锁定 告警故障点。结合告警关联映射规则的设计思想,使得上海综合化集中告警 系统处理 NGN 告警的业务数量大大增加,排查 NGN 告警故障的数量和服务 质量也有非常显著的提高。 3.5 本章小结 本章详细介绍了 NGN 告警采集分析和转发模块的需求分析,根据需求 分析设计的总体功能架构和各子功能模块的详细设计思想,NGN 告警模块子 功能模块包括:NGN 告警采集子模块、NGN 告警关联性分析子模块、NGN 告警转发告警子模块。此外还介绍了内存数据库在综合化集中告警系统的实 际应用价值,并根据该项目二期提出的需求做出的系统资源数据库的设计。 - 32 - 哈尔滨工业大学工程硕士学位论文 第 4 章 NGN 告警采集分析与转发模块的实现 4.1 NGN 告警功能模块的实现技术 上海综合化集中告警二期建设的最终目的将专业 NGN 告警与其他专业告 警系统整合到上海综合平台上,这样综合告警系统不但集中所有 NGN 告警 内容,而且加强了专业内和跨专业的告警关联性分析能力。 NGN 告警采集采用当今流行的 CORBA 协议标准,利用 CORBA 的开放、 跨平台和跨语言的特性,以其作为底层的通信机制设计和实现一个具有较高 性能的中间件 MD,从根本上解决专业网管不能够于综合告警系统连接问题。 通过不断地对中间件的优化和改进,使之成为具有高性能、开放型的接口软 件。 4.1.1 NGN 告警采集的过程实现 框架中 CORBA 服务发布出去的名字为 service,采用 corbaname 的描述 corbaloc:iiop:1.2@machineip:21115/StandardImplName/Naming/root#service , 其中 machineip 为服务所在机器的 IP 地址。通过 service 获得的服务为 ServiceMng,即服务管理接口,通过这个接口中的方法可以获得其他的服务。 ServiceMng 中提供了两个方法,分别用来获得通用的服务和具体的特定服 务。在 CORBA 服务框架下,集中告警系统主要关注 NGN 告警管理、NGN 告警的通知、NGN 告警拓扑管理。如图 4-1 所示。 commconstdef.idl Alarmfrm.idl Comm.idl alarmconstdef.idl exception.idl 图 4-1 以 CORBA 协议为标准的设备接口文件 4.1.1.1 NGN 告警管理服务 AlarmMng 可以通过上述获得的 ServiceMng 后, 调用它的方法:servmng.getCommService("alarm", "");获得。其中告警服务 提供的功能有:确认告警、取消确认告警、清除告警、给告警添加注释、获 取当前未恢复告警、获取当前各级别的告警数目。 NGN告警通知管理北向接口中,网元的告警是通过CORBA的通知服务 上报的,在框架的通用服务中,有一个NotificationMng服务,用来管理告警 - 33 - 哈尔滨工业大学工程硕士学位论文 通知服务。通知管理服务可以通过调用上述获得的ServiceMng的方法。调用 方法如下所示:servmng.getCommService("alarm", "")来获取。该服务中提供 了注册对方事件通道和取消注册两个方法。对接方首先创建用于接收事件的 事件通道,并将它发布在命名服务上,然后调用notreg方法进行注册,该方 法的参数就是对接方创建的事件通道的Corbaname。完成注册后,对接方就 可以从事件通道获取告警事件了。事件采用push的方式,为了方便多事件的 传 送 , 作 为 对 接 方 的 pushconsumer 将 自 己 的 客 户 类 型 设 置 成 ClientType.SEQUENCE_EVENT[45]。 (1)告警事件通用信息组织 CORBA 服务接口的设定规则如下。 Header: domainname:alarm :NotificationType(参见 alarmconstdef.idl) Typename Eventname:AlarmType(参见 alarmconstdef.idl) 其中 Typename 为:NOTIFY_FM_NEW_ALARM Fiter_body: AttributeNameValue.NETYPE (string) AttributeNameValue.NEIP (string) AttributeNameValue.EVENT_TIME (string) AttributeNameValue.PERCEIVED_SEVERIT(short,参见 alarmconstdef.idl 中的 PerceivedSeverity) AttributeNameValue.PROBABLE_CAUSE(long,这个根据不同的网元类 型 解 释 , 请 参 照 各 网 元 提 供 的 信 息 , 其 中 对 SnmpNode 来 说 , 请 参 见 alarmconstdef.idl 中的 SnmpNode_ProbableCause) Remain_body: AttributeNameValue.ENTITY_ID (string) AttributeNameValue.ALARM_ID (string) Typename 为:NOTIFY_FM_COMMENT_ADDED Fiter_body: AttributeNameValue.NETYPE (string) AttributeNameValue.NEIP (string) AttributeNameValue.EVENT_TIME (string) AttributeNameValue.PERCEIVED_SEVERIT(short,参见 alarmconstdef.idl 中的 PerceivedSeverity) AttributeNameValue.PROBABLE_CAUSE(long,这个根据不同的网元类 - 34 - 哈尔滨工业大学工程硕士学位论文 型 解 释 , 请 参 照 各 网 元 提 供 的 信 息 , 其 中 对 SnmpNode 来 说 , 请 参 见 alarmconstdef.idl 中的 SnmpNode_ProbableCause) Remain_body: AttributeNameValue.ENTITY_ID (string) AttributeNameValue.ALARM_ID (string) AttributeNameValue.COMMENTS (string) Typename 为:NOTIFY_FM_ACK_STATE_CHANGED Fiter_body: AttributeNameValue.NETYPE (string) AttributeNameValue.NEIP (string) AttributeNameValue.EVENT_TIME (string) AttributeNameValue.PERCEIVED_SEVERIT(short,参见 alarmconstdef.idl 中的 PerceivedSeverity) AttributeNameValue.PROBABLE_CAUSE(long,这个根据不同的网元类 型 解 释 , 请 参 照 各 网 元 提 供 的 信 息 , 其 中 对 SnmpNode 来 说 , 请 参 见 alarmconstdef.idl 中的 SnmpNode_ProbableCause) Remain_body: AttributeNameValue.ENTITY_ID (wstring) AttributeNameValue.ALARM_ID (wstring) AttributeNameValue.ACK_USER_ID (string) AttributeNameValue.ACK_SYSTEM_ID (string) AttributeNameValue.ACK_STATE ( short , 参 见 commconst.idl 中 的 AckState) Typename 为:NOTIFY_FM_CLEARED_ALARM Fiter_body: AttributeNameValue.NETYPE (string) AttributeNameValue.NEIP (string) AttributeNameValue.EVENT_TIME(string) AttributeNameValue.PERCEIVED_SEVERIT(short,参见 alarmconstdef.idl 中的 PerceivedSeverity) AttributeNameValue.PROBABLE_CAUSE(long,这个根据不同的网元类 型 解 释 , 请 参 照 各 网 元 提 供 的 信 息 , 其 中 对 SnmpNode 来 说 , 请 参 见 alarmconstdef.idl 中的 SnmpNode_ProbableCause) - 35 - 哈尔滨工业大学工程硕士学位论文 Remain_body: AttributeNameValue.ENTITY_ID (wstring) AttributeNameValue.ALARM_ID (wstring) AttributeNameValue.CLEAR_USER_ID (string) AttributeNameValue.CLEAR_SYSTEM_ID (string) Typename为:NOTIFY_FM_NOTIFICATION 通用消息格式和 NOTIFY_FM_NEW_ALARM 一样,不过对通知来说, 没有 alarmtype,所以 eventheader 中的 eventname 是“Unknown alarm type”。 NOTIFY_FM_NOTIFICATION = "x8"; 以下三种目前没有: NOTIFY_FM_CHANGED_ALARM = "x2"; NOTIFY_FM_ALARM_LIST_REBUILT = "x6"; NOTIFY_FM_POTENTIAL_FAULTY_ALARM_LIST = "x7"; (2)查询告警的信息组织 CORBA 服务接口请求对象的设定规则如下。 采用 StructuredEvent[]的形式返回,属性都存放在可变体中: Fiter_body: AttributeNameValue.NETYPE (string) AttributeNameValue.NEIP (string) AttributeNameValue.EVENT_TIME(string) AttributeNameValue.PERCEIVED_SEVERIT(short,参见 alarmconstdef.idl 中的 PerceivedSeverity) AttributeNameValue.ENTITY_ID (string) 若有改变,则有下面的这个属性: AttributeNameValue.ALARM_CHANGED_TIME (string) AttributeNameValue.ALARM_ID (string) 若该告警曾经确认过,则有以下的两个属性: AttributeNameValue.ACK_TIME (string) AttributeNameValue.ACK_USER_ID (string) AttributeNameValue.ACK_STAT(short,参见 commconst.idl 中的 AckState) AttributeNameValue.PROBABLE_CAUSE(long,这个根据不同的网元类 型 解 释 , 情 参 照 各 网 元 提 供 的 信 息 , 其 中 对 SnmpNode 来 说 , 请 参 见 alarmconstdef.idl 中的 SnmpNode_ProbableCause) - 36 - 哈尔滨工业大学工程硕士学位论文 4.1.2 NGN 告警同步 MD 的实现 NGN 模块间的主要工作流程,如图 4-2 所示。 开始 设置北向接口 对象 创建 AlarmSender 启动 AlarmListeningThread 启动 AlarmReceiveThread 将接受的告警加入 对象池 启动AlarmSender 结束 图 4-2 NGN 内部的主要工作流程图 - 37 - 哈尔滨工业大学工程硕士学位论文 NGN 告警模块功能由 MDCtrl、AlarmSender、AlarmListeningThread、 AlarmReceiveThread 主要部分实现,工作流程如下所示。 (1)MDCtrl 的工作流程,如图 4-3 所示。 开始 MD启动 创建停机线程 读取配置文件 设置北向接口 添加北向接口 启动AlarmSender 结束 图 4-3 MDCtrl 的工作流程图 MD 的启动在 main 中,创建停机线程在 startUp 中,读取配置文件在 checkConf 中,设置北向接口,添加北向接口也在 checkConf 中。启动 - 38 - 哈尔滨工业大学工程硕士学位论文 AlarmSender 在 initCore 中。 (2)AlarmSender 的工作流程,如图 4-4 所示。 开始 创建AlarmSender对象 启动 AlarmListeningThread 监听告警对象池 否 是否有告警, 是 从告警池获取告警 调用AlarmUtil处理 结束 图 4-4 AlarmSender 的工作流程 创建 AlarmSender 对象一般是由上层调用 AlarmSender 的 getInstance 函数 获取的。启动 AlarmListeningThread 是在 AlarmSender 的构造函数中进行的。 - 39 - 哈尔滨工业大学工程硕士学位论文 其余的部分都在 AlarmSender 的 run 函数中执行,这样就是一个单独的线程 了。 (3)AlarmListeningThread 的工作流程,如图 4-5 所示。 开始 创建Listening对象 创建监听服务器 监听线程 否 是否有连接, 是 创建Receiving线程 结束 图 4-5 AlarmListeningThread 的工作流程图 创建 Listening 对象一般是由 AlarmSender 调用 AlarmListeningThread 的 getInstance 函数来创建的。这里启动的监听线程需要对监听的每个端口做出 一个判断,监听成功则发送 NGN 告警信息,否则继续启动监听线程。监听 线程有持续监听端口特性,即定期发送连接请求命令。创建监听服务器和下 - 40 - 哈尔滨工业大学工程硕士学位论文 面的操作都是在 AlarmListeningThread 中进行的。 (4)AlarmReceiveThread 的工作流程,如下图 4-6 所示。 开始 创建Receive对象 获取输入流 设置告警对象 告警加入 结束 图 4-6 AlarmReceiveThread 的工作流程图 创建 Receive 对象是由 AlarmListeningThread 调用 AlarmReceiveThread 的 getInstance 来创建的。其余的部分都是在 AlarmReceiveThread 的 run 函数中。 同步 MD 在对接收到的 NGN 告警不做任何处理,发送给下一级综合告 警库当中,对于 MD 本身来说,这样一系列操作是重复而有序的。MD 在监 听连接专业网管端口的同时,对收到的 NGN 告警信息时间进行保存。如果 由于任何一方断开连接,立即保存当前状态,待恢复连接后继续之前的各项 操作。 - 41 - 哈尔滨工业大学工程硕士学位论文 4.1.3 NGN 告警关联性分析过程实现 基于规则引擎的告警预处理和根告警分析 采用 Micromuse 内置的规则 引擎来进行告警预处理和根告警分析。 (1)告警预处理 告警预处理的主要功能是:告警格式专业内统一,主要 是指各专业内部告警数据格式的统一,应将各专业网不同数据格式和不同信 息格式的告警,转换成专业内统一的格式。告警级别的重定义 支持对收集到 的告警进行级别的重定义。系统定义的告警级别为紧急告警、重要告警、次 要告警、普通告警、无法确定告警和清除告警。告警的底层过滤抑制、归并、 过滤 制定相应的过滤条件对原始告警事件进行抑制,从采集层消除无用的或 不关心的告警信息,降低告警处理层的负荷,对底层的告警支持不同阂值的 归并,支持对重复告警和瞬时告警的处理。这里,我们主要需要考虑的是告 警级别重定义规则和告警底层过滤规则。 告警级别重定义规则包括:告警级别定义规则,告警级别变化规则,告 警清除规则。告警底层过滤规则包括:瞬时告警过滤规则,阐值告警过滤规 则,重复告警过滤规则。 (2)根告警分析 根告警分析是指集中式告警系统通过从资源管理系统得 到的专业内的逻辑关联关系和跨专业逻辑关联关系,对告警信息进行专业内 和跨专业关联性分析,最终确认根告警,屏蔽由根告警衍生出来的其它告警。 在集中式告警系统中,告警相关性分析无论是根源告警分析还是告警的 客户影响性分析的基础就是电信网络资源的相关性。必须建立了适当的数据 模型,通过准确、完备的资源数据,清晰地描述资源之间的承载关系。 根告警分析的处理规则,主要是根据网络资源的拓扑关系和承载关系图, 发现告警的相关性,从而屏蔽衍生告警。以下是我们项目中关于根告警分析 的一些脚本实例。 //……………………………………………… // Event Association Policy //……………………………………………… log(2, “……………………………………………”); log(2, “Called Shanghai_PRC. Time:LocalTime(GetDate(), “HH:mm:ss)); log(2, “……………………………………………”); curAssociationID=EventContainer.ASB_AssociationID; - 42 - 哈尔滨工业大学工程硕士学位论文 log(2,“curAssociationID=“+curAssociationID+”,AlertGroup=”+EventConta iner.AlertGroup); if (curAssociationID<=0) { EventContainer. ASB_ImpactStatus=30; ReturnEvent(EventContainer); Exit(); } // 标记当前告警时间经过 EventContainer. ASB_ ImpactStatus=21; ReturnEvent(EventContainer); Ttab=”…”; /* 如果 curAssoicID 组中 ASB_PRC=2 的告警数为 1,则它就是根告警 */ tFilter=”((ASB_PossibleRC=2)and(ASB_AssociationID= “+curAssociationID+”))”; log(2, “Before Step1:tFilter=”+tFilter); PrcArr=GetByFilter(“Shanghai_Ncoms”,tFilter,false); tAlarms=Length(PrcArr); log(2, “Step1:Found”+Alarms+“Alarms”); if(tAlarms= =0) { EventContainer.ASB_ImpactStatus=30; ReturnEvent(EventContainer); Exit(); } if(tAlarms==l) { //需要将同组中其他告警的 PRC 设置为不确定吗? PrcArr[0].ASB_PossibleRC=3; BatchUpdate(„Shanghai_Ncoms?, “((ASB_AssociationID= ”+curAssociationID+”))”, “ASB_ImPactStatus=30”); - 43 - 哈尔滨工业大学工程硕士学位论文 Exit(); /* 找出 ASB_ServicesImpacted==maxServicesImpacted 的所有告警 */ tFilter=“ ((ASB_PossibleRC=2)and(ASB_AssociationID=“+ curAssociationID+”)and(ASB_ServicesImpacted=“+ maxServicesImpacted+”))”; t_MaxISAlarmsArray=GetByFilter(“Shanghai_Ncoms”,tFilter,false); tAlarmNums=Length(t_MaxISAlarmsArray); log(2,“tFilte=“+tFilter+”,nums=”+tAlarmNums); /* 当前告警组中业务影响数为 maxServicesImpacted 的告警只有一个 */ if(tAlarmNums==1) { BatchUpdate(„Shanghai_Ncoms?, “((Serial=“ +t_MaxISAlarmsArray[0].Serial+”))”, “ASB_PossibleRC=3”); t_MaxISAlarmsArray[0].ASB_PossibleRC=3; BatchUpdate(„Shanghai _Ncoms?, “((ASB_AssociationID= “+curAssociationID+”))”, “ASB_ImpactStatus=30”): Exit(): } 通过对告警数目的变化,推断出告警信息是否为根告警以及该告警的告 警次数。在实际应用中出现的类型有很多种,告警分析人员的分析依据可以 通过常见告警信息的产生类型和时间、次数归纳总结专业告警的关联规则。 4.1.4 NGN 告警转发过程环境配置说明 转发 MD 主要是从 SocketWriter 获取 NGN 告警数据,然后通过告警内 容的过滤然后转发给客户。 介于综合告警库与转发 MD 的第三方软件 SocketWriter 实时读取综合告 警库中所有 NGN 的告警,它的主要作用就是对综合告警库下发的告警进行 过滤处理,由于综合告警库集中电信所有的告警信息,所以我们要对向下一 - 44 - 哈尔滨工业大学工程硕士学位论文 级发送的告警进行一个约束条件的处理,即把我们需要的 NGN 告警信息过 滤出来,下发给转发 MD,然后再由转发 MD 发送给各地网元系统中。运行 环境 Socket_Writer 配置环境如下: START WRITER SOCKET_WRITER ( TYPE = SOCKET, #系统确认配置文件信息 REVISION = 1, # 显示版本信息 HOST = '132.150.138.201', # 连接 MD 的 IP 地址 PORT = 15670, # 连接 MD 的端口 DATE_FORMAT = '%F %T', # 显示告警的时间格式 INSERT_HEADER = 'insert:', # 添加告警时显示在告警头部 UPDATE_HEADER = 'update:', # 更新告警时显示在告警头部 DELETE_HEADER = 'delete:', # 删除告警时显示在告警头部 SEPARATOR = '|', # 告警各信息之间的间隔符 INSERT_TRAILER = '\r\n', # 添加告警时显示在告警尾部 UPDATE_TRAILER = '\r\n', # 更新告警时显示在告警尾部 DELETE_TRAILER = '\r\n' # 删除告警时显示在告警尾部 ) 转发MD向下一级网元发送NGN告警信息在满足告警格式内容的前提 下,仍然需要做进一步过滤处理操作,例如,下一级某个网管系统只需要来 自综合告警库的一部分NGN告警字段信息,那我们就可以将它需要的部分信 息转发到这个网管系统中,而不需要将一以完整的NGN告警信息发送出去, 这样做不但有利于下一级网管对NGN告警信息的监控的效率提高,同时也优 化网络传输速率的有效手段之一。 转发MD模块中在综合告警平台ObjectServer的OMNIHOME\etc目录下有 一个conf.ini文件,这个文件中包含了配置的内容和转发NGN告警的约束条 件。 [MDSystem] alarm_file=c:/workspace/NGNT/alm.txt #保存未成功发送告警的路径 time_out=5000 #设置网络连接超时时间 address=132.150.138.201 #SocketWriter的地址 listen_port=15670 #监听SocketWriter的端口 count=1 #北向接口的数目 - 45 - 哈尔滨工业大学工程硕士学位论文 [North1] #第一个北向接口的名称 filter=0;4;2;6; 3; 9 #需要过滤的数据 address=132.150.138.205 #北向接口的IP地址 port=1122 #北向接口的端口号 由此我们的清楚地看到下一级网管对接收 NGN 告警的限制条件,在 filter 的设定里,我们只需要将所需的告警信息标号罗列出来,次序没有要求,中 间用分号隔开,由此实现了综合告警库对下级 NGN 网管的连接传输过程。 连接器 cmdChannel alarmChannel 网管名 告警上报信道 上报缓冲 命令接收器 网管地址 告警池 最后告警时间 重连间隔 serverSocket 时间差 NC地址 告警缓冲池引用 run() NC端口 重连间隔上限 socket 告警缓冲池 初始化() run() 上报告警队列 取时间差() 初始化() 命令缓冲池 未发送告警队列 取最后告警时间() 控制台 连接规程() 同步告警队列 取网管地址() 发送规程() 设置告警信道的socket() getCmd() run() 读入未发送告警(文件地址)() 取告警(非线程安全)() 放告警数组(线程安全)() 放告警() 初始化() 命令信道管理 主线程 命令信道列表 监听器 配置管理 main() 网管列表 告警池引用 初始化环境() 重连间隔上限 取临时文件地址() 取NC信息() 初始化() 取重连间隔() 匹配告警通道() 取监听端口() 取网管列表() 命令信道 网管端口 网管地址 最后告警时间 重试间隔上限 监听器 告警缓冲池引用 serverSocket 时间差 连接器管理对象引用 告警信道 socket 重连间隔上限 网管名 socket 监听端口 命令缓冲池引用 告警缓冲池引用 时间差 run() run() run() sendCmd() 初始化() 设置socket() 连接规程() 发送规程() 创建告警通道() 图 4-7 MD 连接专业网管与综合告警库通信交互类图 NGN 告警采集子模块包含的主要业务就是告警信道和告警同步命令信 道的建立与监听,此外还有对告警缓冲池的队列管理和 NGN 专业告警接口 的环境配置。经过 socker 端口建立链接后,主线程 main()依次启动 MD 接口 建立告警通道,发送时间命令同步告警,建立命令通道。在 MD 启动,配置 - 46 - 哈尔滨工业大学工程硕士学位论文 北向接口文件,成功后启动接收告警 corba 接口和创建 AlarmSender 实例, 逐步启动监听 AlarmListeningThread 线程,对专业 NGN 网管的连接请求,做 出相关应答。 AlarmSender socket maxInterval CommandListene Interval AlarmFile Alarm r NCAddr NCPort context recvSocket CmdFile clearAlarms() powerOn level powerOn SenderCache loadAlarms() state port loadAllCmds() setContext() saveAlarms() cmdSource saveCmds() sendRule() updateFile() clear() setLevel() clearCmds() tmpSave() run() connectNC() getContext() getAlarm() Configer tmpSave() run() getLevel() pushbackAlarm() shutdown() shutdown() saveAlarms() getAlarmsFilePath() connectRule() size() getCacheSize() Command getCmdFilePath() content CmdPool getControlPort() AlarmQueue args commands getNMSInfo() AlarmPool getNMSList() alarmBucket setContent() addAlarm() saveCmd() getErrFilePath() setArgs() removeAlarm() getCmd() getListenEMSPort() saveAlarm() getContent() addAlarms() getMaxNMSCount() pushbackCmd() getAlarm() getArgs() removeAlarms() getMaxRetryInterval() saveAndClear() saveAlarms() size() saveAndClearPool() getNetcoolAddr() getAlarms() clearAllAlarms() getNetcoolName() saveToFile() pushbackAlarm() getNetcoolPort() loadFromFile() pushbackAlarms() getTimeCommandInterval() pushbackAlarm() saveToFile() saveToFile() clearPool() saveToFileAndclear() setNMSSyncTime() savePool() loadFromFile() saveAndClearPool() GlobalInstance NMSCommunicator MDCtrl getAlarmPool() alarmSpecialty getAlarmSender() dealAddNms() NMSIP getCfgFilePath() ExProperties CommandSocket dealCmd() NMSCommandPort getCmdListener() dealErrCmd() cmdSocket getCmdPool() client dealHelp() getProperty() sendTimeCommandThread getConfiger() socketReader dealInfo() sendCommandThread getErrFilePath() load() socketWriter helpForAddNms() receiveAlarmThread getErrParset() save() NMSIP shutdown() NMSSyncTime getLogger() setProperty() NMSCommandPort startUp() timebetween getNMScommunicatorMgr() tmpSave() parent checkConf() NMSName setCfgFilePath() channelStatus setErrFilePath() getAlarmChannelStatus() setupCommandChannel() init() shutdownCommandChannel() TimeCommandChannelT getCommandChannelStatus() sendCommand() hread setAlarmReceiveThread() init() setAlarmSpecialty() cmdSocket syncAlarm() getAlarmSpecialty() interval getStatus() getNMSSynctime() stop setNMSSyncTime() run() getNMSIP() getTimebetween() setCmdSocket() setTimeBetween() shutdownThread() startCommunication() sendTimeCommand() WinStyleLineRe sendGeneralCommand() DateTool ader shutdownCommandChannel() stopCommunication() AlarmListeningThread getTimeDiffer() readLine() alarmListeningPort getTimeBefore() close() server GeneralCommandChann ErrParser run() elThread cmdSocket getErrDescription() run() NMSCommunicateMgr shutdownThread() NMSList listenThread AlarmReceiveThread receiveSocket getNMSByIP() alarmChannelStatus addNewNMS() parent startAllNMS() stopAllNMS() run() loadAllNMS() setupAlarmChannel() setAlarmThreadByIP() shutdownThread() getAlarmChannelStatus() setParent() 图 4-8 MD 进行 NGN 告警通信的内存分配管理类图 由于系统采用 ObjectServer——内存数据库与传统磁盘数据库相结合的 开发环境,所以对系统运行内存空间配置要求较高,合理分配内存地址空间 提高查询、显示 NGN 告警的速度,也是本项目在设计实现中需要考虑的问 题。 4.2 NGN 告警模块开发环境 本项目在原有运行环境和硬件设备基础上增添了两部专业 NGN专业网 管分别由中兴,阿尔卡特两家公司独立建设,他们的北向接口都遵循CORBA 标准协议的通讯规则。综合平台继续沿用Micromuse公司的Netcool平台上实 - 47 - 哈尔滨工业大学工程硕士学位论文 现,项目二期加强集中告警系统内部采集的NGN告警关联性分析, Netcool 平台采用了基于规则引擎和案例推理相结合的告警相关性分析方法,使电信 网络设备的告警事件到了有效的处理和分析,使之能快速、有效地判断网络 的根源告警和故障的真正原因,同时采用高效、准确的告警压缩方法,使网 络的无效告警得到了正确的屏蔽,大大减少了系统的性能负荷 [46]。 应用了先进的内存数据库技术,使之与传统的磁盘数据库进行有机结合, 保证了系统的处理性能,不但节约了投资,也便于系统的维护和管理。此外 本项目资源数据库 orcale9i 客户端,方便维护管理人员的操作。 NGN 告警转发的设计与实现中,为系统针对 NGN 告警过滤这一环节 在 新购进 Netcool Socket Writer Gateway 第三方软件,大大增强系统在运行中稳 定性和准确性。中间件开发选用 java 语言技术,有利于与基于网络呈现 webtop 结合与实现。 4.3 NGN 资源数据库的实现 根据对 NGN 集中告警数据的需求分析,创建出九个 NGN 告警内容和属 性相关数据库表,数据表将 NGN 告警涉及的区局、分局、站点、机房、设 备、机架、机框、板卡和端口相关信息整理在资源数据表中。以下是九个资 源数据表的定义和说明,见表 4-1 至表 4-9 所示。 表 4-1 NGN 告警区局表 NGNRRegion 字段名 数据类型 说明 其他 主键 非空 NGNRRegionid Int 名称 区局名称 Name String 编码 区局编码,唯一 Code String 别名 区局别名 Alias String 地址 Address String 联系人 Officename String 联系电话 Officephone String X 坐标 GEOX Float GEOY Float Y 坐标 备注 Comments String - 48 - 哈尔滨工业大学工程硕士学位论文 表 4-2 NGN 告警分局表 NGNDRegion 字段名 数据类型 说明 其他 主键 非空 NGNDRegionid Int 名称 分局名称 Name String 编码 分局编码,唯一 Code String 别名 分局别名 Alias String 所属区局 外键 NGNRRegionid Int 地址 Address String 联系人 Officename String 联系电话 Officephone String X 坐标 GEOX Float GEOY Float Y 坐标 备注 Comments String 表 4-3 NGN 告警站点表 NGNSite 字段名 数据类型 说明 其他 主键 非空 NGNSiteid Int 名称 局站名称 Name String 编码 局站编码,唯一 Code String 别名 局站别名 Alias String 站点类型 外键 Sitetype Int 地址 Address String 联系人 Officename String 联系电话 Officephone String 所属区局 ID NGNRRegionid Int 外键 外键 NGNDRegionid Int 所属分局 ID GEOX Float X 坐标 GEOY Float Y 坐标 备注 Comments String - 49 - 哈尔滨工业大学工程硕士学位论文 表 4-4 NGN 告警机房表 NGNRoom 字段名 数据类型 说明 其他 主键 非空 NGNRoomid Int 名称 局站名称 Name String 编码 局站编码,唯一 Code String 别名 局站别名 Alias String 机房类型 Roomtype String 地址 Address String 联系人 Officename String 联系电话 Officephone String 所属区局 ID NGNRRegionid Int 外键 外键 NGNDRegionid Int 所属分局 ID GEOX Float X 坐标 GEOY Float Y 坐标 备注 Comments String 表 4-5 NGN 告警设备表 NGNDevice 字段名 数据类型 说明 其他 主键 非空 NGNDeviceid Int 设备名称 非空 Shortname String 设备编号 Shortcode String 机房类型 Roomtype String 所在机房 ID NGNRoomid Int 外键 外键 NGNsiteid Int 所属站点 ID 外键 NGNRRegionid Int 所属区局 ID 外键 NGNDRegionid Int 所属分局 ID IPAddress String IP 地址 工程编号 ProjectNo String 资产编号 ResourceNo String 备注 Comments String - 50 - 哈尔滨工业大学工程硕士学位论文 表 4-6 NGN 告警机架表 NGNRack 字段名 数据类型 说明 其他 主键 非空 NGNRackid Int 所属机架类型 NGNRackType String 所属设备 NGNDeviceid Int 外键 机架编号 非空 Shortcode String 机架序列号 非空 SerialNo Int 网管中标识 NameInEms String 备注 Comments String 表 4-7 NGN 告警机框表 NGNSubne 字段名 数据类型 说明 其他 主键 非空 NGNSubneid Int 所属机框类型 NGNSubneType String 所属机架 NGNRackid Int 外键 机框编号 Shortcode String 机架序列号 SerialNo Int 同一机架,机框唯一 网管中标识 NameInEms String 备注 Comments String 表 4-8 NGN 告警板卡表 NGNPackage 字段名 数据类型 说明 其他 主键 非空 NGNPackageid Int 所属机框 外键 NGNSubneid Int 所属机架 外键 NGNRackid Int 所属设备 外键 NGNDeviceid Int 板卡类型 Model String 板卡型号 PackageType String 板卡编号 ShortCode String 非空 板卡序列号 同一机框,卡号唯一 SerialNo Int 网管中标识 NameInEms String 备注 Comments String - 51 - 哈尔滨工业大学工程硕士学位论文 表 4-9 NGN 告警端口表 NGNPort 字段名 数据类型 说明 其他 主键 非空 NGNPortid Int 速率 DNportcapacity Int 端口编号 ShortCode String 非空 端口序列号 同一板卡,号码唯一 SerialNo Int 业务状态 Servicestatus Int 所属板卡 NGNPackageid Int 外键 所属设备 外键 NGNDeviceid Int 网管中标识 NameInEms String 备注 Comments String 以上资源数据表中明确设定了空间和设备的层次关系,综合告警库实际 上相当于一个内存数据库,将这些表之间进行相互关联,我们可以有效地确 定告警发生的具体发生源,通过这些数据表可以跟踪 NGN 告警从局以下的 机房、设备、机架、机框、板卡以及端口等一系列信息,使得一条 NGN 告 警精确得到及时处理和解决。在现实工作环境下这种定位告警的方式得到了 证实,同时使维护人员对于 NGN 告警问题排查的效率有较大提高。 资源告警库各个资源列表的关系,如图 4-9 所示。 图 4-9 资源告警库九个列表的数据库结构关系图 - 52 - 哈尔滨工业大学工程硕士学位论文 资源关联各表的关系呈现树型结构,在数据库模型关系里表示为一对多 的关系,所以设计表的时候应考虑到各表间的层次问题。 4.4 综合集中告警系统中 NGN 告警界面与应用验证 NGN 告警模块测试用例共 53 个,通过的测试用例为 51 个。代码覆盖率 基本达到 96.2%以上,未覆盖部分大多数是难以构造的异常。 NGN 开发测试结果显示告警采集成功率为 100,,该模块的 12 个 二期 测试用例,通过测试 12 个。在测试流程中没有告警的丢失现象发生,达到了 需求设计中 NGN 告警的“零漏采”的业务需求。告警关联性分析的成功率 为 94.4,,该模块 36 个测试用例,通过测试 34 个,未成功的测试部分涉及 系统硬件环境和操作规范等非接口设计原因,解决的途径完善系统结构,规 范维护人员的操作方法。告警转发测试成功率为 100,,该模块 5 个测试用 个。由此可见,基本满足 NGN 告警采集分析与转发的设计 例,通过测试 5 需求。为 NGN 告警成功统一在综合告警平台提供有力的技术保障。 综合集中告警库 NGN 告警显示页面,如图 4-10 所示。 图 4-10 综合集中告警系统 NGN 告警显示界面 - 53 - 哈尔滨工业大学工程硕士学位论文 NGN 告警的级别以颜色区分,红色代表级别最高——严重告警。其他告 警级别由高到低颜色依次是紫色,蓝色,橘色和黄色。维护人员可以通过告 警信息的颜色来判定操作处理,点选任意 NGN 告警信息双击,可以看到该 NGN 告警信息的详细内容,维护人员可以看到 NGN 告警信息的状态及属性 特征,通过对 Identifier 值的分析,可以从告警的资源数据库中查询出更多的 属性值,例如,该告警的时间,产生的告警次数,告警产生的设备等一系列 源告警的详细信息,缩短了相关人员的维护和处理时间,提高日常工作效率。 综合告警平利用 Netcool 独有的 Webtop 技术,为维护人员提供的丰富的 告警显示方式,对于任意一条 NGN 告警信息,双击或者单击右键就可以得 -11 所示。 到与告警有关的详细信息。如图 4 图 4-11 NGN 告警根告警查询界面 与以往的告警平台不同的是项目中采用内存数据库与传统磁盘数据库相 结合的告警显示方式。现阶段基本满足对 NGN 专业告警的监控和处理工作。 通过对 NGN 告警的根告警关联查询,维护人员可以循序锁定告警产生的具 体地点方位,并在第一时间给出相关操作,该操作涉及对资源数据库的调用 操作,故在显示速度上要略慢一些。图 4-12 所示一条 NGN 告警的详细信息。 图 4-13 所示查询出设备产生的根告警。 - 54 - 哈尔滨工业大学工程硕士学位论文 图 4-12 一条 NGN 告警信息状态显示界面 图 4-13 NGN 告警根告警关联查询结果界面 图中方形图标代表产生 NGN 告警的设备名称,长方形图标代表告警产 生的真正设备名称和状态。 4.5 本章小结 本章分别对 NGN 告警采集、关联性分析分析和转发环节进行的详细的 设计和实现,重要内容展示了真实环境的部分代码和配置信息。 重点论述了 NGN 告警功能模块从设计到实现涉及到的开发思想,开发 涉及环境,关键技术和支撑平台。并在最后一节展示的部分操作截图,更直 观地展示了 NGN 告警模块在整个系统中运行的状态和展示结果。 - 55 - 哈尔滨工业大学工程硕士学位论文 结 论 随着电信重组和中国加入 WTO,国内各电信企业面临着严峻的市场竞争 形势,如何提高运作效率、降低运维成本、改善服务质量、保证网络高效稳 定的为客户提供服务,提高为客户服务的水平是每个电信企业迫切需要解决 的问题。 本文主要论述了基于 IP 承载网网络告警的采集分析与转发模块的设计 与实现。充分结合上海电信在 NGN 告警建设项目的需求,在原有设备和资 源利用的基础上,开发新业务模型。从而使上海电信在南方网络运营方面有 了更加丰富的经验和技术。 文章主要依据上海电信二期开发的需求为出发点,分析了 NGN 告警的 特点及运行环境,整合了传输、交换、数字网络等其他网络环境,同时针对 NGN 告警的自身的发展策略,本项目把开发的重点主要放在 NGN 告警的采 集,NGN 告警关联性分析和 NGN 告警市区转发三个子模块上。通过以往的 开发经验,设计出最符合 NGN 告警功能逻辑的接口软件,为今后电信业务 继续扩大与兼容创造的有利条件。 在设计中突出中间件 MD 的开发和使用,这样的设计思想为告警的采集 和发送提供了更加安全、准确的保障。本设计对集中告警 Netcool 平台的使 用进行了优化和改进,使得内存数据库可以较好地与传统的磁盘数据库有机 地结合在一起。不但节约了建设资金,也便于系统的建设、使用和管理,使 得内存数据库在电信综合告警系统中的应用使这一尝试成为现实。此外,本 文在告警关联性分析上也花费了比较大的心血,当今网络的互通和交流使得 对告警的分析规则有了更高的要求。在前人开发总结的基础之上,NGN 告警 关联性分析也达到了国内先进水平和标准,对于电信业务和服务质量具有较 大的贡献。 - 56 - 哈尔滨工业大学工程硕士学位论文 参考文献 1 陈志坚, 陈中伟, 蒋明燕. 上海电信集中告警系统二期项目可行性研究报 告. 上海邮电设计院有限公司.编号:WF-011-2007-152 糜正馄, 王文鼎. 软交换技术与协议, 人民邮电出版社.2000:5~8 2 3 黄斌. 下一代网络 NGN 中 SIP 技术的研究, 北京邮电大学硕士研究生学 位论文. 2007:2~5 董苏成 . 下一代网络 NGN 研究 , 南京理工大学硕士研究生学位论文 . 4 2007:5~8 张磊等. 基于软交换的下一代网络组网技术, 人民邮电出版社. 2005: 2~5 5 6 陈靖.朗讯科技智能化多业务网络解决方案,电信网技术.2003, (04):10~17 7 万晓榆. 下一代网络技术应用, 北京人民邮电出版社.2003 年: 4~8 8 钟传常 . 本地网综合告警系统接口问题及解决思路 ,沿海企业与科技 . 2007, (09):23~25 陆立等编著. NGN 协议原理及应用, 机械工业出版社. 2006: 8~10 9 10 K Fall. Network Emulation in the VINT/NS Simulator,Computersand Communications. July 1999:244~250 李旻, 陈和平, 蔡艳萍. 基于 CORBA 的传输网网管通用接口适配器设计, 11 全 国 第 十 二 次 光 纤 通 信 暨 第 十 三 届 集 成 光 学 学 术 会 议 论 文 集 .2005: 15~28 12 13 黄而利. 新业务模式是 3G 时代重大挑战, 电子资讯时报. 2004, (08):A06 14 张煜. 信息产业部举办电信新技术新业务研讨会, 中国电子报. 2007: A04 沈云斐, 李丹, 陶琨, 覃征. 基于关联规则和情景规则的网络告警分析模 型,小型微型计算机系统. 2007, (02):41~45 15 刘晓东 . 通信高新技术与标准规范实用手册 , 电子通信技术出版社 . 2005,25 16 17 张宇娜, 王芙蓉. 软交换技术的发展及应用,天津通信技术, 2004:24 ~ 28 王桂梅, 和应民, 刘瑞丽. 综合网管实时告警系统的设计与实现, 电脑与 电信. 2007, (10):45~50 18 19 肖凯. 中国电信 NGN 网概述, 数字通信世界.2007, (07):84~85 罗智萍 . 综合告警系统 —综合化集中维护时代的起点 , 电信技术 .2007, - 57 - 哈尔滨工业大学工程硕士学位论文 (02):21~35 20 马晓芳. 运营商审计调查与电信重组, 第一财经日报. 2007, (09):A02 21 唐亮 . 一种分层实现的分布式告警融合算法 , 长沙通信职业技术学院学 报. 2007, (01):50~65 吴志远 , 周长浩 .多厂商接口的作用、进展和可行性 . 人民邮电出版社 , 22 2004, 23~42 李纯喜, 郭字春等. IP 网络管理中的数据采集问题. 电信科学, 2001. 23 24 黄崎嵘, 李墨. 从多厂商网管接口联调看未来电信网管接口的发展. 人民 邮电出版社, 2007, 150~178 智雨青. 走进内存数据库, 计算机世界报. 2007, (12):B24~B25 25 26 Taichik, Azumao.Simulated Annealing Algorithm with the Random Compound Move for the Sequential Partitioning Problem of Directed Acyclic Graphs. European Joural of Operational Research, 2003,(1):23~29 Bischof E E, Marriott M D. A Comparative Evaluation of Heuristics for 27 Container Loading. European Journal of Operational Research,2005,(44):67 S Brin, R Motwani, J D Ullman et al.Dynamic Itemset Counting and 28 Implication Rules for Market Basket Data. In ACM SIGMD International Conference On the Management of Data, 2006, 104~112 A. Savasere, E Omiecinski, and S.Navathe. An efficient algorithm for mining 29 association rules in large databases. VLDB 04, 432~443 Andreas Mueller. Fast Sequential and Parallel Algorithms for Association 30 Rule Mining: A Comparison. Dept. of Computer Science, Univ. of Maryland, 2006,(8):142~150 徐昊朗, 熊齐邦. 一种新的网络告警相关系统的体系结构. 计算机应用, 31 2004, (9):54~58 郑国庆 , 吕卫锋 . 通信网络中的告警相关性研究 . 计算机工程与应用 , 32 2002, (2):76~81 杨 武 军 , 张 继 荣 . 内 存 数 据 库 技 术 综 述 . 西 安 邮 电 学 院 学 报 , 2005, 33 (7):43~46 彭熙, 李艳, 肖德宝. 事件关联策略的实现及应用研究。计算机工程与设 34 计, 2003, (10):55~60 梁毅, 张文彬. 实时事务的预分析预处理. 计算机应用研究, 2002:80~87 35 36 陈幼均, 王江晴. 支持主导实时事物内存数据库技术. 武汉科技学院学报, - 58 - 哈尔滨工业大学工程硕士学位论文 2004, (2):110~118 37 T. Oates. Fault indentification in computer networks a review and a new approach[R]. Computer Science Teehnieal Report, 2005,(6):95~113 RD. Gardnertd, Harle. Pattern discovery and specification techniques for 38 alarm correlation. Proceedings of Network operations and Management Symposium 1998 (NOMS 98) New Orleans Feb. 2006, (9):719~722 柏文彦 , 熊翱 , 刘婕 . 网络管理接口技术及其发展 . 电信技 术 , 39 2001,(12):6~14 Han J, Micheline K. Data Mining Concepts and Techniques. Morgan 40 Kaufmann Publishers, Inc, 机械工业出版社, 2005, 207~218 Hatonen K, Klemettinen M, Mannila H, Knowledge Discovery from 41 Telecommunication Network Alarm Databases. The twelfth International Conference on Data Engineering, Lodon, 2006, 87~95 ITU-T Recommendation M. 3000, Overview of TMN recommendations. 42 2002,(2):5 ITU-T Recommendation M. 3010, Principles for a telecommunications 43 management network. 2002,(2):13 ITU-T Recommendation M. 3020, TMN interface specifications methodology. 44 2002,(2):10 Brue Lowekamp, David R. O?Hallaron, Thomas R.Gross. Topology 45 Discovery for Large Ehternet Networks. 2001, 8 Simon Beddus, Gary Bruce, Steve Davis. Opening Up Network with JAIN 46 Parlay. IEEE Communication Magazine, 2005: 15~18 - 59 - 哈尔滨工业大学工程硕士学位论文 哈尔滨工业大学硕士学位论文原创性声明 本人郑重声明:此处所提交的硕士学位论文《基于 IP 承载网的告警采集 分析与转发模块的设计与实现》,是本人在导师指导下,在哈尔滨工业大学攻 读硕士学位期间独立进行研究工作所取得的成果。据本人所知,论文中除已 注明部分外不包含他人已发表或撰写过的研究成果。对本文的研究工作做出 重要贡献的个人和集体,均已在文中以明确方式注明。本声明的法律结果将 完全由本人承担。 作者签名: 日期: 年 月 日 哈尔滨工业大学硕士学位论文使用授权书 《基于 IP 承载网的告警采集分析与转发模块的设计与实现》系本人在哈 尔滨工业大学攻读硕士学位期间在导师指导下完成的硕士学位论文。本论文 的研究成果归哈尔滨工业大学所有,本论文的研究内容不得以其它单位的名 义发表。本人完全了解哈尔滨工业大学关于保存、使用学位论文的规定,同 意学校保留并向有关部门送交论文的复印件和电子版本,允许论文被查阅和 借阅,同意学校将论文加入《中国优秀博硕士学位论文全文数据库》和编入 《中国知识资源总库》。本人授权哈尔滨工业大学,可以采用影印、缩印或其 他复制手段保存论文,可以公布论文的全部或部分内容。 本学位论文属于(请在以下相应方框内打“?”): 年解密后适用本授权书 保密?,在 不保密 ? 作者签名: 日期: 年 月 日 导师签名: 日期: 年 月 日 - 60 -
本文档为【基于ip承载网的告警采集分析与转发模块的设计与实现论文论文】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_153723
暂无简介~
格式:doc
大小:474KB
软件:Word
页数:84
分类:工学
上传时间:2017-11-12
浏览量:25