首页 VBR视频通信量预测的神经网络方法研究（已处理）

VBR视频通信量预测的神经网络方法研究（已处理）

VBR视频通信量预测的神经网络方法研究（已处理）VBR视频通信量预测的神经网络方法研究（已处理） VBR视频通信量预测的神经网络方法研究南开大学硕士学位论文 VBR视频通信量预测的神经网络方法研究姓名:苏晓星申请学位级别:硕士专业:光学工程指导教师:张延? 20030522摘要摘要本文对神经网络方法在可变比特率: 视频通信量预测中的应用进行了研究,主要内容如下: .刈视频通信量预测的研究方法和进展进行了综述,重点是神经网络方法。基于这些神经网络方法的成功应用,作者得出了一条结论:用斗压缩算法产生的通信量,在经归一...

VBR视频通信量预测的神经网络方法研究（已处理） VBR视频通信量预测的神经网络方法研究南开大学硕士学位论文 VBR视频通信量预测的神经网络方法研究姓名:苏晓星申请学位级别:硕士专业:光学工程指导教师:张延? 20030522摘要摘要本文对神经网络方法在可变比特率: 视频通信量预测中的应用进行了研究,主要内容如下: .刈视频通信量预测的研究方法和进展进行了综述,重点是神经网络方法。基于这些神经网络方法的成功应用,作者得出了一条结论:用斗压缩算法产生的通信量,在经归一化处理后,将具有相同的时间序列模型。本文采用的梯度径向基函数: 模型, 吼及提出的基于自适应滤波的抽头延迟神经网络模型都是基于这个结论。 .提出把模型应用于视频通信量预测中,由于采用差分输入,能消除局部平均值变化对预测精度的影响,同常用的基于最小均方差的线性模型和静态模型相比,其预测精度得到明显提高。 .提出基于自适应滤波预测模型并应用于视频通信量的预测中, 该网络训练分为离线学习和在线二次学习两个阶段:离线阶段,神经网络的训练采用基于卡尔曼滤波的训练及删剪算法,通过删除隐层神经元,得到一个结构紧凑的网络拓扑结构,作为下一步在线预测与权重更新的先验知识; 在线阶段采用递归最小方差: 算法进行预测与权重更新,以离线阶段得到的权重矢量与协方差矩阵为迭代起点。视频通信量预测的仿真结果表明,同已有的预测方法相比,该模型的预测精度得到明显提高。通过比较可以发现,本模型是对视频通信量预测所期望的精确性与实时性的一个很好的折中。关键词:可变比特率,视频通信量,神经网络,时阳序列预测,梯度径向基函数自适应滤波,卡尔曼滤波,递归最小方差 . . . 】. : , , . ’ , . . . : . ,. . , ’ . . .。 .? . , , :, , , ,第一章引言第一章引言视觉是人类获取外部世界信息的最为重要的形式。据统计,人类通过视觉获耿的信息占全部获取信息的%以上。目前,数字视频?已在许多领域有着广泛的应用,数字电视和高清晰度电视的发展、可视电话的日益普及,均说明了这一点。在图像/视频压缩方面人们已经取得了巨大的成功,使得数字视频的有效存储与低速率传输成为可能,由此产生了可变比特率视频的概念?。而正由于视觉信息的重要性,以及数字视频技术的快速发展,使得视频业务在基于异步传输模式的宽带综合业务数据网.中占据大部分的带宽。因此在现有数字通信技术的带宽瓶颈下,解决视频业务的高服务质传输问题,是构建未来信息高速公路的一个关键量: 环节。解决这一问题有三个基本途径:一是加大网络信道自身的带宽,二.是压缩视频信息的流量,三是改善信道带宽的利用效率,三者相辅相成,缺一不可。本文侧重于研究第三个方面即改善信道带宽的利用效率的问题。这是国家自然科学基金课题和天津市自然科学重点基金课题的一个组成部分。网络~是一种基于连接的通信网络,在用户不始传输前,需要向交换设备申请建立一条信源与信宿之间的逻辑连接,若要建立新连接则必须为其分配带宽。传统上,交换设备根据信源提供的参数“一步封位”的静态分配带宽,而且在信源存在的整个通信过程中,这个带宽值保持不变。但是,由于信源很难用一个确定的数学模型和几个简单的参数来描述,因此静态方案很难给出一个合适的恒定带宽值。针对这个问题,一些学者提出基于预测的动态带宽分配方案【,采用在线测量的方法得到通信流量的统计特性,并对未来的带宽要求进行预测,从而动态分配带宽,这样可以有效提高网络资源利用率。基于预测的动态带宽分配方案的基础是对于不同类型信源的统计特性的研究。视频通信量时间序列是一个复杂的非平稳随机过程,为寻找描述该随机过程的数学模型,人们已经作了大量工作【“?。从最早提出的自回归模型】到复杂的自相似模型,其中都包含着层次不同的时间相关这一重要特性。由于视频通信量序列的时间相关性,使得通信量的预测成为可能【“。基于宽带通信所要求的,对于所采用的预测器的性能自然有了特殊的要求: 预测精度高,实时性好,计算复杂性低,能在线实现。由于研究视频传输的意义巨大,使得视频通信量预测成为目前的一个热点研究课题,其中引用最多的是基于最小均方差或递归最小方差的线性模型【’”,虽然其形式简单,适合网上实时应用,但简单的线性关系不能反映信号本身的非线性实质,自然不会得到很高的准确?生。人工神经网络是一种仿脑信息处理模型,由于它具有不依赖问题本身计算特性的高度并行性处理和不以先验知识或规则为前提的自适应学习能力,因而在那些实时性要求很高且又无法用确切数学模型描述的智能性信息处理问题的求解上,用神经网络方法具有其他方法无法比拟的优势。从神经网络信息处理已经取得的大量应用成果来看,神经网络确为解决一些智能问题提供一种有效的方法。第一章引言在众多的预测模型中,人们通过广泛深入的研究和比较,发现神经网络模型有着良好的预测性能,它能较好的解决非线性时间序列的建模和预测问题,进而受到越来越多的重视。人们已经尝试采用各种不同的神经网络模型用于通信量预测的研究: 文献,采用了适合于非线性时间序列预测的模型,该神经网络模型的输出神经元采用线性激活函数以提高预测精度,但是该模型只能逼近一个静态的非线性关系,因此预测精度不够高;文献,采用的管线循环神经网络模型对于较为平滑的视频业务流 : 如场景变化不大的视频会议能给出很好的预测性能,但对于突发性很强的复杂业务流,其性能则有所下降。并且采用实时循环学习算法束修改权重, 要求在视频采样间隔内完成多次迭代,因此计算复杂性高,网上实时实现存在困难:文献提出了一种基于的自适应神经网络模型,该模型分为离线先验学习、在线二次学习两个阶段。在在线预测阶段,神经网络要根据当前预测误差自适应调整权重,但同时要兼顾该调整量要尽可能使对先验知识的影响最小, 其作者用该模型对.业务量预测作了模拟,得出了令人满意的结果,但是改模型需要一个大规模的矩阵去记忆先验知识,先验知识的改变用一与该矩阵有关的能量函数表示,优化该能量函数的计算复杂度较高,因此该模型的实时性能有所欠缺。有鉴于信流预测器的准确性、实时性与视频通信量的非平稳特性,本文作者在改善信道带宽的利用效率的研究中做了以下工作: 对视频通信量预测的研究进展进行了综述,重点是神经网络方法。基于这些神经网络方法的成功应用,作者得出了一条结论:用相同压缩算法产生的通信量,经过均值为,方差为的归一化处理后, 将具有相同的时间序列模型。作者在本文中采用或提出的梯度径向基函数神经网络、基于自适应滤波的两种预测模型,都是建立在这个结论的基础之上。将文献【提出的神经网络模型用于本课题并进行了仿真实验。该模型虽是一种静态模型,但通过差分输入,也能对局部平均值随时间变化的非平稳时闻序列给出很好的预测性能。提出基于自适应滤波的预测模型。该模型分为离线学习、在线二次学习两个阶段:离线阶段采用神经网络的基于卡尔曼滤波的训练及删剪算法,对训练好的初始网络,通过对隐层神经元的删除,得到一个结构紧凑的作为下一步在线二次学习的先验知识;在线阶段采用递归最小均方差算法,以离线阶段得到的权重矢量与协方差矩阵为迭代起点,进行在线预测与权重更新。将这一算法应用于视频通信量预测,在仿真实验中得到了很高的预测精度。通过比较,可以发现本模型是对预测的精确性与实时性的一个很好的折中。本论文内容安排如下:第二章在介绍了关于视频、时间序列预测、人第一章引言工神经网络等相关概念的基础上,对视频通信量预测的相关进展作了系统综述,重点是神经网络方法在其中的应用:第三章在介绍径向基函数、正交最小算法、梯度径向基函数: 均方:神经网络的基础上,将神经网络应用于本研究课题, 并给仿真实验结果及其预测性能评价;第四章在介绍了自适应滤波、神经网络广义尔曼滤波训练及删剪算法?吼。抛?一一种基于自适应滤波的模,钭应用于本研究课题,并给出仿真实验结粜及其预测性能评价:第血章足全文工作的总结与后续工作展望。第二章相关研究进展综述第二章相关研究进展综述 ?.基础知识 ?..可变比特率视频? 视频是根据视频序列图像本身的信息量冗余,经过各种图像/视频压缩算法的压缩后所产生的图像帧序列,其图像帧中的数据量就是视频通信量。图像/视频的压缩编码已被制定出几个国际标准,如静止图像压缩标准, 电话/会议电视的视频压缩标准、,活动图像压缩标准一、 .、.等。以标准为例,它支持三种编码模式:帧内模式、预测模式、双向预测模式。类似于,帧对单个视频序列帧只根据信息量的空间冗余进行压缩;帧采用前向运动补偿预测和误差编码,出其前面的或帧进行预测:帧采用双向运动补偿预测和误差编码,由前面和后面的或帧进行预测,所以帧的压缩效率最高。视频序列被分成一系列图片组: ,每个由一帧帧和一些帧、帧组成,第一桢一定为帧。视频通信量时间序列是一个复杂的随机过程,总结前人工作的相应结论,对于只有帧内模式的帧序列,可以得到下述基本上和压缩算法无关的统计性质: 无场景变化的应用场合如会议电视,可视电话等的通信量时间序列是平稳的或渐近平稳。但有场景变化时序列是否可看成平稳,尚有疑问,一般将其看成非平稳序列。无场景切换的应用中序列可以看成服从分柿:有场景剀换时较复杂,一般不能用统一的分布来拟合。无场景变化的应用中,序列的自相关函数呈指数下降,几乎不存在长程相关性 ,简称。但是有场景切换时序列的自相关不呈指数下降,具有明显的长程相关性。序列中包含三类、和帧,使其通信传输业务具有明显的特点, 如突发度更大,自相关函数具有周期性尖峰等,但是业务速率分布很散,难于直接建立模型。然而,将其三类帧分别抽出后所组成的序列均服从分布, 且表现出较强的负指数下降的短时自相关。基于这些统计特性,人们已建立了视频业务时间序列的各种数学模型 ,如通/断源模型/、自回归滑动平均:? 第二章相关研究进展综述模型、马尔可夫调制的泊松过程 :模型、分形模型等。本文将要多次用到的一/卜模型是非线性自回归滑动平均模型,该模型的表达式如下: . 一,?,?,一,?..,一日十其中,珂表示通信量时间序列,厂是一非线性函数,和是误差序列,一股认为是一个独立的、有确定分布的随机过程,.式记为 ,,、足正整数。.式中,若,即: . 一,?..,? 则退化为非线性自回归模型。若.、.式中,厂.退化为线性函数,则分别成为与模型。此外,若.、.式中。厂是一时变的非线性函数,即: 月/:石月一,‘一,?,?,‘一,一孽 . . 一,?,? 则分别成为时变的与模型。 ?..时间序列预测? 时间序列是一种数据的集合。一般认为,在时间序列的过去值和未来值之间存在确定的数学关系。时间序列的预测就是根据该时间序列的过去值和现在值, 对其未来值作性质上的推断和数量上的估计。通过对产生时间序列的系统进行分析和预测,以便我们采取有效的措施。按照时间序列的波动性,时问序列预测分为确定型和随机型两大类。确定型的时间序列预测是假定时间序列服从某种线性或非线性关系的规律,通过对该规律的参数拟合,获得预测函数。随机型的时间序列预测是假定时间序列是由某种随机过程产生的,通过建立估计随机过程的模型,获得预测函数。对时间序列进行预测的方式可分为两大类,~类是离线预测,一类是在线预测。离线预测是用时间序列的过去值建立预测模型,在以后的预测过程中,模型中的有关参数不再修改。而在线预测则要求在预测过程中随时对全部或部分参数进行调整。 ?..人工神经网络‘ 人工神经网络是一门发展迅速的交叉学科,这门学科的研究使得诸如生物学、认知科学和非线性科学等基础学科与计算机、电子学、人工智能、微电子、信息处理、模式识别等工程学科有机的结合起来。自世纪年代以来,神经第二章相关研究进展综述网络已被广泛的应用于解决各种实际问题,在众多领域中取得了令人瞩目的成就。人工神经网络的特点是:信息按高度并行的方式处理;信息的存储是分布式的:容错性;鲁棒性;很强的学习能力;它是一个高度非线性动力学系统。当前存在的问题是其智能水平还不够高,许多应用方面的要求还不能得到满足;网络分析与综合的一些理论性问题如稳定性、收敛性的分析,网络的结构优化等还未得到很好的解决。人工神经网络是由大量神经元通过并行连接而构成的高度复杂的非线性网络系统,它反映了人脑功能的若干基本特征,但只是对人脑功能的某种简化和抽象的模型。神经元是神经网络的基本处理单元,它是一个单输出、多输入的非线性元件,图.所示为一个神经元模型,神经元的输入、输出可表示为: . “,?。厂只』图.神经元模型其中“,为神经元的内部状态,只为闽值,。表示从第个神经元到第个神经元的互连权重。,,是神经元的非线性激活函数,最常用的有两种类型:阈值型,这种类型的激活函数是一个阶跃函数:型,这种类型的激活函数是一个对数或是双曲正切等函数,例如,虬五焉面两。第二章相关研究进展综述人工神经网络是一个数目巨大的高度连接的神经元的集合。每一个神经元通常是一个非线性的处理单元,根据某一时刻对它的输入和阈值的比较,神经元就会按照非线性激活函数决定它在下一个时刻的状态。当大量的这种处理单元结合在一起协调工作时,就出现有意义的集体功能。人工神经网络通过建立神经元及其连接的拓手卜结构和参数的各种模型去模拟脑的信息存储和处理能力。人工神经网络中神经元相互作用的强弱用互连权重表示。在人工神经网络在学习过程中, 根据来自环境的信息,不断调整其互连权重的强度,使有关信息按照处理或记忆的要二逐渐分布到互连权重之中。根据神经网络的互连方式,一般可将人神经网络分为前馈式连接和反馈式连接两种,例如,单层反馈式连接的神经网络模型,多层前馈式连接的网络模型等。从理论上可以证明,具有一个隐层的前馈式神经网络能够以任意精度逼近任何连续函数。由于人工神经网络具有不依赖问题本身计算特性的高度并行性和不以先验知识或规则为前提的自适应学习能力,因而对于那些实时性要求很高且又无法用确切数学模型描述的智能性信息处理问题的求解上,用人工神经网络方法具有其他方法无法比拟的优势。非线性时间序列预测恰好具有这样的特点,因此在这一问题的研究中,借鉴和应用人工神经网络的模型和算法具有广阔的发展前景。这是本论文选题的重要出发点之一。 ?.线性预测方法该方法基于预测误差有最小均方误差的思想。对于视频帧序列线性预测是将步预测值估计成序列前个值??.、的 ‖”’ . 七。, 阶? 七,, 《一一需要注意的是,对于视频帧序列,将代表其中的、、子序列.对这三个子序列的预测应该分别进行,以后将不再说明。随时间变化,有两种在线更新策略:第二章相关研究进展综述 ?.. 方法~: , . 这里,是第”个序列值的预测误差:是学习步长,若肝是平稳的,则根据维纳滤波理论】,满足: . “? /‘ 时,在随机取值的情况下,能保证很快收敛于稳定值,其中五。。是自相关矩阵 . ,?? 的最大特征值。文献提出采用归一化的方法应用于本研究课题,‖的更新公式变为: 晓? 叭川卜畎卅砌五簖这样能保证/.时,‖,很快收敛。文献【】提出一种变步长策略,使得由于场景变化而引起的‖的振荡减为最小。方法适合于可用、模型描述的线性平稳时间序列的预测. 如场景变化很小的可视电话业务。对于非平稳过程,作为一种一阶近似学习算法,的更新很难快速跟踪视频通量信号的变化 ?.. 方法’ 由于视频通信量量时问序列具有时变、非平稳特性,方法源于 ,第四章将做详细介绍在每一次叠代的同时兼顾过去、现自适应滤波理论在的变化情况,从最小二乘意义上寻求权重矢量的最佳值。对于单步预测,‖?的选取应对下式取最小值:第二章相关研究进展综述 . ?刀 . ? 略去具体的推导四,‖,可按下式递推计算, ‖”渺”” . , 坳,斋需糯 . 一? . ’一一”?胛一七唧,三 . 、一, 在实际仿真过程中,可以看出算法存在数值稳定性问题和“猝发”现象。可采用以下两种方法来解决这个问题:一种是给最小二乘算法的增益设置阈值, 当它超过这个阈值时,将所有的参数重新初始化,重新开始预测。采用这种方法在预测时,预测带宽有较大的震荡,效果不十分理想。另一种更有效的方法是采用变遗忘因子的方法。文献】采用变遗忘因子的算法进行视频业务量预测,相对于遗忘因子保持不变的算法,提高了预测精度,获得了更好的预测效果。 ?.神经网络预测方法 ?.. 模型线性预测方法只能适用于可用模型描述的时间序列,或者该模型的控制参数随时间变化的时变模型方法适用于这种时间序列。对于第二章相关研究进展综述视频通信量序列最好将其理解成非线性过程,即: . 月这里的是一个未知的非线性函数,是独立、有确定分布的误差。我们可以根据已知样本数据,寻找一个合适的函数,使预测均方 , 误差 . ??一三埘为最小。三层前镄神经网络可以以任意精度逼近任意连续函数,则模型可以以任意精度逼近一个过程,因此.、.式规定的时间序列预测问题可以用训练合适结构的来解决。所谓模型,是指抽头延迟线滤波器与三层前馈神经网络相级联的神经网络模型, : 其输出神经元采用线性激活函数,如图.所示。从神经网络的观点来看, 与神经网络是基本相同的,我们以后还会提到。图..网络结构其输入、输出函数关系是: . ;??,彬”一作者撰写的文献【】以对随机产生的型视频通信量的预测为例,通过实验结果说明了的输出神经元若采用线性激活函数,较之于采用非线性的第二章相关研究进展综述双曲『切函数,离线训练的速度更快,在线预测的精度更高,给出了更好的预测效果。文献】采用用于不同类型视频业务预测,并给出了仿真结果。可以发现由于神经网络的拓扑结构和互连权重在离线训练过程中一旦确定了之后,在在线预测阶段将不再改变,虽然能够给出一个非线性函数关系,但是其函数形式却是静态的。而实际上,即使是同一视频业务,其统计性质亦会随时间发生变化,表现出非平稳特性,所以这种静态的方法的预测效果并不理想。 ?..基于的自适应神经网络模型实际上,可以认为.式中的函数关系?是时变的,即时变模型, 这样就容易描述视频业务统计性质的非平稳特性。基于此,文献提出一利?基于的自适应神经网络模型,并将其用于一业务产生的、、帧业务的预测,相对于静态等方法,获得了很好的预测效果。与静态的模型一样,该模型的应用同样分为离线训练与在线预测两个阶段。不同的是,在在线预测阶段,该自适应模型还要根据当前预测结果适当修改网络的权重值。修改网络权重值的原则是:该修改值既要使神经网络的输出值修币为当前业务量值,又要使其对在离线阶段及其后学习所得的先验知识的影响最小。设在在线预测阶段第月个样本的预测完成之后进行了一次网络权重更新,第个样本值及其预测值分别为月、,更新前后的权重矢量分别为%、睨, 其中 . 睨%% ??是一个小的改变量。 %中包含着通过训练样本集咒.,一.,爿‘虬,而获得的先验知识,睨满足使 . 去兰州矾? 为最小,即 ?‘ . , 睨吉芝 ???第二章相关研究进展综述同时满足约束条件 ”? . %中实际上只有?%为变化成分,由于它是一个小量,利用微分关系,可将、.式描述的具有非线性条件约束的复杂非线性函数优化问题,转化为以.、.两式描述的线性条件约束的二次函数优化问题: ’ . 妄?‖ ?% 。 ?‖ . ??% 具体推导见文献中的附录,在此从略。其中,是一个与样本集合.、权重矢量睨有关的矩阵,口是网络输出函数对权重的梯度矢量,与一、%有关。这是一个简单的条件优化问题,其求解可通过梯度下降法的迭代计算。为减少权重更新的频度,该文献提出权重更新只在预测误差大于一定闽值’ 时发生,如图所示: 图.权重更新机制虽然该方法在仿真实验中获得了很好的预测效果,但是它在在线预测阶段的权重更新算法的计算复杂性过高。从空间复杂性角度讲,需要预备集合的存储空间,这是主要的困难所在;从时间复杂性角度讲,每次求解?暖都需要多步迭代完成,这使时间复杂性按迭代步数增长。因此,这种权重更新机制在网上实时应用时存在困难。 ?..循环神经网络模型是一种反馈神经网络,由于其动力学机制,非常适合于一些复杂的非线性时间序列的建模与预测。第二章相关研究进展综述图.是一种用于预测,的,它的结构包含两层:输入层与处理层。处理层由个神经元构成,第个神经元的输出.作为整个网络的输出,输入层由前馈与反馈两部分组成:前馈部分包括时间序列信号经过滤波器形成的个延迟信号一、?、?,还包括闽值输入;反馈部分包括由.”经过滤波器形成的个延迟信号一、?、,一, 还包括:”、?、。经过一个时阳单位延迟形成的一个输入 :月一、?、。”一。输入层与处理层之涮完全连接,处理层单元采用非线性激活函数。 ? 图.用于预测过程的模型文献】提出算法,在信号采样间隔内根据预测误差实时更新网络权重。算法一般是用梯度下降法通过多次迭代完成,而每次迭代的计算复杂度为,当?较大时,算法难以实时完成。为克服这个困难,文献提出模型,如图.所示。它由个级连而成, 管线: 每个称为一个模块,含有相等的个神经元。因此,一个总共有个神经元。每个模块的输出作为下一个模块的输入,第个模块还同时将输出反馈给自身,最后个模块的输出作为整个的输出。的算法的一次迭代的复杂度是,而对于同样多处理神经元数的鼢州,其计第二章相关研究进展综述算复杂度为 ,即复杂度降低了倍。图结构图文献采用个及其权重更新算法用于业务的、、序列的预测。获得了很高的预测精度,但仍有两个问题值得指出: 由于需要多次复杂度为的迭代运算,总的复杂度仍然很高,其作者仍然建议该预测算法须采用或多的并行运算来实现; 该文献中的实验数据采用了秒的业务数据,其中没有包含多少场景切换,因此数据流较平缓。但根据文献,在数据流变化较剧烈的场合,其预测性能会有所下降。 ?..一个重要结论以上神经网络模型在离线学习阶段都是采用某种压缩算法产生的视频通信量序列,并且序列数据是经过使其均值为、方差为的归一化处理的。在在线阶段对采用同一压缩算法但算法控制参数不一定相同的归一化的通信量序列进行预测,这些神经网络模型都取得了较低的预测误差。由此,我们可以得出这样一个结论:算法控制参数不一定相同的同一压缩算法产生的视频通信量序列, 经过使其均值为、方差为的归一化处理后,可用相同的时间序列模型来描述。则由该结论,以上神经网络模型的离线学习阶段的先验知识对同一压缩算法产生的视频序列都适用。本文后面提出的两种神经网络模型都是基于这个结论。 ?.他预测方法文献提出一种将离散小波变换与线性预测器级联的小波预测器,如图.所示。通过.视频业务预测的实验仿真,获得了比一般的线性预测器更好的预测效果,但正如其作者指出的,该预测器还可以从两第二章相关研究进展综述个方面加以提高图小波预测器采用的是最图.中的离散小波变换: 简单的、波基,可以尝试较复杂的,等小波基图.中的线性预测器可以尝试采用自适应性更强的线性预测器另外,模糊逻辑是一种处理不确定性、非线性和其他不适定问题的有力工具, 文献扯将模糊逻辑应用于本研究课题,取得了一定的预测效果。对此,由于时间和作者水平有限,本文暂不能作出准确描述,留待今后进一步研究。第三章神经网络预测模型第三章神经网络预测模型 ?.径向基函数神经网络 ?..基本原理径向基函数: ,是一种局部分布的、中心对称的非负非线性函数。局部分布是指仅当输入落在输入空间一个很小的指定区域时, 径向基函数才给出有意义的非零响应。中一径向对称是指,对与基函数中一矢量有相同径向距离的输入,径向基函数都产生相同的输出。常用的一种径向基函数是高斯函数,形式为: . 妒:乓盯。神经网络是一种只含一个隐层的前馈神经网络,隐层采用径向基函数作为激活函数,每个隐层节点有不同的径向基函数中心。构造网络的基本思想是:用隐单元实现输入空阳到隐含层空间的变换,以隐层中心与网络输入矢量差之欧氏模作为的变量,从而使每个隐层节点只给出一个径向对称的输出。输出层一般采用线性激活函数,所以整个网络的输出是隐层输出的加权求和。这样,矢量不通过连接权直接映射到了隐层空间。只要确定了的中,,这种关系也就确定了。输入层到隐含层的变换是非线性的,而隐含层到输出层的映射是线性的,即网络的实际输出等于隐层相应输出的加权线性和,对图.中的网络中,输入输出关系为: . ,?。删?, 网络的训练包括确定隐层中一、方差。与权重,.,方法有如下几种【】:方法;和方法;局部学习方法;正交最小均方: 方法;聚类与与最小二乘联合迭代法遗传算法等。算法采用正交化方法独立计算回归算子对输出的贡献,故使中心的选择步骤简单有效,该方法被广泛采用,. 中给出具体介绍。鱼台? 图..网络结构第三章神经刚络预测模型网络的训练算法既保证多层网络的映射能力,又能克服梯度下降方法的局部极小问题,学习速度较快,因而在函数逼近、信号处理、模式识别、时间序列预测等领域得到了广泛的应用。 ?.. 算法【? 不失一般性,假定输出层只有一个神经元。令网络的训练样本对为爿,.,,?,,其中,为训练样本数;为网络的输入数据矢量;为网络的期望输出响应。根据线性回归模型,网络的期望输出响应可表示为: . ?,”, 式中,为隐层神经元个数,在网络中,亦称为网络中心个数;是重建误差;。是回归算子,它实际上是网络中心在某种基函数下的响应。对于所有样本,可将式.写成矩阵方程式,有 . 其中, 口 . ? ,,,,?,, : : ? , , ,,?,日,。求解回归方程式.的关键问题是这里,. 。回归算子的选择,的中一?.,?一般是选择输入样本矢量集合 ?, ??中的一个子集。对于进行正交三角分解 . 删式中,是一个日的上三角矩阵,且对角元素为,是一个?矩阵其各列,,?,正交,第三章神经网络预测模型 . 是一个对角元素为.对角距阵, . ,,?, 由上式可得 ‖ . . 式的正交最乘解为: ’ ~ . 或 . 铲舄胚? 式中,和是方程组: , 综上所述,学习基本算法步骤如上述『交化处理采用.方法。下: 预选隐含层神经元个数; 预选一组的中心矢量; 根据上一步选定的中心及输入样本矢量,计算回归矩阵正交化回归矩阵各列; 计算; 计算上三角阵,并由三角方程求解连接权矢量‖。算法能快速有效的从样本集中选取合适的网络中心矢量,一般地,当时,就能对整个样本集得到很低的重建误差,大大压缩了信息冗余。但同时,算法并不一定能从样本集中选取最佳的个网络中心矢量,使值最小,从而优化出最紧凑的网络结构,具体论述参见文献。 ?.. 网络在时间序列预测中的应用网络也可用于时间序列预测,对于时间序列,的输入为第二章神经网络预测模型行 . 爿一第/个隐层输出为 , ”硎”一, 其中,为第,个隐层节点的中心,?为其径向基函数。假定共有日个隐层节点,则步预测值,即网络输出为 . ”女?,,” 其中,为第,个隐层节点到输出层的连接权重。传统的径向对称的应用于时间序列预测尚存在问题,主要原因在于时间序列预测问题的输入矢量的各分量高度相关,在超空间内一一般并不呈径向对称分布,而径向对称的输出却不能提取这种特征,因此不能给出精确的预测。针对这个问题,文献~分别提出了几种不对称的径向基函数用于时间序列预测,取得了预期的理想效果。其中文献【提出的径向基函数形式较特殊, 其输入采用时间序列的差分信号,故称为梯度径向基函数。消除了时间序列的由于局部均值变化而造成的不稳定性,.节将做详细介绍。 ?. 神经网络 ?..一阶网络网络的输入采用时间序列的差分信号,差分的阶数就决定了网络的阶数,以一阶网络为例,其在时刻的输入为: 一一一一一 ?一? , 一?一? ?的各分量是过去吖个时刻信号的变化。的形式较复杂,以一阶为例,尽管高斯函数仍然作为比较网络第三章神经网络预测模型输入与网络中心的非线性函数,但此时这个高斯函数的输出将被乘上一项 ”,,则对输入‘”,一阶的第,个隐层神经元的输出为: . 办一口渺一×月‘ 其中,是一个维的中心矢量,巧,是一个与该中心有关的增量标量。行项可看作第/个神经元对信号的预测值,如果肖”与:较相似,则其高斯函数的输出接近于,而其他神经元的高斯函数的输出接近于,则第,个神经元的输出将被激活,此时,若 . 一?一则第』个隐层神经元将给出预测值女的近似值,而精确的预测值则是各隐层神经元的输出的线性组合,即 . 工?七?妒, 参数、‘通过网络的训练过程来确定。对于样本时问序列:?,可得到维一阶差分向量集‘。’,对于每个’‘‘’,定义 , 。一如果’‘’’”被选作网络中,,则以应被选作相应的‘。这样,构建一个一阶的问题就转化为从集合??,以中选取子集,,可通过算法来解决,这时.式中的,就变为网络隐层神经元的输出。一阶网络用于时间序列预测的合理性,可清楚的从图.看出:如果第个中心矢量比较接近网络输入?‘竹,则由梯度函数的连续性,万,将接近于女一,则占,将是?的一个很好的预测。这样,通过匹配梯度函数,就能给出原始信号准确的预测,可以消除由于局部平均值的变化而成的不稳定?生,使得一个静态模型预测非平稳信号成为可能。第三章神经网络预测模型图.一阶网络用于时间序列预测的合理性的几何解释 ?..高阶网络以上介绍的是一阶网络,对于高阶网络,其输入就是原始信号扛”的高阶差分。例如,对于二阶网络,其在时刻的输入可定义为: 一一一一一一月一一”一一一一一 /”一?一一?? . 则第/个隐层神经元的输出为 . 彰一”一;×一工野一; 维的中心矢量与标量可从训练集“月,:中选取,其中 . :。一以一。一”一一一一一如果?”竹被选作中心;,则:被选作‘,算法同样适用于该选取过程。我们已经知道一阶网络是通过一阶差分信号的匹配来预测原始信号, 则二阶网络是从二阶差分信号的匹配来预测一阶差分信号。同样的,可将这个结论依次类推到任意高阶网络。 ?.一阶网络用于视频通信量预测第三章神经嘲络预测模型经过视频业务是一种复杂的非平稳时间序列。图.是电影压缩编码的数据量曲线由实验室提供。由于只采用了帧内压缩方式,该数据序列类似于信源产生的时间序列。它的长度为两个小时.速度为帧/秒,共计帧,该序列具有长程相关:与自相似性。用~个窗口大小为的滑动平均滤波器作用于该序列,得到图 .所示的原序列的低频成分,可以看出原序列的局部平均值随时间发生变化。喜善霉量 .咻行蝌鳓图. 压缩视频业务量时间序列曲线 ?且一?墨由?暑乜叠勺阱四视频业务量时问序列的低频分量图.第三章神经网络预测模型阶神经网络可以消除由于局部平均值的变化而造成的不稳定性的影响,给出更加精确的预测。该预测器的参数,包括网络中心矢量、增量标量、隐层到输出层的权重,经过训练一经确定之后在应用时将不再改变,因此是一种静态模型。由第二章所得的结论,对于采用相同压缩编码算法得到的视频通信量序列数据,将它们归一化后可以采用同一参数的预测器。仿真实验进行了单步预测。我们选取这个数据中的第?个数据归一化后作为离线学习样本,因为这个数据的分布范围很宽,变化也很明显。一阶网络的输入维数为,通过这些样本得到个回归算子, 利用算法为这个一阶网络选取了个隐层单元,离线学习样本的预测均方误差为.。在线预测阶段,我们选取第,这个数据作为检测样本,由于在在线阶段事先无法知道序列的平均值与方差,因此采用递归迭代的方法进行在线归一化预处理,假设在第个时刻,计算所得的平均值与方差分别为、盯,在第时刻, . 燮塑砟 . 盯行:生竺』皇尘堕毒』趔一【。为了降低由于事先未知检测样本的平均值与方差而引起的初始预测误差与振荡, 在最不始的个时刻用简单的取平均值的方法进行初始预测,即以前个序列值的平均值来预测第个序列值,值取为,取为。 ?【”】 ?’ 卵夺丽 . 一最终所得的预测曲线如图.所示。计算误差公式为.,表示的是相对均方误差,所得结果是.。我们还采用了其他几种方法,所得相对均方误差的比较列于表,中。可以看出,尽管这是一个静态模型,其优点在于能够映射一种线性函数关系,更重要的是无需参数更新,就能消除由于局部平均值的变化町造成的不稳定性的影响,凶丽能给出比静态模型更精确的预测效果。但由于该预测器在应用时未能更新任何参数,对除局部平均值变化以外的任何时变特性缺乏自适应性,因此预测精度不及线性等自适应方法。第三章神经网络预测模型图.预测曲线表.预测误差比较平均相对预测误差预测算法 ,.. . ?.本章小结本章在介绍了神经网络、算法的基础上,介绍了一种特别适合于做非线性时间序列预测的神经网络。神经网络能够消除由于局部平均值随时间变化而造成的不稳定性,从而给出比一般的网络更高的预测精度。从对视频通信量预测的仿真实验结果可以看出,尽管这是一个静态模型,其优点在于能够映射一种非线性函数关系,更重要的是无需参数更新, 就能消除由于局部平均值的变化而造成的不稳定性的影响,因而能给出比静态模型更精确的预测效果。但由于该预测器在应用时未能更新任何参数,对除局部平均值变化以外的任何时变特性缺乏自适应性,因此预测精度略低于线性 ’ 等自适应方法。第四章基于自适应滤波的预测模型第四章基于白适应滤波的预测模型 ?.概述本章中,我们提出了一种基于自适应滤波算法的模型并把它应用于视频通信量的预测中,同已有的模型相比,自适应模型最显著的特点是网络的训练分为两个阶段进行,即离线学习阶段和在线二次学习阶段: 离线学习阶段;离线学习以获取先验知识,在这一阶段,网络的训练采用基于卡尔曼滤波的自适应训练及删剪学习算法,通过删除不重要的权重,得到一个规模适中的网络拓扑结构,使其具有更好的推广能力,并降低了在线二次学习阶段网络预测与权重更新的计算复杂度。在线二次学习阶段:根据当前误差自适应更新网络权重。如第二章所述,在离线学习阶段所获取的先验知识分布存储于训练好的网络权重之中,每次在线预测及更新都以这个先验知识为起点。在线阶段通过线性化近似,采用算法更新网络权重,由于该算法能自动估算学习步长,且涉及的参数较少,因此网络的收敛速度很快。计算机仿真结果表明,该模型可以实现对通信量快速、实时、准确的预测。节将介绍相关的基础知识,包括自适应滤波理论、基于卡尔曼滤波算法的神经网络自适应训练及删剪学习算法:.节介绍这种基于白适应滤波的预测模型,给出仿真实验结果及与其它模型的具体比较。 ?.基础知识 ?..自适应滤波理论自适应滤波理论主要包括:维纳滤波、卡尔曼滤波、等各种信号估值的理论与方法。本小节将主要概要介绍卡尔曼滤波、这两种递归信号处理方法,只给出一些结论,具体推导从略。卡尔曼滤波考虑一个线性离散时间系统: . 。。 . 。曰第四章基于自适应滤波的预测模型这早,目月是该系统在时刻”的状态向量,是系统的输入,是对该系统的某种测量值,是测量噪声,。、。、。分别是与时刻有关的矩阵。假设系统初始状态为,并且序列、”是独立的高斯过程,且有研口】,】 . ,,瓯, . 瞳,盯已尺厅 . 我们的问题是在给定 ??时,求出十的估计值十月,满足【曰一”】为最小,即: . 口,,?,】可通过以下迭代公式计算,即卡尔曼滤波算法吲: 曰。” . 一一。胛一 . 竹一:【。?一:一 . 『月。 :。月或一 . 尹 ?一。其中 ,称为卡尔曼增益。对于非线性系统,静态方程可表示为: . 臼月。吼 . 。曰月我们可以将非线性函数/:目、‰口、%口在日””、一附近进行泰勒展不, . 厂』口行仃【”一仃】十’?‘第四章基于自适应滤波的预测模型 . 。口『月。臼”。月一十月【臼一月一】这早 . 。 , ?筹。。 . 口?.. 五筹。一采用一级近似,.、.搓述的非线性系统可以近似为。、, 描述的线性系统: . . ? 这罩 , /:一一 . 。一一将.、.两式做简单的变形,可得到.、.两式的形式,则可按以下迭代计算,即广义卡尔曼滤波算法 ,简称四: , . 一月一。竹一 . ?日”“ 厅一日聆行何 ” . . 一一月一通过线性化近似处理,可以把上述卡尔曼滤波算法应用于神经网络的训练中,详细推导见..小节。方法在第二章己对做了一些描述,这里再对其进行系统介绍。考虑系统第四章基于自适应滤波的预测模型目 . 。这罩的问题是,给定/墨曼时,求出臼的估计值,满足: . 阳:窆一,各。防, 『这早,五是遗忘因子,满足丑且接近于。对于每个时刻,可通过以下迭代计算,即算法:. ?月一一日 . 一:,。一】一 . 兄一一五。一这甲,是增益矩阼,满足: . ?】 . ?”兄庐一:。口、可根据先验知识确定,若无任何先验知识,可取 . 如,;, 类似于广义卡尔曼滤波的做法,对于系统: . 一 . 。目” 为求出估值,使 . 古一:窆,一‖一‘刀一,第四章基于自适廊滤波的预测模型最小,则可将。占”在一附近做泰勒展开,得到口,口‘”臼一一其中, . ’四警。、采用一级近似,.、.描述的系统可用以下.、 .两式近似:一 . ’ 玟早. , 。一一 ? 将.、.两式做简单的变形,可得到.、.两式的形式,则各可按与脒类似的方式递归计算】: . 毋?足聍一磊。?” . 门胛一日甩】一.珂,一 . 五一一五“一 , 这罩,的定义与,、.式类似,只是将.式中的。改成、的取值规定亦与前文相同。 ?..基于卡尔曼滤波的神经网络训练及自适应删剪算法全局卡尔曼滤波算法】彳:失一般性,考虑一个层前馈神经网络,它由一个输入层、几个非线性隐藏层和一个输出层组成,第层表示输入层,第层表示输出层,如图.所示。其中,第层的第个输出为;,第层的第个神经元中与第层第个输出的连接权重为彰。若第层的神经元总数表示为??,则该层每个神经元与第层共有?一个连接权重,对第个神经元,磷??。实际上是与第一层的阈值单元的连接权重,则整个网络的权重总数为第四章基于自适应滤波的预测模型 . ?。??一】?? 为了将这个前馈网络的训练问题用广义卡尔曼滤波的递归方法米解决,我们将这些网络权重依次排称的口维列矢量看作系统的状态矢量,即睇雠 . 则这个前馈网络构成的输入输出系统可假定由下述方程来描述目?,矗‘,。功其中的是网络的理想输出矢量,‘以、是网络的输出、输入矢量、分别是平均值为,协方差为蜱、的噪声。这样,的估值可用广义卡尔曼滤波递归计算完成,并且简化为: . 椤,一十足【一‘ . 尸肛?胛月门肝门】?一一一珂【一一以上算法称为神经网络的全局卡尔曼滤波训练算法,其中的是梯度矩阵,由网络输出对各权重的偏导数构成,即: . :丝竖盟到、口。;。一” 可由反向传播算法逐层递归计算得到。当充分大时,算法可将所有样本的网络输出与其期望值间的均方误差降至规定值以下。最终所得协方差矩阵尸。可用来估算每个权重的重要性, 从而删除那些不重要的权重,这旱的删除指的是将其值置为。对于权重以, 。,妞,式规定,设其重要性的度量为。,若在训练过程中规定: 第四章基于自适应滤波的预测模型 . ” 其中,,则有】。。。。吒 . 其中,从理论上估算了删掉权重只,而引起的均方误差的增量。将。按从小到大的顺序排列,从而将这些权重按重要性重新排序为 . 氓,?,目。。。则删掉前个权重引起的均方误差增量可估计为: . ?。。?。 , 若允许的均方误差的增量为?,则可删除的权重数目应满足: ;‰,‰: 式.估算的误差增量往往与根据实际样本集计算出的误差增量有~定的偏差,为精确起见,可按.规定的顺序,依次删掉这些权重,同时根据实际样本集计算出的误差增量,这样得到了一个误差增量序列: ?矿?,?。对于允许的均方误差的增量?,可删除的权重数目满足: . ? 且对任意肌,有 . ,?舡也就是说,.中的排序实际上只是给出了一个较为准确的删除权重的顺序, 均方误差的增量还得根据实际样本集计算。在允许的均方误差的增量?小于一定值时,删除这些不重要的权重可以使网络结构更为紧凑,提高推广能力。局域卡尔曼滤波算法【,。由于全局卡尔曼滤波算法在每次迭代过程中需要更新误差协方差矩阵,而协方差矩阵的大小同权重的总数的平方成正比,其计算复杂度即使对中等规模的网络也是过高的。为了降低计算的复杂度和提高学习速度,人们提出了局域的卡尔曼滤波算法。对于局域的卡尔曼滤波算法,每一次权重调整不是整体进行,而是逐个神经元分别进行,调整公式的形式与全局情况完全相同,只是其中的权重矢量、卡尔曼增益、误差协方差矩阵都是对单个神经元定义,这里就不再赘述。第四章基于自适应滤波的预测模型文献讨论了局域卡尔曼滤波算法,并在此基础上提出了网络权重的删剪算法,其过程与相应公式办与全局情况相同,只是误差协方差矩阵分别采用了各神经元权重矢量的协方差矩阵,在此也不再赘述。 ?.基于自适应滤波的预测模型 ?..非线性时问序列的状态矢量模型在介绍这种预测模型之前,我们先简单介绍一种描述非线性时阳序列的模型,称为状态矢量模型 ,简称。对于非静态的非线性时间序列 . ?即其中, 工一 . 胛 ”是独立的、确定分布的噪声。 .式可以重新描述为 . , 其中,称为状态矢量,它是一个高维矢量,随时间发生变化,是以、口”为变量的非线性函数,该非线性时间序列的特性由及序列徊的变化过程完全确定。一般的,口”可认为是一个随机过程,可用各阶统计参数对它进行描述。 ?..基于自适应滤波的预测模型基于,考虑这样一种非线性时间序列模型:如果的概率分布主要集中在的平均值研曰月周围,即的方差较小。为了直观的进行描述,可将臼”想象成一维的,。目月的函数曲线如图.所示。对于这样的一种非线性时『白序列,其在线预测问题可以用算法很好的解决。算法特别适合于实时信号处理。对于.、.描述的线性系统,第四章基于自适应滤波的预测模型算法能在每一步递归中计算出使误差能量函数下降的系统状态矢量,因此,对于线性系统算法能通过测量函数的观测值,递归计算出系统状态矢量的最佳值。但对于.、.式描述的系统,此时测量函数是非线性函数,算法能否给出系统状态矢量的最佳估算就取决于 .式中的一级近似能否很好的逼近每个时刻的非线性输出函数 ,,民,这就要求臼比较接近于一,只有这样.式中的二次项及其后的高阶项都可以忽略,从而.、.式将成为系统模型的很好近似。用算法进行非线性时问序列.的在线预测相当于对时刻的邻近的一定宽度的时间窗口内的状态矢量值进行一个中值估算,该估算值能使这个邻近窗口内的测量均方误差最小。由于目紧密分布在研口的周围,故将十分接近于,满足对非线性测量函数采取一级近似进行线性化的条件,因此用算法很适合做状态向量的方差较小的非线性时间序列的在线预测。这也是我们选择算法作为预测模型进行二次在线学习算法的出发点。。目九 / , / 图.状态矢量的概率分御然而,应用算法之前还存在两个重要问题: 非线性函数?,”咳如何确定; 迭代初值、的选择。第四章基于白适应滤波的预测模型

                    本文档为【VBR视频通信量预测的神经网络方法研究（已处理）】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

VBR视频通信量预测的神经网络方法研究（已处理）

你可能还喜欢