首页 AVS视频编码技术回顾与应用展望

AVS视频编码技术回顾与应用展望

举报
开通vip

AVS视频编码技术回顾与应用展望AVS视频编码技术回顾与应用展望 AVS视频编码技术回顾与应用展望 马思伟 从2002年8月第一次AVS1会议至今,AVS已走过两年的历程,其间涌现了大量的优秀技术提案,并成功地制定了面向高清晰度(以下简称“高清”)数字电视广播、流媒体传输、移动多媒体通信等应用的视频编码标准,此外在系统规范、音频编码、数字版权保护等各方面也已取得一定的成果,已经初步形成具有自主专利知识产权的标准体系。在产业应用方面,新成立的AVS产业联盟为AVS的应用推广树立一面旗帜。在前不久ISMA2与AVS工作组共同举办的网络电视标准与产业论...

AVS视频编码技术回顾与应用展望
AVS视频编码技术回顾与应用展望 AVS视频编码技术回顾与应用展望 马思伟 从2002年8月第一次AVS1会议至今,AVS已走过两年的历程,其间涌现了大量的优秀技术提案,并成功地制定了面向高清晰度(以下简称“高清”)数字电视广播、流媒体传输、移动多媒体通信等应用的视频编码 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 ,此外在系统 规范 编程规范下载gsp规范下载钢格栅规范下载警徽规范下载建设厅规范下载 、音频编码、数字版权保护等各方面也已取得一定的成果,已经初步形成具有自主专利知识产权的标准体系。在产业应用方面,新成立的AVS产业联盟为AVS的应用推广树立一面旗帜。在前不久ISMA2与AVS工作组共同举办的网络电视标准与产业论坛,以及由台湾华聚产业共同标准推动基金会与中国通信标准化协会、中国电子工业标准化技术协会共同举办的海峡两岸信息产业技术标准论坛上,来自国内外的众多高新技术企业都对AVS的未来前景给以高度评价,并予以支持。 在看到AVS生机勃勃的同时,我们也不能不看到AVS与其他标准间的竞争也是愈演愈烈。那么该如何看待AVS与其他标准间的关系,AVS的生命力何在?下面将就这些问题进行探讨。首先从AVS的技术特征去认识AVS,从技术层面剖析AVS,然后从AVS本身的特点出发看其在专利政策与其他标准间的关系。 1​ AVS历史回顾 由于未经压缩的原始视频数据量之大对于当前有限的传输带宽或存储空间都是难以承受的,使得视频压缩(编码)成为国内外研究和应用的热点之一。在过去几十年里,国际上已经成功地制定了面向各种应用的视频编码标准,主要包括用于CD-ROM3存储的MPEG4-1标准、用于数字视频光盘(DVD5)和数字电视广播(DVB6)的MPEG-2标准、用于视频会议的H.261/H.263标准以及允许对任意形状的对象进行编码的MPEG-4标准。尤其是最近国际上新制定的H.264/AVC视频编码标准,与以往任何编码标准相比,其压缩效率都至少提高了一倍以上,已经得到了各研究机构和多媒体工业界的高度重视,并将引发多媒体产业中一场新的变革。 与此同时国际专利的壁垒一直限制我国多媒体工业的发展,于2002年6月成立的AVS工作组目的是为面向我国的信息产业需求,联合国内企业和科研机构,制订数字音视频的压缩标准,为数字音视频设备与系统提供高效经济的编解码技术,以满足高分辨率数字广播、无线宽带多媒体通讯、互联网宽带流媒体等重大信息产业应用的需求。与国际标准的制定工作相比,AVS更注重应用的需求,为不同的应用提供不同的技术解决 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 ,以达到复杂度和效率之间的适当折衷。目前已分别对面向高清数字电视广播、HD-DVD7存储等高端应用,以及面向移动、无线通信、流媒体传输等低端应用,分别制定相应的标准,即AVS1-P2(工作组常称AVS1.0)以及AVS1-P7(工作组常称AVS-M)。AVS标准与国际标准的发展历程如图1所示。目前AVS1-P2的基准档次(Jizhun Profile)已经完成,与该部分相关的系统部分也已完成,现正进行X Profile的制定工作,以进一步提高编码效率;AVS1-P7主要定位于编码效率的第一阶段已经完成,主要定位于容错的第二阶段也将近期启动。关于音频编码此外标准制定之后对标准的一致性测试工作目前也正在紧密进行。 图 1. 视频编码标准的历程 2​ AVS技术回顾 无论是AVS1-P2还是AVS1-P7标准,都和H.264标准具有相同的编码框架,如图2 所示。但由于标准制定时出于对不同应用的考虑,在技术取舍上对复杂度性能的衡量指标也不相同,因而在复杂性、编码效率上的表现也各有异同。比如一般认为H.264的编码器大概比MPEG-2复杂9倍,而AVS1-P2则由于编码模块中的各项技术复杂度都有所降低,其编码器复杂度大致为MPEG-2的6倍,但编码在高清序列上表现出与H.264相近的性能。 图 2. 视频编码标准的历程 以上编码框架中的技术可以分为如下几类: ​ 帧内预测 ​ 多参考帧预测 ​ 变块大小运动补偿 ​ 1/4像素插值 ​ 整数变换 ​ 量化 ​ 熵编码 ​ 环路滤波 (1.)​ 变块大小运动补偿 变块大小运动补偿是提高运动预测精确度的重要手段之一,对于提高编码效率起着重要的贡献。在以前的编码标准MPEG-1,MPEG-2中,运动预测都是基于16×16的宏块进行的(MPEG-2 Interlace支持16×8划分),在MPEG-4中添加了8×8块划分模式,而在H.264则进一步添加了16×8、8×16、8×4、4×8、4×4等划分模式。但实验数据表明小于8×8块的划分模式对低分辨率编码效率影响较大,而对于高分辨率编码则影响甚微,如图3所示。在高清序列上的大量实验数据表明,去掉8×8以下大小块的运动预测模式,整体性能降低大概在2-4%左右,但其编码复杂度降低则估计可达到30-40%。因此在AVS1-P2中将宏块划分最小限制为8×8,这一限制大大降低了编解码器的复杂度,而在AVS1-P7中则仍采用最小4×4块划分编码,以保证对QCIF,CIF8等低分辨率图像的编码效率。 图3. 变块大小运动补偿在QCIF以及720p序列上的对比效果 (2.)​ 帧内预测 至于帧内编码预测模式,以前的编码标准都是在频域内进行预测(如MPEG-2 DC差分预测,MPEG-4 DC/AC预测), H.264则采用了用相邻像素进行空域预测,并且通过不同方向的预测提高了预测的精确度、帧内编码效率。比如H.264帧内预测有4×4,16×16两种预测模式,其中4×4块亮度预测有9种模式,16×16亮度预测4种模式。与H.264类似, AVS也采用了帧内预测技术,但在AVS1-P2帧内预测是基于8×8块进行的,并且亮度只有5种预测模式,大大降低了帧内预测模式选择的复杂度,但性能十分接近。除了模式种类外,其他区别主要体现在对相邻像素的选取以及对相邻像素所采用的滤波器上。 (3.)​ 多参考帧预测 多参考帧预测能够使得当前块可以从前面几帧图像中寻找更好的匹配,能够提高编码效率。但一般来讲2-3个参考帧基本上能达到最高的性能,更多的参考图像对性能提升影响甚微,如图4所示,复杂度却会成倍的增加。H.264为了支持灵活的参考图像引用,采用了复杂的参考图像缓冲区管理机制,实现较繁琐。而AVS则针对这一情况限定最多采用两个参考帧。尤其是对AVS1-P2,这一限制还有一个优点就是在没有增大缓冲区的条件下提高了编码效率,因为B帧本身也需要两个参考图像的缓冲区。 图4. 多参考帧性能测试 (4.)​ 1/4像素插值 运动矢量的精度是提高预测准确度的重要手段之一。在有关H.264的提案中,更高精度插值成为技术争论的焦点,提出了从1/3、1/4、1/6一直到1/8像素以及自适应预测精度(AMA)运动补偿等各种建议。影响更高精度运动补偿性能的一个核心技术是插值滤波器的选择,对此也有大量的文献研究。其中在MPEG-4中对半像素位置采用的是8拍滤波;在H.264中最终采用了1/4像素运动补偿,其中半像素位置采用6拍滤波。但这样的滤波器只对低分辨率图像效果显著。而AVS1-P2在对高清图像编码时对1/2像素位置插值采用4拍滤波器可达到与6拍滤波器一致的性能,如图5所示,并大大降低了访存带宽,这对硬件实现尤为重要;在AVS1-P7中为了提高编码效率对1/2像素位置水平方向采用8拍滤波器,垂直方向上采用4拍滤波器。 图5. 1/4像素插值 (5.)​ 整数变换 H.264中整数变换代替了传统的浮点DCT9变换。整数变换具有复杂度低、完全匹配等优点。与H.264中的变换相比,AVS中的变换也有自身的特点。由于变换矩阵每行的模比较接近,可以将变换矩阵的归一化在编码端完成,从而节省了解码反变换所需的缩放表。由于AVS1-P2中最小块预测是基于8×8的,AVS1-P7中最小块预测是基于4×4的,因此分别采用了基于8×8,4×4的整数变换。由于8×8的变换比4×4变换的去相关性能力更强,在变换模块,AVS1-P2实际上编码效率有所提高,大概在2%(约0.1dB左右)。H.264在后来的发展过程中也意识到这一点,并在后来的FRx Profile(High Profile)中增添了8×8块变换。 图6. 4×4变换与8×8变换性能对比 (6.)​ 量化 量化是编码过程中唯一带来损失的模块。以前典型的量化机制有两种,一种是H.263中的量化 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 ,一种是MPEG-2中的加权矩阵量化形式。与以前的量化方法相比H.264中的量化与变换归一化相结合,同时可以通过乘法和移位来实现,对于量化步长的设计量化参数每增加6,相应的量化步长扩大一倍。AVS中的量化也与变换归一化相结合,由于变换矩阵每行的模比较接近,变换矩阵的归一化可以在编码端完成,从而解码端反量化表不再与变换系数位置相关。 (7.)​ B帧宏块编码模式 在AVS1-P2中,实际B帧的性能比H.264中的B帧编码技术性能有所提高。这一部分增益主要来自空域/时域相结合的直接模式(Direct mode)以及直接模式运动矢量舍入控制技术。此外,AVS1-P2中提出的对称模式(Symmetric mode)可以在只编码一个运动矢量的条件下实现双向预测,但其编码效率与双向编码效率相近。 (8.)​ 熵编码 熵编码是压缩的重要组成部分之一。H.264/AVC采用基于上下文的适应性编码算法,在基本规范(Baseline Profile),为基于上下文的自适应变长编码(CAVLC10);在核心规范(Main Profile),为基于上下文适应二进制算术编码(CABAC11) 。这两种编码方法更充分地挖掘了编码系数的上下文相关性,可以根据上下文选择合适的上下文模型进行编码,进一步提高编码效率。CAVLC的特点在于在编码一个块的系数过程中会根据编码系Level(数压缩比率等级)值进行适应性的码表切换,同时利用联合编码非零系数个数、最后部分绝对值为1的系数个数以及非零系数间零的个数等信息。这些编码方法比以前单纯编码(Run,Level)的方法效率要高;CABAC的特点则是以算术编码为核心,在编码过程中会根据编码数据的统计信息进行适应性的模型切换,与传统的VLC12编码相比,它能为部分编码信息进行小于1比特的位分配,因此具有更高的编码效率,但其实现极为复杂。 AVS中的熵编码可以说是H.264与MPEG-2熵编码方法的综合。AVS中的熵编码方案既采用了MPEG-2中(run, level)的二维编码机制,又吸收了H.264中利用上下文信息进行自适应编码的策略--对一个系数块采用多个码表编码,即根据编码系数的level值进行码表切换,以适应编码系数的概率分布,从而将编码效率提高到与H.264 CAVLC相当,但复杂度却降低了。 (9.)​ 环路滤波 起源于H.263++的环路滤波技术特点在于把去块效应滤波放在编码的闭环内,而此前去块效应滤波都是作为后处理来进行的,如MPEG-4。在AVS1-P2中,由于最小预测块、变换都是基于8×8的,环路滤波也只在8×8块边缘进行,与H.264对4×4块变换进行滤波相比,其滤波边数变为H.264的1/4。同时由于AVS1-P2滤波点数、滤波强度分类数都比H.264中的少,大大减少了判断、计算的次数。AVS1-P7虽然也是基于4×4块进行滤波,但其判断、计算量也都大大降低,从而降低了环路滤波的复杂度,这对解码器来讲是十分重要的。 以上是从编码模块各个方面认识AVS,从中不难看出AVS对每项技术都进行了复杂性与效率的权衡,为所面向的应用提供了很好的解决方案,努力降低复杂度,并保证相近的编码效率。在这些技术中不乏创新之处,已申请了一大批专利技术,这就为AVS的成功奠定了技术和法律基础。 3​ AVS应用展望 一个标准的成功不仅靠技术上的先进,还需要得到市场的认可。而市场的认可很大程度取决于经济因素,比如由于过度的专利保护所导致的高额专利费会限制技术的应用,MPEG-4标准即是一个很好的实例。AVS制定之初就认真分析了国内外标准和知识产权领域的经验教训,特别是标准制订和专利授权割裂的弊端,走出一条技术、标准、知识产权协调发展的道路。其基本原则为:为保证标准的先进性,AVS标准不排斥专利技术,但专利进入AVS标准必须遵守一定的条件,将专利的利益索求限制在一个合理的水平,以保证标准的公益性。这一原则奠定了AVS将来的市场基础。目前MPEG的收费标准并不合理,因此难以得到众多国际厂商的广泛支持,而AVS与MPEG比较起来,目前的优势主要有编码效率高、实现复杂度低、专利收费低等。与AVS相关的数字电视广播、IPTV、无线移动多媒体通信等应用正蓬勃发展,为AVS的成长壮大提供了很大的发展空间。目前采用AVS标准的芯片已经研发出来,采用AVS标准的机顶盒、电视机、编码器也会陆续由国内、国外厂商推出,AVS的应用正在一步一步地走向辉煌! 参考文献 《AVS通讯》 2005年第5期(总第10期) 作者简介: 马思伟 中国科学院计算技术研究所数字化技术研究室,助理研究员,博士 1 Audio Video coding Standard数字音视频编解码技术标准 2 Internet Streaming Media Alliance互联网流媒体联盟 3 Compact Disk Read Only Memory光盘只读存储器 4 International Standard Organization's Moving Picture Expert Group国际标准化组织的活动图片专家组 5 Digital Video/Versatile Disk,数字视频/万能光盘 6 Digital Video Broadcasting,数字视频广播 7 High Density Digital Versatile Disk 8 QCIF 和CIF均为图像 格式 pdf格式笔记格式下载页码格式下载公文格式下载简报格式下载 。QCIF支持 176×144像素,CIF支持352*288像素。 9 Discrete Cosine Transform离散余弦变换 10 Context-based Adaptive Variable Length Coding 11 Context-based Adaptive Binary Arithmetic Coding 12 Variable Length Coding变长变码
本文档为【AVS视频编码技术回顾与应用展望】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_909364
暂无简介~
格式:doc
大小:3MB
软件:Word
页数:8
分类:互联网
上传时间:2011-04-28
浏览量:29