购买

¥30.0

加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 5.图像压缩(my)青岛大学详解

5.图像压缩(my)青岛大学详解.ppt

5.图像压缩(my)青岛大学详解

中小学精品课件
2019-05-26 0人阅读 举报 0 0 0 暂无简介

简介:本文档为《5.图像压缩(my)青岛大学详解ppt》,可适用于高等教育领域

图像压缩编码图像压缩编码数据压缩与信息论基础图像压缩与编码基本概念信息论基础图像压缩编码无损压缩有损压缩图像压缩编码主要国际标准静止图像压缩编码标准JPEG运动图像压缩编码标准MPEG第一节 图像压缩与编码基本概念为什么要进行图像压缩图像数据压缩的可能性数据冗余图像压缩的目的图像数据压缩技术的重要指标图像数据压缩的应用领域图像编码中的保真度准则信息论基础图像压缩模型一为什么要进行图像压缩?数字图像通常要求很大的比特数这给图像的传输和存储带来相当大的困难。要占用很多的资源花很高的费用。如一幅*的灰度图象的比特数为**=k再如一部分钟的彩色电影每秒放映帧。把它数字化每帧*象素每象素的R、G、B三分量分别占bit总比特数为******bit=,M。如一张CD光盘可存兆字节数据这部电影光图像(还有声音)就需要张CD光盘用来存储。对图像数据进行压缩显得非常必要。二图像数据压缩的可能性一般原始图像中存在很大的冗余度。用户通常允许图像失真。当信道的分辨率不及原始图像的分辨率时降低输入的原始图像的分辨率对输出图像分辨率影响不大。用户对原始图像的信号不全都感兴趣可用特征提取和图像识别的方法丢掉大量无用的信息。提取有用的信息使必须传输和存储的图像数据大大减少。设:n和n是在两个表达相同信息的数据集中所携带的单位信息量。压缩率:描述压缩算法性能CR=nn其中n是压缩前的数据量n是压缩后的数据量相对数据冗余:RD=–CR例:CR=RD=描述信源的数据是信息量(信源熵)和信息冗余量之和。三数据冗余)数据冗余的基本概念A编码冗余:)常见的数据冗余在数字图像压缩中常有种基本的数据冗余:编码冗余、像素间的冗余以及心理视觉冗余为表达图像数据需要用一系列符号用这些符号根据一定的规则来表达图像就是对图像编码。对每个信息或事件所赋的符号序列称为码字而每个码字里的符号个数称为码字的长度。设定义在,区间的离散随机变量sk代表图像的灰度值每个sk以概率ps(sk)出现Ps(sk)=nknk=,,,…,L其中L为灰度级数nk是第k个灰度级出现的次数n是图像中像素总个数。设用来表示sk的每个数值的比特数是那么为表示每个像素所需的平均比特数就是编码所用的符号构成的集合称为码本。等长码:对于一个消息集合中的不同消息用相同长度的不同码字表示编解码简单编码效率不高。变长码:与等长码相对应对于一个消息集合中的不同消息也可以用不同长度的码字表示编码效率高编码解码复杂。例:如果用位表示该图像的像素我们就说该图像存在着编码冗余因为该图像的像素只有两个灰度用一位即可表示。如果一个图像的灰度级编码使用了多于实际需要的编码符号就称该图像包含了编码冗余。B像素冗余:由于任何给定的像素值原理上都可以通过它的邻居预测到单个像素携带的信息相对是小的。对于一个图像很多单个像素对视觉的贡献是冗余的。这是建立在对邻居值预测的基础上。原始图像越有规则各像素之间的相关性越强它可能压缩的数据就越多。例:原图像数据:压缩后数据:相同的目标相同的直方图象素间的相关性不同类似还有:图像彩色光谱空间的冗余视频图像信号在时间上的冗余一些信息在一般视觉处理中比其它信息的相对重要程度要小这种信息就被称为视觉心理冗余。()视觉心理冗余:KK四图像压缩的目的图像数据压缩的目的是在满足一定图像质量条件下用尽可能少的比特数来表示原始图像以提高图像传输的效率和减少图像存储的容量。在信息论中称为信源编码。图像从结构上大体上可分为两大类一类是具有一定图形特征的结构另一类是具有一定概率统计特性的结构。基于不同的图像结构特性应采用不同的压缩编码方法。五图像数据压缩技术的重要指标()压缩比:图像压缩前后所需的信息存储量之比压缩比越大越好。()压缩算法:利用不同的编码方式实现对图像的数据压缩。()失真性:压缩前后图像存在的误差大小。全面评价一种编码方法的优劣除了看它的编码效率、实时性和失真度以外还要看它的设备复杂程度是否经济与实用。常采用混合编码的方案以求在性能和经济上取得折衷。随着计算方法的发展使许多高效而又比较复杂的编码方法在工程上有实现的可能。)办公自动化)医学图像处理)卫星遥感遥测系统)高清晰度电视HDTV)可视电话、会议电视)移动多媒体图像及视频传输:彩信业务手机视频……凡是涉及到图像数据的传输、交换与存储的领域均要求进行图像数据的压缩。六图像数据压缩的应用领域七图像编码中的保真度准则图像信号在编码和传输过程中会产生误差尤其是在有损压缩编码中产生的误差应在允许的范围之内。在这种情况下保真度准则可以用来衡量编码方法或系统质量的优劣。通常这种衡量的尺度可分为客观保真度准则和主观保真度准则。通常使用的客观保真度准则有输入图像和输出图像的均方根误差输入图像和输出图像的均方根信噪比两种。均方根误差:设输入图像是由N×N个像素组成令其为f(x,y)其中x,y=,,,…,N。这样一幅图像经过压缩编码处理后送至受信端再经译码处理重建原来图像这里令重建图像为g(x,y)。它同样包含N×N个像素并且x,y=,,,…,N。()客观保真度准则在,,,…,N范围内x,y的任意值输入像素和对应的输出图像之间的误差可用下式表示:而包含N×N像素的图像之均方误差为:由式可得到均方根误差为如果把输入、输出图像间的误差看作是噪声那么重建图像g(x,y)可由下式表示:在这种情况下另一个客观保真度准则重建图像的均方信噪比如下式表示:图像处理的结果,大多是给人观看由研究人员来解释的因此图像质量的好坏既与图像本身的客观质量有关也与视觉系统的特性有关。有时候客观保真度完全一样的两幅图像可能会有完全不相同的视觉质量所以又规定了主观保真度准则这种方法是把图像显示给观察者然后把评价结果加以平均以此来评价一幅图像的主观质量。()主观保真度准则另外一种方法是规定一种绝对尺度如:表电视图像质量评价尺度评分评价说明优秀的优秀的具有极高质量的图像好的是可供观赏的高质量的图像干扰并不令人讨厌可通过的图像质量可以接受干扰不讨厌边缘的图像质量较低希望能加以改善干扰有些讨厌劣等的图像质量很差尚能观看干扰显著地令人讨厌不能用图像质量非常之差无法观看八信息理论(一)、信源空间概述、信息:事物运动状态或存在方式的不确定性的描述、信源:信源是产生各类信息的实体。信源给出的符号是不确定的可用随机变量及其统计特性描述。信源空间:随机符号及其出现概率的空间、信源的分类:()连续信源离散信源()无记忆信源有记忆信源(相关信源)有限长度记忆信源(Markov信源)按照信源在时间和幅度上是否连续分为连续信源和离散信源离散信源按信源发出的符号之间是否独立分为无记忆信源和有记忆信源Markov信源是有限长度记忆信源它只有前面m个符号有关*(二)、信息的度量、信息公理()信息由不确定性程度进行度量确定事件的信息量为零。()不确定性程度越高信息量越大()相互独立性与信息量可加性独立事件的联合信息等于两个独立事件的信息总和。满足上述公理的函数为:、离散无记忆信源(DNMS)的信息量度量:()信源符号的自信息量定义为:(a)非负性(b)信息量的单位:底为时单位为:比特(bit)底为e时单位为:奈特(Nat)底为时单位为:哈特()、信源平均自信息量(信息熵)离散无记忆信源A的平均自信息量(信息熵)定义为:熵是编码所需比特数的下限即编码所需要最少的比特例:设个随机变量具有同等概率为/计算信息熵H。解:根据公式可得:H=**(log())=**()=图像熵指该图像的平均信息量即表示图像中各个灰度级比特数的统计平均值等概率事件的熵最大。、平均码字长借助熵的概念可以定义量度任何特定码的性能的准则即平均码字长度。其中βi为灰度级di所对应的码字长度。的单位也是比特字符。、编码效率编码符号是在字母集合A={a,a,a,…am}中选取的。如果编码后形成一个新的等概率的无记忆信源字母数为n则它的最大熵应为logn比特符号。因此这是一个极限值。如果H(d)=logn则可以认为编码效率已经达到如果H(d)<logn则可认为编码效率较低。编码效率冗余度根据信息熵编码理论可以证明在H条件下总可以设计出某种无失真编码方法。若编码结果使远大于H表明这种编码效率很低占用的比特数太多。若编码结果使等于或接近于H这种状态的编码方法称为最佳编码。若要求编码结果使<H则必然丢失信息而引起图像失真。这就是在允许失真条件下的一些失真编码方法。、压缩比压缩比是衡量数据压缩程度的指标之一。目前常用的压缩比定义为其中LB为源代码长度Ld为压缩后代码长度Pr为压缩比。压缩比的物理意义是被压缩掉的数据占据源数据的百分比。当压缩比Pr接近时压缩效果最理想。、互信息信源编码输出为bk给出的关于ai的信息量究竟为多少呢?为此将引入另外一个信息量度-互信息对给定的两个离散信源X和YY中事件bk的发生给出关于X中事件ai的互信息I(ai:bk)定义为:其中p(ai|bk)表示信源编码输出为bk估计信源输入为ai的条件概率。I(ai|bk)称为条件自信息量表示在发现信源编码输出为bk对信源输入为ai的不确定性的猜测或知道bk后ai还保留的信息量。I(ai)表示ai的不确定性。两者值差即为bk解除的ai不确定性的多少。设一幅灰度级为K的图像图像中第k级灰度出现的概率为pk图像大小为M×N每个像素用d比特表示每两帧图像间隔△t数字图像的熵H图像的平均码字长度R为:编码效率η定义为:信息冗余度为:每秒钟所需的传输比特数bps为:压缩比r为:九图像的压缩模型源数据编码:完成原数据的压缩。通道编码:为了抗干扰增加一些容错、校验位实际上是增加冗余。通道:如Internet、广播、通讯、可移动介质源数据编码通道编码通道通道解码源数据解码源数据编码的模型源数据解码的模型映射器量化器符号编码器符号解码器反向映射器源数据编码与解码的模型映射器:减少像素冗余如使用RLE编码。或进行图像变换量化器:减少视觉心理冗余仅用于有损压缩符号编码器:减少编码冗余如使用哈夫曼编码源数据编码与解码的模型常用的图像压缩编码方法※无损压缩算法中删除的仅仅是图像数据中冗余的信息因此在解压缩时能精确恢复原图像无损压缩的压缩比很少有能超过:的,常用于要求高的场合。第二节 无损压缩编码哈夫曼编码等长码:对于一个消息集合中的不同消息用相同长度的不同码字表示编解码简单编码效率不高。变长码:与等长码相对应对于一个消息集合中的不同消息也可以用不同长度的码字表示编码效率高编码解码复杂。哈夫曼编码是一种利用信息符号概率分布特性的变字长的编码方法。对于出现概率大的信息符号编以短字长的码对于出现概率小的信息符号编以长字长的码。方法:将信源符号按出现概率从大到小排成一列然后把最末两个符号的概率相加合成一个概率。把这个符号的概率与其余符号的概率按从大到小排列然后再把最末两个符号的概率加起来合成一个概率。重复上述做法直到最后剩下两个概率为止。从最后一步剩下的两个概率开始逐步向前进行编码。每步只需对两个分支各赋予一个二进制码如对概率大的赋予码对概率小的赋予码。Huffman编码输入SSSSSS输入概率Huffman编码输入SSSSSS输入概率第一步Huffman编码输入SSSSSS输入概率第一步第二步Huffman编码输入SSSSSS输入概率第一步第二步第三步Huffman编码输入SSSSSS输入概率第一步第二步第三步第四步Huffman编码输入SSSSSS输入概率第一步第二步第三步第四步Huffman编码输入SSSSSS输入概率第一步第二步第三步第四步S=Huffman编码输入SSSSSS输入概率第一步第二步第三步第四步S=Huffman编码输入SSSSSS输入概率第一步第二步第三步第四步S=Huffman编码输入SSSSSS输入概率第一步第二步第三步第四步S=Huffman编码输入SSSSSS输入概率第一步第二步第三步第四步S=Huffman编码输入SSSSSS输入概率第一步第二步第三步第四步S=哈夫曼编码效率信源熵为:H=∑PilogPi=(loglog*logloglog)=比特符号平均码字长度:R=∑βiPi码字长度R=∑βiPi=××××××=比特符号编码效率:η=HR()η=HR===编码举例cbafef=e=a=b=c=d=d作业:有如下信源x其中:P=,P=,P=,P=,P=,P=,P=,P=。将该信源进行哈夫曼编码。设一幅灰度级为(分别用S、S、S、S、S、S、S、S表示)的图像中各灰度所对应的概率分别为、、、、、、、。现对其进行哈夫曼编码X=uuuuuuuuPPPPPPPP设有一信源X={x,x,x,x}对应概率P={,,,}⑴进行霍夫曼编码(要求大概率的赋码字,小概率的赋码字)给出码字平均码长编码效率⑵对码串解码由于霍夫曼编码法需要多次排序当很多时十分不便为此费诺(Fano)和香农(Shannon)分别单独提出类似的方法使编码更简单。具体编码方法如下:①把按概率由大到小、从上到下排成一列然后把分成两组并使得②把两组分别按赋值。然后分组、赋值不断反复直到每组只有一种输入为止。将每个所赋的值依次排列起来就是费诺香农编码。香农-费诺编码*以前面哈夫曼编码的例子进行香农-费诺编码:输入概率 xxxxxx*从理论上分析采用哈夫曼编码可以获得最佳信源字符编码效果实际应用中由于信源字符出现的概率并非满足的负幂次方因此往往无法达到理论上的编码效率和信息压缩比算术编码以信源字符序列{xy}为例设字符序列{xy}对应的概率为{}Nx和Ny分别表示字符x和y的最佳码长则根据信息论有:字符x、y的最佳码长分别为bit和bi这表明要获得最佳编码效果需要采用小数码字长度,这是不可能实现的即采用哈夫曼方法对{xy}的码字分别为和也就是两个符号信息的编码长度都为。对于出现概率大的字符y并未能赋予较短的码字实际编码效果往往不能达到理论效率为提高编码效率Elias等人提出了算术编码算法。算术编码的特点算术编码是信息保持型编码它不像哈夫曼编码无需为一个符号设定一个码字算术编码分为固定方式和自适应方式两种编码选择不同的编码方式将直接影响到编码效率自适应算术编码的方式无需先定义概率模型适合于无法知道信源字符概率分布的情况当信源字符出现的概率比较接近时算术编码效率高于哈夫曼编码的效率在图像通信中常用它来取代哈夫曼编码实现算术编码算法的硬件比哈夫曼编码复杂。编码原理算术编码方法是将被编码的信源消息表示成之间的一个间隔即小数区间消息越长编码表示它的间隔就越小以小数表示间隔表示的间隔越小所需的二进制位数就越多码字就越长。反之间隔越大编码所需的二进制位数就少码字就短。算术编码将被编码的图像数据看作是由多个符号组成的字符序列对该序列递归地进行算术运算后成为一个二进制分数接收端解码过程也是算术运算由二进制分数重建图像符号序列。编码举例设图像信源编码可用a、b、c、d这个符号来表示若图像信源字符集为{dacba}信源字符出现的概率分别如下表所示采用算术编码对图像字符集编码。信源字符abcd出现概率算术编码的基本步骤()根据已知条件和数据可知信源各字符在区间内的子区间间隔分别如下:a=)b=)c=)d=)()计算中按如下公式产生新的子区间:()第个被压缩的字符为“d”其初始子区间为)()第个被压缩的字符为“a”由于其前面的字符取值区间为)范围因此字符“a”应在前一字符区间间隔)的)子区间内根据公式()可得:=×()==×()=()第个被压缩的字符为“c”由于其前面的字符取值区间为)范围内因此字符“c”应在前一字符区间间隔)的)子区间内根据()可得:=×()==×()=()第个被压缩的字符为“b”由于其前面的字符取值区间为)范围内因此字符“b”应在前一字符区间间隔)的)子区间内根据()可得:=×()==×()=()第个被压缩的字符为“a”由于其前面的字符取值区间为)范围内因此字符“a”应在前一字符区间间隔)的)子区间内根据()可得:=×()==×()=经过上述计算字符集{dacba}被描述在实数)子区间内即该区间内的任一实数值都惟一对应该符号序列{dacba}因此可以用)内的一个实数表示字符集{dacba}。)子区间的二进制表示形式为:)在该区间内的最短二进制代码为去掉小数点及其前的字符从而得到该字符序列的算术编码为。算术编码可以通过硬件电路实现在上述乘法运算可以通过右移来实现因此在算术编码算法中只有加法和移位运算。算术编码效能根据上述运算结果编码惟一代表字符序列{dacba}因此平均码字长度为:bit字符题己知信源X=试对进行算术编码。解()对二进制信源只有两个符号“”和“”设置小概率Qe=大概率Pe=–Qe=()设C为子区间的左端起始位置A为子区间的宽度符号“”的子区间为,),符号“”的子区间为,)()初始子区间为,),C=,A=,子区间按以下各步依次缩小:步序符号CA*=*=*=*=*=*=*=最后的子区间左端(起始位置)C=()d=()b最后的子区间右端(终止位置)CA=()d=()b编码结果为子区间头、尾之间取值其值为,可编码为原来个符号现被压缩为三个符号。行程编码RLE编码(游程长度编码)RunLengthEncoding概念:行程:具有相同灰度值的像素序列。编码思想:去除像素冗余。用行程的灰度和行程的长度代替行程本身。由于一幅图像中有许多颜色相同的图块用一整数对存储一个像素的颜色值及相同颜色像素的数目(长度)。例如:(GL)长度颜色值编码时采用从左到右从上到下的排列每当遇到一串相同数据时就用该数据及重复次数代替原来的数据串。(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)*的像素颜色仅用对数据游程长度编码RLE(RunLengthEncoding):分析:对于有大面积色块的图像压缩效果很好直观经济,是一种无损压缩对于纷杂的图像压缩效果不好最坏情况下会加倍图像RLE编码RunLengthEncoding适合行程编码的图适合行程编码的图※有损压缩是通过牺牲图像的准确率以实现较大的压缩率如果容许解压图像有一定的误差则压缩率可显著提高。有损压缩在压缩比大于:时仍然可重构图像而如果压缩比为:到:则重构的图像与原图几乎没有差别第三节 有损压缩编码变换编码图像数据一般有较强的相关性若所选用的正交矢量空间的基矢量与图像本身的主要特征相近在该正交矢量空间中描述图像数据则会变得更简单。经过正交变换会把原来分散在原空间的图像数据在新的坐标空间中得到集中。对于大多数图像大量变换系数很小只要删除接近于零的系数并且对较小的系数进行粗量化而保留包含图像主要信息的系数以此进行压缩编码。在重建图像进行解码时所损失的将是一些不重要的信息几乎不会引起图像的失真。基本概念: 将空间域里描述的图像经过某种变换(常用的是二维正交变换如付里叶变换、离散余弦变换、沃尔什变换等)在变换域中进行描述达到改变能量分布的目的。优点:将能量在空间域的分散分布变为在变换域的相对集中分布有利于进一步采用其它的处理方式如“之”(zigzag)字形扫描、自适应量化、变长编码等从而对图像信息量进行有效压缩。变换编码的概念物理解释:图像正交变换实现数据压缩的物理本质:经过坐标旋转或变换能够把接近均匀散布在各个坐标轴上的原始图像数据变换在新的坐标系中集中在少数坐标上。可用较少的编码比特表示一幅子图像。从左图可以看出相邻像素之间的相关性非常强。从右图可以看出直流系数位于左上角。变换域要传送的数据量比空间域的大大减少。实例分析:关于正交变换码压缩的说明:将被处理的数据按照某种变换规则映射到另一个域中处理。①如果将一幅图像作为一个二维矩阵则其正交变换计算量太大通常将图像分成×或×的小块进行处理。②正交变换没有压缩数据量不改变信源的熵③正交变换前后能量不变只是重新分配。④变换前后信息量没有丢失。典型的变换编码系统中编码器有四步:  子图像分割、变换、量化和编码。先将整幅图像分成n×n(n一般为或)的子图像后分别处理:因为()小块图像的变换计算容易()距离较远的像素之间的相关性比距离较近的像素之间的相关性小。压缩并不是在变换步骤中取得而是在量化变换系数和编码时取得的。变换编码的步骤一幅n×n图像可表示成它的二维变换T(u,v)的函数。()变换选择许多图像变换都可用于变换编码,变换选择取决于可允许的重建误差和计算复杂性由f(x,y)组成的n×n矩阵若定义一个截断模板F的截断近似M(u,v)消除求和贡献最小的基础图像整幅图像的均方差为所有截除的变换系数的方差之和。因此能把最多的信息集中到最少的系数上的变换所能产生的重建误差最小。不同的变换其信息集中能力不同。傅立叶变换、余弦变换、哈达玛变换一维离散余弦变换:一维DCT变换实际上就是将信号f(x)分解成直流分量(u=)、基波分量(u=)和各次谐波分量(u>)由于二维离散余弦变换的可分离性二维DCT可以用一维DCT来实现二维离散余弦变换:利用FFT的快速算法的FDCT算法余弦变换核实际上就是傅里叶变换核的实部。而变换计算中的乘法运算就是f(x)与变换核的乘法运算。一种自然的想法就是先对f(x)执行FFT然后对其取实部就可以了。利用代数分解的FDCT算法一维离散哈达玛变换一维离散哈达玛反变换离散哈达玛变换二维离散哈达玛变换二维离散哈达玛反变换基于FFT变换的图像压缩技术基于DCT变换的图像压缩技术基于哈达玛变换的图像压缩技术FFT变换编码效果原始图像压缩比为:erms=压缩比为:erms=例erms均方根误差DCT变换编码效果原始图像压缩比为:erms=压缩比为:erms=Hadamard变换编码效果原始图像压缩比为:erms=压缩比为:erms=从erms值比较可知,DCT比FFT和HT有更强的信息集中能力离散余弦变换在图像压缩中具有广泛的应用例如在JPEG图像压缩算法中首先将输入图像划分为的方块然后对每一个方块执行二维离散余弦变换最后将变换得到的量化的DCT系数进行编码和传送形成压缩后的图像格式。在接受端将量化的DCT系数进行解码并对每个方块进行二维IDCT最后将操作完成后的块组合成一幅完整的图像。在变换编码中首先要将图像数据分割成子图像然后对子图像数据块实施某种变换如DCT变换那么子图像尺寸取多少好呢?根据实践证明子图像尺寸取×、×、×适合作图像的压缩这是因为:<>如果子图像尺寸取得太小虽然计算速度快实现简单但压缩能力有一定的限制。<>如果子图像尺寸取得太大虽然去相关效果变好因为象DFT、DCT等正弦型变换均具有渐近最佳性但也渐趋饱和。若尺寸太大由于图像本身的相关性很小反而使其压缩效果不显示而且增加了计算的复杂性。()子图像尺寸选择变换编码的步骤这里考虑对子图像经过变换后要截取的变换系数的数量和保留系数的精度。在大多数变换编码中选择保留的系数办法有以下二种:<>根据最大方差进行选择的称为区域编码。<>根据最大值的量级选择称为阈值编码。而整个对变换后的子图像的截取、量化和编码过程称为比特分配()比特分配变换编码的步骤典型的区域模板区域编码具有最大方差的变换系数携带着图像大部分信息并在编码处理的过程中应该保留下来。最大方差的系数通常被定位在图像变换的原点周围。区域取样处理可看成每个T(u,v)与相应的区域模板中的元素相乘。对区域取样过程中保留的系数必须进行量化和编码。因此区域模板有时表示成对每个系数编码的比特数。两种分配方案:给系数分配相同的比特数给系数不均匀地分配几个固定数目的比特数(a)(b)区域编码的几点说明:   因为人眼对亮度信号比对色差信号更敏感因此使用了两种量化表:亮度量化值和色差量化值。此外由于人眼对低频分量的图像比对高频分量的图像更敏感因此图中的左上角的量化步距要比右下角的量化步距小。例:典型的阈值模板和系数排序序列阈值编码(门限编码)对任何子图像,最大量级的变换系数对重构子图像的品质具有最大的影响因为不同子图像的最大系数的位置是变化的,所以通常将m(u,v)T(u,v)的元素重新排列成一个一维行程编码有种基本途径对一幅变换后的子图像进行门限处理(即生成子图像门限模板函数)<>对所有的子图像使用单一的全局门限对不同图像的压缩等级不同<>对每幅图像使用不同的门限对每幅子图像丢弃相同数目的系数,编码率恒定<>门限随子图像中每个系数的位置函数的变化而变化编码率变化,但是可以将门限处理和量化过程结合起来是取阈值和量化近似Z是变换的归一化矩阵使用下式代替m(u,v)T(u,v),将取阈值和量化结合起来(a)一条门限编码量化曲线对Z(u,v)赋予某个常数c(b)JPEG编码标准中的DCT量化步长矩阵Z使用×DCT系数的门限编码区域编码利用DCT标准化阵列的压缩:::误差第三列是直接应用标准化阵列得到的第四列图是用乘以标准化阵列得到的预测编码的基本概念预测编码(Prediction Coding)是根据某一种模型利用以前的(已收到)一个或几个样值对当前的(正在接收的)样本值进行预测将样本实际值和预测值之差进行编码。如果模型足够好图像样本时间上相关性很强一定可以获得较高的压缩比。具体来说从相邻像素之间有很强的相关性特点考虑比如当前像素的灰度或颜色信号数值上与其相邻像素总是比较接近除非处于边界状态。那么当前像素的灰度或颜色信号的数值可用前面已出现的像素的值进行预测(估计)得到一个预测值(估计值)将实际值与预测值求差对这个差值信号进行编码、传送这种编码方法称为预测编码方法。预测编码*统计编码*就是根据过去的信号样值预测下一个样值并仅把预测值与现实的样值之差(预测误差)加以量化、编码以后进行传输的方式如下图所示在接收端经过和发信端的预测完全相同的操作可以得到量化的原信号然后再通过低通滤波便可恢复与原信号近似的波形。预测编码的原理统计编码建立一个数学模型利用以往的样本数据对新样本值进行预测将预测值与实际值相减对其差值进行编码这时差值很少可以减少编码码位预测编码的分类预测编码:在均方误差最小的准则下使其误差最小的方法。   线性预测:利用线性方程计算预测值的编码方法。线性预测编码方法也称差值脉冲编码调制(Differention Pulse Code ModulationDPCM)非线性预测:利用非线性方程计算预测值的编码方法。。   帧内预测编码:根据同一帧样本进行预测的编码方法。帧间预测编码:根据不同帧样本进行预测的编码方法。   自适应预测编码(ADPCM):预测器和量化器参数按图像局部特性进行调整的编码方法。条件补充帧间预测编码:在帧间预测编码中若帧间对应像素样本值超过某一阈值就保留否则不传或不存恢复时就用上一帧对应像素样本值来代替称为条件补充帧间预测编码。   运动补偿预测编码:在活动图像预测编码中根据画面运动情况对图像加以补偿再进行帧间预测的方法称为运动补偿预测编码方法。对于具有M种取值的符号序列{xk},其第L个符号的熵满足:知道了前面的符号xk(k<L),再猜后续符号xL,则知道得越多,熵越小。意味着该信源的不确定度减小,数码率自然降低。基础理论:*发展历史年Bell实验室的BMOliver等人开始线性预测编码理论研究。同年该实验室的CCCulter取得了DPCM(DifferentialPulseCodeModulation,差分脉冲编码调制)系统的专利奠定了真正实用的预测编码系统的基础。预测编码技术:从过去的符号样本来预测下一个符号样本的值。直观理解:根据:认为在信源符号之间存在相关性。如果符号的预测值与符号的实际值比较接近它们之间的差值幅度的变化就比原始信源符号幅度值的变化小因此量化这种差值信号时就可以用比较少的位数来表示差值。DPCM的基础对预测的样本值与原始的样本值之差进行编码。DPCM系统发送端先发送一个起始值x接着就只发送预测误差值线性预测:式中表示的时序在之前为因果性预测否则为非因果性预测。*如果没有传输误码预测编码系统的误差为:这正是发送端量化器造成的量化误差。即整个预测编码系统的失真完全来自量化器。对于xk已经是数字信号去掉量化器qk=:可用于“信息保持型”(Lossless)编码如果qk≠:可用于“非信息保持型”(Lossy)编码。①算法简单、速度快、易于硬件实现。②编码压缩比不太高,DPCM一般压缩到~bits。③误码易于扩散抗干扰能力差。预测编码方法的特点分形编码分形编码分形是世纪年代出现的一门非线性学科。分形一词最早由数学家Mandelbrot提出用以描述这样的几何外形它与欧几里德外形相反处处无规则可言但在各种尺度上都有同样程度的不规则性。世纪年代中期Barnsley提出了迭代函数系统(IFS)的分形图像压缩编码方法为图像编码提供了一个全新的思路。在此之后他的学生Jacquin又提出分块的迭代变换算法理论为利用计算机自动进行分形压缩奠定了基础。从分形的角度许多视觉上感觉非常复杂的图形其信息量并不大可以用算法和程序集来表示在借助计算机可以显示其结合形态这就是可以用分形的方法进行图像压缩的原因。对于分形图像压缩它是一个逆问题即把欲编码的图像当作一组压缩仿射变换的迭代极限假如能够找到这些压缩仿射变换的参数就可以重建原始图像。为此寻找一个压缩仿射变换使它对原图像进行压缩仿射变换后的结果能与原图像的一部分吻合。如果原图像各个部分均可被对原图的不同压缩仿射变换的结果所覆盖则就找到了一个将图像映射成自身的变换。分形编码由于其计算量的繁复、庞大在实际应用中受到了限制。图像标准的制定:ISO和CCITT(国际电报电话咨询委员会)联合制定标准的类型:连续图像压缩标准:静止帧黑白、彩色压缩:()面向静止的单幅图像-JPEG连续帧黑白、彩色压缩:()面向连续的视频影像-MPEG第四节 图像压缩编码标准        JPEG标准简述JPEG压缩流程JPEG压缩算法的实现JPEG压缩举例静止图像压缩编码标准-JPEGJPEG标准简述由ISOIEC与CCITT联合发起的联合图像专家组在过去十几年图像编码研究成果的基础上于世纪年代初制定了静止图像(包括bit像素的灰度图像与bit像素的彩色图像)的编码标准。JPEG标准在较低的计算复杂度下能提供较高的压缩比与保真度。在视觉效果不受到严重损失的前提下算法可以达到到的压缩比。如果在图像质量上稍微牺牲一点的话可以达到:或更高的压缩比。JPEG定义了一个基本系统一个符合JPEG标准的编解码器至少要满足基本系统的技术指标。JPEG基本系统其核心属于变换编码。JPFG编码时对原始图像的每一个分量首先分割成互不重叠的×像素块然后对每个像素块的编码过程可分为二维DCT变换。根据图像信号的特点对图像块进行二维DCT变换可以消除像素间的相关性。自然图像的像素块经DCT变换后图像信号的能量主要集中到块的左上角即图像的低频成分中。DCT变换后得到的系数矩阵中包括左上角的一个直流(DC)系数与个交流(AC)系数从左到右.水平频率增高从上到下坚直频率增高。JPEG编码的总体框架JPEG图像压缩算法JPEG是有损压缩算法JPEG核心是离散余弦变换(DCT)连续帧图像的定义连续帧图像压缩的基本思想帧间运动补偿预测编码技术MPEG标准运动图像压缩编码标准-MPEG连续帧图像的定义由多幅尺寸相同的静止图像组成的图像序列被称为连续帧图像。与静止帧图像相比连续帧图像多了一个时间轴成为三维信号因此连续帧图像也被称为三维图像。基于如下基本假设:在各连续帧之间存在简单的相关性平移运动。一个特定画面上的像素量值:)可以根据同帧附近像素来加以预测被称为:帧内编码技术)可以根据附近帧中的像素来加以预测被称为:帧间编码技术连续帧图像压缩的基本思想通过减少帧间图像数据冗余来达到减少数据量、压缩连续帧图像体积的目的。将连续帧图像序列分为参考帧和预测帧参考帧用静止图像压缩方法进行压缩预测帧对帧差图像进行压缩。由于帧差图像的数据量大大小于参考帧的数据量从而可以达到很高的压缩比。MPEG标准是由国际标准化组织ISO与国际电工委员会IEC共同制定的标准的编号是ISOIEC标准的题目是“码流速率约为lMbs时用于数字存储媒体的活动图像及其伴音的编码”。应用范围:视频CDROM存储、视频消费主要编码技术:DCT变换前向、双向运动补偿预测Zigzag排序霍夫曼编码算术编码MPEG标准MPEG标准为了在高速网络的环境下(如ATM)提供高比特率、高质量的视频应用,ISO下属的MPEG委员会在年又发布了MPEGMPEG是一种高质量视频的编码标准,也称为广播电视的视频编码标准ISO和IEC在制定MPEG标准时,已经开始考虑MPFG和MPEGMPEG是作为一个传输标准制定的,同时也是MPEG的兼容扩展,它能广泛应用于各种速率(~Mbs)和各种分辨率同MPEG相比,在完全引用了MPEG基于DCT变换和运动补偿帧间双向预测的基本结构的基础上,作了许多扩展人们对MPEG标准在质量与应用方面提出了许多要求,希望能包括视频通信的各个领域如:()MPEG的视频图像格式达到×码率达到Mbs。()支持多点电视会议(MultipointVideoConferencing)。()支持工作站视窗显示(WindowDisplayonWorkstations)。()支持基于ATM的视频通信(VideoCommunicationsonATMNetworks)。()支持嵌入式标准电视的HDTV(HDTVwithEmbeddedStandardTV)。MPEG标准应用范围:数字电视、高质量视频、有线电视、视频编辑、视频存储主要编码技术:DCT变换前向、双向运动补偿预测Zigzag排序霍夫曼编码、算术编码MPEG标准MPEG是ISO的MPEG委员会制定的关于低于kbs传输速率的适用于可视电话的运动图像编码标准MPEG旨在建立一种能被窄带网络、宽带网络、无线网络、多媒体数据库等各种存储传输设备所广泛支持的通用音频、视频数据格式最终的MPEG标准在年底完成,第一版和第二版分别于年和年颁布。MPEG标准较之MPEG、MPEG的一个较大的改进就是提出了任意形状视频目标的编码方案。在这新的编码技术中较大的扩展了MPEG、MPEG中所采用的传统方块变换编码方案。对任意形状的目标编码包括对目标形状的轮廓编码以及对目标本身的编码。MPEG标准应用范围:互联网、交互视频、移动通信主要编码技术:DCT变换、小波变换前向、双向运动补偿预测Zigzag排序脸部动画、背影编码霍夫曼编码、算术编码本章重点常见的数据冗余数据压缩的评价指标哈夫曼编码的计算香农范诺编码行程编码算术编码变换编码预测编码Jpeg和mpeg按照信源在时间和幅度上是否连续分为连续信源和离散信源离散信源按信源发出的符号之间是否独立分为无记忆信源和有记忆信源Markov信源是有限长度记忆信源它只有前面m个符号有关***第三列是直接应用标准化阵列得到的第四列图是用乘以标准化阵列得到的**

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

评分:

/156

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利