© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第 卷 第 期
年 月
自 动 化 学 报
,
,
,
视频转码技术研究现状与最新进展
尚书林 ‘
,
杜清秀 ‘ 卢汉清 唐小军 ‘
摘 要 简要回顾了视频转码技术的研究发展状况 , 系统地归纳 了各种转码
方法
快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载
, 分析 了相关的转码算法的特点 针对最新坏
缩
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
的出现 , 文中特别介绍总结 了最新出现的转码方面的研究成果 最后 , 分析 了转码研究未来的发展和可能存在的
难点和问题
关键词 转码 , , 码率 , 误差扩散 , 同质转码
中图分类号
一 ‘ , 片 ‘ 一 以 ‘
,
,
肠 , , , ,
引言
视频技术和视频压缩标准的不断发展 以及视频
节 日在不同应用环境中的需要 , 促使了视频转码研
究的出现和不断发展 目前 , 视频转码技术己被人们
‘ 一
泛研究 具体来说 , 什么是视频转码呢 顾名思义 ,
视频转码就是从一种视频编码流到另一种编码流的
转换川 , 日的是把输入的压缩流转换成符合接收端
要求的压缩流
视 频 压 缩 的 标 准 有 很 多 种 , 如
、 一 、 、 一 、 等
等 不 同视频格式 或相同视频格式 之 间转换的
需要促使了视频转码研究的开展 , 而新标准的制定
和应用又推动 了新的转码技术的研究 首先出现的
转码需求是码率变换转码 在数字电视广播领域和
系统中的视频服务器端 , 为了使不同带宽的用
户能够收看视频点播 , 视频服务器端需要利用转码
器将高码率视频转换为低码率视频 然后 , 在低分辨
率显示和处理器性能较弱的移动设备 如 手机 、
移动 的应用中 , 需要考虑降低空间分辨率和
收稿门期 一 一 收修改稿 日期 一 一
, ,
国家高技术研究发展计划 计划 和国家科技支
撑计划 资助
妙
,
,
即 盯
中国科学院自动化研究所高技术创新巾心 北京 中国
科学院 自动化研究所模式识别国家重点实验室 北京
一 , 朋 ,
,
尽 , ,
,
一
时间分辨率的转码 近年来新制定的 编码标
准采用多项先进编码技术 , 进一步提高了压缩效率 ,
在数字电视 、 、 移动视频等领域都将得到 “ 泛
的应用 因此 , 将 一 的视频转为 格式
成为了转码研究的重要方向
最基本的转码结构是 “全解全编 ” 结构 如 卜页
图 所示 , 直接由解码器和编码器串联而成 先对
输入流进行完全解码 , 然后再按照新的码率要求进
行编码 , 当然还可 以根据实际要求进行空间分辨率
或帧率调整 然而 , “全解全编 ” 转码的计算复杂度
很高 , 适合一些离线应用场合 实用的转码结构一般
是在上述结构的基础上采取 了许多优化措施 , 譬如 ,
在解码环路中利用输入码流中如视频序列头信息
、
宏块编码模式信息 、 运动矢量信息 、 频域的压缩系
数等压缩信息 在保持视频质量 卜降不大的条件 卜,
尽可能降低转码计算复杂度
视 频 转 码 器 的 类 烈 多 种 多 样 , 按 照 结 构
主 要 分 为 两 大 类 像 素 域 转 码 一
,
, ” 不压缩域转码
, ” ‘ , 也可 以称
为变换域转码 是指对输入流进行完全解码得
到像素域图像 , 在像素域进行转码 则不需要
完全解码 , 而是在变换域中进行转码 有着
实现灵活的特点 , 可 以满足多种不同的转码需要 , 输
出图像质量较高 , 但 了转码时需要做 和
计算 , 复杂度较高 则是直接处理压缩域系数 ,
减少重新编码的计算量 , 但其实现框架不够灵活 , 转
码质量 卜降较大
本文内容安排如 卜 第 协主要介绍 了视频转
码技术的研究现状 , 包括码率转换 、 空间分 辨 率 转
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
自 动 化 学 报 卷
调调整空间分分分分分分
辨辨率或帧率率率率率率率
帧缓存存
图 全解全编转码
刃旧
码 、 时间分辨率转码 、 容错转码和语法转码的各种
技术 第 节介绍了最新的转码研究进展 , 主要是关
于新标准 的转码技术 第 节对转码做了简
单的总结
研究现状
视频转码主要有以下儿种类型 码率转换
、 空间分辨率转换
、 时间分辨率转换
、 语法转换等 另外 , 随着网
络技术和 技术的发展 , 容错视频转码 。卜
访 获得了人们的广泛关
注
码率转换
码率转换主要应用于电视广播 、 因特网视频流
传输 、 无线网络等传输领域 其口的是 有效地降低
码率 节省带宽 , 使得网络 、 无线传输或数字设备
存储应用中输出码率符合条件要求 降码率转码研
究主要集中在两方面 降低复杂度和减少误差漂移
〔‘
误差漂移问题可被理解为连续的预测帧图像的
逐渐模糊 在视频编码过程中 , 使用参考帧对一个
图像帧进行预测 , 仅所得残差被编码 只有当存储在
解码器预测器中的重建参考帧与编码器预测器的重
建参考帧一致时 , 解码器才能输出正常的编码图像
当编解码器预测器中的重建图像不相匹配时 , 由此
导致的误差积累问题被称为误差漂移 误差漂移
问题导致在一段时间内图像质量逐渐变坏 , 直到一
个帧内编码帧的出现 帧内图像是独立的 , 不依赖于
其他帧 , 不受误差漂移问题影响 , 图像质量重新变
好
作为最早的研究成果 , 文献 针对
视频压缩流之间码率转换方面提出了四种方法 第
一种是截断高频 分量 如图 , 通过丢弃部
分高频 系数 , 使各块的比特数满足要求 , 其
缺点是丢弃高频系数会造成图像细节的损失 , 易在
重建帧中产生块效应 文献【 」中有选择地丢
弃 系数 , 提高了转码质量 第二种方法选取
合适量化步长 , 对解码后频域系数进行再量化
来降低码率 文献 【 也有相关研
究 , 其转码框架大致如图 所示 第三种方法
利用提取的运动矢量和编码模式
对图像重新编码 , 避免重做运动估计和编码
模式选择 , 而且重新运动补偿防止了误差积累 第四
种方法在第三种方法的基础上重新选择最优的编码
模式
码码码码码码率控制制缓缓存存存 剪除高频系数
图 截断高频系数方法的结构图
四种方法中 , 方法一 、 二属于开环系统 , 不需要
进行 且重建图像 , 这样在很大程度上
降低 了复杂度 然而 , 由于编解码器的预测器中的
重建图像不相匹配导致了漂移误差的产生 , 在
内 , 图像误差逐渐积累 方法三 、 四属于闭环系统 ,
虽然复杂度略高 , 但由于对解码图像进行了重建 , 反
馈参考帧图像 , 重新计算了各宏块的残差 , 有效地去
除了误差扩散 , 因此其转码视频质量较高 关于转码
质量的比较 , 开环方法由于误差扩散所以质量较差 ,
“全解全编” 转码的质量最好 , 闭环方法的质量接近
“全解全编” , 但转码复杂度比较低
除上述四种方法外 , 后面又有了许多发展 如图
, 就是根据数学推导对 “全解全编 ” 转码结构的
一种简化 ’ 转码器从输入视频流中提取相应的编
码信息 , 不需重新运动估计 , 而且 、 只需
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
期 尚书林等 视频转码技术研究现状与最新进展
··
图 开环结构 对再量化数据进行漂移误差补偿的闭环结构
叩 汤
进行一次 , 大幅降低了复杂度 , 同时相对于开环形式
如图 , 取得不错的转码质量 对于转码所需
的运动信息 , 相比较上面方法三 、 四中采用的简单
的重用策略 , 文献【 , 】分析了调整量化步长导致
运动矢量非最优 , 采用运动矢量优化方法
且 比 , 提高运动估计精
度 为降低闭环形式的复杂度 , 文献【刘分析了闭环
结构中的量化误差积累补偿问题 , 提出一种闽值 自
适应算法 , 利用积累量化误差的大小决定是否误差
补偿 , 进一步降低了计算复杂度
降低码率转码还可 以在变换域着手陈
, 一
变换域转码可 以在图 的基础上省略了
和 计算 , 进一步降低计算复杂度 , 主要问题是
研究在变换域上的运动估计 , 进行漂移误差补偿 但
是需要注意的是 , 在无误差扩散降帧率转码 、 空间分
辨率转码和异质转码 不同编码标准之间转码 中 ,
变换域转码计算会十分繁琐
还 有 从 到
的转码研究 , 编码中码率
恒定而图像质量不恒定 , 中采用适当的码率分
配使得码率不恒定而 图像质量恒定 文献 」把
朋 码率控制算法 中 控制策略应用到
转码中的码率控制方面 , 给出了一个非常有效的方
法
算法和伸缩算法 , “刘、 宏块编码模式决策 、 帧内
刷新机制即
, ” 等等
降低空间分辨率的下采样算法 在降分辨率转
码中 , 需要缩小图像的空间尺寸 文献 」中提到三
种方法 像素平均方法 , 即用 像素的平均来
表示一个像素 滤波加子采样方法 , 其中采用了
一七抽头滤波器对原图像滤波 , 然后抽样陌 用
截断原输入 系数的方法来获得低分辨率的图
像 , 此方法截断原来四个 块成四个 块 ,
分别对所得四个 块进行 获得一个新的
块
上面讨论的是当转码后图像大小为原图像的整
数分之一时的情况 当转码后图像尺寸不为原图像
的整数分之一时 , 文献 提出先对原图像进行补
零插值 , 然后用低通滤波器 去除插值带来的高
频残差 , 最后再进行下采样得到所需的图像 ,
流程
快递问题件怎么处理流程河南自建厂房流程下载关于规范招聘需求审批流程制作流程表下载邮件下载流程设计
图
如图 所示 , 这里 为上采样 补零插值 倍数 ,
为
一
卜采样倍数
图 降分辨率
流程图
破产流程图 免费下载数据库流程图下载数据库流程图下载研究框架流程图下载流程图下载word
空间分辨率转码
进行空间分辨率转码的动因是由于移动多媒体
设备的显示分辨率较低 , 人们需要寻找措施把现有
的大量 一 高质量视频降低空间分辨率以便
能在这些设备上播放 同时 , 从高清电视到标清电
视的转换也是原因之一 与降低码率转码相比 , 空间
分辨率转码的 “全解全编 ” 结构中需要添加一个采
样模块 同样 , 为提高转码视频质量和压缩效率 ,
并降低转码器复杂度 , 人们进行了许多方面的研究
在降低分辨率的研究中主要有以下儿方面内容 降
低空间分辨率的下采样算法阳 , 、 运动矢量的映射
运动矢 的映射算法和伸缩算法 如图 所示 ,
空间分辨率降低后 , 低分辨率图像的一个宏块会对
应原来的多个宏块 宏块运动矢量选择也存在多
对一映射的问题 , 采用一定的方法计算选择合适的
运动矢量作为新宏块的运动矢量 最后 , 所得的
运动矢量还需要除以分辨率压缩比 , 使之与低分辨
率图像相对应 运动矢量映射算法的相关研究有很
多 ‘ , ,
, “ , ”‘一 , 如文献【 给出了三种方法 平
均值法 、 中值法和任意选取一个矢量作为当前宏块
的运动矢量 文献 利用图像活动度做加权平均
来计算运动矢量 文献 」用各个宏块在降采样宏
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
自 动 化 学 报 卷
块上对应的面积 , 对候选运动矢量做加权平均来计
算运动矢量 , 这种方法的缺点是对脉冲噪声敏感
为克服这个缺点 , 文献【 , 」提出使用加权中值滤
波方法 , 来计算预测运动矢量 文献 则提出了
一种 一 的方法 , 一 法利用原各宏块的
系数作为活动度度量 , 取最大 系数宏块的运
动矢量作为要求的运动矢量 , 此法计算复杂度低 , 所
得 值高于平均值法 文献【 讨论了在输入
图片格式为场同时存在跳帧的情况时 , 预测运动矢
量的计算方法 , 最后 , 在上述方法所得运动矢量的附
近进行 , 可得到更准确的运动矢量附
数的宏块模式为当前宏块的模式 当选择帧间编码
模式编码 帧时 , 面临着前向、 后向 、 双向三种预测
方向 , 同样采取上述原则来选择
帧内刷新机制 降低空间分辨率开环转码结构
有着复杂度低的优点 , 但其中的漂移误差现象会使
输出视频图像质量变坏 文献【 , 提出在开环结
构中采用帧内刷新机制 , 即在 帧中提供一定比例
的帧内宏块编码 , 由于误差漂移只能发生在帧间编
码模式中 , 所以增加帧内宏块可以在一定程度上阻
止误差的积累扩散
司 口
图 一个宏块对应原来的 个宏块 下采样
宏块编码模式决策 在运动估计之后 , 编码器进
行宏块编码模式选择 在转码中 , 通过利用输入流的
模式决策信息来为宏块选择新的编码模式 , 节省了
运动估计的部分计算量 降分辨率后的每个宏块对
应着原来的多个宏块 这些宏块的类型并不一定一
样 因此 , 需要根据候选宏块的类型为新的宏块选择
合适的类型 文献【刀的处理方法是
如果四个宏块中至少有一个 类型 ,
则新宏块选择为 类型
否则 , 如果一个宏块为 类型 , 则选择
类型
当所有宏块类型为 类型时 , 选择
类型
在编码器中重新估计宏块类型
文献【 」则在宏块编码模式决策过程中先后进
行了帧内一帧间决策和预测方向决策 对于帧内一帧
间决策 , 采用了 “少数服从多数 ” 的原则 , 选取占多
时间分辨率转码
时间分辨率转码 , 即降低视频序列帧率的转码
降低帧率的同时可以降低码率 , 降低对解码设备处
理能力的需求 , 适合应用于网络带宽较窄 、 用户端
设备处理能力弱 、 显示设备分辨率低等场合 在转
码过程中 , 降低帧率意味着需要提出合适的丢帧策
略 、 必要时需要进行帧类型转换 、 需要利用丢弃帧
的运动信息来重新合成运动矢量 因此 , 时间分辨
率的转码的主要研究内容包括 丢帧策略【’、 帧类
型转换 , ” 、 场帧转换 、 运动矢量合成和优化算
法 ‘
, ‘ , ‘
丢帧策略 考虑到 帧对 、 帧没有影响 , 文
献【 」提出首先考虑丢弃 帧
,
帧率太低 , 往往会
导致视频图像视觉上的不连续 , 为使转码后的视频
序列在输出码率符合带宽要求的同时图像中的运动
比较平滑 , 需要采用合适的跳帧策略 文献 根据
运动矢量的累积幅度来决定是否跳帧
帧类型的转换 文献 【 给出了 一 到
一 转码时 , 由于 一 不支持
帧 , 需把原来的 帧转码成 帧的方法 , 即把原来
存在的前向、 后向 、 双向运动矢量按照依赖关系全部
转换成前向运动矢量 图 是文献【 中
、 印 、 , 到 一 转
码时 , 丢帧及更新参考帧和运动矢量的示意图
场帧转换 转码中有时会遇到场编码方式转换
为帧编码方式的情况 , 文献 针对 一 到
转码 , 给出了 “ 场 、 帧 , , 和 “ 场 、 帧 , ,
转换时运动矢量的调整算法
一 、了飞 厂飞了一
图 降低帧率转码时的运动矢量更新实例
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
期 尚书林等 视频转码技术研究现状与最新进展
运动矢量合成算法
, 视频各帧之间由于运动矢量带来
的依赖关系 , 在丢帧之后产生中断 利用被丢掉参
考帧中的运动信息 , 采用运动矢量合成算法 , 把运
动矢量进行累加 以产生指 向新的参考帧的运动矢
量 ’, 】 具体算法有双线性插值方法 ’ , 前向主
矢量选择法 ,
‘ 如 图 , 伸缩矢量合成法
, , 宏块活动度主运动
矢量选择法 ,
等
措施 具体措施有 加快空间域上的再同步 , 减少每
个 所包含的宏块个数以增加空间域容错 增
加每帧帧内宏块的比例 以减少运动估计导致的错
误扩散 帧内宏块 自适应刷新
机制 发送反馈控制信号
,
川 等技术
材材嗜冲冲
一
,
、、、二 气气气
犷犷犷勺勺勺
勺下获获叮叮一‘‘ ’材叮
片片片 叮叮
叮叮叮 叮叮
日
图 前向主矢量选择法
即
当前宏块在被丢掉参考帧中最多与四个彼此相
邻的宏块相重叠 双线性插值法对这四个宏块的运
动矢量进行线性插值 , 求得重叠区域在前面未被丢
弃的参考帧中对应的运动矢量 , 通过叠加求得当前
宏块指向新参考帧的运动矢量 方法则在这
四个宏块中 , 选取重叠面积最大的宏块为主宏块 ,
取主宏块的运动矢量为所需的中间运动矢量 如
图 , 选择面积最大的宏块 片一‘ 为主宏块 , 取宏块
片一‘ 的运动矢量 玲一‘ 为中间运动矢量 ,
,
与 十分相似 , 但复杂度较小 , 仅仅是把
当前宏块在被丢掉帧对应宏块的运动矢量逐个累加
在一起 , 其效果只 比 稍微差一点 , 甚至相同
则是对 的一种改进 , 利用宏块活动度
来选择主宏块和运动矢量 在 之后 , 利用得到
的运动矢量作为参考运动矢量 , 进行 , 达到近
似最优匹配 , 从而提高运动估计的精度陌
容错转码
相对于有线信道 , 无线信道有着信道窄 、 误码
率高的特点 因此 , 在无线信道上传输视频 , 需要加
一些容错措施 相对于简单使用在信道编码中的前
向纠错
, ” 和 自动重
发请求 明 等容错措施 ,
文献 睁 , 则是从信源编码方面采取相应的容错
视频转码研究的最新发展
近 两年 , 国际 视频标准 协会 一 制定 了
标准 , 编码效率比 一 高出许多 , 在相同
画面质量下 , 码率只有 一 的 、
的制定带领着新一轮视频转码技术研究的发展 , 卜
面首先介绍 的特点 , 然后详细分析了
变换域转码技术 , 最后分析总结了 模式选抒
的快速算法
的特点
采 用 了 许 多 新 技 术 提 高 编 码 效 率
一 最多支持 个参考帧 在 帧时 ,
可以支持多达 个参考帧 一 中只支持
系数的 预测 , 而 中支持多种帧内宏块
预测模式 , 如 支持九种预测模式 ,
支持四种预测模式 一 只支持
、 场模式 块运动补偿模式 , 而
支持七种块运动补偿模式 、 、 、
、 、 和 一 只支持 像
素运动估计 , 而 支持 像素运动估计 正是
因为 采用多参考帧 、 多编码模式以及 像
素运动估计 , 提高了运动估计的准确度 , 所以才有很
高的编码效率 但是多种预测模式大幅度增加了模
式选择的计算量 , 因此 , 在转码过程中 , 需要研究模
式选择的快速算法 , 以提高计算速度 另外 , 相比较
一 、 采用的 变换 , 采
用的是 整数变换 在增强的高清部分 , 采用
整数变换 还支持容错编码 , 而 一 不
支持
上面提到的是应用最普遍 、 技术非常具有典型
性的 一 到 之间的转码 实际上其他
标准与 相 比也有着相似的技术差距 因此 ,
在传统标准到 的转码需要有效地研究利用转
码前后两标准的相似之处来降低转码的复杂度 , 研
究各种视频转码架构和技术以在加快转码速度的同
时平衡所得的视频质量
大体说来 , 需要进行如文献 , 」所述儿部分
内容的研究 变换域编码 帧内图像预测 转码中的
多模式选择问题和运动估计等
下面介绍一些已有的技术研究成果
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
卷
曰 。 ,
一 输入
图
输出
到 转码的开环结构
一 一
变换域转码
直接变换域转码可 以省略 和 计算 ,
有利于降低计算复杂度 , 因此有必要对其进行研究
一 变换 变换域转码首先要解决
变换与 的 整数变换 之间的
转换 在文献 , 中都提出了 一 变换算
法 , 基本思路是将 和 这两个变换结合成
为一个矩阵算子 , 并使用快速算法降低计算量
变换域帧内转码 文献 给出了一种完整变
换域帧内转码算法 该算法可以与快速帧内模式选
择算法结合进一步减小计算量 其关键技术有两点
在变换域计算预测残差 在变换域计算帧内转
码失真函数例 计算残差过程中先计算帧内预测信
号的 变换 , 然后用源图像的 系数减去预测
信号的 系数 , 以得到预测残差的 系数 , 由于
预测信号的 变换计算量很小 ’ , 该算法可以节
约计算量
变换域帧间转码 文献 」对变换域帧间转码
做了详细的分析研究 , 如图 所示用算子将 系
数转换为 系数即可形成开环转码结构 , 然而开
环结构中存在两个主要的漂移误差 亚像素插值滤
波器引起的误差和量化不同产生的误差
采用的是 拍插值滤波器 , 而 采用的是 拍
插值滤波器 , 这样会导致运动估计出现可扩散偏差
一 与 量化不同也会产生扩散偏差 该
文献中推导了变换域偏差补偿的公式 , 使编码质量
儿乎达到了像素域的效果 , 并降低了计算复杂度
需要注意的是在变换域进行模式和 的计
算量反而 比像素域算法的计算量大 , 因此文献
只能直接采用原编码的模式和运动矢量 , 没有选择
最优模式和运动矢量 , 达不到 应有的压缩效
率 , 所以 的变换域转码只适用于简单的实时
转码
快速模式选择算法
提供了大量的帧内和帧间模式可供选择 ,
可以用率失真优化畔 的算法来选择最优的模式 如
的 参考软件中的模式选择算法 , 但是遍
历式的率失真函数计算需要大量的计算量 , 速度不
能满足实际应用的要求 , 因此有必要研究像素域转
码中的快速模式选择算法以提高转码速度
利用 一 的模式和运 动矢 信息 在
等介质上的许多 一 视频流是采用模
式决策 , 方法来决定帧的类型 ,
因此 , 在做 一 到 转码时可以重新利用
这些帧类型信息 , 根据 一 编码的宏块帧内帧
间类型来确定 转码中采用帧内还是帧间方式 ,
从而节省帧内 帧间判别的计算量 在文献 阵 中利
用 一 中的模式信息进行宏块帧内帧间的判
定 , 利用 一 中的运动矢量作为帧间宏块的运
动矢量 , 使转码速度提高了很多 , 而且
一
卜降
不大 当然帧内或帧间的模式选择还需要其他方法
来确定 , 而且 一 的运动矢量也需要优化才能
达到最优运动矢量
利用 一 宏块的 系数选择
帧内编码模式 一 采用的帧内编码模式是简
单的频域 , 而不同于 的空间域帧内编
码模式 因此在做 一 到 帧内转码时很
难直接利用原编码信息进行帧内模式选择 文献
则利用 一 帧内宏块的 系数选择
帧内编码模式 , 取得较好效果 其基本思想是 如果
宏块内的 个块的 系数差异较小 , 则说明该
宏块比较平滑 、 细节较少 , 可以采用
模式 反之说明宏块不平滑 、 细节较多 , 应当采用
模式 另外该文献中使用 绝对
误差和 来确定 的 种模式选择 , 取
得比较好的效果 然而文中进一步利用 系数确
定 的 种模式选择时 , 效果并不理想 ,
的模式选择采用其他方法来确定会更
好
使用提前终止机制 提前终止机制的思路是将
各种模式出现概率从大到小排列 , 逐个模式进行选
择判断 , 当某个模式的编码代价 已经足够小时 , 提
前终止模式选择 , 不再考虑其他模式 文献 ,
中采用此机制降低模式选择的计算量 其中文献
阵 是利用 模式的编码代价作为依据进
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
期 尚书林等 视频转码技术研究现状与最新进展
行模式选择 , 如果 模式的编码代价小 , 则
说明该宏块适合用大块的帧间模式 , 否则需要考虑
小块的帧间模式或者帧内模式 , 其实验显示该算法
在 值降低不多的前提下 , 大幅提高了转码速
度 文献 阵 则是假设编码代价随宏块的大小而单
调变化 , 先尝试大块宏块模式 , 如果较小宏块模式对
应的编码代价大于较大模式的编码代价 , 则选择较
大宏块对应的编码模式 , 提前终止模式选择 另外 ,
相关实验表明 帧 模式 或者 帧
模式 和 模式占了所有使用模式的很大部分 ,
如果能够提前判断此模式 , 则其他模式就不用考虑
了 , 从而提高了转码速度
减少模式类别 排除一些不常用的编码模式 , 可
以降低模式选择的复杂性 文献 」提出了 在色
度帧内预测时 , 只考虑 模式 在
预测中去掉 模式 此方法以损失很小视频质
量的代价换得转码速度的提高
矢量 编码中的快速估计算法 在文献【 中
得到了新的应用 , 并将输入视频流的运动矢量作为
的预测运动矢量之一
转码快速运动估计技术
有多种帧间模式可供选择 , 需要计算各
种模式的运动矢量 , 用全搜索方法选择运动矢量计
算量显然是非常大的 在 转码中 , 需要对其
中的快速运动估计算法进行研究 一般转码快速估
计算法包括三个步骤 首先 , 挑选一些已知的预测运
动矢量 丽 , 丽下 , ⋯ , 丽下几 , 在其中选择
一最优矢量作为搜索中心的运动矢量 然后 , 在得到
的搜索中心周围小邻域内做 , 以提高运动补偿
的效果 并使用提前终止准则来加快估计速度 , 当预
测精度达到某个阑值时就停止运动矢量搜索
预测运动矢量是对最优运动矢量的初始估计 ,
在转码中可供选择的 有以下三类 输入视
频流中的运动矢量 , 该运动矢量是编码原视频流时
得到的最佳运动矢量 , 因此该矢量与最优运动矢量
的相关性最大 空间邻域块 包括左 、 上 、 右上 、
左上邻域块 的运动矢量 , 由于运动矢量的空间相关
性 , 所 以相邻块的运动矢量一般比较接近 已计
算的其他模式的运动矢量 , 对于同一个宏块 , 不同编
码模式对应的运动矢量一般比较接近 文献【 」在
做 一 到 转码时 , 直接将在这三类运动
矢量中选择的最优矢量作为 的最优运动矢量 ,
在不做 考虑到 一 的运动矢量已经比
较精确 的情况下就能取得比较好的效果 文献
在做 一 到 转码时 , 先在 一 运
动矢量和空间邻域运动矢量中选择最优矢量作为搜
索中心 , 并在搜索中心的小邻域内做 , 将得到
的运动矢量作为 的 模式运动矢量 , 这
样首先得到了大尺寸块模式的运动矢量 , 可 以作为
小尺寸块模式的 , 用 以确定小块模式的运动
结束语
最新的视频编码标准 的颁布 , 影响 了
新一轮的视频转码研究 , 已有的 一 素材到
的转码研究和 不同应用之间的转码研
究正在如火如茶地进行 同时 , 和 一
的出现为转码研究添加了新的内容 虽然 , 在过
去的时间里 , 针对不同的标准 、 不同的应用场合 , 出
现了许多实用的转码技术 但同时 , 从上述文献分析
中可以看出 , 视频转码方面的研究并不是 已经臻于
至善了 在已有的多种转码结构中 , 每一种结构都有
自己的局限性 例如 , 变换域上做运动矢量估计和模
式选择 , 计算量会非常大 , 所以在降低空间分辨率转
码 、 时间分辨率转码和 转码中 , 变换域的处理
很受限制 许多研究工作的开展或者是基于前者或
者是基于后者进行的 当然 , 并没有简单的 “哪种方
法更好 ” 的结论 , 不同的应用场合 , 会有不同的合适
选择
视频转码方面的研究仍然有许多工作需要完成 ,
譬如 , 视频传输中容错转码方面 、 转码的降分
辨率 、 降帧率等方面的研究 , 需要人们来细化 、 深入 ,
就像文献【 中提到的那样 “展望视频转码的未来 ,
仍有许多方面的问题需要进一步的研究 其中问题
之一是怎样找到一种最优的转码策略”
, ,
乃
, 叮 匀彭坦 , , 、
于 毛
, , 一 ,
叨 ,
,
一
, 一 助
·
,
一 介 ,
, 尽 ,
, 一
,
, ,
工日 乃 七
凸 云 二 祷 于兜力 ,
,
, , 一
人化朋 〔 ‘ 了 吞
忆唱少 , , 、
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
自 动 化 学 报 卷
陈功 , 黄祥林 , 沈兰荪 视频转码技术 测控技术 , ,
、
朋 , 叫
旧 料 一 一
工 刀旧 亡万 忿 忿
功 了 打 ‘犯 , , 、
, , 而吐沁
一
创火 人 ,
, ,
氏泪 召, 亡 , 、
, 朗
阳
夕 创犯
·
面 ,
侣 」 , , 启
妙 仪对 夕
曲
,
, 一 一
认
,
姻 , 、
, ,
旧 雌 于 旧 忿溯亡 , ,
, ,
招 升 朋配幻
主 , , 、
, , , , 比
以沮 朗
, , 、
叭 , 雌
升 灯。 困 如 吕
刀配亡 。 , , “
,
佣 一 石日 目 。
」 万 七牙 , ,
, , 加 , £
石 升 亡 闭 伪
止 , , 、
, ,
姗 抽
犯 乙日卜
, , 、
, , 旧
川 犯
五
, 、
节几 , , 】 哪一 目 吧卜
, , 、
, , , 升
活 以泪 罗
佣 邓 吓
日 目 , 、
, ‘ 旧 山坦以对
、犷 月 已
招 升 二 宜 , 砚洲 〕,
、
, , , 印
乎
朋
, 、
, 佣 升
不日 升 旧 万。刀‘ 朋 打 ,
, 、
, , , 一
了 升 刀旧 索 行 山切 昆阳
‘ 仍 吸烈 ‘飞。护 , ,
, 、龟 , , 路
时 朋 石日 升 索。刀月 。
已 如 亡 功 于戈七 哪口 , ,
、
, , , 旧
旧 吧
佣 位
, 、
节 , 佣 , 习 协
旧 朋
以效
明 , , 、
, , 朗 一
班犯 旧 不日 升
幻。。吕 口 山 亡 价 于兜为 臾妙 ,
。 、
, , 佣
住曰刃
招 了, ‘ , , 侧
、
, , 邪 鳍
夕 人
泊 , ,
、
, ,
目 幽
·
招
仍洲朋配幻 山 忿 日 份 叨 么
处妙 , , 、
, 几
】姐
以滋 罗 目 几比
助场 , ,
七 , , ,
升 衍。刀 , 切 卜
氏出 哪口 , ,
取丫朗 佣 , 取 , ,
卜 刀旧
石日 叨 目 吕 幻。刀旧 , 以 ,
、
, , 目甘 , 毗地 ,
刀旧扫 £灯。刀 。
切 只 功 , 为 哪口 , ,
阳
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
期 尚书林等 视频转码技术研究现状与最新进展
, 叮 ,
云
云厂 刀 , , 、
, 七 , ,
, ℃ 印 洲 任沼
升 亡万 幻 , , 、
, , , 一
己
正厄 朴 幻。刀吕 叨 凸 山
功 玩 。护 , , 、
一
刀
, , 、
即 牛 一
夕
日 ,
、
, , , 一
·
对 朗 】
, 、
, ,
,
价
,
, , , 丫妞 , 叭厄 升 。
面 一
工召 乍 七主 山
功 刃比 盯尹, , 、
吧 , 士 , , 佣 ,
几
召召召 乃 刀胡 灯。朋 叨 口比山 仙 民娜
叭 印 , ,
, , , 毗
姗
一 ·
以泪
, , 、
叭陇 , 叭厄 , ,
一
山。 川 , , 、
, , , 叮 万铀
运
·
朋 铭 以刃 企
、 ,
, 、
, , 时
旧
邵 印 ,
, 、
飞七 一
, 一
信息技术先进 音频编码第二部分 视频 ,
一 哪
幼 ,
尚书林 中国科学院自动化研究所博
研究生 年获得北京师范大学信息
学院电子系学 上学位 , 主要研究方 向为
图像与视频压缩技术 本文通信作者
卜 回
·
,
, 盯
杜清秀 中国科学院自动化研究所副研
究员 主要研究方向是人机交互 、 虚拟现
实 、 多媒体技术
·
回
·
鱿
矛
一 ,
,
, , 仔
卢汉清 中国科学院自动化研究所研究
员 主要研究方向是图像视频分析 、 多媒
体系统 回 场
,
, 吐 ,
旧 邝 ,
·
唐小军 中国科学院自动化研究所硕
研究生 年获得北方工业大学 自动
化系学士学位 , 主要研究方 向是图像和
视频压缩技术
七 四
,
, 盯 盯