音频编解码器 AAC的学习
AAC编解码器资料 下载网址:
AAC(Advanced Audio Coding),中文称为“高级音频编码”,出现于1997年,基于 MPEG-2的音频编码技术。由Fraunhofer IIS、杜比实验室、AT&T、Sony(新力)等公司共同开发,目的是取代MP3格式。2000年,MPEG-4标准出现后,AAC 重新集成了其特性,加入了SBR技术和PS技术,为了区别于传统的 MPEG-2 AAC 又称为 MPEG-4 AAC。
【扩展名】
AAC编码的主要扩展名有三种:
(1).AAC - 使用MPEG-2 Audio Transport Stream( ADTS,参见MPEG-2 )容器,区别于使用MPEG-4容器的MP4/M4A格式,属于传统的AAC编码(FAAC默认的封装,但FAAC亦可输出 MPEG-4 封装的AAC)
(2).MP4 - 使用了MPEG-4 Part 14(第14部分)的简化版即3GPP Media Release 6 Basic (3gp6,参见3GP ) 进行封装的AAC编码(Nero AAC 编码器仅能输出MPEG-4封装的AAC);
(3).M4A - 为了区别纯音频MP4文件和包含视频的MP4文件而由苹果(Apple)公司使用的扩展名,Apple iTunes 对纯音频MP4文件采用了".M4A"命名。M4A的本质和音频MP4相同,故音频MP4文件亦可直接更改扩展名为M4A。
【 概览 】
作为一种高压缩比的音频压缩算法,AAC压缩比通常为18:1,也有数据说为20:1,远胜mp3;在音质方面,由于采用多声道,和使用低复杂性的描述方式,使其比几乎所有的传统编码方式在同规格的情况下更胜一筹。不过直到2006年,使用这一格式存储音乐的并不多,可以播放该格式的mp3播放器更是少之又少,目前所知仅有苹果iPod、Sony Walkman(NWZ-A、NWZ-S、NWZ-E、NWZ-X系列)、任天堂NDSi和魅族 M8(微软最新推出的Windows 7附带的Windows media player12也支持aac)。此外计算机上很多音乐播放软件都支持AAC(前提是安装过AAC解码器),如苹果iTunes。但在移动电话领域,AAC的支持度已很普遍,Nokia、Sony Ericsson、Motorola 等品牌均在其中高端产品中支持 AAC(一开始主要是LC-AAC,随着移动电话性能的发展,HE-AAC的支持也已广泛)。
【特点】
AAC可以支持多达48个音轨,15个低频(LFE)音轨,5.1多声道支持,更高的采样率(最高可达96kHz,音频CD为44.1kHz)和更高的采样精度(支持8bit、16bit、24bit、32bit,音频CD为16bit)以及有多种语言的兼容能力,更高的解码效率,一般来说,AAC可以在对比MP3文件缩小30%的前提下提供更好的音质。
【 版本与扩充 】
(1) MPEG-2 AAC Main
(2) MPEG-2 AAC LC (Low Complexity) 传统的 LC-AAC 即low complexity版本的 AAC。
(3)MPEG-2 AAC SSR (Scalable Sampling Rate)
MPEG-2的两种是是已经过时的了,多用的是MPEG-4的main、LC和he三种模式。
(4)MPEG-4 AAC Main
(5)MPEG-4 AAC LC (Low Complexity) ,为低复杂度版本,适合中等码流 96kbps ~~192kbps,在此码流下,LC-AAC 可以完全打败同码率的用LAME最高质量慢速编码模式的MP3。
(6) MPEG-4 AAC SSR (Scalable Sample Rate)
(7)MPEG-4 AAC LTP (Long Term Predicition)
(8)MPEG-4 AAC LD (Low Delay)
(9)MPEG-4 AAC HE (High Efficiency) ,高效AAC,HE-AAC或AAC-HE,"AAC+") - 结合了谱带复制 (Spectral Band Replication,SBR) 及AAC技术,适用于低比特率(64kbps以下),简写又称为 "aacPlus v1"。
HE主要是为了低码率,在小于36kbps的情况下,能达到比其他编码器都要优秀的音质。HE有两个版本,一个是V1,也就是aac+,包含LC+SBR。
HE V1版(aacPlus V1):即 豪华版AAC
HE V2版(aacPlus V2):即 增强的 豪华版 AAC
(10) HE-AAC v2,又称 "aacPlus v2",enhanced aac plus, – 采用HE-AAC 中的SBR技术,结合参数化立体声 (Parametric Stereo,PS) 包含LC+SBR+PS。
3gpp组织的Enhanced aac plus,包含有定点和浮点,需要优化。
4、代码优化
主要从 基本运算,函数内联,mmx/sse等方面实现优化,算法方面改动很少。经过查找,在万方维普等数据库找到了几篇相关的硕士论文,西电有几个导师在带领学生搞这套代码的优化,看了他们在优化方面做的已有的工作。遗憾的是,并没有用上。
5、问题及解决
Faac/faad的源代码中间可能存在很多问题,如播放声音,女声有尖锐的现象,最后用了lp滤波(low pass??)来实现,截断高频,此控件可供选择使用。
AAC V1 + (PS) ----> AAC V2
aacPlus V1 豪华版 AAC: AAC 技术+ SBR(谱带复制技术)
aacPlus V2 也叫增强的豪华版AAC: AAC技术 + SBR(谱带复制技术) + PS(参数化立体声)
【AAC编码库---- faac编码库调用接口实习 】:
1、AAC Encode
iso/MPEG 2 AAC 或者 mpeg4 AAC的编码库提供一个高层面的 接口来编码 mpeg2 a和 mpeg4的 iso aac文件,对于c/c++程序,通过使用 faac.h 中的函数接口来完成
对于 AAC的编码,其
工程
路基工程安全技术交底工程项目施工成本控制工程量增项单年度零星工程技术标正投影法基本原理
下的 include 包含头文件有 faac.h 及 faaccfg.h两个头文件。
AAC编码库的调用顺序:对于编码AAC码流,以下调用顺序是必须的。
(1) 每需要一个 AAC encoder编码器实例,则调用 faacEncOpen() 创建AAC encoder 编码器。
(2) 设置 AAC encoder 编码器的相关选项:先调用调用faacEncGetCurrentConfiguration()获取 AAC编码器的相关选项,调用 faacEncSetConfiguration() 来设置 AAC Encoder编码的相关选项。
(3) 不断调用 faacEncEncode() 函数对 音频数据进行编码,直到音频数据编码完,faacEncEncode()函数会返回存储于用户所分配的缓冲区的AAC编码数据码流。
(4) 用 0样本输入来初始化 faacEncEncode()过程,然后只需调用 faacEncEncode(),直到所有的音频数据样本都被编码完。
(5) 如果 faacEncEncode() 已经编码完,并返回 0字节的输出数据,则可以释放 AAC encoder编码器实例。
AAC编码库 libfaac的相关函数接口:
相关函数:
1、 初始化AAC编码器及释放 AAC编码器相关的函数。
(i) faacEncOpen 函数接口:创建,并初始化一个AAC编码器
faacEncHandle FAACAPI faacEncOpen
(
unsigned long sampleRate, /*采样率*/
unsigned int numChannels/*通道个数*/,
unsigned long *inputSamples//由AAC编码器内部返回来的值,返回每次调用 AAC编码器时,要送给编码器编码的样本个数,也即一次需送多少个样本给 AAC编码器
unsigned long *maxOutputBytes /*最多输出多少字节*/
);
(ii) faacEncClose() 接口,释放AAC编解码器
void FAACAPI faacEncClose
(
faacEncHandle hEncoder
);
(ii) faacEncGetCurrentConfiguration(),AAC 编码器相关参数选项的获取
faacEncConfigurationPtr FAACAPI faacEncGetCurrentConfiguration
(
faacEncHandle hEncoder
);
(iv) faacEncSetConfiguration() 设置 AAC encoder 编码器的参数相关信息。
int FAACAPI faacEncSetConfiguration(faacEncHandle hEncoder,
faacEncConfigurationPtr config)
(v)AAC编码器核心函数 : faacEncEncode()
/*
如返回 <0 ,则
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
明 AAC编码失败
如返回 0,并不代表失败。
如返回 >0,则返回的是 outputbuffer中的编码样本字节数
*/
int FAACAPI faacEncEncode
(
faacEncHandle hEncoder, // AAC编码器的指针
short *inputBuffer, //输入语音样本数组
unsigned int samplesInput, //输入语音样本个数,这个样本数应该同 faacEncOpen()函数在创建 AAC 编码器时所返回来的 inputSamples值一样。
unsigned char *outputBuffer, /*存储AAC编码之后的数据流,该缓冲区的大小至少必须为 由faacEncOpen()调用后所得到的 maxOutputBytes 值大小。*/
unsigned int bufferSize
);
AAC编码器配置选项的数据结构:
typedef struct faacEncConfiguration
{
unsigned int MPEGVersion; //mpeg的版本: mpeg2,mpeg4
unsigned int aacObjecttype;//aac对像类型, Main,Low,或 LTP