首页 IP网络电话关键技术浅析

IP网络电话关键技术浅析

举报
开通vip

IP网络电话关键技术浅析 IP网络电话关键技术浅析 交换接入北京分部 邱金胜 随着Internet的普及基于TCP/IP网络技术的不断发展 IP的应用越来越 丰富 IP网络电话的成功开发和应用预示了以IP为基础的新一代信息网络的 出现 IP网络电话技术主要涉及语音处理 通信协议 网络安全管理技术 现对其进行逐一浅要的分析 有助于对IP电话技术的认识和了解 一 语音处理技术 IP网络电话涉及的语音处理技术主要是两个方面 一是在保证一定语音 质量的前提下尽可能降低语音编解码比特率 二是在IP...

IP网络电话关键技术浅析
IP网络电话关键技术浅析 交换接入北京分部 邱金胜 随着Internet的普及基于TCP/IP网络技术的不断发展 IP的应用越来越 丰富 IP网络电话的成功开发和应用预示了以IP为基础的新一代信息网络的 出现 IP网络电话技术主要涉及语音处理 通信协议 网络安全管理技术 现对其进行逐一浅要的分析 有助于对IP电话技术的认识和了解 一 语音处理技术 IP网络电话涉及的语音处理技术主要是两个方面 一是在保证一定语音 质量的前提下尽可能降低语音编解码比特率 二是在IP网络环境下保证一定 的语音通话质量 前者主要是语音编解码技术 包括静音检测 后者主要是 分组丢失补偿和回波抵消技术 在语音通话过程中 时延过大会使声音有不 连续的感觉 而时延抖动感觉不是很明显 1 语音编解码 目前在PSTN中普遍应用的是PCM语音编码 其比特率为64Kbit/s 语 音采样频率是8KHz 它属于波形编码类型 其编码的最低比特率一般为 32Kbit/s 即ADPCM 若要进一步降低其比特率 特别是低于16Kbit/s的低比 特率编码方案 必须采用新的编码原理 这就是参数编码 又称声码器技术 Vocoder 技术 它通过模拟人的发声器官 提取模型参数来降低话音信息 编码率 IP网络电话推荐使用 ITU-T定义的低比特率编码 其比特率为 5.3~16Kbit/s 均为中低复杂度编码算法 语音分组长度在30ms以下 语音质 量良好 目前 IP电话中常用的语音编码速率如下 48~64kbpsG.722 64kbpsG.711 编码速率语音编码算法 [IP网络电话关键技术浅析] 华为技术 8或13kbpsG.729或G.729A 5.3或6.3kbpsG.723或G.723.1 16 kbpsG.728 1 G.729系列原理 G.729系列协议是ITU-T制定的8kbps 语音压缩编码协议 它的全称是 共 轭 结 构 算 术 码 激 励 线 性 预 测 CS-ACELP Conjugate-Structure Algebraic-Code-Excited Linear-Prediction G.729A是G.729协议简化版本 两者仅仅是算法稍有不同 而传输速率 各比特的定义都相同 而且互相兼 容 语音质量方面 G.729A仅在特殊情况下 音质不如G.729 G.729B增加 了VAD Voice Activity Detection 静音检测 DTX Discontinuous Transmission 和 CNG Comfort Noise Generation 舒适噪音 功能 G.729B一 般 和 G.729或 G.729A一起使用 所以有 G.729B+G.729A和 G.729B+G.729的版本 这一语音算法是基于ABS Analysis By Synthesis 原 理 即基于合成的分析 建立在CELP模型基础上 语音生成模型可概括地 表示如下图所示 浊音(自适应码本) 清音(固定码本) 声道调制 线性滤波器 语音 图3-13 语音生成模型 G.729或G.729A对语音信号的采样速率为8kHz 它对语音信号进行分 帧处理 每帧语音包含80个样点 即帧长为10ms 对于每一个十毫秒的帧 编码器对输入语音信号分析得到CELP模型的参数 线性预测滤波器系数 自 适应码本和固定码本的码字 这些参数被编码后传输 在解码端 这些参 数被用来产生激励信号及合成滤波器 语音由激励信号通过短期合成滤波器 重建 2 G.723系列原理 G.723.1编码方案有两种速率 即5.3和6.3 kbps 高比特率具有很好 的音质 低比特率在具有相当的音质同时提供给了系统一定的灵活性 两种 [IP网络电话关键技术浅析] 华为技术 速率对编码器和解码器都是必须的 有可能以30ms为最小间隔变化速率 如 果加上静音检测 VAD 可以获得更低的比特率 G.723.1编码方案在此速 率下可以最优地表现话音的效果 压缩音乐和其它声音时 音质没有话音好 编码采用的原理是基于合成分析的线性预测 并尽量减小感觉加权后 的误差 编码以240个采样点为一帧 相当于8K采样率的30ms的时间跨度 每帧首先经过一高通滤波器 去除直流成份 然后分为4个子帧 每子帧60个 采样点 对每个子帧 算10阶线性预测编码 LPC 滤波器系数 LPC滤波 器系数利用了PSVQ Predictive Split Vector Quantizer 进行量化 未量化的 LPC系数同时还用来构造短时感觉加权滤波器 此滤波器对整个帧进行滤波 量化得到感觉加权后的语音信号 对每两个子帧 120个样点 用感觉加权 后的信号计算开环基音周期 基音周期在18至142个样点的范围内进行搜索 利用之前估值的基音周期来构造谐振噪音整形滤波器 LPC合成滤波器 共 振峰感觉滤波器 谐振噪音整形滤波器三者一起建立脉冲响应 利用基音周 期估值 LOL和脉冲响应来计算闭环预测器 基音周期预测器为五阶 基音 周期是开环基音估值加上一个小的差值 随后 由初始目标向量中减去基音 滤波器的贡献 基音周期和残差都传到解码器 最后近似计算激励的非周期 成份 对高比特速率应用多脉冲最大似然法量化激励 MP-MLQ Multi-Pulse Maximum Likelihood Quantization 对低比特速率应用算术码 本激励 ACELP 2 静音检测 静音检测又称语音活动性检测 VAD Voice Activity Detection 它 是一种静音压缩技术 在电话通信中 每一方说话的时间和听对方说话的时间大体各占一半 即使在说话时还有停顿时隙 因此任一方对线路的占用率大约只有40% 在 电路交换中 即使通话者不说话 也要占用64Kbit/s的信道 在分组交换中 由于传输通道是统计复用的 因此在通话者不讲话时可以不发送话音分组 从而进一步降低话音比特率 这一技术的关键就是如何检测说话者处于不发 声状态 即VAD 检测的基本原理是判断话音信号能量 当低于一定门限值 就认为静默状态 静音检测有两个技术难点 一是如何在噪声较大的环境中检测静音 二 是 剪音 问题 所谓剪音是指话音还原时有一部分被剪切掉了 使人感到 [IP网络电话关键技术浅析] 华为技术 失真 解决这一问题的方法是在一组突发话音分组前增加一个话音分组进行 平滑 话音突发后沿剪音也可用同种方法解决 在实际使用中还有一个问题 如果静音期不发任何分组 即完全无声 收听者反而会感到不自然 因此实用的静音压缩算法有两部分组成 1 语音活动性检测器 VAD 制定输入信号是话音还是背景噪音 如果信号被确认为话音 就以编码算法规定的固定比特率对其编码 若是噪 音 就以非常低的比特率对其编码 或者根本就不发送任何比特 2 舒适噪音生成器 CNG 接收方采用某种机制重构背景噪音的主要 特征 噪声生成方法的设计必须保证解码器和编码器之间的同步 3 分组丢失补偿 在IP网络中分组丢失是不可避免的 丢失的原因可能是线路误码或网络 路由故障 更常见的原因则是传输时延过长或网络拥塞导致分组被丢弃 由 于低比特率声码器都是基于线性预测编码原理 当其值是通过以前历史值线 性组合而得 因此通过内插的方法不难得到丢失分组的近似估计值 ITU-T定义的标准编码的解码器部分都已包含分组丢失补偿这一功能 4 回波抵消 对于纯IP电话系统来说 由于语音信号的接收和发送经由不同的物理 线路 也就是所谓的四线制 因此不存在回音的问题 若IP网和PSTN互连 通信双方至少一方是二线制电话 涉及有混合线圈的2/4线转换电路 就会产 生回音 理论讲 混合线圈对端间的衰耗应为无穷大 这样IP电话发出的语 音信号只能送到PSTN电话 不会串到对端 由于实际很难做到完全平衡 这 样一部分将漏到对端返回IP电话 如果传输时延过大 发话者就会感到明显 的回音 严重干扰通话 按照电话网的严格规定 单向时延大于25 ms就需考 虑回波问题 实际上单向时延达到100~150ms人耳感觉尚可容忍 目前回波控制均采用回波抵消方法 即通过自适应方法估计回波信号 的大小 然后在接收信号中减去此估计值 此方法已专门芯片推出 在IP网 络和PSTN互通情况下 回波抵消功能一般由网关完成 [IP网络电话关键技术浅析] 华为技术 二 IP语音通信协议 IP语音通信协议应包含以下几个方面 1 语音通信控制协议 语音通信控制协议就是电信网中的呼叫控制信令 它包含地址信息 用户状态信息 音信号 DTMF信号等 这些信息是以控制分组的形式发送 的 由于信令的重要性 采用可靠的传送方式 如果发生差错可通过重发机 制校正 因此此类协议采用TCP协议 2 语音信息传送协议 语音信息协议规定了语音分组应如何封装 复用和传送 包括具有语 音检测功能的各种语音编码分组如何封装和标识 由于话音分组需要实时传 送 不允许有大的时延 因此无法采用重发校错机制 即语音分组只能采用 UDP协议 3 会议电话控制协议 会议电话应用一般要用一称为多点控制单元 MCU Multipoint Control Unit 的网络部件 由它来控制点到多点连接的建立 设置主席 控制发言 权 进行话路切换等 会议电话控制协议规定了如何建立各与会者至MCU的 话音通道 协商会议的规模和能力 确定会议管理方式等过程 MCU 多 点控制单元用于控制多点会议 也可以用于连接两个终端的点对点会议(这种 点对点会议以后可能发展为多点会议) MCU通常按H.231 MCU的方式行事 不过音频处理器不是必须的 MCU由两部分组成 必备的MC和可选的MP 最简单的MCU可以只包括一个MC 没有MPs MC是 网 络 上 的 一 个 H.323实体 它为多点会议中三个或更多个终端的参与提供控制 也可以在点 对点会议中连接两个终端 以后发展为多点会议 MC与所有终端进行能力协 商 在共有的水平上进行通讯 它也可以管理会议资源 例如谁正在多点传 送视频 MC不执行媒体流的混响与交换 MP Multipoint Procressor 是网 络上的H.323实体 它为多点会议中的媒体流提供集中处理能力 在MC的控 制下 提供混响 交换 和其它对媒体流的处理过程 MP 能够处理单个或 多个媒体流依赖于支持的会议类型 [IP网络电话关键技术浅析] 华为技术 4 实时控制协议 RTP Real-Time Protocol 协议 RTP是IETF定义的用以传送音频 视频流的协议 RTP建立在UDP上 在RTP的头部 定义了一个时间戳 Time Stamp 使得音视频的实时传送及同步得到保证 该协议可传送分 组的时间戳 time stamp 分组序号等信息 支持Qos监视和多数据流合并 RTCP则是控制和监视RTP及其QoS的协议 IP网络电话利用RTP分组语音数 据 此外 为了确保分组语音通信的实时性 还可采用RSVP协议为呼叫保留 网络资源 RSVP Resource Reservation Protocol 一般说来 在IP网络上保 留足够的带宽用于多媒体的传送是十分困难的 为此IETF定义了资源预留协 议 RSVP RSVP允许接收者申请特定数量的带宽用以进行数据传输 有 了RSVP 传统的无QoS Quality of Service 保证的IP网络获得了QoS保证 三 网络安全管理技术 IP网络电话是基于在Internet网络基础上 而Internet网络是开放式网络 这给IP网络电话安全管理带来较大的考验 防止网络受到恶意攻击 网络安 全和用户信息泄露 这就使IP网络电话除了一般的管理外 还必须具有完善 的安全管理技术 其安全管理技术主要包括以下几 方面 1 权限管理 用户的身份验证 接入控制功能 系统对每个呼叫进行鉴 权功能 2 加密 信令消息 计费等信息的加密 3 数据的完整性 确保用户信息不能被未授权的其他人截取或修改 随着宽带接入网的发展和住宅局域网的普及 开发低成本 高性能 易 于使用的终端将是未来IP网络电话发展的重要技术之一 以目前的技术和IP网的网络条件而言 IP电话的质量还无法与现有电话 相比 由于Internet是一种不可管理的网络 带宽条件动态变化 不保证服务 质量 因此 在公共的Internet上实现非常好的话音质量是非常困难的 而对 于Intranet和专网来说 有保证服务质量的机制 可以实现较好的话音质量 [IP网络电话关键技术浅析] 华为技术 当然 随着IP网络 语音压缩技术的发展 网络带宽的增加和一系列标准协 议的推出 极大地改善了话音质量 IP电话的话音质量会不断的提高 使 IP电话话音质量逐步接近于传统电话 [IP网络电话关键技术浅析] 华为技术
本文档为【IP网络电话关键技术浅析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_943076
暂无简介~
格式:pdf
大小:77KB
软件:PDF阅读器
页数:7
分类:互联网
上传时间:2011-04-28
浏览量:32