售前电话
135-3656-7657
售前电话 : 135-3656-7657
波形编码的基本出发点是最小化原信号和重构信号之间的差值信号,最小化判据一般为以"块”为基础的差分信号的均方差,块可以小到单个话音抽样。波形编码的设计要求是获得尽可能高的信噪比(SNR)。改进的编码器还考虑人类听觉系统的主观感觉效果,为此可设置屏蔽滤波器,修正原信号和重构信号。这样SNR有可能下降,但主观感觉质量反而会提高。波形编码器主要利用话音波形的短时相关性,特别是相邻抽样点之间的相关性来降低比特率,改进算法还考虑了长时相关性。
参数编码的基本出发点是根据确定的成音模型确定模型参数,虽然LPC声码器也是通过残差信号的最小化进行计算的,但是其着眼点是要求模型参数的最佳值,而并非SNR的最大化。
参数编码的精度主要取决于模型本身的正确性。图3.12所示的话音生成数字模型和实际情况还是有差距的。例如,模型采用清/浊音二元判决,也就是说任一时刻的话音或者是纯粹的清音,或者是纯粹的浊音,实际情况并非完全如此,尤其是从一个音素到另一音素转换的过渡阶段比较复杂, 理论上应采用多元判决。模型中激励源只有两个,每次只能产生一种音,但实际话音有许多部分的频谱呈谐波频谱和噪声谱的组合频谱。模型假设浊音激励是规则的周期脉冲,这也是对实际情况的一种理想化近似。另外,模型参数是按照帧周期进行更新调整的,对于爆破音等快速变化音素的编码来说就有较大的误差。凡此决定了参数编码的固有误差,这是由模型本身所限定的,尤论怎样增加参数的编码比特率,减小量化误差,都不能使重构信号收敛于原信号。而波形编码则不一样,理论上只要预测阶数足够高,量化误差足够小,重构信号将收敛于原信号。这是两种编码方式的显著不同之处,这一概念可由图3.15表示。但是参数编码的一个重要优势是可以有效降低编码比特率,从而得到越来越广泛的应用。
参数编码标准
有影响的话音参数编码国际标准和地区性标准主要由ITU-T和数字蜂窝标准组织制订,其特性如表3.4所示。它们采用的都是线性预测编码器和码本激励矢量量化技术。IP网络电话应用主要使用ITU定义的三个标准。G.728比特率为16kbit/s,标准研究始于1988年,其目的是建立
一个通用的16kbit/s长途质量的话音编码标准。它的第一个应用是H.320低比特率可视电话。G.728对具有背景噪声的信号或音乐具有很好的健壮性,抗随机比特差错能力优于G.711和G.721,可通过所有的网络信令音,还能通过高达2400bit/s的低比特率modem信号。
CELP:码激励线性预测RPE-LTP:规则脉冲激励一长期预测TIA:电信工业协会RCR:无线电系统研发中心
G.729比特率为8kbit/s。最初由ITU-R提出此项研究,其目的是用于第三代移动通信系统。G.729A是G.729的DSVD(话音和数据同时传送数字系统)型式。与G.729比特流兼容,即它们的编码都能被对方的解码器接收重建信号。但G.729A的复杂度降低了50%,代价是在某些运行条件下性能稍有下降。
G.723.1为双速率话音编码器,作为PSTN上可视电话标准系列中的话音编码标准。其中,6.3khit/s比特率采用多脉冲LPC编码,对于一般的话音信号,其话音质量相当于G.721,但对于童声、音乐和具噪声背景的话音输入,其质量不如ADPCM。5.3kbit/s比特率采用多脉冲算术码本激励,定义该速率的目的是增加系统设计的灵活性。如用于低速率通道时,可为视频编码器留出一些比特空间;可为复用系统提供lkhit/s的“虚信道”以传送附加信息。该标准确定重用编号G.723,但增加一层子序号以区别于被G.726取代的原来的G.723。