
| |
|
|
| 第1章 语音编码概论 1 1.1 语音编码的数字化 1 1.2 语音编码的必要性和推动力 1 1.3 语音编码的声学基础知识 3 1.3.1 响度级和响度 3 1.3.2 听觉掩蔽和临界频带 4 1.3.3 听觉掩蔽在语音编码中的作用 6 1.3.4 发声器官的声电类比线路 7 1.3.5 语言发声的数学模型 10 1.4 语音信号的物理特性 15 1.4.1 语音信号在时域和频域的特性 15 1.4.2 语音信号的统计特性 17 1.4.3 语音传输所需比特率的估计 19 1.5 除去语音冗余度的方法 21 1.6 语音编码器方案的分类 23 1.6.1 波形近似语音编码器 23 1.6.2 参量编码器 24 1.7 语音编码的发展趋势 24 参考文献 25 第2章 语音信号的采样和量化 27 2.1 采样 27 2.2 标量量化 28 2.2.1 量化误差 29 2.2.2 均匀量化器 30 2.2.3 最佳量化器 31 2.2.4 对数量化器 32 2.2.5 自适应量化器 33 2.2.6 差分量化器 35 2.3 矢量量化 37 2.3.1 失真测度 38 2.3.2 码书设计 39 2.3.3 码书种类 40 2.3.4 训练试验和码书的顽健性 45 参考文献 46 第3章 语音信号的分析和建模 48 3.1 短时频谱分析 48 3.1.1 窗的作用 49 3.2 语音信号的线性预测模型 53 3.2.1 语音产生的源滤波器模型 54 3.2.2 线性预测分析(LPA)的求解 55 3.2.3 线性预测分析的实现和物理解释 62 3.3 音调预测 64 3.3.1 语音信号的周期性 64 3.3.2 音调预测器 65 3.4 音调检测 68 3.4.1 时域波形的相似性方法 69 3.4.2 频率域频谱的相似性方法 72 3.4.3 预处理和后处理技术 74 参考文献 79 第4章 使用线谱频率(LSF)量化线性预测编码(LPC)参量 82 4.1 LPC参量的编码 82 4.2 LPC参量的另外一种表示——PARCOR系数 82 4.3 LPC到LSF的变换 87 4.3.1 LSF的计算 88 4.3.2 LSF到LPC的变换 95 4.3.3 LSF的特性 96 4.4 转换型——自适应帧间矢量预测(SIVP) 98 4.4.1 SIVP编码方案 98 4.4.2 矢量预测器 99 4.4.3 预测误差的量化 100 4.4.4 性能的比较 102 4.4.5 实时实现中的问题 105 4.5 SAVQ编码方案 107 4.5.1 SAVQ 系统 107 4.5.2 性能比较 107 4.6 无记忆的LSF量化 109 4.6.1 LSF的分裂矢量量化 109 4.6.2 非均匀的标量量化 109 参考文献 111 第5章 按合成分析法(AbS)的语音编码方案 112 5.1 按合成分析法(AbS)的基本原理 112 5.2 通用的AbS编码方案 113 5.2.1 时变滤波器 114 5.2.2 建立在理解上的最小化程序 115 5.2.3 激励信号 116 5.2.4 最佳激励序列的确定 118 5.2.5 AbS-LPC 方案的特性 121 5.3 多脉冲激励线性预测编码(MPLPC) 124 5.3.1 MPLPC的最优幅度激励 125 5.3.2 具有长期预测的MPLPC 127 5.3.3 脉冲位置编码 129 5.3.4 脉冲幅度编码 130 5.3.5 联合的脉冲幅度量化(JPAQ) 132 5.4 码激励线性预测编码 134 5.4.1 引言 134 5.4.2 短期预测(STP) 135 5.4.3 长期预测(LTP) 136 5.4.4 辅助激励的计算 145 5.4.5 LTP和辅助激励联合计算 159 5.4.6 具有后滤波的CELP 160 参考文献 162 第6章 低时延语音编码 165 6.1 编码时延与对低时延编码器的要求 165 6.2 G.728 16kbit/s LD-CELP语音编码器 166 6.2.1 方框图与工作原理 166 6.2.2 高阶后向自适应线性预测 168 6.2.3 听觉加权滤波器 169 6.2.4 激励增益预测器 170 6.2.5 码书结构与搜寻 171 6.2.6 同步和带内信令 178 6.2.7 自适应后置滤波器(adaptive post-filter) 178 6.2.8 G-728编解码器的复杂度和性能 182 参考文献 183 第7章 多带激励声码器 184 7.1 导言 184 7.2 多带激励语音模型 185 7.3 多带激励语音分析 189 7.3.1 频域分析 190 7.3.2 时域分析 192 7.3.3 INMARSAT-M IMBE模型分析算法 195 7.4 多带激励语音合成 204 7.4.1 清音成分的合成 204 7.4.2 浊音成分的合成 205 7.4.3 重建语音的产生 207 参考文献 207 第8章 低速率语音编码 208 8.1 波形内插语音编码 208 8.1.1 浊音语音的波形内插 209 8.1.2 广义WI模型 212 8.1.3 2.4kbit/s GWI语音编码系统 215 8.2 正弦变换编码 218 8.2.1 语音信号的正弦分析 218 8.2.2 语音信号的正弦合成 219 8.2.3 低比特率正弦编码器 220 8.2.4 与原型波形内插相结合 221 8.2.5 基音的频域估计法 222 8.2.6 确定残差信号的正弦模型参数 223 8.2.7 正弦激励参数的量化 227 8.2.8 正弦变换解码器 231 8.2.9 正弦变换编码器的性能 232 参考文献 234 第9章 宽带语音编码 235 9.1 引言 235 9.2 子带编码(sub-band coding) 236 9.2.1 工作原理 236 9.2.2 子带编码的比特分配 237 9.3 G.722宽带语音编码 240 9.3.1 技术要求 240 9.3.2 方框图 240 9.3.3 SB-ADPCM编码器的工作原理 241 9.3.4 SB-ADPCM解码器的工作原理 242 9.3.5 正交镜像滤波器组(quadrature-mirror filter bank) 244 9.3.6 G.722自适应量化与预测 251 参考文献 256 第10章 语音编码的方案和标准算法 257 10.1 语音编码标准的发展概况 257 10.2 语音编码器的属性 258 10.2.1 比特率 258 10.2.2 延迟 258 10.2.3 复杂度 259 10.2.4 语音质量 259 10.2.5 规范和适应性的确认 260 10.3 世界上有哪些标准化实体,他们是怎样开展工作的 261 10.3.1 国际电信联盟(ITU) 261 10.3.2 北美的标准化组织 262 10.3.3 欧洲电信标准研究所 262 10.3.4 日本的RCR 262 10.3.5 我国的电信标准化组织 262 10.3.6 建立参考条款 263 10.3.7 语音编码器的性能测量 263 10.3.8 工作日程 264 10.4 现在的语音编码标准 264 10.4.1 ITU公布的具有电话带宽的语音编码器 265 10.4.2 ITU-T近期发布的电话带宽语音编码器 266 10.4.3 ITU 7kHz宽带语音编码器 267 10.4.4 欧洲的数字蜂窝电话语音编码器 268 10.4.5 北美的数字蜂窝语音编码器 269 10.4.6 日本的数字蜂窝电话编码器 270 10.4.7 国际海事卫星4.15kbit/s IMBE编码器 271 10.4.8 用于保密通信的语音编码标准 272 10.5 语音编码器性能的总结 273 10.6 附加的信息 274 参考文献 274 第11章 语音编码器的质量评价 277 11.1 语音质量的定义 277 11.1.1 对发音者和语言的依赖 277 11.1.2 对信号功率级的依赖 277 11.1.3 背景噪声 278 11.1.4 多种编码的级联 278 11.1.5 信道误差所产生的影响 279 11.1.6 非语音信号 279 11.2 语音质量的客观测量 279 11.3 语音质量的主观测量 280 11.3.1 绝对等级的评定试验(ACR) 281 11.3.2 降低等级的评定试验(DCR) 281 11.3.3 诊断测量试验(DAM) 282 11.3.4 通话试验 282 11.3.5 主观质量的预测 282 11.4 测量语音可懂度和对发音人的识别能力 283 11.4.1 可懂度 283 11.4.2 对谈话者的辨认能力 283 11.5 汉语清晰度测量和语音质量的诊断 284 11.6 检测语音质量的数据库和另外的试验信号 287 11.7 典型MOS试验的描述 288 11.7.1 试验方法和实验的设计 288 11.7.2 语音材料的选择和处理 288 11.7.3 试验结果 290 11.8 确认语音编码器实现的方法 291 11.9 复杂度和延迟的测量 292 11.9.1 复杂度 292 11.9.2 延迟 293 11.10 结论 293 参考文献 293 第12章 语音编码的实时实现 298 12.1 引言 298 12.2 数字信号处理器(DSP) 298 12.2.1 DSP芯片的发展概况 299 12.2.2 定点实现的DSP 300 12.2.3 浮点实现的DSP 304 12.2.4 TI公司的TMS320 C6000芯片系列 305 12.3 实时的软件开发方法 308 12.4 典型的CELP实现方案 309 12.4.1 AT&T的WE-DSP32 309 12.4.2 典型的WE-DSP32C基础硬件 310 12.5 DSP的开发和调试工具 312 12.6 有效的编程技术 313 12.6.1 CELP复杂性降低的策略 314 12.6.2 典型CELP方案中对处理和存储的要求 317 参考文献 318 第13章 系统应用中的有关问题 319 13.1 引言 319 13.2 回波抵消 320 13.2.1 数字回波抵消器的原理 321 13.2.2 回波抵消的数学表述 322 13.3 语音不连续的传输(DTX) 324 13.3.1 声音激活的检测 325 13.3.2 语音加数据的编码和传输 328 13.4 传输过程中的同步 329 13.5 语音数据的安全 331 参考文献 333 课程习题与设计选题汇集 334 附录 G.729 8kbit/s共轭结构一代数码激励线性预测编码 337 本书缩写字的中英文译名 370 |
商品评论(0条)