网上购物 货比三家
您现在的位置:快乐比价网 > 图书 > 计算机与网络 > 网络通讯 > 商品详情

现代语音技术基础与应用

分享到:
现代语音技术基础与应用

最 低 价:¥22.40

定 价:¥32.00

作 者:蔡莲红

出 版 社:清华大学出版社

出版时间:2003-11-1

I S B N: 9787302072775

价格
22.40元
价格
25.30元
价格
25.60元
价格
28.80元

商品详情

编辑推荐

语音处理——综合性的新兴学科
语音合成——教计算机学会说话
语音识别——让计算机听懂人类语言
语音编码——去除冗余压缩数据
本书综合介绍了现代语音处理的研究与进展。内容包括语音学基础、方法及应用,是一本论述现代语音处理的专著。 全书共分8章。第1章概述语音处理研究的问题和方向:第2章介绍数字信号处理和语音信号处理基础。第3章从工程的角度出发简单介绍了语音基础知识和语料库有关内容;第4章介绍语音编码的算法和国际标准;第5章介绍语音合成的原理和文语转换系统;第6章介绍语音识别基础;第7章介绍可视语音和汉语视位;第8章介绍典型语音系统及其应用。语音信号处理是计算机应用的重要研究方向。本书主要介绍语音信号处理的基础知识以及相关的新方法和新技术。
本书内容精心挑选,叙述深入浅出、基础理论和实际应用并重。本书可供语音处理和相关学科的研究生和本科生作为教材,也可作为研究人员和工程技术人员的参考书。

内容简介

本书概述了语音处理研究的问题和方向;介绍了数字信号处理和语音信号处理基础,语音合成的原理和文语转换系统,语音识别基础等内容。

作者简介

目录


第1章绪论
1.1言语过程
1.2语音技术的研究范围
1.3数字信号处理与数字语音信号处理
第2章语音信号处理基础
2.1数字信号处理基础
2.1.1离散时间信号与系统
2.1.2离散傅立叶变换
2.1.3Z变换
2.1.4离散余弦变换
2.1.5卷积和滤波
2.2语音信号产生模型
2.2.1语音的产生机理
2.2.2级联声管模型
2.2.3语音生成模型
2.3语音信号的时域处理
2.3.1语音信号的抽样和量化
2.3.2语音信号的短时分析和预处理
2.3.3短时能量.短时平均幅度和短时平均过零率
2.3.4语音的端点检测
2.3.5短时自相关函数
2.3.6短时基音周期估计
2.4语音信号的频谱分析
2.4.1短时傅立叶变换和语谱图
2.4.2同态信号处理的基本原理
2.4.3复倒谱和倒谱
2.5语音信号的线性预测编码分析
2.5.1线性预测的基本原理
2.5.2线性预测方程组的解法
2.5.3线谱对参数
2.6语音信号的矢量量化
2.6.1矢量量化的基本原理
2.6.2失真测度
2.6.3量化器和码本的设计
2.6.4量化系统的复杂度控制
2.7听觉特性和语音感知
2.7.1听阈与听域
2.7.2音调(pitch)
2.7.3向度级.响度与遮掩效应
第3章语音基础知识与语料库
3.1语音基础知识
3.1.1国际音标
3.1.2音素的分类和特点
3.2汉语的特点
3.2.1汉语拼音方案
3.2.2汉语音素及其分类
3.3汉语的音节
3.4汉语的声调
3.4.1汉语的声调的特点
3.4.2声调的标记
3.4.3声调的声学特性
3.4.4动态声调
3.5汉语的语调
3.5.1关于语调
3.5.2语调的模式
3.6语音语料库
3.6.1概述
3.6.2语音语料库的设计与建设
3.6.3TIMIT
3.7基于语料库的语音学研究
3.7.1声学参数的统计分析
3.7.2音节聚类研究
3.7.3音域模型初探
第4章语音编码
4.1语音编码基础
4.1.1信息论基础
4.1.2语音编码分类
4.1.3语音编码与其他语音处理领域
4.2语音编码的评价方法和依据
4.2.1语音编码的评价方法
4.2.2语音编码的评价依据
4.3波形编码及其国际标准
4.3.1标量量化
4.3.2瞬时压扩
4.3.3自适应差值脉冲编码
4.3.4G.721-32kbps自适应差值脉冲编码调制(ADPCM)
4.4参数编码与混合编码
4.4.1编码参数及其量化
4.4.2LPC-10声码器
4.4.3编码结构的改进
4.4.4低延时CELP16kbps语音编码标准
4.4.5G.723.1X7.速率多媒体通信传输语音编码器
4.5码本设计与生成
4.5.1G.728激励码本
4.5.2G.729激励码本
4.6感知编码
4.6.1感知编码原理
4.6.2感知编码算法
第5章语音合成
5.1语音合成研究的历史和现状
5.2语音合成方法
5.2.1共振峰合成
5.2.2波形拼接合成
5.3TTS系统的文本分析和韵律预测
5.3.1文本分析概述
5.3.2文档结构分析
5.3.3文本规范化(textnormalization)
5.3.4语法分析
5.3.5韵律分析
5.3.6字音转换
5.3.7小结
5.4韵律建模
5.4.1韵律的描述
5.4.2韵律与句法
5.4.3韵律建模
5.5文语转换系统
5.5.1汉语TTS系统Sonic
5.5.2基于大语料库的TTS系统
5.5.3基于匹配代价函数的基元选取
5.5.4权重的设定和训练
5.6语音合成技术展望
第6章语音识别
6.1语音识别基础
6.1.1语音识别基本原理
6.1.2语音识别分类
6.2特征表示与提取
6.2.1LPC倒谱系数(LPCC)
6.2.2Mel频率倒谱系数(MFCC)
6.2.3特征提取的具体问题
6.3模板匹配技术
6.3.1相似性度量
6.3.2动态时间规整(DTW)
6.3.3特征模板训练
6.4隐马尔可夫模型(HMM)
6.4.1HMM基本概念与原理
6.4.2前向概率与后向概率
6.4.3HMM模型的三个问题
6.4.4HMM模型的训练
6.4.5HMM求解具体问题
6.4.6HMM的结构和类型
6.4.7HMM模型相似性比较
6.5孤立词及连接词识别
6.5.1孤立词识别
6.5.2HMM模型参数选择
6.5.3HMM模型参数训练--分段K均值算法
6.5.4连接词识别
6.6连续语音识别
6.6.1连续语音识别整体模型
6.6.2声学模型
6.6.3语言模型
6.7说话人识别
6.7.1说话人识别的基本原理与系统性能评价
6.7.2说话人识别的特征选择
6.7.3说话人识别的基本方法
第7章可视语音
7.1概述
7.2看得见的语音
7.2.1语音波形图
7.2.2语谱图
7.2.3可视发音器官的运动
7.3视位
7.3.1视位的定义
7.3.2视位的参数表示方法
7.3.3视位的非参数表示方法
7.3.4汉语视位
7.4动态视位模型
7.4.1基于权值融合的动态视位模型
7.4.2视位数据的自动提取
7.4.3动态视位模型的参数估计
7.5文本-可视语音转换
7.5.1基于参数控制的方法
7.5.2基于数据驱动的方法
7.6机器自动唇读
7.6.1视觉特征
7.6.2实现方法
7.7双模态语音识别
7.7.1双模态信息融合的时间
7.7.2双模态信息的同步
7.7.3确定双模态信息的融合权重
7.8音视频映射
7.8.1语音特征选取
7.8.2基于矢量量化分类的方法
7.8.3基于混合高斯模型的方法
7.8.4基于神经网络的方法
7.8.5基于隐马尔可夫模型的方法
7.8.6基于支持向量回归的方法
第8章系统与应用
8.1多模态三语种分布式口语对话系统ISIS
8.1.1概述
8.1.2对KQML软件代理的授权
8.1.3ISIS中的多模态
8.1.4小结
8.2人机口语对话系统与应用
8.2.1语对话系统
8.2.2清华大学校园导游系统EasyNav
8.2.3电话航班订票与信息查询系统EasyFlight
8.3炎黄之声语音合成服务器SinoSomc
8.3.1语音合成服务器概述
8.3.2语音合成服务器体系结构
8.3.3SinoSonic语音合成服务器的应用
8.3.4Monternet(移动梦网)统一消息平台语音技术应用TTS
8.3.5TTS在其他领域的应用和今后的工作
8.4IBM语音解决方案简介
8.4.1桌面听写机系统(ViaVoiceDesktop)
8.4.2电话语音识别系统(ViaVoiceTelephony)
8.4.3嵌入式ViaVoice技术
8.4.4WebSphereVoiceServer

商品评论(0条)

暂无评论!

您的浏览历史

loading 内容加载中,请稍后...