基于HTK和Microsoft Speech SDK的连续语音识别系统的研究及实现

来源 :厦门大学 | 被引量 : 0次 | 上传用户：maxyz

【摘要】

：

语音识别是近年来高速发展的一项技术。让计算机听懂人说话,甚至和人进行交流是我们梦寐以求的梦想。在不久的将来,这个梦想会变成现实。本文的主要目的是对连续语音识别进行

【作者】

：

黄旭

【机构】

：

厦门大学

【出处】

：

厦门大学

【发表日期】

：

2007年期

【关键词】

：

连续语音识别快速高斯计算 Speech API

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音识别是近年来高速发展的一项技术。让计算机听懂人说话,甚至和人进行交流是我们梦寐以求的梦想。在不久的将来,这个梦想会变成现实。本文的主要目的是对连续语音识别进行探讨。本文开始先介绍了语音识别的基础知识,详细的讨论了语音信号的处理方法和语音识别系统的原理。接下来本文从两方面进行展开。一方面从模式识别的研究角度,探讨语音信号的提取和语音识别的原理,建立相应的语音识别模型。本文综合了基于MFCC的特征提取技术,HMM原理、训练算法和单音子模型的建模技术,上下文无关文法的定义和应用,Viterbi算法等方法,构筑了HTK3.4+TIMIT的连续语音识别实验系统,并做了关于混合分量维数的实验,结果表明随着混合分量数从1提高到128,系统的识别率从47.01%提高到了62.33%。针对LVCSR中混合分量数的提高带来的时间消耗增加问题,本文研究了似然率的快速算法。本文基于HTK 3.4实现了部分距离消去算法(PDE)、最佳混合预测算法(BMP)和特征矢量元素重排算法(FCR)。实验结果表明,快速似然率计算方法在可接受的识别率的降低范围内,可显著地降低似然率计算的时间开销。另一个方面从识别系统的软件开发考虑,建立一个基于篮球比赛的数据统计的语音识别系统。介绍了Microsoft的Speech SDK在系统中的嵌入,介绍了XML。之后给出一个实例,运用SAPI建立了能够识别多个句型和几十个词汇的一个限定领域的连续语音识别系统,用作篮球比赛数据统计系统的语音界面,经测试系统的识别率可以达到86%,之后介绍了噪声控制的一些技术和提高系统语音识别率的方法。

其他文献

面向服务的访问控制系统的设计与实现

面向服务的体系结构(SOA)作为一种新的软件架构方法,已成为企业实施信息化集成的首选解决方案。但SOA所具有的动态性、开放性特点,使其面临的安全问题更加突出。服务请求者和

学位

可扩展访问控制标记语言基于属性的访问控制模型授权策略的管理

嵌入式监控设备驱动技术与实现

随着视频监控技术的发展,嵌入式视频监控系统以其直观、方便和内容丰富等特点,日益受到人们的重视和关注,被广泛应用于众多场合。武汉精伦电子股份公司的四路网络视频监控服

学位

视频监控集成电路音频直接内存访问告警管理

基于半随机多决策树模型的数据流概念漂移发现研究

网络等信息技术的迅速发展和广泛应用产生了大量的数据流,如:超市交易记录、网络搜索请求、电信通话记录等。这些数据流中隐含着丰富的有价值的知识亟待挖掘。分类算法研究作

学位

数据流概念漂移半随机决策树朴素贝叶斯

随机局部搜索算法及其应用研究

随机局部搜索算法是一种解决计算机科学和运筹学领域中组合最优化问题的元启发式方法。近年来,由于其简单、高效的特点而得到越来越多的应用。本论文中,我们对随机局部搜索算

学位

随机局部搜索组合优化集合覆盖问题多维度多选择背包问题

P2P网络环境下的Web服务发现技术研究

Web服务将程序封装成单个实体并发布到网络上以供其他程序使用的功能,可以使企业和个人迅速且廉价地向网络用户提供服务。Web服务具有十分广阔的市场前景。随着Web应用的迅速

学位

Web服务语义Web服务P2PWeb服务发现

频繁和高效用项集挖掘算法研究

从事务数据库中挖掘有意义的项集已经被研究超过10年。频繁项集挖掘主要挖掘出那些在事务数据库中大量出现的项集,这些项集之间存在很强的联系,可以为决策者提供有效信息,从

学位

频繁高效用高质量项集质量值上界

ReSIProcate协议栈分析与改进及与JAIN-SIP映射关系的研究

随着数据业务的不断发展,下一代网络成为发展的必然趋势。下一代网络采用分层的结构,分为松散耦合的业务层、控制层、媒体传输层和接入层。在下一代网络的发展中,SIP(Session

学位

下一代网络IMSSIP协议ReSIProcateJAIN-SIPJNI通用消息中间件

基于多支持度的正负关联规则挖掘技术的研究

关联规则的研究是数据挖掘的重要内容之一,现有的关联规则挖掘算法大都是在频繁项集的基础上进行挖掘,关于非频繁项集的研究较少,然而在研究负关联规则后,非频繁项集因包含重

学位

数据挖掘负关联规则多支持度非频繁项集

一种电子健康数据整合脚本语言的设计与实现

数据整合是解决信息“孤岛”问题,实现数据共享的重要途径。医疗健康信息的数据整合是为了实现跨医院、跨地区、跨领域的健康资料共享,提高我国的全民健康和医疗卫生水平。脚

学位

电子健康数据整合脚本技术语言设计解释系统

基于多特征抽取的商标图像检索

基于内容的图像检索技术是根据描述图像视觉内容的特征向量进行相似性检索,其中,图像视觉内容的提取可以是通用的,也可以是基于特定应用领域的。基于特定应用领域的图像检索

学位

商标图像检索子图像多特征抽取多对多匹配

基于HTK和Microsoft Speech SDK的连续语音识别系统的研究及实现

其他学术论文