基于HMM的分布式语音识别系统的研究与应用

来源 :浙江大学计算机科学与技术学院 浙江大学 | 被引量 : 0次 | 上传用户:wywinnie1105
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的嵌入式语音识别系统存在结构复杂、硬件要求高、灵活性和鲁棒性差以及词库更新难等不足。本文从网络应用的角度研究了基于HMM的分布式汉语语音识别系统的相关技术,包括服务器上词库的分类、更新和训练方法,以及在嵌入式终端中端点检测和特征提取过程的优化实现等。通过建立语言模型将孤立字识别转换为词识别以及将语音训练和识别过程从嵌入式终端转移到网络服务器等方法,降低了终端的计算量,提高了系统整体的灵活性和响应能力。本文的主要工作和创新点如下:(1)利用分布式信息处理的思想,将语音训练和识别分布在服务器上、语音特征提取分布在终端。终端将提取出的语音特征格式化成数据包,通过网络传递给服务器,由服务器进行语音识别并返回结果。(2)提出在服务器端用标签对词库进行分类和更新的方法。将词汇集中的每个词赋以标识该词所在分类信息的标签后存储到数据库。当获得该词的足量语音样本时进行训练并创建声学模型和语言模型。本文还提出了个性化语音识别方法,通过显式或隐式搜集特定用户的语料,对通用语音模型进行个性化调整,提高系统对特定用户语音识别的准确率,同时不失通用语音识别系统的普适性优势。(3)在嵌入式终端将频域端点检测和特征提取同步进行,结合算法优化、查表和定点实现等措施降低计算时间,并将得到的语音特征通过网络传递给服务器并由服务器进行语音识别计算,最后接收服务器的识别结果。(4)将网络服务器和嵌入式终端通过网络互联,以一个网络新闻推荐系统(智能网络搜音机服务平台及终端)为例实现了一个分布式语音识别系统原型。实验表明分布式语音识别可行性强,能为嵌入式系统分担计算和存储压力,且词库可动态更新,并具备个性化语音识别能力,系统的灵活性好。
其他文献
汽车防抱死制动系统(Anti-lock Braking System,ABS)作为主动安全装置的典型代表,主要目的是防止紧急制动时车轮抱死,保持车辆制动时方向的稳定性和方向盘的可操纵性,缩短制
云任务调度算法在很大程度上决定了云集群的性能以及用户是否拥有良好的服务体验,而数据本地性任务的选择又是研究云调度算法所需要重点考虑的部分。延时调度算法是公平调度
知识工程是人工智能的一种实现方法,对那些需要专家知识才能解决的应用难题提供求解的手段,它在中医学领域中的应用方兴未艾。本文介绍了浙江大学CCNT实验室与中国中医科学院
覆盖控制作为无线传感器网络(Wireless Sensor Networks, WSN)中的一个最基本的问题,是衡量无线传感器网络工作性能的重要评价指标。它不仅使WSN的空间资源得到优化,而且影响
本体作为一种能在语义和知识层次上描述知识系统的概念模型和建模工具,自被提出就引起了国内外众多科研人员的关注,并在计算机的许多领域得到了广泛应用。但是本体的构建研究
在织物染色配色问题研究中,由于染料本质的问题,本文中提出两种不同的解决问题的思想,并且建立了两种模型。第一种方法采用数学建模方法,主要针对三种染料与三刺激值之间关系
模型驱动架构(MDA)是对象管理组织(OMG)提出的一种新的软件开发框架。与传统软件开发不同,MDA以模型为中心,使用模型来指导系统的设计、开发和维护。它将模型和实现技术分离,
FPGA技术已经取得了巨大进步,FPGA芯片在容量和速度上都达到了较高的水平,现在已经有许多学者研究如何使用FPGA完成对应用程序的加速。Deflate算法是无专利保护的可以自由使用
深度学习是人工神经网络的新技术进展。深度学习在若干领域已经突破历史记录,提高准确率和缩短收敛时间依旧是神经网络追求的目标。人脸识别作为深度学习的一个成熟的应用领