论文部分内容阅读
在当今这个信息时代,随着电子技术的迅猛发展,使得我们更加渴望实现人机之间的交流。基于生物特征的身份识别技术是当前国际上的重点研究内容,语音识别作为生物认证技术的一种,是根据应用语音波形中反映说话人生理和行为的语音特征参数,自动鉴别说话人身份的一种技术,因此,受到越来越多的关注。特别是近些年来迅速发展的语音信号处理专用芯片ASIC (Application Specific Integrated Circuit)和语音识别片上系统SOC (System on Chip)的出现为语音识别创造了更有利的条件,使得其更加快速的发展。本文通过分析语音识别基本原理与系统结构,考察现有的说话人识别技术,并研究了线性预测倒谱系数、美尔倒谱系数等特征参数,矢量量化(VQ)与高斯混合模型(GMM)等应用于语音识别的算法,设计和实现了语音门禁系统。首先分析了国内外语音识别的现状、语音识别的算法和流程,然后在此基础上以提高语音识别系统的识别率为目的,针对实时性问题提出了一种以FPGA (Field Programmable Gate Array)为硬件平台的解决方案,并对语音识别的算法进行了分析和改进。在FPGA平台上实现了系统的控制模块、信息采集模块、算法模块,充分发挥了FPGA高速、并行运算的优势。系统主要包括语音信号采集、端点检测、特征提取、码本训练和识别判断5个部分。语音采集模块通过12C总线完成了对WM8731语音编解码芯片的控制;端点检测模块设计并实现了基于短时能量和短时过零率的双门限算法;特征提取模块完成了MFCC系数的提取并与LPCC算法进行了比较;通过LBG算法完成了码本的训练,识别算法是在传统的VQ识别算法的基础上进行改进,提高了系统的识别率。实验表明,该系统可以实现文本相关的语音识别开集系统的基本功能,完成了语音门禁系统的设计。经测试系统可以正常工作、运行稳定、适应能力强并具有很高的安全性。通过对算法的改进有效地提高了系统的识别正确率,是一种解决实时性问题的有效方案。