噪声环境下鲁棒性文本自由说话人辨认系统的研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:yongz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人辨认系统的目的是提取、特征化和辨认表征说话人身份的语音信号信息,因此它在身份验证领域具有广阔的应用前景。本文对噪声环境下闭集文本自由的说话人辨认系统中的两个部分进行了研究。首先本文介绍了各种特征提取的方法,如LPCC、MFCC等,在分析了它们的缺点的基础上,本文根据人耳频率子带独立识别的特性和能量算子,提出了子带能量倒谱特征参数,并用提出的瑞利倒谱提升进行加权,突出说话人的个性信息。其次,在对说话人辨认分类器的特性进行深入分析的基础上,本文提出了概率神经网络说话人辨认方法,并就概率神经网络的模型、训练算法、实时性、噪声鲁棒性、网络结构改进等方面进行了深入研究。(1)提出了一种基于高斯核函数有不同协方差的混合模型的异方差PNN模型及其算法。(2)提出了一种基于最小分类错误准则的概率神经网络的训练算法。(3)提出了一种基于声学分类的并行异方差PNN的实时说话人辨认系统。(4)提出了一种新的基于PNN分类器的噪声自适应更新训练方案。(5)提出了一种新的类条件密度函数估计的PNN模型及其算法。最后,Matlab和Visual C++说话人辨认实验证明了本文提出的参数、模型和算法提高了噪声环境下的系统辨认性能
其他文献
以GaN基LED为代表的固态照明光源以其节能、环保、寿命长、光谱纯度佳、抗机械振动能力强等诸多优点引起了科学界和工业界广泛的研究兴趣。其有望取代白炽灯、荧光灯,成为新一
学位