基于文本无关的说话人识别研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:linjavac
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别始于20世纪30年代,从20世纪70年代开始日益成为国际上的一个研究热点。说话人识别具有广泛的应用前景,如:说话人核对、司法取证、医学应用、声控电子密码锁等领域。正因为说话人识别具有如此广阔的应用前景,国内外许多研究机构和研究者长期从事于这一领域的研究,推动了说话人识别技术的发展,但它还未成熟。本文重点研究了与文本无关的说话人识别技术。首先,详细讨论了说话人识别系统的基本原理,接着介绍了语音信号产生的数学模型、语音信号的数字化及预处理,内容涉及语音信号的加窗分帧、预加重滤波、端点检测;重点讨论了传统的双门限比较法的端点检测,并给出了一种改进的端点检测方法:基于ICA增强和谱熵结合的端点检测;重点分析了当前最常用的语音特征参数:基于听觉模型的美尔倒谱系数MFCC的提取方法。其次,着重讨论了说话人识别中常用的两种识别方法:基于VQ的说话人识别方法和基于GMM的说话人识别方法。详细讨论了VQ的基本原理、失真测度、最佳码本设计以及介绍了基于FVQ的说话人识别方法,实验结果表明基于FVQ的识别率较基于VQ的识别率提高了近十个百分点;接着介绍了GMM的基本概念、模型参数的估计算法以及说话人识别算法的实现,通过实验确定了识别的最佳混合数M。通过不同长度的训练语音进行仿真实验,得出在实验条件相同的情况下,基于GMM的说话人识别识别率较好。最后对本文的工作进行了总结,同时对未来的研究工作进行了展望。
其他文献
地球物理勘探作为研究和探索地球内部结构及资源分布的理论和方法,对于经济发展、城市规划、资源开发等都有着重要意义。多通道瞬变电磁法作为一种建立在电磁感应基础上的时间域电磁探测方法,具有更大的动态范围、更高的分辨率及更广泛的空间覆盖等优点而被广泛应用于:地质矿产、石油、煤炭、工程物探等行业。地球物理勘探系统中采集系统的数据回传是勘探过程的第一步也是数据处理分析成功的前提和保证,采集通道数的拓展,分布的
随着科学技术的发展,计算机技术在医学领域得到了广泛的应用,其中计算机辅助医疗外科技术及辅助诊断技术越来越受到人们的青睐,尤其是在医学显微图像处理方面的应用更是倍受关注
2013年11月5日至2014年2月15日,列支敦士登王室珍藏展将在国家博物馆北一、北四展厅举行。此次展览精选了巴洛克时期佛兰德斯画派的油画、版画与挂毯等一百余件杰出艺术作品,佛兰德斯画派是西方艺术史上巴洛克时期重要的艺术流派,国博相关负责人表示,此次展览共分为13个单元,系统、完整地为观众梳理与展示了一个鲜活、生动的佛兰德斯画派发展历程,再现了十六、十七世纪尼德兰南部地区的人文风貌、历史概况与城
下一代光网络是现阶段通信领域研究的热点之一,而自动交换光网络(ASON)是光传送网实现智能化控制的一个发展方向,而作为ASON核心的控制技术是目前光网络研究领域中的一个重点