基于高斯混合模型的与文本无关说话人识别的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:chubiao5201314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别始于20世纪30年代,从20世纪60年代开始日益成为当今的一个研究热点.说话人识别具有广泛的应用前景,如保安、公安司法、军事、财经和信息服务等领域.正因为说话人识别具有如此广阔的应用前景,国内外许许多多的工作者投身于这一领域的研究中,使得说话人识别方面出现巨大发展.但它还远远没有成熟.该文主要从识别模型的训练、判别方法和语音降噪等方面作研究探讨.在识别模型的训练方面,主要研究高斯混合模型的模型训练.第一,利用最大似然估计获取初始模型,然后用EM算法的重估结果对初始模型按一定比例进行修正,最终获得较优模型.第二,把第一种方法获得的部分最优个体作为遗传算法的初始种群,通过交叉、变异和选择,最后收敛到最优模型.遗传算法采用浮点编码,交叉和变异在一个种群的胜者组和败者组同时进行,最后改选择为优胜劣汰.判别方法方面,对一段语音中的帧得分进行不同变换,然后获得最终的得分,从而改善识别效果.语音降噪方面,先用谱减法对语音作轻度的消减,避免出现音乐噪声,然后用小波降噪方法对它作进一步的噪声消减.
其他文献
该论文在详细研究了H.26L的体系结构、核心技术的基础上,根据实时视频通信应用的需要,对H.26L的编码、解码算法进行了多层次的优化,大大提高了算法的编码速度,优化后的代码能
表层穿透雷达是利用电磁波对表层下目标定位、检测和识别的设备,在民用和军事领域应用十分广泛。与之相关的信号处理技术中,穿透成像可以有效地降低数据解译难度,意义重大。
完全植入式静脉输液港(totally implantable venous access ports,TIVAP)是一种可植入皮下长期留置在体内的静脉输液装置,包括尖端位于上腔静脉的导管部分及埋植于皮下的注射
互连网络作为影响并行计算机性能的一个主要因素,已发展成为计算机组织和系统结构学的一个独立方向.该文对构成互连网络的交换开关、影响网络性能的参数以及网络路由和反死锁
目的:探讨品管圈活动对降低医嘱执行误差率的效果.方法:成立品管圈活动小组,确立“降低医嘱执行误差率”为活动主题.活动前对我科180份(住院病历102份,出院病历78份病历存在