基于高斯混合模型的与文本无关说话人识别的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户：chubiao5201314

【摘要】

：

说话人识别始于20世纪30年代,从20世纪60年代开始日益成为当今的一个研究热点.说话人识别具有广泛的应用前景,如保安、公安司法、军事、财经和信息服务等领域.正因为说话人识

【作者】

：

罗贤钢

【机构】

：

东南大学

【出处】

：

东南大学

【发表日期】

：

2003年期

【关键词】

：

说话人识别高斯混合模型改进EM算法改进遗传算法语音降噪

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

说话人识别始于20世纪30年代,从20世纪60年代开始日益成为当今的一个研究热点.说话人识别具有广泛的应用前景,如保安、公安司法、军事、财经和信息服务等领域.正因为说话人识别具有如此广阔的应用前景,国内外许许多多的工作者投身于这一领域的研究中,使得说话人识别方面出现巨大发展.但它还远远没有成熟.该文主要从识别模型的训练、判别方法和语音降噪等方面作研究探讨.在识别模型的训练方面,主要研究高斯混合模型的模型训练.第一,利用最大似然估计获取初始模型,然后用EM算法的重估结果对初始模型按一定比例进行修正,最终获得较优模型.第二,把第一种方法获得的部分最优个体作为遗传算法的初始种群,通过交叉、变异和选择,最后收敛到最优模型.遗传算法采用浮点编码,交叉和变异在一个种群的胜者组和败者组同时进行,最后改选择为优胜劣汰.判别方法方面,对一段语音中的帧得分进行不同变换,然后获得最终的得分,从而改善识别效果.语音降噪方面,先用谱减法对语音作轻度的消减,避免出现音乐噪声,然后用小波降噪方法对它作进一步的噪声消减.

其他文献

H.26L算法优化及其DSP电路实现

该论文在详细研究了H.26L的体系结构、核心技术的基础上,根据实时视频通信应用的需要,对H.26L的编码、解码算法进行了多层次的优化,大大提高了算法的编码速度,优化后的代码能

学位

H.263解码算法视频信号TM1300芯片

反向投影穿透成像的自聚焦理论与实验研究

表层穿透雷达是利用电磁波对表层下目标定位、检测和识别的设备,在民用和军事领域应用十分广泛。与之相关的信号处理技术中,穿透成像可以有效地降低数据解译难度,意义重大。

学位

穿透成像探地雷达反向投影成像自聚焦聚焦度聚焦度函数点扩散函数

肿瘤患者静脉输液港期留置期间5例并发症分析与处理

完全植入式静脉输液港(totally implantable venous access ports,TIVAP)是一种可植入皮下长期留置在体内的静脉输液装置,包括尖端位于上腔静脉的导管部分及埋植于皮下的注射

期刊

新型RDT互连网络结构及性能分析

互连网络作为影响并行计算机性能的一个主要因素,已发展成为计算机组织和系统结构学的一个独立方向.该文对构成互连网络的交换开关、影响网络性能的参数以及网络路由和反死锁

学位

互连网络路由算法反死锁

运用QCC降低医嘱执行误差率的效果评价

目的:探讨品管圈活动对降低医嘱执行误差率的效果.方法:成立品管圈活动小组,确立“降低医嘱执行误差率”为活动主题.活动前对我科180份(住院病历102份,出院病历78份病历存在

期刊

医嘱误差品管圈效果

基于高斯混合模型的与文本无关说话人识别的研究

其他学术论文