论文部分内容阅读
说话人识别始于20世纪30年代,从20世纪60年代开始日益成为当今的一个研究热点.说话人识别具有广泛的应用前景,如保安、公安司法、军事、财经和信息服务等领域.正因为说话人识别具有如此广阔的应用前景,国内外许许多多的工作者投身于这一领域的研究中,使得说话人识别方面出现巨大发展.但它还远远没有成熟.该文主要从识别模型的训练、判别方法和语音降噪等方面作研究探讨.在识别模型的训练方面,主要研究高斯混合模型的模型训练.第一,利用最大似然估计获取初始模型,然后用EM算法的重估结果对初始模型按一定比例进行修正,最终获得较优模型.第二,把第一种方法获得的部分最优个体作为遗传算法的初始种群,通过交叉、变异和选择,最后收敛到最优模型.遗传算法采用浮点编码,交叉和变异在一个种群的胜者组和败者组同时进行,最后改选择为优胜劣汰.判别方法方面,对一段语音中的帧得分进行不同变换,然后获得最终的得分,从而改善识别效果.语音降噪方面,先用谱减法对语音作轻度的消减,避免出现音乐噪声,然后用小波降噪方法对它作进一步的噪声消减.