论文部分内容阅读
说话人识别技术因其独特的方便性、经济性和准确性,在身份验证和识别领域,特别是在电子商务、犯罪识别、信息安全等领域有广阔的应用前景。现有的说话人识别技术在理想条件下效果很好,但在实际环境中却由于各种因素的影响,不能得到普遍的应用,其中最重要的一个原因是大训练量和实时性不够。为了在不影响识别率的情况下,提高说话人识别系统的训练和识别速度,本文采用支持向量机(SVM)算法进行说话人识别,提出了两种不同的说话人识别方法:1)基于MRSVM的说话人辨识通过对约简支持向量机的研究,针对该算法中对“支持向量”的选取没有代表性的缺点及说话人识别中大样本训练问题,提出一种基于MRSVM的说话人辨识方法。先通过基于熵的特征筛选法,对训练样本进行维数约简,并改善聚类性能。然后用基于核的可能性聚类算法(KPCM)在特征空间选择最具有代表性的样本训练约简SVM,减少系统的存储量和SVM的训练量。相对标准的SVM,该方法使说话人识别速度有了进一步提高。2)基于IPSO-SVM的说话人识别针对PSO算法容易陷于局部极值的缺点,提出了一种改进的PSO优化算法(IPSO)。该算法根据粒子进化速度对粒子个体极值进行自适应扰动,使粒子及时跳出局部极值点而继续优化,从而扩大粒子搜索范围。改进后的PSO算法可以加快收敛速度,能够更好地调整算法的全局与局部搜索能力之间的平衡。同时,给出了应用IPSO算法训练SVM的方法,并将其应用于说话人识别。改进后的PSO可以使SVM用较少的SV取得最优分类面,从而减少SVM的训练量,提高了说话人识别速度。