论文部分内容阅读
语音情感识别是情感计算研究方向的重要研究分支,它通过分析语音中情感的特征,进而识别语音中的情感状态。语音情感识别在翻译系统、航线监控系统、E-learning、移动智能终端等领域有广泛应用。由于集成多分类器已经被证明比单一分类器具有更好的识别效果,聚类集成使用反映样本内在结构的聚类信息辅助识别,以提高分类器的整体识别率,因此,本文的主要工作是从增量学习和融合算法两个方面结合聚类信息探索高效、准确、泛化性能好的语音情感识别方法。论文主要工作内容如下: (1)提出基于结合聚类信息和多分类器集成的语音情感融合识别方法。在使用多分类器集成的语音情感识别方法中,为了将聚类信息融入到语音情感识别中,同时避免因语音信号情感特征分布误差导致分类器总体识别率低的问题,提出基于结合聚类信息和多分类器集成的语音情感融合识别方法。首先使用语音情感训练样本训练多个基本分类器,使用多种聚类方法对训练样本进行聚类划分;然后为了得到每种聚簇划分中聚簇号和类别之间的对应关系,使用图聚类标签传播算法计算聚簇类别信息。将测试样本的聚类类别信息和基本分类器的预测结果使用协议最大化方法进行语音情感识别。实验结果表明:使用图聚类标签传播算法后,集成多分类器的总体识别率比原有集成多分类器提高了8.33%,对六类典型情感的识别率提高至73.89%,比SVM和Ada Boost高出3.33%和8.99%。 (2)提出基于动态增量学习的语音情感识别方法。由于样本之间的分布差异导致样本间的聚类信息存在误差,为了提高结合聚类信息的集成多分类器的泛化能力,则对该集成多分类器进行增量学习。首先根据训练样本的聚类划分动态选择近邻训练样本对新增测试样本进行融合识别;然后根据选定近邻样本的识别结果对集成多分类器中的聚类信息进行增量学习,如果选定近邻样本的识别率低于设定阈值,则将新增测试样本及错误识别的样本归为一个新簇,并重新计算集成多分类器的聚类信息,否则直接将新增测试样本加入训练样本集便于后续样本的识别。将此算法应用于语音情感识别,实验结果表明,该方法对6种典型情感的平均识别率提高到了79.44%,比未进行增量学习的集成多分类器提高了4.86%。 (3)原型系统的设计与实现。在Matlab2012a开发环境下,设计实现基于增量和集成学习的语音情感融合识别系统,通过实验验证所提方法的有效性。