基于语音与人脸表情信息的情感识别算法研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:akuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单模态情感识别由于受到单一模态情感特征的限制,识别率并没有得到较大的提高。近年来,多模态情感识别突破了这一限制,在情感识别过程中,引入了多种模态的情感特征进行融合,从而在识别率上有了较大的提高。目前,多模态情感识别的方法和思路主要有判决层融合与特征层融合。本文采用特征层融合的方式,提取人脸表情特征和语音情感特征,然后根据两种模态情感特征的特点,进行特征优化处理,最后设计分类器进行情感的分类。本文选择本课题组自建的情感数据库作为课题研究的数据,该数据库包含语音、表情和脑电三种模态的情感数据,情感类别有7种,即生气、厌恶、害怕、高兴、中性、悲伤和惊奇。本文的主要研究工作有:(1)语音情感特征提取,本文采用不同的语音特征提取方法(14维特征和74维特征),提取包括短时能量、基音频率、第一共振峰、美尔频率倒谱系数(MFCC)和语音持续时间等特征类别,同时计算了这些特征类别相关的统计参数,并以这些特征作为语音情感特征数据用于情感识别。(2)人脸表情特征提取,本文提出了改进的局部二值模式(LBP)表情特征提取算法主要提取人脸的眼睛和嘴巴两个部位的纹理特征。该算法的目的在于保证表情识别率,同时尽可能地降低特征数据的维数,减少计算量。(3)语音与表情特征的融合,本文根据语音和表情的情感特征,提出了语音与表情特征的直接融合算法和语音与表情特征的融合优化算法。语音与表情特征的直接融合算法主要解决两种模态特征维数上差异;语音与表情特征的融合优化算法考虑两种模态特征的联系与差异,提出先融合,后利用主成分分析(PCA)方法进行降维优化处理,再进行情感分类。(4)双模态情感识别,本文采用支持向量机(SVM)算法进行情感识别的仿真实验。该算法对小样本、非线性分类问题具有很强的分类能力。在SVM参数优化问题中,本文提出了改进的网格搜索参数优化算法,该算法基本思想是先通过基本的网格搜索算法进行粗搜,确定参数的范围,然后再在此范围内进行精搜,找到最优识别率的参数组合。仿真实验验证了上述算法的有效性。
其他文献
工业控制系统运行的初期往往可以运行在优良的状态下,但是随着时间的推移,其性能将不能维持在原有的最优状态上,存在缺陷的控制系统将会导致诸多问题,因此越来越多的专家学者
论文在分析图象处理、模式识别的基础上,设计并实现了一个新型的指纹自动识别系统.对于指纹的自动摄入、识别等技术都进行了深入的讨论,同时通过实践证明这种方法不仅具有较
面向仪器作为传统自动测试系统(Automatic Test System,ATS)测试环境的重要开发特性,导致测试系统具有较差的通用性,具体表现在测试仪器不可互换、测试程序集(Test Program S
控制领域中的一大难点就是测量与产品质量非常相关的但是难以直接测量的参数。这个问题未能得到有效解决的原因可能是出于对经济成本的考虑,也可能是传统的技术无法实现直接
该文是在国家自然科学基金项目:"电梯交通系统的智能控制及最优配置研究"支持下进行的研究.电梯系统的智能群控所要解决的是一个复杂的、具有非线性、不确定性目标随机系统的