【摘 要】
:
随着人们工作生活节奏加快和压力增大,抑郁症已成为一种流行性精神疾病,当前社会存在抑郁症高发和专业医护人员严重不足的矛盾。情感计算领域的研究人员试图结合人工智能、心理学、生理学和认知研究,从人的音视频信息和生理信号估计抑郁状态,为临床抑郁症诊断提供一定的辅助。本文围绕音视频情感特征提取方法和抑郁症识别模型两个方面,对抑郁症自动评估进行了研究,并在听视觉情感挑战赛(AVEC2013和AVEC2014)
【基金项目】
:
国家自然科学基金项目《真实自发情感的听视觉多模态实时心理学连续维度分析》(61273265); 陕西省国际科技合作重点项目《面向心理障碍评估的自动情感与行为分析》(2017KW-ZD-14);
论文部分内容阅读
随着人们工作生活节奏加快和压力增大,抑郁症已成为一种流行性精神疾病,当前社会存在抑郁症高发和专业医护人员严重不足的矛盾。情感计算领域的研究人员试图结合人工智能、心理学、生理学和认知研究,从人的音视频信息和生理信号估计抑郁状态,为临床抑郁症诊断提供一定的辅助。本文围绕音视频情感特征提取方法和抑郁症识别模型两个方面,对抑郁症自动评估进行了研究,并在听视觉情感挑战赛(AVEC2013和AVEC2014)的抑郁症数据库上进行了实验验证,具体工作和创新点如下:1.针对现有手工设计特征维度高和特征聚集方法需要手工指定聚类个数的问题,提出了一种基于人脸动态序列描述子特征和狄利克雷过程高斯混合模型-费舍尔向量(Dirichlet Process Gaussian Mixture Model—Fisher Vector,DPFV)的抑郁症识别方法。首先基于中值鲁棒扩展的局部二值模式(Median Robust Extended Local Binary Pattern,MRELBP)特征,通过在面部视频序列上计算中心像素强度值和邻域像素强度值的动态纹理特征,提出了中值鲁棒扩展的局部二值模式-三维正交平面(Median Robust Extended Local Binary Pattern-Three Orthogonal Planes,MRELBP-TOP)动态描述子特征,以描述面部图像的局部和动态特征信息。然后在MRELBP-TOP帧级特征序列上,通过自适应确定聚类个数,采用DPFV进行视频子序列的全局特征提取,以挖掘MRELBP-TOP特征高层次的抑郁模式信息。最后采用带有交叉核的支持向量回归(Support Vector Machine for Regression,SVR)进行抑郁程度的估计。在AVEC2013和AVEC2014测试集上,抑郁程度估计值和真实值之间的均方根误差(Root Mean Square Error,RMSE)分别为9.20、9.01,优于当前绝大部分基于面部视频的抑郁症识别方法的性能。2.针对目前抑郁症识别方法没有有效地从序列信息中刻画长时特征表示的问题,提出了一种基于三维卷积神经网络(3D Convolutional Neural Network,3D-CNN)和时空注意力机制Conv LSTM(Spatial-Temporal Attention Based Conv LSTM,STAConv LSTM)的抑郁症识别方法。该方法采用3D-CNN和STA-Conv LSTM模块来学习长时的、具有注意力的高层语义依赖信息,从而实现了端到端的抑郁症识别和分析。在AVEC2013和AVEC2014测试集上,RMSE分别为10.32、10.27,取得了比当前大多数基于面部视频的抑郁症识别方法更优的性能。3.针对深层视觉特征提取过程中微调深层模型需要大量人脸图像以及没有考虑多个预训练深层模型的并行性问题,提出了一种基于深层回归网络(Dep Net)的抑郁症识别方法。该方法采用少量的面部图像序列,通过并行微调多个二维卷积神经网络(2D Convolutional Neural Network,2D-CNN)进行深层特征的提取,然后采用动态时序特征聚集模块(Dynamics Temporal Feature Aggregation Module,DTFAM)在深层特征上聚集和抽象高层特征。在AVEC2013和AVEC2014测试集上的实验结果表明,效果优于当前大部分基于深度学习模型的识别结果。与三维卷积神经网络-循环神经网络(3D convolutional Neural Network-Recurrent Neural Network,C3D-RNN)相比,RMSE分别减少了1.19%、1.53%。4.提出了一种联合微调2D-CNN的听视觉多模态融合的抑郁症识别方法。针对语音输入,通过联合微调全局统计特征、语谱图、语音子片段,以及语谱图的MRELBP特征的2D-CNN模型,深层次融合多种语音信息,提升了抑郁症识别的准确度。在AVEC2013和AVEC2014测试集上,RMSE为10.00和9.98,优于当前基于语音的抑郁症识别方法的性能。对于音视频融合抑郁程度估计,通过联合微调VGG-Face人脸特征和语谱图的2D-CNN模型,在AVEC2013测试集上的RMSE为10.08,取得了当前听视觉多模态融合方法中最优的识别结果,在AVEC2014测试集上的RMSE为9.99,优于当前绝大部分听视觉多模态融合抑郁症识别方法的性能。
其他文献
绿色发展战略的实施和产业结构的优化调整使我国众多城市掀起高污染企业整改和搬迁的热潮,遗留的旧厂址则成为棕地。城镇化进程加快和人口增长使得我国城镇建设用地供需矛盾日益突出。加快修复城市棕地,促进棕地资源开发再利用,已经成为缓解这一矛盾的重要途径。当前,我国的棕地修复仍然处于初级阶段,立法、信息管理、融资机制,评估等方面尚不成熟,特别是资金短缺已经成为棕地修复进程缓慢的主要障碍之一。选择合理、可行的融
大推力液体火箭发动机是载人登月、深空探测等重大航天活动的主动力,其性能和可靠性直接关系到我国航天事业的发展。大推力发动机结构复杂、服役环境苛刻与极端,结构动力学问题非常突出,对发动机自身、火箭的工作可靠性与安全性均有着极其重要的影响,发动机结构动力学问题一直是运载推进系统研究的热点和难点之一,已成为解决发动机关键技术问题的基础学科。因此,论文紧密围绕我国在某大推力液体火箭发动机研制过程中结构动力学
因其高的比刚度、比强度以及优良的抗疲劳性能等特性碳纤维增强树脂基复合材料在航空、航天、风能发电等领域有着广泛的应用前景。然而,由于层合板复合材料层间无增强相,在冲击载荷作用下复合材料结构极易发生快速的分层扩展。而在冲击载荷下,层间裂纹的传播速度可能高达200–500 m/s,这显然不再是断裂静力学的研究范畴。另一方面,分层损伤严重影响复合材料结构的完整性及降低其剩余强度。虽然,准静态下和动态下裂纹
相比于传统材料力学性能检测方法,压痕法在微损检测、原位检测、跨尺度测量及试验便捷性方面具备巨大优势。由于能够更好地满足检测结果的唯一性问题,球压痕已成为压痕检测领域研究的新热点。利用球压痕识别材料力学性能参数的核心在于识别算法的构建,而算法的合理性及可靠性则取决于对球压痕塑性变形机理的深入研究。目前,虽然众多研究者提出了各类算法用以获得材料的应力应变曲线、蠕变性能和断裂韧性等力学性能参数,但是对相
数值离散格式、湍流近似模型和计算网格是影响计算流体力学(CFD)模拟精度的主要因素,其中工程上常用的数值格式和湍流模型都经过了大量的标定,因而气动特性的影响规律较为明晰且应用经验丰富。然而,由于计算网格的生成缺乏统一标准,网格质量因人而异。并且,网格分布难以做到与流态匹配,计算结果与网格的相关性较强。传统的网格无关性研究必须生成多套网格尺寸递减的网格,人力及计算资源耗费巨大。本文开展耦合流场特征的
超高温陶瓷(UHTCs)改性C/C复合材料(C/C-UHTCs)结合了UHTCs优异的化学稳定性以及C/C复合材料良好的力学性能,是广泛使用的高温结构材料。然而,目前制备C/C-UHTCs复合材料的方法存在致密化效率低、UHTCs分布不均匀等缺点。化学液相汽化沉积(CLVD)是一种制备C/C复合材料的工艺方法,该工艺具有致密化效率高、操作简单,可对复合材料微观结构进行调控等优点。但目前将CLVD工
随着雷达探测技术的发展,包括飞行器侧向、前向和尾向在内的全方位隐身问题亟待解决。目前,针对侧向和前向的机翼等低温部件用吸波型聚合物基复合材料(PMC)研究较多,吸波性能较优异,但仍有待进一步提高。尾向的发动机尾喷管等高温陶瓷部件的吸波型陶瓷基复合材料(CMC)需要兼顾高温下的吸波和力学性能,基于化学气相渗透(CVI)方法制备的SiCf/Si3N4复合材料是当前的候选材料之一,但其现在吸波性能只能满
小说《飞越杜鹃巢》是20世纪60年代美国社会现实的缩影,通过对疯人院,护士长雷察德,迈克·墨菲以及其他病人的刻画,再现了20世纪60年代美国社会制度对人性与自由的压迫,具有深刻的暗讽意味。小说中不乏哥特式写作手法的影子,这种哥特手法也进一步加强了小说对社会现实的批驳。从故事背景,人物塑造,情节编排到主题刻画方面阐释哥特手法在小说中的体现,指出哥特手法的运用使小说对现实的批判更加富有力量。
水下目标定位技术在海洋开发和利用中扮演着非常重要的角色,由于声信号在水中的传播特性,使得水下声学定位仍然是水下目标定位的首选解决方案。其中,长基线/超短基线(Long Baseline/Ultra Short Baseline,LBL/USBL)组合声学定位系统是近年来被广泛研究和应用的水声定位系统。本文针对如何提高水下声学定位精度的问题,对LBL/USBL组合声学定位跟踪的若干关键技术展开研究,
随着多站点、多频段雷达探测技术的发展,对未来战斗机的隐身性能提出了更高的要求。发展可用于改善战斗机隐身性能的宽频(8~18 GHz)、强效(电磁反射系数≤-10 d B)吸波材料是实现未来战机全方位隐身的重要途径。业界公认,吸波材料需要满足“宽”、“强”、“轻”、“薄”的要求,此外,隐身战斗机用吸波材料的服役环境要求其具有高低温协同隐身性能。想要满足上述要求,须从吸波材料的电磁波损耗机制出发,通过