论文部分内容阅读
提出了一种适用于多视角人体动作识别(Multi-view Human Action Recognition,MVHAR)的深度神经网络模型——CNN+CA模型(Convolutional Neural Network plus Context Attention Model)。该模型由卷积神经网络(Convolutional Neural Network,CNN)模块和上下文注意力(Context Attention,CA)模块两部分组成。其中,CNN模块能够自动学习多视角融合特征,CA模块能够自动突出特征中有利于识别的区域,进一步提高特征的判别力。提出了一种基于序列匹配的识别方法。在IXMAS 数据集和i3DPost 数据集上的实验结果表明,所提方法在识别精度上超过了其他同类方法。