论文部分内容阅读
人体的位置检测和关键点检测都是计算机视觉中极具挑战性的任务。在最近的研究中,基于深度卷积神经网络的方法取得了比传统方法更大的进步。然而现有的方法仍然存在一些问题,本文针对这其中的人体位置检测、单人和多人人体关键点检测进行了研究,主要工作有:(1)提出并实现了一种基于深度学习的人体位置检测方法,该方法扩展了通用的物体检测框架Faster R-CNN来做行人的位置检测,在引入了多尺度的特征后,解决了对小尺寸人体位置检测不够敏感的问题。该方法在KITTI行人检测数据集上的平均准确率超过了当时最好的MS-CNN,在Caltech行人检测数据集上比当时最好的RPN+BF的缺失率更低。(2)提出并实现了一种单人人体关键点检测方法,改进了最新的Stacked Hourglass模型,扩大了网络中神经元的感受视野,尝试了多尺度的融合,解决了 Stacked Hourglass模型对人体的尺度变化不敏感的问题。该方法在MPII单人关键点检测数据集上取得了比当时的Stacked Hourglass模型更高的PCKh值。(3)提出并实现了一种多人人体关键点检测方法,引入实例分割中的判别损失函数进行人体关键点的检测,同时还提出了一个新颖的人体候选框组合策略。该方法在MS COCO数据集上进行了可行性的验证,取得了比当时最新的Associative Embedding更好的检测结果。