基于注意力机制和无监督学习的行人重识别算法研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:laiyongxuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别技术的主要目的是利用视觉外观信息,在跨摄像机的监控网络下检索到特定的人,该技术是智能监控的核心技术之一,其具有很广泛的现实应用场景,如视频监控,人的行为分析,多目标跟踪等。近年来,越来越多的研究人员将卷积神经网络应用到行人重识别任务中,用于提取行人特征。但是由于背景噪声,相机风格不同,光照条件不同等因素的影响,导致行人的外观产生较大的变化,这些挑战增大了行人重识别任务的难度;另外,由于行人重识别数据集制作困难,且当前大量的行人重识别模型泛化能力弱,这些问题严重阻碍着行人重识别在现实生活中的广泛应用。针对上述问题,本文提出了两种不同的算法分别来解决相应的问题,主要工作如下:(1)为了提取更加具有表征能力的行人特征,以解决背景噪声,相机风格变换,光照变化等导致行人外观产生较大变化的问题。本文提出了一种基于多信息融合的全局注意力模块(Multi-information Fusion based Global Attention,MIFGA)。该模块可以从多方面获取特征图中空间位置之间和通道之间的关联信息,从而更好地指导注意力的学习,促使模型提取到更加具有判别性的特征。具体来说,MIFGA包含空间注意力子模块MIFGA-S和通道注意力子模块MIFGA-C。在空间注意力中,由于深层特征中具有更多的语义信息,所以其中也会包含了更多的拓扑信息,例如行人肢体特征之间的拓扑信息。为了挖掘特征图中潜在的拓扑信息,本文进一步提出了自学习图卷积网络(Self-Learning Graph Convolution Network,SLGCN)。MIFGA-S通过融合局部特征的语义信息和空间拓扑信息来指导空间注意力的学习。在通道注意力中,利用通道与通道之间的亲和度信息学习对应的权重,通过加权叠加的方式将注意力聚焦到更加重要的通道上,以此来提升特征图的表征能力。MIFGA-C通过融合通道语义信息和通道亲和度信息来指导通道注意力的学习。通过在公共行人重识别数据集上进行大量的对比实验和消融实验,证明了本文提出的MIFGA可以有效提升行人重识别模型的性能。(2)由于行人重识别数据集制作困难,且现有的行人重识别模型泛化能力弱,导致行人重识别技术难以在现实生活中得到广泛应用。所以本文采用无监督行人重识别的设定,即无需使用具有行人ID标记的行人重识别数据集,这种方式大大地减少了数据集的制作成本。本文提出了一种基于非对称双网络相互教学的无监督行人重识别算法(Asymmetric Double Networks Mutual Teaching,ADNMT)。该算法利用两个非对称网络通过聚类相互生成伪标签,并通过交替训练进行伪标签的更新和优化。具体来说,ADNMT包含两个非对称网络,一个是多粒度网络,其可以提取行人的多粒度特征,并对应多个分类器。另一种为传统的单分支主干网络,用于提取行人特征,并对应一个分类器。此外,本文利用行人图像的相机ID,设计了相机间的相似度补偿(Similarity Compensation of Inter-Camera,SCIC)和相机内的相似度抑制(Similarity Suppression of Intra-Camera,SSIC)来优化行人特征之间的相似度计算,进而减小相机风格的变化对无监督行人重识别性能的影响。本文通过大量实验表明,相比于其他先进的无监督行人重识别算法,ADNMT可以更好解决无监督行人重识别的问题。
其他文献
法国一直处于欧盟区块链革命前沿。在推动区块链技术发展过程中,法国政府与加密生态系统的相关参与者相互合作建立了监管框架,致力于在推动法国区块链生态发展的同时避免过分监管抑制创新发展。本文首先系统梳理了法国区块链技术发展三大阶段;其次,阐述法国区块链国家战略主要政府工作;再次,从加密资产发行监管、交易监管、税收监管、流通和反洗钱监管四个方面出发,深度解析法国区块链技术监管框架;最后,聚焦保险业、银行业
在百年变局背景下的数字化时代,央行数字货币成为世界各国关注的焦点,更是维护国家金融安全的重要抓手。本文将国家金融安全的内涵扩展为金融体系安全、金融主权安全和金融技术安全三个维度,探讨央行数字货币对国家金融安全的影响。研究发现,一方面,央行数字货币可以加强金融信息安全、减少洗钱及恐怖主义融资等金融犯罪风险、降低私人数字货币对金融主权安全的威胁,有助于维护国家金融安全;另一方面,央行数字货币在发展初期
随着互联网平台和大数据技术的快速发展,将云平台技术与传统菜场行业相结合,以线上线下相结合的形式,实现“互联网+菜市场”。结合已有的C2C和B2C商业模式,基于物联网技术,为顾客家庭安装一个与其用户身份绑定的触控屏,该触控屏与居住地范围内菜市场相互连接。由用户通过平台发起订单,平台根据用户已选择的多种条件,综合选择商家、商家根据订单抢单、交由送货员派送订单、用户收到订单并进行评价、平台统计评价。以这
目的:探讨白藜芦醇是否能通过调节肠道菌群,抑制PPAR通路治疗酒精性脂肪肝。方法:将28只C57BL/6J雄性小鼠随机分为四组,分别为对照组(Con组),白藜芦醇组(Res组),酒精性肝病模型组(Alc组),酒精-白藜芦醇治疗组(Alc_Res组)。所有小鼠液体对照饲料适应性喂养5天后,进入正式造模期:Con组、Res组小鼠给予液体对照饲料;Alc组、Alc_Res组小鼠给予酒精液体饲料,连续喂养
企业发展的核心内生动能是基层党组织,通过基层党组织的高质量工作开展,能够有效地推动企业形成内生合力,进而推动企业在新时代经济社会高质量发展中,贡献其应有的力量,产生更好的社会效益和经济效益。本文围绕新时代基层党组织工作的理解认识与作用展开讨论,并探索基层党组织在推动国有企业高质量发展中的工作路径选择,以期为基层党组织建设提供有益的参考。
目的 研究对经过急性阑尾炎术后的患儿进行非药物护理对其不同时段的视觉模拟评分法(VAS)及疼痛行为量表(FLACC)的变化。方法 随机选取该院在2020年1月—2021年3月所接收和治疗的经过急性阑尾炎术后患儿共100例作为研究对象,将其按照随机法分为一般组和研究组,每组50例。一般组对患儿进行常规护理,研究组对患儿进行非药物护理。对比两组患儿的护理效果。结果 术前,两组VAS评分及FLACC评分
<正>目前,我国高速公路总里程已超16万公里,国家高速公路网主线基本建成,覆盖了约99%的城镇人口20万以上城市及地级行政中心,对促进经济社会发展发挥了越来越重要的作用。与此同时,涉及高速公路安全监管的智能交通系统建设如全程视频监控管理系统、
期刊
随着计算机信息技术和人工智能技术的发展,人体行为识别成为最热门的研究方向之一,并广泛应用于人机交互、自动驾驶、智能家居、智能监控以及医疗保健等领域。传统的人体行为识别算法需要人工针对特定任务进行设计,且提取特征的过程比较复杂,导致效率低下、泛化能力差。近年来基于深度学习的三维卷积神经网络算法以端到端的方式提取行为特征、准确率高等优点替代了传统算法。但也存在一些不足之处,首先,三维卷积神经网络参数量
非遗助力残疾人就业是帮助残疾人就业的新模式。基于对江苏省常州市181个社区通过开展社区教育助力残疾人就业现状的调查,以及对常州市市级以上非遗项目传承人的访谈,总结了影响非遗助残就业的因素,提出了通过社区教育利用非遗助力残疾人就业的对策建议。