基于YOLOv4+DeepSORT的多目标跟踪算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:xiaogege0451
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多目标跟踪技术作为计算机视觉中的一个重要研究方向,已被广泛应用于自动驾驶、智能监控、国防军事及人机交互等多个领域。基于检测的多目标跟踪策略由于在跟踪性能上的优势,成为近年来的研究热点,并获得显著成果。但仍存在以下问题:旧目标消失和新目标的出现、频繁的目标遮挡、目标运动所导致形状或尺度发生变化及跟踪过程中的不可靠检测等,对多目标跟踪算法的准确性和鲁棒性带来巨大的挑战。本文基于检测的多目标跟踪策略,对当前目标检测及目标跟踪算法的不足进行研究与分析,主要的研究工作如下:1.考虑到YOLOv4目标检测算法存在小目标漏检率较高以及抗遮挡能力较差的问题,本文从三个方面进行改进:针对K-means聚类算法对初始聚类点依赖较大的问题,采用K-means++算法对数据集聚类重构Anchor Box,提高定位精度与目标检测准确率。针对小目标漏检率较高的问题,对YOLOv4特征融合结构进行修改,在原有基础上新增一个检测尺度,用于提取浅层信息。针对检测中的遮挡问题,引入CIOU-NMS算法,过滤冗余候选框时采用CIOU评判标准,提高模型的抗遮挡能力。实验证明,改进后的YOLOv4目标检测算法在不影响检测速度的情况下,降低了小目标漏检及误检率,在提升检测精度的同时具有良好的抗遮挡能力。2.考虑到DeepSORT多目标跟踪算法存在跟踪性能较差,身份切换次数较高的问题,本文提出了一种基于YOLOv4的Deep SORT多目标跟踪算法。针对宽残差网络提取外观特征的局限性,本文采用一种人体区域对齐的网络提取行人特征,提高追踪器的识别能力。针对多目标跟踪场景中因目标检测漏检、误检带来的跟踪失败问题,引入轨迹评分机制,产生一个统一检测框和预测框的标准置信度,降低身份切换次数。针对跟踪过程中的严重遮挡问题,动态设置运动特征和外观特征的权值,提高算法的抗遮挡能力。实验结果表明,本文算法在MOT16数据集上有较好的跟踪性能,同时在应对目标发生姿态变化、尺度变化及遮挡情况下也能保持目标的稳定跟踪。
其他文献
大数据时代,视频数据量在不断增加,视频编码技术也在不断发展。实际应用中H.264和高效视频编码(High efficiency video coding,HEVC)标准共同存在,通用视频编码(Versatile Video Coding,VVC)标准也逐渐登上历史舞台。由于不同编码标准的编码器在以后很长一段时间都会共存,这使得视频转码技术的研究十分具有意义。现存的视频转码算法常存在编码复杂度高和压
学位
人脸表情识别作为情感研究的重要组成部分,是实现人与机器交互的必要条件,具有重要的研究意义及潜在的商业价值。本论文就人脸表情识别过程中两个重要环节进行了分析,分析了现有的人脸表情特征提取算法以及人脸表情分类识别方法中存在的不完善的地方,并且提出了解决方案。本文研究的主要内容有:1.针对局部梯度二值模式(Local Gradient Binary Pattern,LGBP)只能在单尺度模板下提取人脸表
学位
通信信号调制类型识别是一种典型的模式识别问题,被广泛应用于信号确认、无线电侦听、电子对抗、信号监测和分析等领域。在通信环境日益密集,信号调制类型日益丰富的情况下,信号的调制识别变得愈加困难。近年来,随着机器学习的快速发展,深度学习算法在模式识别领域得到广泛应用,并逐渐用于解决信号调制识别问题。本文主要研究基于深度学习的信号调制识别算法,主要内容如下:1.针对现有方案在低信噪比环境下识别准确率较低的
学位
随着科技的发展,各行各业对钢材的需求量不仅越来越大,而且对质量的要求也是越来越高。精确测量钢水的温度可以提高钢铸工件的合格率,降低燃料成本,是推动钢铁自动化生产必不可缺的一步。目前通常采用红外测温技术全面监测冶炼炉中的钢水温度。但由于生产现场环境复杂,工作过程中受到环境温湿度、测温距离、发射率和粉尘等多种因素的影响,限制了测温精度。因此,本文将针对主要的影响因素,提出有效的温度补偿方法,以提高红外
学位
随着4G的全面普及和5G的加快部署,各种互联网新兴应用层出不穷。作为集中式无线接入网的核心部分,传统的移动前传面临着成本、传输速率和频谱利用率等方面的挑战。基于模拟光载无线的高效移动前传具有低成本、高传输速率和高频谱利用率等优势,已成为国内外专家学者的研究热点。为了便于高效移动前传中系统设备的控制和管理,以及与通用公共无线接口的背向兼容性,控制字与无线信号需要进行同步传输。当前,业界主要采用的基于
学位
随着人机交互技术的飞速发展,人们越来越注重机器人情感状态对整个交互过程的影响,重点关注机器人的情感响应过程和情感引导过程。以增强机器人在交互过程中的情感计算能力为目的,赋予机器人独特、主动的特点使其能够对参与人的输入情感进行响应并引导参与人情感向目标情感逐步过渡。该文先介绍机器人情感计算(Affective Computing,AC),然后针对实现机器人情感响应和对参与人情感引导的问题,构建不同的
学位
视觉目标跟踪是计算机视觉领域的一个重要研究方向,其任务是给定视频序列中首帧目标的尺寸和位置,在后续视频帧中持续输出目标的状态信息。随着近年来计算机视觉技术的发展,目标跟踪技术已经被广泛应用到众多领域,如智能安防、无人驾驶、虚拟现实等。但目前目标跟踪任务仍面临目标快速形变、非刚性形变、尺度变换、前景-背景判别等难题和挑战,导致复杂场景下无法对目标进行准确鲁棒地跟踪。本文针对上述问题,提出了两种基于深
学位
随着通信业务的爆炸式增长,海量节点将会接入到物联网中,如何延长能量受限节点的运行周期将会成为大规模部署物联网亟待解决的问题之一。为了满足传输需求和降低能耗,将反向散射通信(Backscatter Communication,Back Com)技术与无线供电技术结合形成无线供电反向散射通信网络(Wireless-powered Back Com Networks,WPBCN)。WPBCN被认为是解决
学位
针对海水海砂再生骨料混凝土(SSRAC)在柱构件中的应用问题,本研究采用组合设计的方法,提出工程水泥基复合材料(ECC)外壳约束SSRAC柱的形式,对其施行轴心/偏心受压试验.结果显示,ECC外壳可对SSRAC形成良好的约束作用,构件破坏时表现为受压区及受拉区的裂缝宽度增大,材料未压溃.轴心受压时,ECC外壳约束SSRAC柱的峰值荷载相比整浇SSRAC试件提高15%,但其轴向刚度降低;偏心受压时,
期刊
随着移动通信网络的飞速发展,各种新兴移动应用大量涌现,资源受限的移动设备,难以为用户提供满意的服务体验。移动边缘计算通过将云端资源下沉分发至网络边缘,给用户带来低时延、高可靠和高带宽的网络服务,极大地提高用户服务体验。无人机辅助通信技术的出现,为移动通信领域带来了新的机遇。无人机与地面用户以较高概率进行视距通信,从而降低传输时延。同时,无人机部署灵活,可有效地解决热点区域的网络拥塞问题。将无人机网
学位