基于深度学习的目标跟踪算法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:tjn000800
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机信息技术和深度学习算法的发展,作为计算机视觉领域的热门方向之一的视觉跟踪技术在深度学习算法的协助下,逐渐成为了人工智能领域及物联网感知层的重要技术之一。视觉技术成为了人类和计算机认知世界的重要途径之一,并且基于深度学习方法的计算机视觉技术日渐被应用于军事作战和社会生活的各个方面。例如,在现代化战争中占据重要地位的精确制导武器采用视觉跟踪技术提高打击目标的击中率;随着5G时代的到来,处于人工智能热潮中的自动驾驶行业也采用视觉跟踪技术实现车辆行人轨迹的跟踪预测。本文以计算机视觉技术中的视觉跟踪技术为背景,针对视觉跟踪技术中的单目标跟踪技术存在的问题进行深入分析研究,具体工作如下:首先,针对基于候选区域的孪生神经网络目标跟踪算法中特征提取网络的参数量大,算法结构分支复杂,抑制算法运行速度提升的问题,本文在此算法基础上改进提出了一种基于特征相关性分类回归的轻量级跟踪算法。该算法首先调整了特征提取网络层结构参数,缩减网络模型参数量,其次根据特征间相关性响应结果特征进行目标的类别和边框预测,进一步实现算法的简化及性能增强。其次,为了解决预训练的特征提取网络模型不能提取到通用表观性能好的目标图像特征问题,本文提出了一种融合显式上下文特征映射的跟踪改进算法。此算法的提出受贝叶斯推理启发,融合目标的显式上下文信息,获取更具通用表征性的高层语义特征,通过一种高维特征降维可视化的方法验证此算法的有效性。再次,针对基于候选区域的孪生神经网络目标跟踪算法在不更新目标模板的前提下,目标模板可能包含大量背景信息,导致特征提取网络提取到混杂着大量背景信息的图像特征,本文提出基于特征相似度分离前景与背景特征的跟踪算法,充分利用前景特征与背景特征的潜在价值用于目标搜索,完成跟踪任务。最后,基于python开发语言和pytorch深度学习神经网络开发框架完成了算法的实现验证。实验结果表明,本文提出的算法均能实现单目标的稳定跟踪。
其他文献
随着城市轨道交通行业的迅猛发展,地铁建设与运营公司对自动售检票(Automatic Fare Collection,AFC)系统的功能和可靠性关注也逐渐加强,在系统运行前需进行严格的测试。而作为AFC的终端设备之一的自动检票机,对其测试系统的研究就具有重要的意义。本文研制了一套24小时无人值守的自动检票机自动化测试系统,然后对所设计的测试平台进行了验证,并对模拟刷卡装置的控制算法进行研究,以提高其
随着航空航天技术的发展,被拦截目标的速度越来越高、机动性越来越强、干扰措施越来越多,传统导引律和现代制导律难以满足战争的反导拦截要求。此外,某些特定的作战任务对拦截末端的攻击角度具有一定的要求,因此适应现代战场复杂作战环境的新型制导武器是各国夺得战争主导权的重要手段。滑模变结构控制对于系统参数不确定性和外界干扰具有不变性,因而被用来设计制导律,但变结构开关项所引起的抖振会降低控制系统的动态品质。R
在传统的光学成像中,成像系统简单化和高成像质量往往是一个矛盾的问题,为了解决这个问题,本文在简单光学系统中,基于计算自适应光学技术,对成像系统像差的校正做了研究,使光学系统直接成的像作为中间像,像差校正后的像为最终像,间接提高成像质量,这一研究有望降低光学系统设计的难度。本文基于衍射传输理论和相位恢复算法,建立了光学系统光瞳函数的求解模型,并分别用梯度下降法、Fletcher-Reeves(FR)
文章首先论述了传统媒体的局限性,探讨广播电视媒体与新媒体融合的必要性,分析新媒体对广播电视媒体的影响,以及将两者进行融合发展期间遇到的问题,提出新时期推动广播电视媒体与新媒体融合发展的有效策略。
在机场安防体系中,机场围界有效的保障了机场内部的安全。当前机场围界以人工巡检为主,因此利用机器人进行围界防入侵巡检工作,能够减轻工作人员劳动压力,有效提高巡检效率。本文从移动视觉检测角度,设计开发了一种机场围界巡检机器人系统,主要完成了如下的研究工作:介绍了机器人系统的总体设计,对轨道机器人进行了相关硬件选型,并设计了上位机软件总体架构。提出了一种针对移动巡检时动态背景下的运动目标检测方法,该方法
视觉目标跟踪技术作为计算机视觉研究的重点方向之一,在视频监控、智能驾驶和人机交互等众多领域都具有广阔的应用前景。随着近些年来跟踪领域的飞速发展,目标跟踪算法的精度越来越高,实用性越来越强。然而,由于实际环境复杂多变,在实际应用中实现精确、鲁棒的跟踪依然是一个很大的挑战。鉴于此,本文对基于相关滤波和孪生网络(Siamese网络)的目标跟踪算法进行了深入研究,主要内容如下:(1)研究了目标跟踪的基本流
在导弹生产生命周期中,装配作为其最后一道生产工序,其中装配质量很大程度上会影响导弹整个生产质量。为了保证装配的质量,最关键是需对其电气和机械性能进行评估。针对于前者电气性能,目前普遍的做法是采用模式识别结合工程师经验的方式对进行评估,然而这种方式每次仅能对单维度进行分析,自然地效率和准确度都相对较低。蚁群聚类算法是一种用于群聚问题的群智能方法,其灵感来自于将尸体聚类并对其幼虫进行分类的蚁群行为。与
巨大的市场需求,方便快捷的购物方式,使得自助售货机成为线下零售行业研究的热门方向。但是,目前主流的自助售货机商品识别技术存在各自缺点,RFID标签易撕毁,纯重力识别种类受限,视觉识别误判度高,多传感器融合成本高。近年来深度学习的目标检测技术快速发展,为自助售货机的商品识别带来新的方法,但是深度学习模型复杂,参数冗余,计算负荷较重。本文以自助售货机为应用背景,主要研究了商品识别算法,具体包括:(1)
近几年,随着网络通信与传感器技术的迅速发展,结合网络控制与视觉伺服的网络视觉伺服控制系统获得了越来越多的关注。与传统的点对点控制结构相比,网络视觉伺服控制系统有着诸多优势,例如连线简单,灵活度高,采样信息丰富等。然而,在实际应用中,其输出往往带有采样与时延,且系统受到非线性,未知输入扰动以及输出测量噪声的影响。本文综合考虑了上述采样、时延、未知输入扰动以及测量噪声等问题,将重点进行网络视觉伺服控制
微纳结构检测手段不断发展,现在主要使用的是白光干涉显微的检测方式,但是由于台阶边缘处的衍射,造成台阶边缘处会出现蝙蝠翼效应的伪影,严重影响到高度信息的获取,这种现象在台阶横向尺寸上达到分辨率极限时尤为明显。因此针对蝙蝠翼效应问题,探究白光干涉显微成像中横向分辨率与纵向分辨率的影响关系,寻找抑制或减小蝙蝠翼效应的有效方法,对正确提取微观形貌的三维信息有重要的科学意义与应用价值。本文探讨了蝙蝠翼效应产