基于有缺陷数据集的深度语义分割与目标跟踪算法研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:Ling_cheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义分割和目标跟踪等高级视觉理解任务,是计算机视觉领域的重要研究问题。近年来,深度学习的兴起使语义分割和目标跟踪算法取得了长足进步。由于深度学习在提取特征方面具有显著的优势,研究者们相继提出网络层越来越深、设计越来越复杂的卷积神经网络。这些深度学习算法不断刷新公开数据集上的性能指标。然而,这些深度神经网络模型的训练依赖大规模带标签的数据集。目前的高级视觉数据集却存在如下缺陷:1)语义分割数据集的训练样本不平衡问题;2)语义分割数据集的精细样本标签稀缺问题;3)目标跟踪数据集缺乏对抗样本带来的安全隐患等,这些数据集缺陷很大程度上限制了高级视觉算法的发展。因此,本文针对这些数据集缺陷问题展开基于深度学习算法的研究。首先,针对语义分割的样本不平衡问题,我们提出基于深度模型和损失函数的改进,并构建了真实场景的语义分割数据集,实验证明提出的算法对小样本的语义类别分割有重要的性能提升。其次,针对视频语义分割数据集的精细样本标签稀缺问题,我们提出一种弱监督学习算法,充分利用有限的弱标签和视频时序信息,公开数据集上的实验结果证明提出的算法达到最佳性能和实时运行速度。最后,针对对抗样本问题,我们分析了视频目标跟踪的对抗样本生成原理和方法,通过模拟对抗样本对几种不同跟踪算法的白盒攻击,提出可能的防御方向。本文的主要工作和贡献总结如下:1.本文全面概述了基于深度学习的视频语义分割现状,对现有的深度学习方法进行分类解析和深入对比;对公开数据集与评价指标进行全面总结;对公开数据集上的性能表现进行横向对比分析;并展望了未来可能的发展方向。2.提出了基于非平衡样本的语义分割算法,提出Focal Hinge损失函数来训练基于编解码结构的跨接深度卷积网络,缓解了语义分割算法的样本不均衡问题;构建了真实场景下的语义分割数据集,改善了语义分割算法的场景局限性。3.提出了基于弱标签样本的视频语义分割算法,充分利用基于点标注的弱监督信息和视频流的时序信息进行弱监督学习。提出记忆流蒸馏的训练模块,提升了分割准确率的同时达到实时运行速度。4.分析了视频目标跟踪算法的对抗样本的生成原理和方法,通过研究对孪生网络结构等主流跟踪器的白盒对抗攻击算法,分析对抗样本对目标跟踪算法的威胁程度,并提出该任务未来可能的防御方向。
其他文献
在新药研发早期,分子模拟技术的应用能够大大缩短研发时间,降低研发成本,是发现候选化合物的重要策略。糖皮质激素受体(Glucocorticoid receptor;GR)和雄激素受体(Androgen receptor;AR)属于核受体家族中的经典核受体,其功能紊乱往往与系列疾病的发生发展密切相关。临床上的多种药物均为靶向GR或AR的活性分子,但是其不良副作用以及耐药性的产生都限制了使用,开发针对这
LED器件的出现,开启了人类照明革命,也使无线光通信成为可能。相较于频谱资源短缺的传统无线射频通信技术,无线光通信由于拥有无需授权的丰富频谱资源、高保密、绿色和无电磁辐射的特点,已经成为未来6G通信的潜在关键技术之一。利用Ⅲ-氮化物半导体材料的优良特性,本文研制出了光电转化效率高、探测距离远、感应灵敏度强的超薄GaN基同质集成芯片;面向无源节能、绿色环保的下一代智慧照明应用场景,基于量子阱二极管芯
“分享”是网络社会的核心文化之一,作为社交媒体的主力军,年轻人往往在不同的社交平台上分享不同的内容,扮演不同的人设。研究的核心问题是:青年群体如何在多元的社交媒体平台中进行内容分享?本文所研究的“分享”,关注的是在社交平台中所进行的状态更新,即年轻人究竟在这些社交平台中怎样发布内容。研究通过半结构深度访谈以及问卷调研的方式进行数据收集,以“结构化”理论为基本框架,采用“媒介二重性”以及“适应性信息
临界拟线性薛定谔方程在等离子体物理学、流体力学、冰川学、人口动力学等学科中有着广泛应用,对这类方程的研究具有重要的现实意义。因此,近几十年来,临界拟线性薛定谔方程的相关问题一直是非线性分析及其在椭圆方程应用领域的研究热点之一。本文主要根据变分学和椭圆方程理论研究几类全空间上临界拟线性薛定谔方程的多解性,包括系数函数有界的修正型薛定谔方程,系数函数无界的修正型薛定谔方程和临界-Laplacian方程
随着我国城镇化水平的提高,城市人口越来越密集,人员密集场所的数量也不断增加,人员密集场所下的火灾、踩踏等事故灾害对人民生命财产的威胁也与之俱增。因此以城市内的各种大型综合体、高层建筑等为代表的人员密集场所的人员安全得到了越来越多的关注,建筑内人员疏散规律的研究也愈发受到重视。本文在空间分割的思路下,将建筑内疏散研究划分为建筑内水平疏散过程研究、建筑内水平疏散过程中寻路机制研究和建筑内垂直疏散过程研
本文主要研究二维共形场论的手性形变理论。我们构造了二维共形场论的手性形变理论的配分函数,并证明了Dijkgraaf的主方程。在自由-(7(8系统的手性形变理论中,我们使用费曼图构造了该系统的关联函数并建立了量子主方程和手性同调的一个精确联系。我们提出了一个一般的数学框架来研究非线性-模型的微扰论。在这个框架下我们细致的研究了拓扑量子力学,并建立了拓扑量子力学和代数指标理论的严格联系。作为另外一个应
海洋环境下因氯离子侵蚀而导致的混凝土结构表观劣化问题,是海洋土木工程结构设计建设需要面临的主要挑战之一。如何对海洋环境下的混凝土结构进行耐久性设计和性能控制,是此类工程项目的设计部门和建造单位需要解决的重要问题。耐久性可靠度定量设计方法是解决该问题的科学手段,已被用于港珠澳大桥工程的结构耐久性设计,并首次写入了《混凝土结构耐久性设计标准》(GB/T 50476-2019)。但该方法由于以钢筋脱钝为
地震定位和地震层析成像是地震学反问题中非常基本和重要的课题。近些年,随着数值算法和计算能力的快速发展,人们具备了通过直接求解波动方程来反演地球内部结构信息的能力。相比于传统的射线方法,新方法不依赖高频波假设,所以可以给出高分辨率的反演结果。因此,上述方法也逐渐成为地震学中的主流研究方向之一。本论文针对传统地震定位方法面临的计算代价大、收敛范围小和定位精度低的困难,提出了一系列解决方案。在2范数下,
在疫情影响下,许多企业面临着生存危机。这要求企业必须紧跟市场发展的趋势,不断进行优化与改善。当前,生产领域的成本压缩空间已经趋于饱和状态,而物流作为第三利润源泉,通过降低物流成本而获益的可能性越来越大。其中,仓储作业成本是物流总成本的重要组成部分,对仓储作业进行优化是实现物流成本控制的重要环节。在仓储作业中,货物的存放位置直接关系到各工作环节的工作效率,影响到整个配送中心的服务水平。合理的货位分配
ISG15是干扰素刺激基因15(Interferon-stimulated gene 15)的表达产物,经干扰素诱导而高水平表达。因其结构域泛素(ubiquitin)类似,可以与目标蛋白质形成共价结合的复合物,被称为蛋白质的ISGylation修饰。与泛素化修饰(ubiquitination)类似,参与ISGylation修饰的酶包括ISG15活化酶E1,ISG15偶联酶E2和ISG15连接酶E3