【摘 要】
:
随着计算机技术的进步,尤其是深度学习技术的发展,数字图像处理和计算机视觉技术已经逐渐自成体系。图像的语义分割问题作为计算机视觉的基本任务,因其可被用于辅助其它计算机视觉任务的实现,同时也受到越来越多的关注。图像语义分割对图像进行逐像素的分类,为图像中所有像素点分配语义标签,从而实现从像素级别理解图像内容,在自动驾驶、物体检测和跟踪、人机交互、场景识别与理解等领域都有着广阔的应用前景。本文总结了语义
论文部分内容阅读
随着计算机技术的进步,尤其是深度学习技术的发展,数字图像处理和计算机视觉技术已经逐渐自成体系。图像的语义分割问题作为计算机视觉的基本任务,因其可被用于辅助其它计算机视觉任务的实现,同时也受到越来越多的关注。图像语义分割对图像进行逐像素的分类,为图像中所有像素点分配语义标签,从而实现从像素级别理解图像内容,在自动驾驶、物体检测和跟踪、人机交互、场景识别与理解等领域都有着广阔的应用前景。本文总结了语义分割领域的现有算法,深刻认识到,传统基于深度学习的图像语义分割方法一方面性能非常依赖于数据集的质量,然而通常情况下,想要获取高质量的像素级标注数据是非常昂贵和耗时的。另一方面,在实际应用中,在特定数据集下训练的网络模型,通常只在当前数据集下具有良好的性能,用于相似数据集时性能会出现明显下降,从而限制了语义分割方法在现实情境中的应用。本文旨在提高遥感图像语义分割的精度,具体工作如下:(1)本文提出一种结合上下文信息和注意力机制的改进U-Net网络用于实现遥感图像的道路语义分割。传统遥感图像道路语义分割方法缺乏对多层次的道路特征的提取,没有考虑道路整体所具有的几何拓扑结构,使得最终的道路分割结果的结构不完整;同时在图像下采样特征提取的过程中图像的分辨率不断下降,丢失的空间信息难以恢复,使得提取的道路边缘不清晰。为解决此类问题,本文提出了结合上下文信息和注意力机制的改进U-Net网络模型,模型通过提取遥感图像的多层次特征来实现图像的上下文信息的提取和整合,确保对道路整体的几何结构特征的提取;同时,使用注意力机制模块来对通过跳跃连接向上采样过程传递的底层特征图进行权重调整,提升分割网络对于下采样过程中缺失位置信息的恢复,从而提高道路边缘区域的分割精度。此外,在公共数据集Deep Globe道路数据集上对算法进行验证,进一步证明了在编解码器网络的跳跃连接中引入注意力机制的价值。(2)本文提出了一种结合生成对抗网络和域自适应方法的无监督遥感图像道路语义分割算法。在遥感图像的获取过程中,由于卫星、拍摄设备,光照强度,季节等条件的影响,会使得不同数据集之间存在明显的域间差异,其中图像分辨率的不同对遥感图像的语义分割造成的干扰最为明显,这些因素导致的域间差异会造成了不同训练集下的遥感图像语义分割模型的性能下降。针对以上问题,本文将超分辨率的方法引入语义分割的网络中,通过整合图像超分辨率过程中的提取的不同分辨率的特征,来辅助语义分割网络的特征提取和信息恢复,从而减弱图像分辨率所引起的数据集的域间差异;同时采用基于生成对抗网络的域自适应方法来对源域和目标域的域间差异进行消除,最终实现目标域遥感数据集下的无监督的语义分割。(3)分别验证本文构建的无监督遥感道路语义分割模型在遥感道路分割数据集与传统的基于特征的域自适应方法和基于输出空间的域自适应方法在遥感数据集上的道路分割效果。实验结果表明,本文构建的引入超分辨率的对抗域自适应的网络在无监督遥感语义分割中具有更好的分割结果。进一步证明了图像的超分辨率方法对于图像的语义分割网络的辅助作用。
其他文献
伴随着外骨骼理论及技术的逐步成熟,外骨骼设备已广泛应用于社会的各个领域。考虑到由于矿井下有许多繁重的体力劳动,因此本文提出研制外骨骼机器人来辅助人工完成这些重体力作业。本文以矿用外骨骼机器人的驱动系统为研究对象,应用外骨骼运动学相关知识和软件建模及仿真等手段,对矿用外骨骼机器人的驱动系统进行了详细的分析研究。具体内容如下:(1)对外骨骼机器人的关节配置及驱动理论进行分析研究。根据拟人化仿生机械相关
近年来,随着物联网技术的不断发展,与物联网相关的环境感知、数据传输和云端计算等技术已成为热门的研究方向。物联网感知层的主要目的,是将物理世界的模拟信号转换为计算机能传输、存储和计算的数字信号。感知层中的主要任务是对用户和物品的定位,以及对用户的认证和行为动作的感知。其中用户认证部分是物联网感知层的关键技术,在对用户身份认证后,才能进一步提供个性化服务。本文重点研究采用射频识别(Radio Freq
随着移动互联网的快速普及,人们使用网络的目的也发生了巨大变化,电商平台的出现也极大的改变了人们的消费方式,随之而来的互联网评论信息也使得人们在进行决策行动之前有了更多的参考。就各大酒店预定平台使用过程来说,用户通过浏览酒店的评论信息来获得更直观的判断。通过对酒店的评论数据进行情感分析,可以清晰地了解到用户对于酒店的客观评价以及入住体验,从而帮助其它用户进行快速决策,选到合适的入住酒店,降低用户的选
随着人工智能不断发展,人机交互在现实生活中也越来越重要,实现良好人机交互离不开对情感的识别。除此之外,情感识别在医疗卫生,国防安保,商业金融等领域也有着十分广泛的应用。如今情感识别可以分为基于生理信号的情感识别和基于非生理信号的情感识别,其中基于人脸的情感识别是基于非生理信号情感识别的重要部分。基于人脸的情感识别有着方便快捷的优点,但是在人为主观的刻意隐藏情况下,会造成识别不准确的问题;使用生理信
互联网和人工智能技术的快速发展为信息的传播和有效利用提供了时宜的契机,但是随着信息量的大量积累,信息过载问题已然成为困扰人们的重要问题,为此个性化推荐算法应运而生。推荐算法不仅可以节省用户的搜索成本,增强用户体验,而且可以将有价值的产品推荐给用户,增强实体制造商的积极性。因此,如何将有价值的产品推荐给有真正需求的用户是推荐算法研究的重要课题。融合社会化关系的个性化推荐算法不仅可以传递好友间的信息,
图像信息是人们感知世界的一种重要形式,随着人工智能的发展,人们对图像处理的要求越来越高,在图像处理的整个过程中,图像分割处于较为基础的地位,对图像识别的准确性有很大的影响,因此图像分割在工程领域和日常生活中都有重要的作用。长久以来,研究者们在图像分割领域进行了深入的研究,图像分割的方法也越来越多样化,但是至今仍然没有一种通用的方法,所以有关图像分割的探索一直在继续。其中模糊C均值(Fuzzy C-
河域边界线指的是河域中波动的水面与河滩的瞬时交界线,其位置信息的实时监测在河域自动化测流中起着十分重要的作用。现为实现河域测流平台在测流时对河域边界线的自动实时视觉识别与定位而可自动布置测流点,达到河域全自动化测流的目标。现针对河域边界线的实时视觉识别提出方法研究,接着对识别到的边界线进行坐标定位并应用于测流点布置。本课题针对水文站的实际测流工作需要,首先进行了视频监控系统的搭建,实现了研究对象的
近年来,我国的交通运输业成为了发展较快的行业之一,成为了构成国家经济中的一个核心部分。交通基础设备建设关联了社会中的各种环节,对城市以及国家的经济增长起着关键作用。全覆盖的建设高速网络,可连接部分人口较少的城市,提升居民出行便利性,支撑新型城镇化发展。据相关部门的规划,在十三五结束时,我国的道路可以行车的总公里数将实现15万公里的突破,至2020年,我国在城市建成区已经拥有超过每平方公里8公里的平
特殊场景常常面临样本不易获取的问题,由此造成该场景分类识别任务的样本缺乏。针对场景样本缺乏的问题,利用辅助域(或称源域)构建迁移学习模型,提高困难场景中样本分类准确度与性能是当前研究的热点与难点。以本地森林火灾预防为例,由于样本缺乏,对本地森林火灾图像检测较困难,近几年森林火灾频繁发生,使提高本地森林火灾图像检测准确率变得尤为重要。因此,解决本地森林火险多分辨图像分类识别问题并提高烟雾样本分类准确
随着医学领域的随访工作逐渐被重视,在医学图像处理领域,通过相关分析方法获吗取随访信息的工作也变得越来越重要。就肺癌筛查工作而言,在早期阶段的诊断过程中,医师常需要根据分级报告对当前CT的筛查结果进行评估并给出随访筛查的建议。而随着随访时间和随访次数的推移,医师对于随访类筛查结果的判断往往容易忽视时间信息及相关随访信息从而造成误诊和漏诊问题。同时,在肺癌的计算机辅助诊断方法中,大多肺结节分类模型并没