基于深度卷积神经网络的室内布局估计

来源 :天津大学 | 被引量 : 0次 | 上传用户:poloyzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
室内布局估计是计算机视觉领域的研究热点之一,是室内场景理解的一个重要基础任务,其目的是根据室内场景图像还原出室内的几何结构。室内布局估计在机器人室内导航与定位、增强现实和室内场景三维重建等方面具有广泛的应用前景。室内布局估计问题面临着室内物体繁杂、平面边缘遮挡及物体表面纹理复杂等问题的挑战。目前的室内布局估计方法大多基于单一全局特征,且需要复杂的前处理或后处理过程,准确度一般,实时性较差。针对这些问题,本文对室内布局估计任务进行了重点研究。主要研究工作总结如下:(1)总结并分析了室内布局估计的基本概念与相关原理。首先,分析了“曼哈顿世界假设”与“单天花板-单地面假设”,并使用这两个假设对室内场景进行约束;接着,总结了室内布局估计的常用特征,包括消失点(Vanishing Point,VP)、几何上下文(Geometric Contex,GC)、室内信息化边缘(Informative Edges,IEs)、室内关键角点(Corner Keypoints,CKs)、室内平面语义(Plane Semantics)和室内布局类型(Room Types,RTs),并分析了不同特征的优缺点,确定了本文方法采用的特征;最后,概述了与室内布局估计相关的深度学习方法,包括卷积神经网络、全卷积神经网络与编码器-解码器网络。(2)提出了一种基于多特征融合的室内布局估计方法。首先基于高分辨率网络(High-Resolution Net,HRNet)提取室内CKs和IEs特征,使用Mobile Net V2对RTs进行分类;接着基于贪婪策略的后处理算法融合提取到的室内特征,并生成最终的布局。在LSUN数据集上对该方法进行了验证,展示了该方法的可视化结果,并对该方法准确度进行了定量评估。根据不同RTs下二维拓扑结构的相似性,将CKs由之前的48维降为8维,并通过实验验证了使用8维CKs的有效性。(3)提出了一种基于多任务监督学习的实时室内布局估计方法,并通过改进Non-bottleneck-1D卷积模块使其轻量性更佳。采用参数硬共享机制搭建了一个编码器-解码器网络,使用室内平面边缘热图与室内平面语义分割图对网络共同监督,实现了端到端的室内布局估计。对该方法进行了定量分析和可视化结果展示,验证了多任务监督机制的引入提高了室内布局估计的准确性。使用1×1卷积代替1×3和3×1卷积,对Non-bottleneck-1D模块进行了改进,并对这一改进进行了理论分析和消融实验,证明了该改进减小了网络模型体积,提高了网络的实时性。(4)通过实验对比了不同的室内布局估计方法的性能。首先,介绍了传统室内布局估计方法及本文提出两种方法的流程,分析了这些方法之间的异同,并通过实验证明了本文方法的准确性远高于传统方法;接着,通过实验对比了本文方法与其它基于深度学习方法的准确性,实验结果表明本文方法的准确度高于其它深度学习方法;最后,对比了本文两种方法的实时性,结果表明,多任务监督学习方法好于多特征融合方法。
其他文献
在素质教育理念不断推进与发展的今天,高中历史学科在高中课堂上的教学地位越来越重要,同时在学习案这一教学模式的指引下,学生们对于历史的学习已不再局限于"重复昨天的故事",而是随着知识的不断积累,使学生在了解历史的同时,可以感悟历史,以史鉴今。就此,本文主要从学习案的内涵价值和学习案在高中历史教学中的应用优势两方面入手,就学习案引领下的高中历史分层教学策略展开相关研究与探析。
期刊
报纸
<正>福建省作为全国第三批高考综合改革试点的省份,从2018年秋季入学的高中一年级学生开始推行选课走班制新高考改革。在选课走班制教学模式下,学生根据自己的意愿与兴趣对科目自主选择学习,有利于学生的个性发展。如何在选课走班模式下,引导学生顺利完成合格性考试与等级性考试,为学生进入更好的高校平台搭建桥梁,这是历史教师当前要解决的问题。
期刊
复杂系统广泛存在于日常生活和科学研究中,包括金融系统、交通系统、社交网络等,这些系统的共性是无法通过数学解析方法进行精确描述,需要借助观测得到的多元时间序列为中介,间接地实现对复杂系统规律的把控。近年来,深度学习方法在图像分割、无人驾驶、机器翻译等领域取得了重大突破,其中,卷积神经网络通过权值共享和局部感受的结构设计,获得的强大分析处理能力为多元时间序列的研究提供了极大助力。本课题以气液两相流电导
学位
航天器发射升空后全天时运行,由于恶劣未知的空间环境及星上元器件的老化等原因,难以避免会发生故障,如果不及时对故障进行处理,有可能导致航天任务执行的滞后。因此,研究航天器的故障检测技术,根据故障的特征及早实现故障检测,不仅能够保证航天器的安全可靠运行,对其服务寿命的延长也具有十分重要的意义。航天器显著故障多由微小故障发展演变而来,处于早期的微小故障对航天器的正常运行影响很小,故而难以发现故障征兆,然
学位
全方位移动机械臂由于其高度的机动性和操作灵活性被广泛应用。但是由于系统的复杂程度高、不确定性强,且建模过程对先验知识有较高的要求,精确建模难以实现。基于Koopman算子理论的建模方法能够在完全数据驱动条件下为复杂非线性动力学系统建立高维线性动力学模型的显性表达式而无需任何系统先验知识,且该模型适用于基于模型的控制器设计。本文以一台轮式全方位移动机械臂为研究对象,基于Koopman算子理论完成系统
学位
深度脑刺激(Deep brain stimulation,DBS)是目前治疗帕金森、特发性震颤等运动障碍疾病的有效手段,其通过向病灶区施加高频脉冲刺激来缓解症状。影响DBS效果的主要因素是刺激的波形、频率、幅值及个体差异等,构建闭环DBS是解决上述问题的最优策略。为此,本文开发了一种兼容开闭环设定、多波形发生的多模式DBS装置,实现刺激波形优化及闭环调节。同时,搭建基于模型的DBS实验系统,模拟在
学位
多相永磁同步电机因其具有低压大功率输出能力、可靠性高和转矩脉动小等优点,在工业领域中应用越来越广泛。在多种电机控制策略中,有限集模型预测控制由于具有多约束处理能力、脉冲输出方式简单、动态响应快等优点,成为多相永磁同步电机驱动系统控制策略的研究热点之一。但是相较于三相永磁同步电机,多相永磁同步电机相数增多,模型更加复杂,导致有限集模型预测控制存在计算量大,复杂度高的问题。针对以上两个问题,本文以双三
学位
新冠肺炎(COVID-19)疫情期间在线教育使用者激增,庞大的音视频流量给网络基础设施带来了巨大冲击。如何在有限的带宽条件下提升音视频流畅度具有重要意义。针对此,本文研究基于超分辨率技术的低码率音视频重建方法,通过超分辨率方法将低采样率音视频重建为高采样率音视频。由于现有的重建方法难以满足高质量在线教育音视频的需求,本文使用外部参考引导的方式使重建音视频更加真实。在视频超分辨率方面,为了满足低时延
学位
石油开采难度随着油田储油量的减少不断升级,为更准确的监控采集信息,多相流传感技术也随之不断发展。测量参数的增加使井下仪器需要采集的信息更丰富。随着数据传输量不断增加,对传输数据的正确性也提出了越来越高的要求。对于整个测井系统的发展,数据传输部分至关重要,且单芯电缆作为测井数据传输介质可用传输带宽有限,在井下温度和压力的影响下数据传输的误符号率(Symbol Error Rate,SER)难以保障。
学位