论文部分内容阅读
图像深度估计是一类从图像中估计场景深度的技术,是图像理解的一种形式。从场景中提取深度时,深度估计结果常常存在结构模糊、层次不清、物体深度与背景融合等问题。为解决以上问题,通过图像分割得到不同的场景区域,有针对性地进行深度估计和结果优化,是一种可行的方案。本文对图像分割技术展开研究,并将其用于深度估计方法,以期改善深度估计的质量。本文研究了两种分割方法,分别用于处理目标物体和图像场景的分割。针对物体深度消失的问题,本文提出了一种基于目标性的视频运动目标分割算法,该算法利用目标性技术从视频中提取目标可能出现的区域,并通过分析区域的运动、颜色等性质实现物体的分割。结合物体分割结果,本文利用物体与支撑面的深度关系优化深度估计结果,解决了物体深度消失的问题。针对深度图上场景结构模糊的问题,本文研究了图像语义分割方法,实现了对图像场景的语义解析。该算法利用全卷积网络对图像所有像素进行分类,得到初始的分割结果,再利用稠密条件随机场的整体建模能力进行优化。本文将语义分割应用于深度估计,提出了一种新的深度估计算法。该算法使用语义分割完成场景解析,并使用结构化随机森林算法对不同语义区域分别建立深度估计模型。实验表明,该算法可以得到结构清晰、层次分明的场景深度,具有较高的准确性。本文的研究和实验表明,图像分割技术有助于提升深度估计质量,对解决图像深度估计中物体深度消失、场景结构模糊、深度层次性差等问题能起到重要作用。