论文部分内容阅读
随着手持相机的普及以及网络海量影像数据的可获取,散乱图片集已经成为计算机视觉领域进行场景分析与三维构建的重要媒介。当前,从图像中恢复几何模型的一种有效视觉途径,即是运动求结构技术。它可以从不同角度拍摄的图像中同时计算出摄像机姿态以及三维空间点坐标。凭借其优良的灵活性以及适用性,运动求结构技术已经被广泛的应用于工业和军事等领域,例如,文物数字化保护以及无人机侦查等。虽然计算机视觉领域的快速发展使得运动求结构技术更加高效而且精确,但是其仍然存在很多重要问题亟需解决。本文将从效率性、稠密性以及鲁棒性三个关键方面来重点考察和研究当前运动求结构方法的不足以及相应解决途径。本文首先对视觉三维重构的效率问题进行研究,解决了运动求结构方法中进行大规模图像集匹配操作时带来的大量计算开销;然后针对当前重构结果的稀疏性,本文利用特征点之间存在的几何约束,提出了一种可以定量度量匹配对正确性以及提高点云稠密度的算法;最后本文对重复性结构场景的歧义性分析与重构问题进行了研究,提出了一种基于测地上下文的歧义性检测与去除方法。具体而言,本文的主要研究内容及创新点可以概述如下:(1)提出了一种面向特征点邻接关系的大规模图像集快速匹配算法。不同于当前基于图像为处理单元的特征匹配算法,本方法从三个方面对匹配过程进行优化。首先,通过将所有特征点放到一棵树上进行聚类,来减少反复的建树操作引起的计算开销。其次,构建一个图结构来使每一个特征点自适应的找到少数相关的候选特征点进行匹配操作。另外,设计了一种新的邻接矩阵形式用于进行快速的相似性度量,以代替传统的欧式距离度量法在高维空间计算下的不便。通过实验表明本节设计的面向特征点的图像集匹配算法可以带来极大的效率上的提升。(2)研究了一种几何信息引导的特征点匹配对客观性度量与稠密化方法,可对匹配对的对错性做定量的分析和描述。该算法通过研究不同图像之间特征点集的对极几何约束,将特征点匹配对的判定问题转化为一个目标优化问题,并通过一种类似k均值聚类的方法进行线性迭代求解,可以恢复许多被误匹配以及误删除掉的特征点对应。通过实验表明本文算法不仅可以产生精确而且稠密的特征点匹配结果,而且还可以应用于三维重构领域来得到更加精细的三维点云模型。(3)提出了一种新的基于测地上下文感知的运动求结构歧义性消除算法。它可以从图片集中推理出拍摄场景的地理性差别。这项工作的一个重要创新是通过一个视角流形模型来表示输入图像集的拓扑结构。容易发现,虽然存在歧义的图片在纹理上看起来很相近,但在地理位置上实际却离得很远。这种远近关系可以描述成存在一系列连接它们视角变换关系的图像数量。算法通过自适应的识别具有相似拍摄视角的图像来构建所需要的流形模型,并且提出了新的度量尺度,测地线一致性,来检测歧义性的发生。该算法在一系列复杂的重复性场景数据集上进行了测试,其中甚至包括没有背景上下文的歧义性结构场景,实验结果验证本文提出的方法可以有效而且快速的为它们重建出正确的三维几何模型。本文的三个研究内容以运动求结构处理流程为主线,层层深入且相互关联,并通过在不同场景数据集上的大量实验证明了算法的有效性。本文提出的理论和模型具有较好的扩展性,对于计算机视觉和图形学的其它相关问题与应用也有指导意义。