论文部分内容阅读
近年来,随着虚拟现实与增强现实技术的不断发展,用户对多媒体沉浸式体验的需求日益增加。与此同时,以深度学习为代表的智能感知算法也有从基于普通的透视图像到基于特殊全景图像感知的发展趋势。因此,灵活简单地生成高质量的全景图像在当前的发展背景下变得尤为重要。图像拼接技术作为一种有效生成全景图像的方式,具有采集方式灵活、设备廉价易得等优势,因而在近年来得到了广泛的关注。本文主要关注了利用图像拼接技术生成的全景图像的自然感官问题,提出利用曼哈顿场景下的全局灭点约束来进行高自然度的图像拼接,即自然图像拼接。本文利用了曼哈顿世界下灭点的两个特征来辅助进行自然图像拼接。第一,一簇空间平行线所对应的灭点往往具有显著的方向性且反映了场景的上下文结构信息,基于这一点本文提出利用灭点对每张图像全局相似变换的图像先验首先进行粗略的估计;第二,图像灭点在曼哈顿假设下具有全局一致性,利用这一特性本文进一步对图像的相似变换先验信息进行鲁棒的估计。最后,本文在传统的基于网格变形的图像拼接流程中,加入了灭点引导的全局相似变换约束,在保证图像重叠区域对齐质量的前提下,实现了高自然度的图像拼接结果。此外,本文还探索了所提出的拼接算法在类曼哈顿场景下的鲁棒性,以及与非曼哈顿场景的兼容性。结果表明,本文提出的算法在曼哈顿与类曼哈顿场景下都取得了较好的自然图像拼接性能,在场景不满足曼哈顿假设时,算法可以有效退化为传统的网格变形拼接流程,输出与现有方法相当的图像拼接结果。本文在合成场景与真实场景下的典型室内与街景图像上与现有算法进行了对比实验。为了对不同算法输出的全景图像的自然感官程度进行定量评价,本文提出了LD和GDIC两个评价指标,分别从局部射影变形与全局方向一致性两个方面对全景图像的自然程度进行了表征。定性与定量的实验结果一致地表明本文提出的拼接算法在充分利用了场景中的灭点信息后,可以显著提升全景图像的自然感官程度。其次,本文还在宽基线图像上进行了对比实验,实验表明本文提出的算法可以很好的解决这种具有挑战性的拼接场景。此外,本文还采用了用户主观评价的方式,比较了本文提出的算法与现有的典型图像拼接算法。主观评价结果一方面验证了本文提出了评价指标在表征图像自然感官上的可行性,也进一步表明了本文提出的算法在自然图像拼接问题中的有效性。