论文部分内容阅读
大范围应用增强现实ξAugmented Reality,简称ARο技术是当前该领域的研究热点。其中目标识别技术是实现该任务的关键技术之一,计算机需要在图像中定位和识别用户感兴趣的对象。然而现实环境中的目标种类繁多,外界干扰因素严重,极大地增加了识别的难度。根据目标类型的不同,本文将目标识别任务分为两类:ξ1ο以整幅图为目标的场景识别任务;ξ2ο一幅图像有多个目标的物体检测识别任务。计算机视觉提供了丰富的场景识别和物体检测识别技术。然而这些方法大多忽略了增强现实对算法的实时性要求。大多数场景识别方法使用单一特征导致相似场景识别失败。同时,当场景数量继续扩展,算法的实时性和准确性都会降低。另外,现有基于部件的模型具有良好的物体检测速度和精度,但由于缺乏描述部件组成结构的方法,限制了识别的精度。为完善目标识别的方法和提高目标检测识别的精度和实时性,本文主要研究了户外场景识别和物体检测识别算法,完成的研究工作包括:ξ1ο针对场景识别使用特征单一的问题,本文提出使用融合地理位置信息和视觉信息的方法。首先,把所有的场景划分为几个区域,识别时根据地理位置信息查找用户对应的区域,实现场景的初定位。接着使用本文提出的混合特征模型,使用纹理。轮廓和颜色三种视觉特征精确定位用户感兴趣的场景,提高了算法的鲁棒性和实时性。ξ2ο针对场景数量增加导致识别实时性和准确性降低的问题。本文提出一种地理信息检索树的方法层次化地自动划分场景。通过聚类算法递归的建立了一棵K叉树,将场景划分为由树的叶节点定义的若干原子区域。使用地理信息检索树保持每个原子区域中的场景维持在一个相对较少的数量,保证了识别算法的实时性和稳定性。ξ3ο针对物体检测识别中缺乏描述物体组成结构的问题,本文提出一种重构模型,学习物体的组成结构以捕捉特征的空间关系,提高物体的检测和识别率。为描述部件,本文定义了由不同大小。长宽比和位置的部件组成的字典。通过与或搜索学习字典的一个非重叠子集作为最优组成结构,提高检测和识别的精度。实验证明本文提出的场景识别算法和目标检测识别算法很好地解决了增强现实中户外复杂环境下的目标识别问题。