一种新的层次化概率生成模型及场景分析方法

来源 :中南大学 | 被引量 : 0次 | 上传用户:FSFASF
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体信息技术的迅猛发展,图像数据正以前所未有的速度在不断增长。面对海量图像数据,利用计算机对数据进行有效管理已成为一项紧迫任务。场景分析是根据图像场景的内容信息对场景所属类别进行判定和对场景中的目标对象进行标准的分割识别,已经成为图像检索、目标识别、计算机视觉等研究的一个重要研究方向。传统技术采用视觉词包(Bag of Visual Words,BoV)对场景进行语义建模,并结合有监督的机器学习来对场景进行学习,这种建模方式相对简单,但是没有充分描述丰富的区域表面视觉特征,并且忽略了视觉词语之间的空间信息。本文将概率生成模型应用于图像场景分析上,重点研究场景的语义建模方式,区域特征的表达方式以及视觉词语之间的空间信息,具体内容及创新点如下:1)本文根据人们对视觉场景的日常认知习惯,把场景图像划分为三个层次,即场景类别层、对象层、特征层,从而形成一个包含三种层次信息的统一框架。然后根据三层之间的概率约束关系,构建了一种新的层次化概率生成模型。2)在区域特征表示方式上,加入了超像素混合体(Super-Pixel Mixtures, SPM)表征,即通过进一步把图像区域(region)进行二次分割成超像素,然后再提取出每个超像素的颜色与纹理特征。这样,与从图像区块(patch)所提取的SIFT特征一起,得到了图像区域的三种视觉特征词语的联合分布表示,增强了区域视觉特征表达的丰富性和稳定性。3)为了结合视觉词语间的空间信息相关性,本文在模型的生成过程中,约定同一区域内的视觉词语均由同一个对象生成,这种处理使得本文构建的模型具有一定的空间相干性。本文所设计的模型是一个完整的生成模型,在进行场景的类别判定时,能够完全摆脱对特定分类器的依赖,同时可实现像素级的对象识别与分割。通过对UIUC-Sport数据库进行实验测试,并与Li-HPGM、Spatial-LTM等传统方法的结果进行比较研究表明,本文所提出的结合超像素区域视觉特性的层次化生成模型,比以往方法拥有更高的场景分类准确率和对象识别精度。
其他文献
人体软组织弹性模型是指用于软组织形变建模的形变模型。随着生物力学的发展和计算机运算速度的提高,物理形变模型得到了很大的发展,先后出现了质量-弹簧模型和有限元模型。
针对粉煤灰年排灰量大,利用率低,污染严重,粉煤灰中钛含量高达2.72%;而钛资源越来越少,优质钛矿短缺;钛工业不断发展,传统人造金红石原料要求高的现状,本课题研究了微波活化
高炉煤气清洗系统的主要任务是使煤气质量(含尘量、含水量和煤气温度)达到煤气加压输送和煤气用户使用的要求,应力求技术上先进,经济上合理。高炉煤气清洗工艺流程的选择,主要决
高炉热状态是高炉冶炼过程最基本的表征,热状态预报模型是高炉实现智能控制基础内容之一。本文简要阐述了国内外高炉有关各类控制模型状况,在我国鞍钢大型高炉的计算机信息化
热风炉是高炉炼铁过程中重要的附属设备,主要的用途是为高炉生产提供高风温热风,它供给高炉的热风热量约占炼铁生产所需能量的四分之一,它消耗的高炉煤气约占高炉产生煤气的一半
高氮钢作为一种新型工程材料,具有非常优良的机械性能、抗腐蚀性等。但实现高氮钢的工业化生产,还有许多需要解决的问题,如在熔炼过程中怎么将大量的氮渗入到钢液中,在凝固过
该文就如下四方面进行较为深入的研究:1、借鉴前人用一阶微分小波检测QRS波的经验,依据双通道滤波器组的网络结构,设计一组双正交样条小波滤波器,应用于QRS波检测.经MIT标准
学位