基于多示例多标记学习的图像语义标注方法的研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:jhf44623386
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动图像标注技术主要是根据图像的底层视觉特征来分析其高层语义信息,并用一个或多个语义标注词来描述图像的语义内容。由于多示例多标记学习从内容表示和概念标记上同时考察了图像的歧义性,是一个比较合理全面的学习框架,因此,在多示例多标记框架下研究图像的语义标注是极具价值的。  鉴于多示例多标记图像相似性度量与传统多标记图像相似性度量存在一定的区别,据此提出了基于平均Hausdorff距离和基于特征转换的包距离计算方法,其中基于特征转换的包距离计算方法是先利用K-mediods聚类或稀疏编码的方法将多示例特征转换为单示例特征,然后利用传统多标签学习方法度量图像的相似性。结合近邻优化的图像标注算法,提出了基于稀疏编码的近邻优化图像标注算法SP_MIML以及SPML_MI。针对K-mediods聚类的结果多样化及执行代价高等缺点,提出了基于平均Hausdorff距离的支持向量机图像标注算法。为了进一步挖掘语义,考虑标签间的语义关联信息,提出了基于隐马尔科夫(HMM)模型的图像语义标注方法,进一步分析了图像的内容和语义间的关联。  为了验证提出算法的可行性及有效性,在自然场景和Corel图像数据集上分别进行了实验。实验表明,SP_MIML和SPML_MI算法的标注性能接近当前先进水平,基于平均Hausdorff距离的支持向量机图像标注算法在标注性能以上较MIMLSVM算法有所提高。最后,实验也验证了基于HMM选择标注词的方法在精度上较基于标签排序选择标注词的方法略高。
其他文献
近年来,随着计算机硬件技术的不断增强,普通计算机已经可以完成复杂运算,由此推动了三维重建技术的发展。虽然经过国内外科研工作者的不断研究,涌现出许多三维重建系统,但大多存在
验证最终设计的正确性,对设计复杂的芯片起到了关键性的保证作用。有资料显示,芯片一次投片成功率只有35%左右,造成芯片重复投片的主要原因就是验证不够充分。随着设计规模的
随着现代信息技术的快速发展,新的视频压缩标准不断推出。MPEG-4是由国际运动图像专家组(MPEG)在继MPEG-1和MPEG-2之后,制订的又一个新标准,全名为ISO/IEC 14496。MPEG-4能够
医学图像三维可视化技术是目前的一个研究热点问题,是数字化虚拟人的重要的技术基础。对医学图像序列进行可视化,得到人体组织、器官以及病变体的三维图像,可以帮助医生进行
21 世纪的竞争是供应链之间的竞争,而库存管理则是供应链管理中非常重要的环节,本文就是选择先进的库存管理方式——供应商管理库存(VMI)进行探讨。产品的多样化及顾客需求改变的
在高校招生规模不断扩大的情况下,学生收费管理已成为整个高校管理工作中的关键环节之一。因此,迫切需要开发一套高校学生收费管理系统来实现收费管理工作的系统化、自动化、规
客观现实中的物体,其表面往往有某种纹理,纹理绘制是增强图形真实感的重要手段,是真实感图形绘制中的重要研究课题。物体表面纹理可分为颜色纹理和几何纹理两大类。颜色纹理
WebGIS是Internet技术与GIS相结合的产物,WebGIS为公众获取GIS数据和地理信息服务提供了一个有效的工具。在目前的地理信息相关的系统软件开发中已经大量的运用了WebGIS模式
当前软件行业不断发展,开发与维护成本也在不断增加,软件复用,特别是基于构件的软件研发,成为一种有效的解决途径。网上越来越多的构件加大了用户查找自己感兴趣产品的难度,通过网
本文结合西北工业大学航空微电子中心所承担的“十五”国防预研项目:项目编号:41308010108,在该项目当中,作者负责高性能嵌入式微处理器“龙腾R2”的定点主控部件的设计和验