基于半监督学习的图像自动标注方法研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:xujingtony
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和数码设备的普及,各种媒体图像数据飞速增长,大量的可视化数据,如图像、音频、视频等随处可见,如何合理地组织和管理这些无标注的数据,给用户高效率的浏览和检索成为研究者广泛研究的问题。自上世纪70年代起,图像检索就成为十分活跃的研究领域,但由于人工标注工作量大和“语义鸿沟”的出现,大大的限制了图像检索技术的发展,为改善该技术的困境,图像自动标注技术得到了广泛的应用。图像自动标注描述的是计算机通过算法将一个或多个描述性关键字自动地分配给相关图像的过程。迄今为止,研究者提出了很多图像自动标注技术,本文在前人的基础上进一步探究图像自动标注技术。论文首先分析了图像自动标注的研究背景和国内外研究现状;接着讨论图像自动标注的关键技术;然后重点阐述论文的几个主要工作:第三章提出基于混合模型的图像自动标注方法;为了有效地利用无标注数据来提升标注模型的性能,第四章提出基于协同训练的图像自动标注方法并结合实验结果进行对比分析;为了去除冗余标注词,第五章提出基于词语相关性的图像标注改善方法,最后在第六章总结了论文的主要研究工作并讨论了下一步的工作展望。论文的主要研究内容有:1、提出一种图像自动标注的混合模型LDA-SVM。首先利用词袋模型集成多种图像特征,得到图像的词袋表示;然后构造LDA模型来挖掘图像潜在主题,从训练图像集中学习两种潜在分布:图像的主题分布和图像的视觉词主题分布,并以图像的主题分布作为中间表示向量来训练SVM多类分类器。在图像的标注阶段根据从训练阶段获得的训练图像的视觉词主题分布来学习测试图像的潜在主题分布,结合训练好的SVM得到待标注词序列,选择概率最大的5个词作为最终的关键词。实验在两个标准的图像集(Corel 5K和IAPR TC-12)上进行,并使用标准的评价指标衡量图像标注的性能。通过与几个典型的图像标注方法进行比较,实验结果证明了LDA-SVM的可行性与高效性。2、提出一种基于协同训练的图像自动标注方法,充分利用了未标注样本来提高图像标注的性能。基于Co-Trining的理论,提取图像的不同特征集并使用两个不同的分类器——LDA-SVM和神经网络进行协同训练。未标注数据的价值就在于它能有效的辅助分类器进行加强训练,因此获得高质量的未标注样本是半监督学习方法的关键。本文使用自适应加权融合的方法来度量无标记样本的置信度,并将置信度高的样本交给两个分类器重新训练。实验选取了两个较大规模的数据集(IAPR TC-12和NUS-WIDE)进行实验,对比结果显示该方法的标注性能优于大多数先进的图像标注方法,验证了该方法确实能有效地利用未标注样本来提高图像的标注性能。3、结合图像标注改善思想,提出基于词语相关性的图像标注改善方法,利用加权互信息来度量标注词之间的相关性。考虑到标注词与图像具有不可分割的关系,在计算互信息的过程中加入待标注图像与训练图像集中相关图像的相似度来构造加权互信息模型,结合初始标注模型对待标注词置信度的影响,计算待标注词的最终标注置信度,选取置信度高的若干个词来组成待标注图像的关键词集合。通过选择不同的初始标注词个数进行实验,验证了该方法能有效地改善图像的标注。
其他文献
目的探讨血清铜在阿尔茨海默病及脊髓病的发病中可能起的作用.方法选择2001-01/2004-12被Medline收录的与血清铜、阿尔茨海默病及脊髓病发病机制、治疗的相关文章,就其内容进
目的探讨精子色素酶A3(CMA3)阳性率与IVF受精率之间的相关性。方法收集2015年4月至2016年7月因单纯输卵管性不孕在我院生殖医学科行常规IVF助孕的156个周期,以受精率〈25%为低
期刊
目的:评估关节镜下使用同种异体髌腱重建后交叉韧带术术后实施康复训练患者膝关节功能恢复的远期效果.方法:选择2000-01/2003-12广州市第一人民医院关节外科收治的膝关节损伤
适当优化土地利用方式,在一定程度上可作为城市排水的一个辅助条件,缓解城市暴雨积水问题。通过实验室模拟降雨,初步得出结论:在相同降雨强度的情况下,绿地相对于裸土而言具有较大