论文部分内容阅读
自动图像标注技术主要是根据图像的底层视觉特征来分析其高层语义信息,并用一个或多个语义标注词来描述图像的语义内容。由于多示例多标记学习从内容表示和概念标记上同时考察了图像的歧义性,是一个比较合理全面的学习框架,因此,在多示例多标记框架下研究图像的语义标注是极具价值的。 鉴于多示例多标记图像相似性度量与传统多标记图像相似性度量存在一定的区别,据此提出了基于平均Hausdorff距离和基于特征转换的包距离计算方法,其中基于特征转换的包距离计算方法是先利用K-mediods聚类或稀疏编码的方法将多示例特征转换为单示例特征,然后利用传统多标签学习方法度量图像的相似性。结合近邻优化的图像标注算法,提出了基于稀疏编码的近邻优化图像标注算法SP_MIML以及SPML_MI。针对K-mediods聚类的结果多样化及执行代价高等缺点,提出了基于平均Hausdorff距离的支持向量机图像标注算法。为了进一步挖掘语义,考虑标签间的语义关联信息,提出了基于隐马尔科夫(HMM)模型的图像语义标注方法,进一步分析了图像的内容和语义间的关联。 为了验证提出算法的可行性及有效性,在自然场景和Corel图像数据集上分别进行了实验。实验表明,SP_MIML和SPML_MI算法的标注性能接近当前先进水平,基于平均Hausdorff距离的支持向量机图像标注算法在标注性能以上较MIMLSVM算法有所提高。最后,实验也验证了基于HMM选择标注词的方法在精度上较基于标签排序选择标注词的方法略高。