论文部分内容阅读
机器学习是计算机科学领域的研究重点和难点,基于视觉信息的学习被称为计算机视觉。自动图像标注是目前计算机视觉的一个研究热点,它主要用于互联网的海量图片管理和智能检索。传统的图像标注由人工完成,但由于大数据时代的来临,人工标注的效率太低从而无法适应当下的需求,必须由计算机学习出相应的图像标注规则以实现更高效率的自动标注。同时满足高效性和准确性则是自动图像标注所关注的重点。为了提高图像标注的准确性和高效性,本文针对图像库的海量数据,在两个方面进行了研究。通过增加过滤器和相应的距离度量方法改进了基于正反例学习的图像标注方法,提高了图像标注的准确率;设计了基于BHF-LDA(Fast LDA Based on Hadoop)的图像标注方法,在训练LDA(Latent Dirichlet Allocation)模型时,大大减少了训练时间。本文的主要研究内容如下:(1)研究图像特征有效提取方法,提取图像的颜色特征、纹理特征和SIFT(Scale-invariant feature transform)特征。研究N-cuts(Normalized-cuts)和Mean-Shift算法,设计并实现基于N-cuts和Mean-Shift-N-cuts的图像分割,实验表明,基于Mean-Shift-N-cuts的图像分割更加高效和实用。此外,还研究了视觉词袋模型,引入图像标注效果评价标准。(2)设计并实现基于最近邻的图像标注方法,实验表明不同的特征对图像标注结果影响很大,使用JEC(Joint Equal Contribution)距离要明显好于单独使用其他特征。设计并实现基于正反例学习的图像标注方法,并改变正反例权值进行多组实验。基于正反例向量加权组合的不足,通过增加过滤器和相应的距离测量方法对正反例学习过程加以改进。实验结果表明,经改进的图像标注方法对标注准确率有明显提高。(3)针对互联网上海量图像,设计一种快速图像标注方法。分析Hadoop的系统结构及运行原理,搭建了基于Hadoop的实验平台。研究LDA的数学模型,并通过Gibbs采样求解LDA的参数。设计并实现了基于LDA的图像标注,实验表明该算法获得了较高的图像标注准确率。提出了一种新型的BHF-LDA算法,利用Mapreduce并行计算框架节省了LDA模型的训练时间。实验表明,与单节点系统运行时相比较,基于BHF-LDA的图像标注方法大大提高了标注系统的运行效率。