线性多度量动态相似性检索的研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:HHP110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息爆炸式的增长,相似性检索被越来越多地应用于非结构化数据库中,例如图像库、三维对象库、生物序列库等。相似性检索已经成为信息检索中的一个重要研究领域。然而,在现有的大多数相似性检索中,对信息对象采用的度量方式为单度量。由于相似度计算的复杂性以及信息特征的多样性,单度量检索往往取得的效果不甚理想,且无法满足用户多变的需求。为了解决这个问题,现借助于多度量空间搜索来改善相似性检索的效果,并在相似性检索中引入多度量的动态组合来满足用户多变的需求。这里,线性多度量加权方法作为多度量动态组合的典型方式,被选取用于相似性检索中的度量基础。现在,在可度量空间中一般使用聚类索引树作为索引结构,其中CM-tree(Cluster Metric-tree,可度量聚类索引树)是一种较好的结构,但它不适用于多度量空间。因此将CM-tree进行改造,使它适用于多度量空间,进而支持动态相似性检索。并且,对CM-tree的构造算法进行改进,使得它在结构上有更好的聚类效果,从而进一步提高检索效率。最后,在上述的索引结构上实现动态K-NN(K-Nearest Neighbors,K近邻)相似性检索算法和其相应的裁剪法则。最后,针对索引构造和K-NN相似性检索,将改进后的索引与原始CM-tree进行对比测试。从而证明了改进算法的有效性。另外,在该索引上进行动态相似性检索测试,以验证改进后的索引对多度量动态相似性检索的适用性和有效性。
其他文献
主动轮廓线模型(Snake)是一种有效的复杂轮廓提取及图像解释方法,它通过不断地极小化自身的能量函数来达到定位物体边界的目的。但是,传统的Snake模型及其应用仍存在一些问题,如
学位
图像分割是图像识别与理解中的关键步骤之一,图像分割质量的好坏将直接影响图像识别与理解的结果。近年来,在图像处理和计算机视觉领域中,符合人眼视觉模型的多分辨率技术日
学位
随着计算机技术、多媒体技术及Internet的迅速发展,基于内容的图像检索成为多媒体领域最活跃的研究热点之一。它结合人工智能、计算机视觉、模式识别、心理学等研究领域,通过对
学位
随着数字电视的普及,数字电视网上的非法复制和侵权行为越来越严重。据国际知识产权联盟(IIPA)2006年的统计数据显示,90%以上的盗版是通过对终端接口解密以后的数据进行拷贝和录
随着计算机网络和Internet的迅猛发展,运用先进的管理信息系统(MIS)及软件开发平台,对信息进行科学化和网络化管理,已经成为高校信息系统的发展趋势。学科建设是高等学校发展
2000年以来,在人类、水稻等重要生物基因组草图相继完成和信息技术发展不断推动下,生物信息学研究进入了崭新的后基因组时代。基因组信息爆炸式增长、研究工具不断涌现、研究
学位
随着新型嵌入式芯片层出不穷,相应的高级语言汇编器是必不可少的。然而,汇编器的复杂性决定了不可能在短时间内重新为一款新型芯片开发出高级语言汇编器。因此,不断出现的新
学位
随着软件系统的普及,软件测试成为保证软件质量、提高软件可靠性的重要手段。而软件测试的工作量很大,用人工测试几乎难以胜任,在规模迅速扩大的软件系统中,实现高准确度,高
多媒体的应用越来越广泛,已经成为网络传输的主体,如何有效传输这些多媒体数据,已经成为网络时代的一个新的研究方向。多媒体传输涉及到一系列多媒体相关理论,如多媒体数据压
随着信息技术的发展,数据挖掘技术得到了广泛的关注。在数据挖掘技术中有很多研究领域,聚类分析是数据挖掘的一个非常活跃的研究方向,有着重要的理论意义和应用价值。目前在
学位