【摘 要】
:
关键字检索和不确定数据处理是近年数据库领域的两个研究热点。本文研究的主题是在含有不确定数据的关系数据库和XML数据库上了运用关键字方法,检索用户查询的关键字。本文的
论文部分内容阅读
关键字检索和不确定数据处理是近年数据库领域的两个研究热点。本文研究的主题是在含有不确定数据的关系数据库和XML数据库上了运用关键字方法,检索用户查询的关键字。本文的研究成果通过将关系数据库和XML的关键字检索技术和不确定数据的处理技术结合起来,为用户查询不确定数据提供更友好的检索方式。 首先,针对结构化数据和半结构化数据的不同,本文区分了(1)关系数据库和(2)XML上的两种不确定模型。这两种模型相结合能覆盖和处理很多不确定数据的关键字检索问题。 然后,分别为两种模型,定义了不确定关键字查询的语义和查询结果。对于(1)关系数据库,本文提出了一种在属性级粒度上进行top-k关键字检索的算法。该算法根据用户指定的k值计算并返回分数最高的前k个结果,每个结果是关系数据库上通过主外键关联在一起的元组连接树。查询结果的评价函数综合考虑了结果与关键字的相关度和结果在可能世界语义下的概率大小。通过进一步优化,显著降低了该算法的计算复杂度。对于(2) XML数据,本文定义“最小有意义片段”为查询结果,“最小有意义片段”是包含用户所查询的所有关键字并且在可能世界语义下概率为正值的概率XML上的一个最小子树。基于该定义,本文通过5个策略,优化了计算最小有意义片段概率的计算复杂度,最后提出概率XML上的top-k关键字检索的算法。 最后,本文进行了一系列不同数据集上的实验,实验多角度测试了在top-k的不同k取值、用户查询关键字个数变化、不确定数据分布概率不同时本文方法的性能和剪枝优化效率,实验结果表明了这两种方法对各自不确定数据查询的实用性和高效性。
其他文献
本文提出了基于CORBA/java的“软部件”技术。该技术是对现有各种管理信息系统与部件研究的基础上,学习VFP部件和JAVA部件开发技术,将CORBA规范应用到软部件技术中,通过一种
本文定位于医学 CT(断层扫描技术)图像三维重建,在全面了解当前可视化技术发展现状的同时,有重点的阐述了可视化技术在医学中的应用,并针对三维重建技术实现的技术细节,尤其
本文研究了防火墙规则的相关性,提出了防火墙规则的行为表示法,使用这种表示法研究防火墙规则之间的内在联系,在此基础上提出防火墙规则从相关性到无关性的转化算法。在转化
随着万维网上大量网络服务的出现,面向服务的体系结构越来越受到人们的重视。Web服务作为一种新型的分布式计算模型,可以方便地实现Internet上异构平台的连接和集成。目前Web
遥感图像数据挖掘是一个有着广阔应用前景的研究领域。由于遥感图像数据库的海量特征,遥感图像数据挖掘已成为空间数据挖掘的主流。近年来,随着图像获取和图像存储技术的迅速
随着网络技术的发展和Internet在全球的推广,网络在给人类社会带来便利的同时,网络安全问题也困扰着网络技术的发展和应用,信息安全问题也成为社会关注的焦点之一。在信息技术的
本文以提高网络的容错度为目的,在M(o)bius立方体这种互连网络拓扑结构下,考虑故障处理器发生的概率和故障处理器的分布状况,即在条件连通度下分析互连网络的容错性能和容错
电源技术是一种应用功率半导体器件,综合电力变换技术、现代电子技术、自动控制技术的多学科的边缘交叉技术。随着科学技术的发展,电源技术又与现代控制理论、材料科学、电机工程、微电子技术等许多领域密切相关。 本文结合日本株式会社要求研制设计的三相交流AC150V、450HZ输入,220V、50/60HZ单相正弦波输出的逆变电源设计项目,针对正弦波逆变器的工作原理、控制方式以及输出滤波等问题进行了研究
容迟网络(DTN)通常被认为是一类由于设备经常移动、分布稀疏的特性或是设备电量受限或是可能经常发生故障等因素,通信设备之间缺乏稳定连接的网络。由于其不稳定的网络性质,针对
人脸自动识别系统是模式识别、数学图像处理、计算机视觉、神经网络等学科的一大研究热点,可以广泛地应用于安全部门、电视电话会议、身份识别、数字监控等领域。由于快速增