P2P环境下基于模式匹配的复杂查询处理的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sogood1918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Peer-to-Peer(P2P)技术为资源共享提供了分布式体系结构,随着P2P系统从文件共享向数据共享的转化,如何将数据管理系统能力和P2P结合起来支持结构化、语义丰富的数据成为研究的热点。由于系统的不稳定性和系统规模的扩大,使得P2P数据管理问题更加复杂。P2P数据共享系统的工作集中在模式管理、查询处理和优化互相关联的三个问题,目前存在的P2P数据管理项目,在一定程度上实现了数据库的共享,但没有对无全局模式的异构P2P数据库系统中的模式管理和复杂查询处理提出有效的算法。本文描述了一个P2P数据库共享系统,利用超节点网络的特点结合半自动的模式匹配技术来解决系统的语义异构问题。系统旨在不存在全局模式,也不存在人工定义或领域专家定义的映射,使用属性和关系来描述元数据的情况下来共享异构数据库中的结构化数据,为此,本文采用超节点的模式映射来协调节点间的模式,这种方法结合了中间模式和一对一模式映射的优点,设计了社区间模式映射的形成算法。为了实现基于内容的定位,系统建立了基于语义相似度的语义覆盖网络,根据向量空间模型计算社区之间语义相似度。为了在保持节点自治性的情况下,保证语义相似社区的聚簇,系统给出了利用模式传递性原理的语义网络重新配置方法,使得与社区的内容最相似的社区成为邻居社区。系统提出了基于模式映射的路由方法,通过建立模式级的路由索引来使查询路由到合适的语义子网。在聚集查询处理方面,设计了基于树型结构的聚集查询处理算法,社区内利用超节点的层次结构实现聚集查询处理,通过在中间模式的数值属性中缓存聚集值,提高了简单查询的处理速度。针对MAX-MIN聚集函数,提出了加快定位最值的排序及预值计算等查询优化方法。针对Join查询中的等值查询进行了研究,给出了P2P-Join的定义和查询处理算法,社区内采用半连接的方法实现Join查询处理,社区间提出了基于虚连接的查询优化方法。最后,在Netlogo建立的仿真实验环境中对语义网和复杂查询处理方法进行了实验,实验结果证明,本文提出的语义覆盖网络和复杂查询处理算法在减少网络通信开销、降低响应时间、节省网络资源方面具有良好的性能。
其他文献
随着国际互联网的迅猛发展和日益普及,电子邮件以其通信的方便、快捷、成本低廉成为了人们日常生活中通信、交流的重要手段之一。但是近些年来,垃圾邮件问题日益严重,网络用户平
随着计算机与网络信息技术的迅速发展,企业管理系统的模式也随之发生了巨大的变化。企业为了提高自身效率、提升行业竞争力,需要一个展示其产品,与用户进行沟通的平台。当前大量
随着Internet的快速发展,Web信息的迅速增加,人们越来越依赖使用搜索引擎来获取互联网上有用的信息。中文未登录词的识别和歧义的消解是影响信息检索系统准确率的重要因素。
数字水印是一种有效的数字产品版权保护手段。本文重点研究栅格图像中DRG图像的数字水印技术。在分析现有图像数字水印算法的基础上,根据地理信息系统中栅格图像的特点和对水
随着计算机和网络通信技术的发展,数字签名技术应运而生。代理签名是数字签名中的一种特殊的签名形式,由于它在实际应用中起着重要作用,所以一提出就受到了广泛的关注,国内外
2010年6月教育部印发《关于“十二五”期间加强学校基本建设规划的意见》,意见中明确提出,要加快教育基本建设信息化建设,打造教育基本建设科学管理平台。为贯彻落实这一构想,教
信息技术的快速发展使生活变得便利有序,同时对系统安全提出了更高的要求以防范未经授权的侵入及权力的滥用。生物特征识别(Biometrics)利用人体与生俱来的生理特征或行为特征进
随着图像识别的广泛应用和深度学习的兴起,深度卷积神经网络在图像识别领域也获得广泛的应用。基于深度卷积神经网络的图像识别方法是当前识别正确率较高的方法,是一种基于特
随着人们对公钥密码的深入研究和计算机计算速度的提高,目前广泛使用的公钥密码系统RSA的安全性受到了很大的威胁,为了提高RSA的安全性,RSA的密钥长度不断增加。但是对椭圆曲线
本文首先介绍了课题的学术背景和业务背景,然后通过比较当前主流的三种分布式组件技术说明了本课题选择EJB技术的原因,并对EJB技术做了深入的探讨,在此基础上设计和实现了基