论文部分内容阅读
Peer-to-Peer(P2P)技术为资源共享提供了分布式体系结构,随着P2P系统从文件共享向数据共享的转化,如何将数据管理系统能力和P2P结合起来支持结构化、语义丰富的数据成为研究的热点。由于系统的不稳定性和系统规模的扩大,使得P2P数据管理问题更加复杂。P2P数据共享系统的工作集中在模式管理、查询处理和优化互相关联的三个问题,目前存在的P2P数据管理项目,在一定程度上实现了数据库的共享,但没有对无全局模式的异构P2P数据库系统中的模式管理和复杂查询处理提出有效的算法。本文描述了一个P2P数据库共享系统,利用超节点网络的特点结合半自动的模式匹配技术来解决系统的语义异构问题。系统旨在不存在全局模式,也不存在人工定义或领域专家定义的映射,使用属性和关系来描述元数据的情况下来共享异构数据库中的结构化数据,为此,本文采用超节点的模式映射来协调节点间的模式,这种方法结合了中间模式和一对一模式映射的优点,设计了社区间模式映射的形成算法。为了实现基于内容的定位,系统建立了基于语义相似度的语义覆盖网络,根据向量空间模型计算社区之间语义相似度。为了在保持节点自治性的情况下,保证语义相似社区的聚簇,系统给出了利用模式传递性原理的语义网络重新配置方法,使得与社区的内容最相似的社区成为邻居社区。系统提出了基于模式映射的路由方法,通过建立模式级的路由索引来使查询路由到合适的语义子网。在聚集查询处理方面,设计了基于树型结构的聚集查询处理算法,社区内利用超节点的层次结构实现聚集查询处理,通过在中间模式的数值属性中缓存聚集值,提高了简单查询的处理速度。针对MAX-MIN聚集函数,提出了加快定位最值的排序及预值计算等查询优化方法。针对Join查询中的等值查询进行了研究,给出了P2P-Join的定义和查询处理算法,社区内采用半连接的方法实现Join查询处理,社区间提出了基于虚连接的查询优化方法。最后,在Netlogo建立的仿真实验环境中对语义网和复杂查询处理方法进行了实验,实验结果证明,本文提出的语义覆盖网络和复杂查询处理算法在减少网络通信开销、降低响应时间、节省网络资源方面具有良好的性能。