图数据库上的查询问题

来源 :复旦大学 | 被引量 : 0次 | 上传用户:liujiecumt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的广泛应用,数据管理的对象从非结构化数据向结构化数据延伸。依赖于图数据结构强大的表述能力,一些新兴数据库如XML文档数据库、社会关系网、化合物分子数据库以及蛋白质基因结构匹配数据库等都采用图数据结构建模。 另一方面,作为信息获取的重要工具,查询操作是数据库领域经久不衰的研究课题之一。基于图数据结构的数据库,不仅引入了新的数据模型,同时由于图结构自身的复杂性,给查询问题带来了新的挑战。 图数据库上的查询问题指的是查找并验证查询图在图数据库上的所有出现。回答该查询问题通常可以分为两个阶段,即查询过滤阶段与查询验证阶段。不同于相关工作聚焦于查询过滤阶段,本文把更多的注意力放在查询验证阶段,通过对数据库的索引以及关键信息统计,加速该阶段的性能。本文的研究成果主要有: (1)提出了查询验证时间开销的度量模型。本文从基本的子图匹配算法入手,继而研究了其搜索空间,并给出了形式化的度量模型。在该度量模型的指导下,发现查询验证阶段的性能瓶颈。同时,该度量模型也给本文提出的查询验证阶段的加速技术提供了理论依据。 (2)发现了调整查询图的边序可以加速查询验证过程。提出了边序重排的启发式算法框架,并分别给出了基于概率模型以及基于木桶模型的启发式算法eSI_prob以及eSI_barrel。实验表明,两个算法都能够有效的提高查询验证阶段的性能。与此同时,eSI_prob和eSI_barrel使用的统计信息,与图数据库本身比较,只占用了很小的存储空间。 (3)发现了索引子图片段在数据库中的出现可以加速查询验证过程。提出了索引高度自同构的频繁子图或索引分布距离较远的频繁子图两种索引项选择方案,并使用有向无环图组织索引项的索引,形成了基于片段索引的子图查询方案pSI_auto以及pSI_cluster。实验表明,两个算法均可以进一步的提高子图验证的性能。当图数据库中的自同构结构频繁出现时,pSI_auto效果更为显著。同时,本文讨论了当数据库执行插入、删除与修改时,索引的更新操作,并提出了索引自动重建策略。 (4)通过集成查询过滤算法c-tree和GIndex,形成了子图查询系统的原型。实验证明,本文研究的查询验证加速技术与相关工作研究的查询过滤技术可以低耦合的结合使用,互为补充。
其他文献
随着无线通信技术的发展,各种新的业务相继出现,这些业务在带宽、时延等方面的要求互不相同。无线城域网技术作为有竞争力的下一代无线网络技术,己经把对多种业务提出QOS(服务质
目前,EDI是电子商务最重要的组成部分,是国际上广泛采用的自动交换和处理商业信息和管理信息的技术。UN/EDIFACT报文是唯一的国际通用的EDI标准。利用Internet进行EDI已成为
当前网络正在深度和广度方面飞速地发展着,Internet上包含了大量的信息资源,如何在这些大量、异构的海量信息资源中,快速有效的发掘蕴含具有巨大潜在价值的有用知识和信息,是当今
近年来,随着中国社会主义市场经济的高速发展,人民生活水平日益提高,汽车保有量也逐年上升。由此而产生的一系列交通安全问题、目的地导航问题也逐渐显现。借鉴国外发达国家
嵌入式系统近年持续迅猛发展,已经成为后PC技术时代信息化的中坚力量。由于嵌入式系统具有体积小、性能强、功耗低、可靠性高及面向行业应用的突出特点,目前已经广泛应用于网络
随着无线传感网络技术的发展和逐步走向成熟,越来越多的相关应用和产品出现。基于 IEEE802.15.4 协议和 ZigBee 协议的无线传感网络应用开始成为研究的热门课题。 随着我国
基于物理的人体动画可以产生真实感高的运动,因而是当前研究的热点问题。运动样式的提出则解决了基于物理的人体运动在约束条件较少和能量较低的情况下表现出的结果单调和不
随着互联网的不断普及和网上商务活动的日益频繁,网络安全作为一个无法回避的问题呈现在人们面前,入侵检测技术的发展为我们解决这个问题提供了一种有效的主动防御手段。而安全
GPS(Global Positioning System)全球定位系统以其全球性、全天候、实时定位等优点显示出强大的生命力和竞争力,在航空、航天、航海及许多民用领域有着广泛的应用。近年来,随着
速度是计算机最基本的性能参数,致力于提高计算机性能的所有方法都是为了加快运算速度。多核系统为并行计算的研究及其实验提供了便利条件,已经成为系统架构设计中的主流。双核