论文部分内容阅读
半结构化数据XML凭借自身所具有的自描述性、灵活的数据结构及丰富的数据表示能力等特性,正在成为Internet上数据描述和交换的标准。XML数据指数级的增长,要求更有效的对XML数据进行管理及对其更快、更准确的查询。因此XML数据库的研究及对XML数据的查询成为新的研究热点。
查询系统是数据库的关键部分,而索引技术是实现快速、准确查询的有效方法,因此本课题选择该部分进行研究。众所周知,面向对象的方法具有很强的建模能力,本课题针对面向对象的XML数据,设计与实现了面向对象XML数据库中的基于路径仓索引模式的查询系统。论文首先介绍了本系统实现的理论基础,这包括查询系统所涉及的数据模型、查询语言等。面向对象XML的数据模型类似复合对象数据模型,该模型支持元素层次,多重继承和多态等特性;其次设计并实现了本系统的存储模型和索引模式。本系统对面向对象XML文档采用了两种存储模型:集中式数据仓和分布式数据仓,并在这两种存储模型的基础上建立了两种索引模式:集中式路径仓和分布式路径仓;再次本系统基于两种存储模型和两种索引模式分别设计与实现了扩展XML-RL查询语言的两套查询代数,并结合面向对象的特征实现了面向对象XML的查询。
最后通过对本文提出的查询系统进行的功能测试和性能测试,结果表明系统性能良好。与面向对象XML数据库的查询系统的测试结果比较,本系统的查询性能优于前者,因此本文设计的索引模式和查询代数是可行的,本系统可以完成对面向对象XML的快速、准确的查询。