基于RDBMS的XML文档检索技术研究与实现

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户：liyongrubylian

【摘要】

：

因特网诞生以来，网络信息资源急剧增长，如何利用数据检索技术有效的发现和使用资源成为急待解决的问题。XML具备许多HTML没有的优点，其实现了内容、结构和表现三者的分离，因此适

【作者】

：

何东彬

【机构】

：

内蒙古大学

【出处】

：

内蒙古大学

【发表日期】

：

2006年01期

【关键词】

：

XML 检索索引存储

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

因特网诞生以来，网络信息资源急剧增长，如何利用数据检索技术有效的发现和使用资源成为急待解决的问题。XML具备许多HTML没有的优点，其实现了内容、结构和表现三者的分离，因此适于数据表现、交换及存储。同时，它是一种半结构化文档，其结构信息使得文档不仅能够被计算机所理解，同样适合人类阅读。而且，XML较HTML更加适合应用于网络和检索。因此越来越多的数据开始使用XML进行描述、存储和交换，XML正逐渐成为Web舞台上的新星，取代HTML成为Web数据表现、存储、集成和交换的标准指日可待。如何有效地利用、加工、分析和处理XML，目前已经存在一些XML的查询和存储管理技术方面的研究成果。本文在前人已有工作的基础上，针对XML文档的具体特点，从检索原理、数学模型、信息压缩、数据库实现等方面研究了已有的技术和实现手段，就XML文档检索模型的主要技术问题，给出了一个XML文档检索的总体框架和理论模型，提出了一种索引和存储方案。具体就是基于数据库存储，充分利用成熟的数据库系统以简化对并行处理、数据恢复、事务处理的系统实现；对文档树的内容和结构进行先序索引；对索引表中关键词的置入表进行压缩编码处理。并给出了基于树查询的部分匹配检索算法，使系统适用于不同类型的XML文档的检索需求。最后，设计并实现了一个基于改进向量空间模型的原型检索系统。

其他文献

嵌入式小词汇量语音识别系统的设计与实现

近年来,语音识别技术取得了巨大的进展。人们迫切的希望把它推向广泛的实用领域,而不满足于只是理论研究。本文以教研室的《基于鱼类生物模型的计算机动画》项目为背景,分析

学位

语音识别特征提取线性预测动态时间规划

基于Inclusion-Exclusion原理的频繁项集压缩方法的研究

频繁项集的挖掘是多种数据挖掘任务中至关重要的一步，然而由于潜在的频繁项集的数据与项的个数呈指数倍关系，导致了频繁项集的数量都往往大得惊人，使用户难以处理和理解，不仅仅影

学位

数据挖掘频繁项集压缩表示Inclusion-Exclusion冗余信息推算

LogGP模型的同步通信性能分析与评测

论文以LogGP并行计算模型的长消息通信机制为核心展开研究。并行计算模型为并行算法和并行计算机系统结构的分析与设计提供了具有指导意义的理论界面和模型框架，它是并行计算

学位

并行计算通信机制长消息通信模型同步通信

时空数据库数据生成器的研究与设计

随着“数字地球”概念的提出，地理信息系统和时空数据库已经成为研究热点。而今移动通信技术的高速发展，时空数据库越来越多地应用在地理信息系统、交通管理、定位、城市规划、

学位

地理信息系统时空数据库数据生成器无线定位业务

“设计模式”与SNMP网管软件的开发

SNMP(Simple Network Management Protocol，简单网络管理协议)是TCP／IP网络上应用最广泛的网络管理协议，网络上的服务器、工作站、路由器等各种网络设备基本都支持这一协议，因此

学位

“设计模式”SNMP分布式网络管理JAVA

基于自定义空间要素类型的WFS服务系统

随着Intemet技术的迅速崛起和在全球范围内应用的飞速发展，信息共享已经成为—种必然的要求，地理信息也不例外。为了促进地理空间信息的共享和互操作，开放地理信息联盟(OGC：O

学位

WFS服务系统查询执行策略自定义空间信息共享查询分解算法地理信息数据库连接池技术

基于多层Markov网络的信息检索模型

随着互联网的蓬勃发展，信息资源数量呈指数级的增长，信息检索技术也在不断地进步。通过信息检索系统，用户可以迅速地接触到丰富精彩的信息，对于生活、工作和学习都带来了许多便利

学位

信息检索多层Markov网络查询扩展团

基于Web Services和元数据的信息集成技术研究

随着市场竞争的加剧及经济全球化的发展,虚拟企业、协同设计、网络化制造、企业动态联盟等虚拟系统将是未来企业的主要组织形式。信息集成是这些虚拟系统有效运作的前提和基

学位

虚拟系统信息集成Web Services元数据查询处理查询优化

面向移动可视搜索的描述符生成和压缩算法研究

目前，移动可视搜索研究主要是基于客户端-服务器模式，将图像特征上传到远程服务器进行查询，从而完成目标识别。但这种模式对网络实时传输依赖性较强，当网络拥塞时，会出现查询速度

学位

移动可视搜索系统描述符生成算法压缩算法检索时间

基于.NET的电子商务系统的研究与实现

随着互联网的迅速发展,电子商务有了飞速的发展,企业信息系统的也越来越复杂化,因而对企业管理和经营模式也提出了全新的要求。现今的电子商务都要求建立在信息的获取和发布

学位

.NET电子商务Web服务

基于RDBMS的XML文档检索技术研究与实现

其他学术论文