基于模式的XML文档模糊检索技术

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:lhm136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet己成为当今和未来人们获取资源和信息交流的主要场所,而Web则是Internet上应用最广泛的服务。到目前为止,几乎所有的Web页面都是用HTML编写的。HTML简单易学又通用,句法简明紧凑,使它得以在Web页面上大显身手。但是随着互联网技术的飞速发展,HTML语言本身所具有的弱点,使得其已不能满足Web越来越广泛的应用。XML可扩展标记语言是专门为Web应用设计的一个简单的SGML的子集,既克服了HTML的不足,又除去了SGML中那些对于当前Web用户来说不必要的特性,必将成为Web应用的主流标记语言。 本文在对XML文档的特点、XML文档的基本理论、XML查询语言及传统信息检索模型在XML文档检索中的应用等问题进行仔细分析的基础上,提出了基于模式的XML文档模糊检索模型系统的总体系统框架及具体算法。作者首先将查询语言XQL作了一些改进,提出了一种简单的模糊查询语言。它支持分类层次体系结构及布尔查询模式,实现了基于模式的模糊检索算法来对XML文档的检索。充分利用XML文档查询语言分类层次体系结构的特点,对每个XML查询式分析其结构,从而实现XML查询的扩展。利用查询扩展代价来进行查询结果的排序。采用太原理工大学硕士研究生学位论文自底向上的查找方法实现路径匹配,准确定位用户的兴趣需要。同时最大限度地减少检索时间,提高检索速度。本系统还只是个原型系统,相信随着时何的推捧,其功能将不断完善;必将成为一个真正实用的系统。
其他文献
在美国国家安全局2000年发布的信息保障技术框架中,根据计算机网络的拓扑结构,将网络信息安全划分为三个层面的安全:内部用户应用环境安全、应用区域边界安全、网络传输安全.
随着中国加入世贸组织,企业资源计划将成为每个企业提高自身竞争力的一个重要的选择方案.该文结合当今流行的J2EE技术和Struts框架,提出了一种新的构建ERP系统的方案,并给出
模式是软件工程的重要研究领域,在软件设计中使用模式可以比面向对象技术实现更高层次的软件复用,提高软件的生产率与质量,因此是软件工程领域近年的研究热点.早期的模式研究
该论文首先介绍了现有接入技术,然后分析了DSL(数字用户环路)技术的优势,之后对组播技术,尤其是IP组播技术做总结分析比较.通过对DSL中DSLAM(DSL接入复用器)设备的发展和现有
软件复用是提高软件开发生产率和软件产品质量的一条行之有效的途径。类库作为一种粒度粗细可控性强的复用方式从众多的软件复用技术中脱颖而出。它不仅是开发者进行快速应用
随着计算机技术的发展和数据应用需求的不断增长,企业对数据库的应用已经从小型数据库发展到了Oracle、SQL Server等大型数据库。但是出于成本以及使用方便性的考虑,企业信息资
高可靠性的个人身份验证系统在身份证管理、电子商务、自动银行等众多领域有着广阔的应用前景。生物识别技术,是利用人体生物特征进行身份验证的一种技术。与传统的使用密码或
学位
传统的工作流管理系统多是基于集中式的C/S结构,工作流引擎驻留在一个或者多个服务器上,负责调度所有物理上分布的各个活动的执行,实时连接和频繁交互会造成网络拥塞和服务器
传统IP网络所采用的"尽力而为"转发机制,已经不能满足用户的QoS要求.QoS实现问题一般可分为两部分:(1)QoS路由问题;(2)资源共享问题,其研究对象为各种接纳控制(Admission Con