论文部分内容阅读
Internet己成为当今和未来人们获取资源和信息交流的主要场所,而Web则是Internet上应用最广泛的服务。到目前为止,几乎所有的Web页面都是用HTML编写的。HTML简单易学又通用,句法简明紧凑,使它得以在Web页面上大显身手。但是随着互联网技术的飞速发展,HTML语言本身所具有的弱点,使得其已不能满足Web越来越广泛的应用。XML可扩展标记语言是专门为Web应用设计的一个简单的SGML的子集,既克服了HTML的不足,又除去了SGML中那些对于当前Web用户来说不必要的特性,必将成为Web应用的主流标记语言。 本文在对XML文档的特点、XML文档的基本理论、XML查询语言及传统信息检索模型在XML文档检索中的应用等问题进行仔细分析的基础上,提出了基于模式的XML文档模糊检索模型系统的总体系统框架及具体算法。作者首先将查询语言XQL作了一些改进,提出了一种简单的模糊查询语言。它支持分类层次体系结构及布尔查询模式,实现了基于模式的模糊检索算法来对XML文档的检索。充分利用XML文档查询语言分类层次体系结构的特点,对每个XML查询式分析其结构,从而实现XML查询的扩展。利用查询扩展代价来进行查询结果的排序。采用太原理工大学硕士研究生学位论文自底向上的查找方法实现路径匹配,准确定位用户的兴趣需要。同时最大限度地减少检索时间,提高检索速度。本系统还只是个原型系统,相信随着时何的推捧,其功能将不断完善;必将成为一个真正实用的系统。