论文部分内容阅读
元搜索引擎具有建立在独立搜索引擎之上的特性,能够为用户提供更好的检索帮助,从而近年来获得了较为广泛的应用。但是随着时代的发展,人们需要元搜索引擎能为每个用户提供“量身定制”的个性化服务,并且更进一步期望含义模糊的检索要求能够得到有效服务,以帮助用户廓清其真实的检索需求。针对这两个问题,本文首先围绕元搜索引擎、个性化模式、推理等一系列相关内容深入进行了研究综述;接着在分析了一般元搜索引擎模型的基础上,设计了一个基于Agent的智能元搜索引擎模型(M.Meta-search Engine,MMSE)并研究了一些主要实现技术;然后针对用户的个性化、智能化检索需求,从理论上给出一种树图和基于本体的模式空间图的两层概念层次表示的个性化模式库建模方法,并且研究了模式库的建立与更新算法;随后为满足用户特殊的模糊检索需求,提出了建立在个性化模式库基础上的一种推理机制,给出推理算法并进行了理论分析;最后为了体现上述工作对信息检索的重要作用,设计了本系统的分类逐层深入检索交互界面原型。本文的创新性尝试主要有:1)在对现有元搜索引擎一般结构深入分析的基础上,设计了一个基于Agent的智能元搜索引擎模型(MMSE),该模型具有一定的实用价值;研究了一种基于搜索引擎知识库的新的成员搜索引擎调度策略,依据收集并储存于基于特征词条的权值向量矩阵等结构中的各引擎重要信息来进行成员搜索引擎的调度选择;在基于概率模型的基础上,研究了分类相关度排序法,分类思想的使用不仅能使用户更快地找到所需信息,还便于系统收集用户反馈信息,并由此设计了分类逐层深入检索交互界面原型。2)提出了一种树图和基于本体的模式空间图的两层概念层次表示的模式库建模方法。树图的初始值是依据杜威十进分类法,并对其做了扩展的基础上而来,从树图中查找以选择模式空间图,能使系统整体上有一个提纲挈领的作用;深入研究了基于本体的模式空间图,在空间图中建立本体节点,并引入区间值模糊集理论,给出节点的本体表示及一系列相关的定义与公式,构建了相应的数学模型。这种建模方法对改进传统树型建模的不足有一定益处,更利于建立、使用和完善用户个性化模式。最后提出了模式库的建立与更新算法,设计了一系列相关的数据结构和隶属函数,理论和实验分析证明该算法具有正确性、有效性并且复杂度低的特点。3)提出了建立在个性化模式库基础上的一种推理机制以及个性化模式库的推理算法。个性化模式的全体构成了用户信息检索时的行为背景,从心理学以及人工智能角度的分析支持了该背景提法对推理用户真实检索需求具有可行性。推理机制是为了解决用户的一些特殊需求(比如用户对检索需求认识不清等)而提出的,理论分析证明了该算法具有正确性、有效性并且复杂度低的特点。本文在教育部科技研究重点项目“基于Agent的个性化Web信息检索技术的研究”、以及两项山西省自然科学基金项目“个性化Web信息检索及其代理技术的研究”和“图像情感语义的本体描述方法研究”的支持下,选择了元搜索引擎的个性化与智能化作为研究内容,针对每一个用户的独特信息需求进行有针对性的服务,满足用户的个性化、智能化检索需求,从而提供和完善一种合理的信息服务方式,对充分利用Internet上的资源进行信息检索,提高资源的利用率和检索的效率,实现信息时代人们的个性化需求,具有重要的理论意义和实用价值。本文研究的内容是信息检索的发展趋势和热点方向,故具有一定的前沿性与创新性。