论文部分内容阅读
随着互联网的蓬勃发展,网上信息资源呈几何级数的速度增长。搜索引擎的出现帮助广大网民迅速定位到自己想要的信息,节省了用户在漫无边际的网络中查找信息的时间,但是单个搜索引擎的覆盖率却随着网络信息的快速增长而开始下降。为了提高搜索的覆盖范围,元搜索引擎应运而生。元搜索引擎是利用现有的独立搜索引擎的查询性能,将它们看作一个整体,为用户提供一个统一的查询界面并返回结果。本文在综合分析国内外有关元搜索引擎排序技术的基础上,对如何提高元搜索引擎精度进行了深入的研究。首先,介绍了独立搜索引擎和元搜索引擎中一些相关的基础知识,并在此基础上深入地分析了元搜索引擎存在的必要性以及当前存在的不足。针对用户查询信息不足的问题,提出一种基于元搜索引擎的查询扩展的方法,利用该方法对用户的查询词进行扩展,然后选取与原查询词贴近度最大的几个扩展词,进行输入并按照一定的排序算法返回结果。其次,元搜索引擎的调度策略是元搜索引擎的关键技术,在对已有的一些调度算法介绍并分析的基础上,提出一种新的元搜索引擎的调度方法,该方法从系统和用户两方面入手,系统按照一定的方法选择出系统认为是最重要的几个通用搜索引擎,用户则从主观上挑选出几个优秀的专业搜索引擎,按此方法对独立搜索引擎进行调度。并通过实验对提出的调度方法进行验证。最后,针对元搜索引擎如何进一步提高搜索精度的问题,在介绍和分析当前一些主要的结果排序算法的基础上,提出一种基于位置/网页摘要与标题相结合的排序算法来对元搜索引擎结果进行合并,并最终通过实验对所提出的算法的有效性进行了验证。