元搜索引擎调度策略及结果排序算法的研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:jessiemaa18
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的蓬勃发展,网上信息资源呈几何级数的速度增长。搜索引擎的出现帮助广大网民迅速定位到自己想要的信息,节省了用户在漫无边际的网络中查找信息的时间,但是单个搜索引擎的覆盖率却随着网络信息的快速增长而开始下降。为了提高搜索的覆盖范围,元搜索引擎应运而生。元搜索引擎是利用现有的独立搜索引擎的查询性能,将它们看作一个整体,为用户提供一个统一的查询界面并返回结果。本文在综合分析国内外有关元搜索引擎排序技术的基础上,对如何提高元搜索引擎精度进行了深入的研究。首先,介绍了独立搜索引擎和元搜索引擎中一些相关的基础知识,并在此基础上深入地分析了元搜索引擎存在的必要性以及当前存在的不足。针对用户查询信息不足的问题,提出一种基于元搜索引擎的查询扩展的方法,利用该方法对用户的查询词进行扩展,然后选取与原查询词贴近度最大的几个扩展词,进行输入并按照一定的排序算法返回结果。其次,元搜索引擎的调度策略是元搜索引擎的关键技术,在对已有的一些调度算法介绍并分析的基础上,提出一种新的元搜索引擎的调度方法,该方法从系统和用户两方面入手,系统按照一定的方法选择出系统认为是最重要的几个通用搜索引擎,用户则从主观上挑选出几个优秀的专业搜索引擎,按此方法对独立搜索引擎进行调度。并通过实验对提出的调度方法进行验证。最后,针对元搜索引擎如何进一步提高搜索精度的问题,在介绍和分析当前一些主要的结果排序算法的基础上,提出一种基于位置/网页摘要与标题相结合的排序算法来对元搜索引擎结果进行合并,并最终通过实验对所提出的算法的有效性进行了验证。
其他文献
目前,无线局域网的通用标准是由IEEE制定的802.11标准。该标准定义了无线局域网媒体访问控制(MAC)和物理层规范。在标准中,访问无线信道的基本机制是基于载波侦听多路访问/冲
机器人,是多学科交叉与融合的结晶,计算机技术、人工智能、材料学、网络通信等技术的飞速发展,也推动着机器人技术的不断前进。而仿人机器人,这个人类最初的梦想,是机器人发
航拍图像处理系统是一款针对航空采集的影像进行处理并能生成处理报告进行分发的图像信息综合处理系统。所处理的类型有CCD图像、红外图像、雷达图像等。所包含的模块有图像
学位
功能磁共振成像(fMRI)研究表明静息状态下功能相关的脑区间存在着低频、同步的自发神经活动,而且这种同步活动具有重要的生理意义。本研究组在静息态fMRI的计算方法与应用领域
样条函数,就是具有一定光滑性的分段函数。样条在函数逼近、计算几何、计算机辅助几何设计、有限元等领域中有广泛的应用.同时样条函数又是散乱数据插值和拟合中常用的方法之
随着网络用户的快速增长,网络拥塞问题日趋严重。拥塞控制机制是提供数据流的传输速度与网络所能提供的可利用带宽有效匹配的保证。在网络中间节点实施的主动队列管理算法(AQ
随着社会的进步和人们生活水平的提高,人们更加注重生活质量,要求住宅更加安全、方便和舒适,智能家居的概念应运而生。智能家居(Smart Home)的基本构建单元是住宅,利用综合布线技
本硕士论文中主要探讨了强化学习中的两个方法。一个是基于图模型的关系强化学习方法,另一个是结合核函数的函数估计方法。前者重点解决关系模型下先验规则的学习筛选。后者试
学位