面向推荐的Web检索系统研究与实现

来源 :中北大学 | 被引量 : 0次 | 上传用户:pooh__5210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,Web资源越来越丰富,内容越来越广泛,它已成为最重要的信息源。帮助用户快速、准确地查找和推荐有用的信息,具有广泛的应用背景和实用价值,已经成为近年来的研究热点。论文将Powazi.com中具有推荐功能的信息检索作为研究工作的应用背景,设计与开发了一个支持推荐的Web检索程序系统。综述了信息检索、推荐的理论和关键技术。依据传统信息检索与推荐方法,对改善Powazi.com的检索及推荐效果,进行了较深入的研究和实践。研究工作主要包括以下几个方面。(1)基于改进向量空间的检索算法研究。针对传统搜索引擎缺乏语义理解的缺点,在传统的信息检索方法上提出一个基于改进向量空间的检索算法。该算法采用统计法建立“文档—潜在语义一词”之间概率分布关系,并利用这种关系进行检索。当用户在Pwaltz的检索系统中输入查询关键字后,检索系统先使用VSM模型将文档中包含关键字的文档检索出,形成基本满足用户查询需求的结果集;接着使用PLSA模型,找出和关键词最相关的潜在语义,查找到的潜在语义查询和它最相关的文档,计算各个文档的关联度,并排列顺序。实验证明,关键词和文档的关系通过隐含语义层联系起来,使信息检索能够理解用户请求,改善了信息检索效果。(2)Pwaltz系统的推荐算法研究。将推荐问题转变成一个排序问题,提出了一种基于Random walk的机器学习调整异构资源网络参数算法。该方法采用机器学习确定不同类型节点之间边的权重,根据系统内信息的重要度和相似度,向用户提供:与查询关键词相关,并且在系统中比较重要的信息。实验证明,在推荐效果上基于Random walk的机器学习方法优于基线方法。(3)支持推荐的Web检索程序系统建构。按照Pwaltz系统的检索与推荐功能需求,采用JAVA编程实现了基于MVC的Web检索与推荐程序系统。该程序系统在采用lucene全文检索技术的基础上,依据基于改进向量空间的检索算法,基于Random walk的机器学习调整异构资源网络图参数算法,优化了系统的检索和推荐功能。通过系统演示,给出了从文档索引建立、准确性检索和多类型资源推荐的整个流程。综上所述,论文提出的:基于改进向量空间的检索算法,基于Random walk的机器学习调整异构资源网络图参数算法,具有模型简单、易于软件工程人员理解的特点。不仅在理论上值得深入研究,而且还具有较好的工程应用价值。
其他文献
随着Internet技术及应用的迅猛发展,web数据库的应用开发已成为主流和发展趋势。通过计算机教学管理系统实施学校教学工作的综合管理,是提升学校教学管理工作的水平、促进学
本研究针对传统报表工具(面向程序员报表)的不足和用户的不同需求,实现了具有明细查询和汇总统计等功能的动态报表(用户可以自由组合不同种类、不同格式和不同条件);实现了具有
随着计算机网络技术与多媒体技术的发展,数字多媒体作品的制作、复制与传输变得非常方便与快捷,与此同时,它们的版权保护也成了迫切需要解决的问题。数字水印技术作为知识产
针对钻井企业物料管理中因钻井物料库存量大、种类多、价值高而导致的管理难度大、成本高的现状,指出开发钻井ERP系统的必要性。采用ERP物料清单的管理思想和方法,在钻井工程的
据最新的互联网发展状况统计报告显示[1],在中国2.1亿网民中约八成是网络音乐和影视的用户。可见,流媒体技术成为当今互联网的一项主流应用。由于流媒体具有带宽高、时延长等特
在中国石油勘探生产分公司信息化建设过程中,存在着勘探生产应用系统相互独立,难以进行信息整合与共享的问题,需要采取一些办法对这些应用进行集成。Web服务是建立在XML基础上,适
网格技术自20世纪90年代中期出现后,便引起人们的广泛关注,目前该技术正从科学计算领域转向广阔的工业领域。数据库在诸多领域的应用中扮演着不可或缺的角色,当前数据库系统
无线Ad Hoc网络是一种无线多跳的、无固定基础设施的移动对等网络。它由一组移动终端临时组成,具有多跳路由、动态拓扑、自组织等特性。组播是一种介于单播和广播之间的、一对
学位
本文在前人已有的工作基础上对智能规划领域的观测约简和互斥检测问题做进一步的研究。智能规划的研究领域在近年来得到了不少的扩展,比如不确定规划(NDP)放松了确定性系统的