基于依存关系网络的查询扩展研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:wgqlogin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息规模的飞速增长,搜索引擎成为了人们快速获取网络信息所必不可少的工具。用户只需向搜索引擎输入查询词,便会得到相应的搜索结果。但是,查询输入通常只有几个词,且常常有歧义,所以有时并不能准确地反映用户的查询意图,导致返回无关信息。实时查询扩展是一种对用户输入进行扩充以便更准确的体现用户查询意图的技术。基于向用户实时的推荐新查询词,它可以补全用户查询句,减少用户的输入量,同时消解意图上的歧义。传统的实时查询扩展技术大多是利用查询日志,基于关键词频率进行查询词补全和查询词推荐。本文首先提出了一种基于“动词+修饰词+名词”依存关系的查询意图表示方法,并基于对总大小为1.15G的915600篇文档的大规模语料分析,构造了一个超过5万个节点的依存关系网络。然后,提出了一个利用上述大规模依存关系网络为用户进行实时查询扩展的方法。实验表明,该方法的扩展成功率达到84%,并能减少用户查询时所需的输入量。最后,实现了一个具有完整检索功能的实时查询扩展系统。该系统综合利用上述的查询词扩展技术和基于字符串的词语补全技术来进行实时查询扩展。系统评测表明,该系统可以减少63.75%的用户操作。而且在经过扩展之后,检索结果的nDCG评分达到88.95%。与微软的Bing搜索引擎的比较表明,本系统在用户输入的词序不同时有更稳定的查询扩展能力。
其他文献
点型紫外火焰探测器性能检验装置在国家消防电子产品质量监督检验中心执行国家标准GB12791-91《点型紫外火焰探测器性能要示及试验方法》过程中发挥着重要作用.它主要对点型
目前众多小微APP存在“信息孤岛”问题——很多APP内的数据在Web上无法访问到,特别是现有的搜索引擎无法快速定位到这些信息。应用内搜索技术,就是专门解决“信息孤岛”的技术,
GEO卫星移动通信系统具有网络控制简单,良好的性能和通信容量保障等特点,成为区域性通信的首选。在GEO卫星移动通信系统中,信道分配是无线资源管理模块的核心,对提高用户的通信质
随着Web2.0的兴起,基于web的在线考试系统正大量涌现。然而开发成本高、维护困难、多媒体支持性差等问题制约了在线考试系统的发展。而云计算服务具备的资源按需分配、用户无
微博,作为一种新兴的互联网交流与分享平台,已经获得巨大数量用户的亲睐,Twitter、FaceBook、Sina、Tencent等微博网站已成为海量信息的发布体。微博平台中蕴含着大量有价值
基于加速度传感器,特别是智能手机内嵌的三轴加速度传感器的人体动作识别是普适计算和移动计算领域的一项重要研究。其研究成果在医疗卫生、生活服务、商业服务、公共管理等领
随着科技的高速发展,人们日常生活中使用的交互方式也越来越具有多样性,但目前的主流交互方式仍存在空间受限、设备受限、操作不便等问题,手势交互以其直观、便捷、有趣味性等特
随着集成电路技术的进步,计算机系统性能不断提升,同时计算机系统的功耗也带来了多种问题。以PKUnity-3(65)系统芯片为核心的PKUnity-3(65)系统也面临着功耗问题的挑战。该系统
随着图书馆提供无线移动服务的时机已成熟,同时国内外科研活动的不断深入,各类文献资源数据也呈海量的形式出现,种类繁多的文献资源数据库每天都提供大量的资源信息。科研人员在
随着经济的增长,有限的资源已经难以适应日益扩大的企业规模,合理分配资源成为增强企业竞争力的重要因素。停机位作为机场的核心资源之一,直接关乎到机场的运营效率,因此以停