文本检索相关论文
文本检索的主要任务是从海量语料中匹配与查询相关的文档,通常返回的是相关的候选文档集合或是按照语义相关性排序的候选文档序列......
随着互联网和数字化技术的发展,网络上的信息越来越多、数据规模越来越大,传统的人工团队难以应对用户各种实时性的数据需求。为此......
随着信息化的持续深入与快速发展,各行业的存储数据量急剧增加,促进了大数据相关技术的蓬勃发展。文本检索作为文本大数据处理和分......
随着互联网大数据时代的到来,越来越多的信息从书面存储转向了网络存储,数字技术在人们的工作生活中的各个方面都体现的淋漓尽致,......
学位
随着法律文书数据越来越多,信息过载问题日益严重,快速且准确地在海量法律文书中进行检索显得非常必要.法律文本作为一种特殊的文......
勘探开发领域的工作结果往往以论文、报告等非结构文档的形式进行展示,而勘探开发知识图谱是其知识提纯的产物。实际的勘探开发工......
机器阅读理解是自然语言处理领域中的一个重要研究方向,它要求机器通过阅读文本回答问题。以往的机器阅读理解模型大多专注于单文......
流数据往往是由连续的数据块组成,数据流场景下的检索研究是数据挖掘领域的重要基础应用,其在机器学习等各种分析任务中扮演着不可......
大数据时代人们对海量语音数据的检索需求和提高语音检索系统性能的要求变得越来越迫切,因此语音检索方法的研究逐步地成为一个热......
查询空间与文档空间的不匹配是文本检索中的一大难题,在句子级别的检索中表现尤为突出.为解决这个问题而提出的查询扩展方法本身存......
TREC2004 Robust任务有一项新要求,就是要把检索主题按照从易到难的顺序排列.针对新要求,该文提出了基于单词歧义性大小的检索主题......
提出了一种全新的文本与多媒体检索方法,既可实现各种对象的混合检索,又能实现对象的分类检索;可以检索中文字、词、英文文字、音......
虽然已有的研究表明,相对于词袋模型,利用词项依存关系能够显著的提高检索性能,但不同的词项依存关系却缺乏系统的横向比较。为此,在文......
随着三维应用的普及,三维模型大量产生并广泛传播。由于三维模型广泛应用于计算机辅助设计、三维游戏、电影特效制作等诸多领......
会议
研究将XML文本检索方法应用于长文本环境,并以中文博硕士论文为数据集。对博硕士论文数据集的XML标引、索引、关键词检索和结构化......
文章对传统信息检索中存在的问题进行了分析,简单介绍了语义网,并针对基于语义网的信息检索进行了简单的论述,最后对语义网信息检......
全文文本检索及其汉字软件实现研究胡燕导师:曾民族研究员(北京文献服务处) 全文文本检索的基本特点,是系统对文本中的每一个词建......
本文强调了一个情报检索系统在正式运行前必须进行试验,并阐明了一个复杂的情报检索系统是由多种因素制约的。当发现实际值与理论......
本文在传统检索方法的基础上,综合运用人工智能基于知识的理论和技术,提出一种文本概念检索方法。这种方法试图从自然语言中的概念及......
文章通过对维普中文科技期刊数据库2000-2003图书馆学情报学核心期刊关于自然语言检索方面论文的调查分析,旨在揭示自然语言检索在......
可进行图像标签搜索的搜索引擎AltaVista引擎能搜索的另一个标记是“image”(图像)。如果你在搜索框中输入一条短“image:Partheno......
古籍文本检索目前大多局限于篇、章及目录,即使是全文检索一般也是基于单汉字的检索,由于没有现成的古籍词表可用,古籍文本的标引......
INEX与TREC是检索领域的两大检索系统评价平台,在检索技术发展迅速的今天依然保持强大生命力,在当今检索技术评价领域起着十分重要......
为满足用户查询多样化需求,检索结果的多元化成为信息检索领域一个新的研究热点。文章提出一种支持搜索结果多元化的数据融合技术,......
“中国科学引文索引”光盘(1996-CD版)是以“中国科学引文数据库”为基础制作而成的,它收集了我国出版的315种中、英文重要期刊上1991~1......
随着微博的快速发展,其在社交领域的地位也越来越重要.基于满足用户从海量微博中获取信息的需求,微博检索已经成为一个重要的研究......
随着Internet的迅猛发展,Internet承载了无比浩瀚的海量信息,如何从这些海量信息中方便高效地获取信息和知识,是当今一个非常重要......
本论文提出了一种新的基于内容的图像检索方法—基于边缘结构几何划分的图像检索方法。该方法用“边缘结构片断(EPS)”描述图像特......
本文设计并开发了结合文本自动分类系统的AIP平台,即全天候信息跟踪平台。它作为关注多方面消息的企业或团体查看Internet上新......
当前,大量的基于内容的图像检索思想都是使用颜色、纹理、形状等视觉特征来获得图像内容信息,衡量图像之间的相似程度以实现图像检......
信息技术的发展使Internet出现了“信息丰富而知识相对匮乏”的问题。由于Internet的开放性及异构性,用户很难快速准确地从WWW上获......
搜索引擎作为针对Web页面的文本检索工具,已经成为了Inernet用户利用Web信息的重要工具.一人优秀的搜索引擎应该能够迅速、准确地......
信息检索,包括信息的组织、呈现、查询、存取等各个方面,为人们提供了快速、精确地获取所需信息的方式.信息检索通常是文本检索,其......
该文从面向大规模真实文本的角度出发,初步介绍并讨论了大规模真实中文文本的处理技术和特点:首先,在文本表示方面,该文采用向量空......
当前农村医疗的信息化建设还不完善,与农村常见病相关的医学数据利用率低、数据量大,如何从这些数据中准确、快速的检索到需要的数......
该文提出了一种基于多级模糊识别的文本自动分类体系.在文本的表示方式上,采用了以词语表示文本的方式,对文本进行以词为单位的切......
在针对公安部门开发的《移动警务助理嵌入式信息系统》系统中,其数据记录有30多万条,该系统由是由PC端和PDA端的两部分应用程序组......
随着Internet的迅猛发展,大量的电子信息成几何级数增长。面对浩瀚的信息海洋,如何从中间获取自己所需的信息,成为越来越多的人的迫切......
随着Web2.0的快速发展,互联网上积累了海量的用户产生内容,如微博、论坛、贴吧、评论等。这类信息资源具有两个显著的特点:(1)文档具......
文本检索通常分为两个阶段,初始检索和重排序。初始检索目标是以较低的代价从整个文档集合中检索出一小部分文档,使其包含尽可能多地......
互联网技术的飞速发展,网络上文本信息爆炸式增长给信息检索技术带来了巨大挑战,人们越来越难以快速准确地从网上检索到自己真正想要......