面向生物医学领域的问答系统的研究与实现

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:ivyjiawx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字信息的膨胀,大量可用的数字信息对于回答用户的各种问题变成了可利用的资源。传统的信息检索通常会对用户的提问返回成百上千篇文档,而用户必须依靠自己在这些繁多而又充满重复的文档中筛选自己需要的有用信息。为了克服这些不足,近年来,越来越多的研究机构和公司致力于新一代信息检索系统的研究。其中一个很重要的方向就是问答系统。现今大多数的问答系统对于简单的事实性问题和常问问题的回答已经达到了很高的准确率,然而对于特殊领域和复杂问题回答研究的很少,而且准确率不高。本文根据生物医学领域的特点,设计并实现了一个面向生物医学领域的问答系统。本文是对生物医学问答系统的一个探索,系统包括三个主要组成部分:问题处理、信息检索和答案抽取。不同部分运用了不同的自然语言处理技术,因此可以说问答系统是集自然语言处理技术的大成。在问题处理阶段,浅层句法分析的引入,能够有效的将问题分类并提取出关键词,同时生物医学语义资源的应用能够将问题中的关键词进行有效扩展,提高系统的召回率。在答案抽取阶段,为了在文档中找到含有一定信息量并且冗余信息少的文档片断,本文给出了一种段落抽取方法,首先获得相应的自然段,然后在自然段的基础上通过热区找到所需片断的位置。为了节约用户的时间,在返回给用户答案时,利用计算句子相似度的方法有效去掉重复或相近的答案。该系统在TREC(Text Retrieval Conference)的数据集上进行了实验及测评,从各项指标上看,本系统能够有效的回答生物医学问题。
其他文献
近年来随着许多P2P系统的出现,P2P技术逐渐成为人们研究的热点。P2P技术目前主要应用在文件共享、分布式计算、协作系统、电子商务和以P2P为基础的深度搜索引擎等方面。其中,信
在当今的证券行业,集中交易已经成为必然的趋势,它给证券公司带来的优势是无法比拟的。所谓证券集中交易,就是采取业务整合、数据整合的方法,将当前证券公司基于营业部的、分散的
直接体绘制是体数据可视化的一种重要方法。体数据通常来自于计算机断层扫描(CT)、核磁共振成像(MRI)等采样设备,其他还包括如计算流体力学(CFD)、地震采样数据等。很多科学计
数据流是一种潜在无限的、连续快速的、随时间不断变化的数据序列,挖掘数据流中的频繁模式已成为数据挖掘的研究热点之一,许多数据流频繁模式挖掘算法被陆续提出。由于数据流中
入侵检测作为一种积极主动的防御手段,近年来已成为信息安全领域的研究热点。针对信息安全等级保护测评过程中发现的四种主要攻击类型,拒绝服务攻击(Dos)、监视探测活动(Prob
随着移动通信技术的飞速发展和手机普及率的迅速提高,手机短信越来越受到众多人士的青睐,短信日益成为人们日常生活中的一种重要通信和交流方式。然而,随之产生的大量垃圾短
本文对数字化高职学院教务管理系统的设计与实现进行了研究。文章首先介绍了教务管理系统研究的背景及意义、教务管理软件发展的现状和趋势。其次,详细阐述了数字化高职学院教
学位
人脸具有非常丰富的信息,是人类互相认识主要标志。人脸信息处理在计算机视觉、模式识别、多媒体技术研究中占有重要的地位。人脸检测作为人脸信息处理中的一项关键技术,是目
随着计算机技术的发展,人工智能已经成为研究的一个热点。而机器人世界杯—RoboCup为人工智能的研究和应用提供了标准平台,其中最新引进的RoboCup3D仿真竞赛是其重要组成部分。