基于百度百科的人物新闻本体自动构建研究与实现

来源 :武汉理工大学 | 被引量 : 2次 | 上传用户:j395188088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体在语义网七层模型中处于词汇的“定义层”,用于向计算机描述各种概念,实现人机交互的概念共享。在互联网时代,对于人物信息的检索需要从海量结果中筛选出针对同一目标人物的信息,利用本体可以解决不同人物描述之间的歧义问题。本文针对新闻内容出版过程中需要检索人物信息的情况,设计了一个人物新闻本体自动构建模型,通过对模型的研究和实验对人物新闻本体自动构建的重难点进行分析。本文完成的主要工作如下:1.通过对人物新闻本体自动构建中的关键环节人物实体识别的研究,结合人物新闻本体,对人名识别、人名消歧的流程进行了优化。2.根据对本体概念、本体构建的理解结合百度百科人物相关词条、人物新闻相关内容,构建了简单的人物新闻本体的基本框架,设计实现了利用抓取的内容资源实现本体自动完善的流程。本模型利用采集的百度百科信息构建人物新闻本体中的基础人物个体,利用本体中的人物个体对采集的新闻数据进行实体识别处理后构建人物新闻本体中的新闻个体,并利用新闻信息对人物个体进行完善、补充,完善人物的基本资料。3.通过对百度百科人物相关词条、人物相关新闻的内容组织结构、内容特点进行分析,设计实现了百度百科人物相关词条、人物相关新闻内容的抓取处理流程。根据人物新闻本体的自动构建完善流程的结果的初步验证和分析,总结了人物新闻本体实现完全自动构建所需要解决的关键问题。本文构建了一个简单的人物新闻本体,设计了利用百度百科和人物新闻来完成本体自动构建的系统,初步实验可以实现人物与新闻的关联,构建的人物新闻本体以人物个体的形式提供人物相关信息的知识服务,可以为人物新闻的编辑写作提供相对准确、丰富的参考资源,减少用户的信息搜集、处理工作,具有一定的应用价值。同时通过对本体自动构建的研究和实践,提出了进一步完善人物新闻本体自动构建系统的方向。
其他文献
以新疆开都河-孔雀河流域为例,利用熵值法分析原理建立了流域水资源承载力综合评价指标体系,对其进行了量化分析以及指标客观赋权,并得出研究区水资源承载力水平综合得分值.
研究了绿微康打浆酶LPK-CR616E应用于竹浆打浆的最佳工艺和使用效果。当打浆酶用量150mg/kg绝干浆、水浴温度50℃、pH7.0、作用时间60min、揉搓时间间膈10min时,作用效果最好。L
本文介绍了其特点及如何以风险为导向进行内部审计,以期对相关企业的内部审计管理工作有所帮助。
<正>自冷战结束以来,不干涉他国内政的原则受到越来越多的挑战。有两个因素可以解释这种变化:一是经济全球化和相互依赖;二是苏联解体和东西方对抗结束以后,越来越多的人认识
21世纪我国将面临严峻的人口———粮食———资源———环境的挑战。农业高新技术的突破性发展是解决这些问题的唯一途径。本文简述了农业高新技术的内涵及十大特点,分析了
<正> 「歌舞伎」——日本传统的古典歌舞剧,是多年以来日本人民丰富的创造性积累的成果,是综合了日本古典民族艺术和民间艺术的结晶,在日本国内拥有广大的观众。「歌舞伎」是
<正> 硅平面器件在工艺流程中,通过每次光刻时,背面氧化膜均被刻蚀,因此引起了两个严重问题:一,在扩散时硅片的背面与正面(抛光的一面)刻蚀后的图形区都等同的扩入了p、n型杂
IEC60870-5-104远动规约在电力系统中的应用越发广泛,但由于104规约在制定过程中预留的可定制项较多,不同厂家、设备的规约解释与处理方式不尽相同,给厂站远动信息接入带来了
全球性的能源短缺、环境污染等问题使得太阳能这一清洁、无害的高效绿色能源成为了最理想的替代能源。针对太阳能电池的摸索与改进成为了各国科学家讨论和研究的热点。近年来
对于法理学与法哲学的关系,我国学术界大致上可以分为“法哲学独立论”和“法哲学即法理学”两大系列观点。法理学与法哲学都是研究法律一般理论的学科,但由于支配它们的哲学