改进的篇章微观结构分析及参数优化方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zszkcj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过对文章中关联词的分析,针对关联词的各种逻辑关系,按照一定层次分析出文章的层次结构关系.通过与已有的语义分析模型相结合,完成文摘模型的建立.对其进行参数优化以后,利用文摘生成技术,生成文摘.具体的讲,该文从如下几个方面进行了研究:一、该文研究了目前中文信息处理方面比较常用最大匹配自动分词算法.首先介绍了自动分词当前所面临的关键问题,包括歧义切分和未登录词识别问题.进而介绍了最大匹配算法的实现原理和实现方法.二、研究了篇章微观结构分析中的复句分析算法.首先讨论了复句内部依存关系,从语言学上对复句的依存关系进行分类.在分析了各种依存关系 后,讨论了如何通过关联词进行复句结构分析,着重分析了该改算法(ISAA)与原结构分析算法(SAA)的改进之处,最后给出了分析实例.三、为了进一步提高文摘的质量,必须对复句的上一级别即段落也进行高质量的结构分析,该文讨论了如何用复句分析算法来有效改进段落分析算法(PAA),在此基础上,实现了段落分析算法.四、对于关联词权值的确定,当前没有好的处理方法,主要是采用经验预先给定,该文在研究遗传算法及其在数值优化上应用的基础上,给出了遗传算法与关联词权值联合起来对关联词权值进行优化的方法.该方法有效的 提高了文摘的质量.
其他文献
人群疏散仿真在公共安全领域中有着重要应用。与传统人群仿真相比,疏散仿真具有行人个体状态和认知能力各异、环境危险情况多变、疏散时间压力大等特点。本文主要针对拥挤人群
目前,汇率预测常用的方法有人工神经网络和贝叶斯估计方法,但它们一般都仅基于数据本身,没有充分利用与之相关的经验知识.事实上,影响汇率变动的因素很多,如政治、经济、心理
随着社会发展,电子商务正成为现代商务的主流,而政府作为社会主要信息的收集和发布者,如果其信息化应用水平跟不上企业和社会上信息发展的步伐,信息化应用水平跟不上企业和社会信
现在的软件系统对软件质量的要求越来越高.如何提高软件质量有两个关键因素:过程质量的控制和软件产品本身的质量.在传统的软件测试中,比如V模型,人们只对软件产品本身进行测
软件维护占据了软件产品的很大一部分成本,以往的研究显示软件维护消耗了70%左右的软件开发成本。随着现代软件工程的发展,软件缺陷(bugs)是不可避免的产物。修复软件缺陷是软件
90年代初期是客户/服务器模式的鼎盛时期,大多数金融、电信企业采用这种技术,组建企业内部网,这种架构分为客户机、服务器两个层次,其主要特点是:客户端:提供用户操作界面,接
随着电子商务的发展,电子商务系统所包含的商品信息越来越多,给电子商务系统的用户带来了所谓的“信息过载”问题,即用户需要过滤掉越来越多的无关内容才能找到自己感兴趣的商品
该文撰写的背景是中国科学院“十五”重大科研项目--科学数据库及其信息系统.该文的主要研究成果包括(1)综合的考察并分析了科学数据库对元数据标准的需求,为科学数据库中如何
该文对数据挖掘中的分类和聚类方面的技术进行了初步的探讨和研究,对部分算法进行了实现和改进.其中,分类采用的核心方法是二叉的决策树归纳,一个重要的设计原则是对较大的数
该文提出了对移动代理系统安全性的要求,论述了目前已提出来的保护代理平台和保护移动代理的技术,分析比较了这些技术的优缺点和实用性.该文从分析代理平台对移动代理攻击的