面向框架语义分析的汉语句法分析模型

来源 :全国第八届计算语言学联合学术会议 | 被引量 : 0次 | 上传用户:bazhahai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语的句法结构可以从多角度、多层次进行分析,但如果服务于框架语义分析,则有其特定的要求.本文试图构建一个汉语句法分析模型,它是一个词汇化的句法分析模型,能够解决框架语义分析的特定需要.我们使用了BaseNP的界定和依存关系模型,后者中心词的确定是研究重点.由于框架语义分析的实质是研究中心词与支配词之间的依存关系,因而面向框架语义分析的句法分析需要分析出句法中心词.而词汇的引入必然带来严重的数据稀疏问题,针对此问题本文采用了删除插值平滑算法.最后,通过对一个实例的部分数据分析,可以预期此句法分析模型具有较高的准确率.
其他文献
应用Xscale处理器、嵌入式Linux与开源路由协议软件aodv-uu,使用IEEE 802.11b无线网卡,设计并实现了一个无线多跳网络实验床.通过该实验床能进行无线多跳网络的网络安全、入侵检测、应用层协议等一些需要实际数据传输与实际算法运行的研究,并大大促进无线多跳网络的研究工作.
嵌入式操作系统是操作系统研究领域的一个重要内容,近年来由于Linux操作系统的发展和成熟,许多企业和科研机构把目光转向嵌入式Linux的开发和研究上.嵌入式Linux是嵌入式操作系统的一个新成员,Linux以其自身良好的特性被广泛地用在嵌入式系统中.Boot Loader是操作系统和硬件的枢纽,负责初始化硬件和引导操作系统的内.U-boot是一款功能强大的Boot Loader.文中主要介绍了嵌入
便携式网络监测终端可以实现对网络进行方便快捷的监测和维护.文中研究了基于ARM9便携式网络监测系统设计与实现的一系列关键技术.着重阐述了系统的设计思路、主要功能模块的设计与实现,并对其中的一些技术难点进行了深入的分析说明.
文中在研究嵌入式系统,单片机系统以及二维图像处理的基础上,讨论了三维图像采集系统的构建,并在嵌入式微处理系统云台上对实时拍摄的大量二维图像数据进行三维重构.提出基于二维图像的定标算法,实现标志点的自动识别和匹配,并根据标志点进行图像整合,从而得到三维效果,并应用OpenGL构建具有人机交互的可视化界面,展现物体的真实三维图像.将嵌入式系统,单片机以及三维图像处理有效结合,充分发挥单片机系统简单便携
目前,企业的客服中心在客户服务和产品咨询上起着重要的作用,但是企业需要承担大量的相应开销,而且电话咨询的方式给用户带来了很大的不便.针对这一问题,本文研究了基于常问问题集的问答系统在企业在线客服中的应用,文中提出了基于常问问题集的在线客服系统的框架,并针对系统中的句子相似度计算进行了详细的讨论和分析.最后,针对金山在线客服系统实际应用,进行了详细的实验及分析.通过实验表明,基于常问问题集的问答系统
本文的目的是构建一个面向信息处理的形式化的汉语语义描述系统.这个系统以Fillmore框架语义学为理论基础,包含框架语义构造式和框架两个子系统,从而把句法语义的构造跟词汇语义信息联系起来,系统表示汉语语义.框架语义构造式包括基本构式和复合构式,我们归纳了150个汉语顶层框架的基本构式,各种句式的复合框架构式:初步构建了24个顶层框架,29个框架参与元素,并建立了框架之间的多种联系.
网页查重就是将大量网页集合中重复的网页找出来,并加以选择,使用户不用处理大规模重复信息,在节省时间的同时,提高信息检索等的应用效率.快速高效的网页查重算法无论对于采集器,还是web检索系统都十分重要.本文在对已有的文本查重算法进行比较研究的基础上,提出了一种基于特征码和词频的快速网页查重算法,该算法将特征码算法和传统的分类算法结合起来,在检索速度和效率上都取得了比较好的实验结果.
时间信息抽取是自然语言处理的一个新课题.2004年ACE评测在TERNevaluationplan中对时间表达式的评测给出了详细的定义和要求.本文给出了表达明显时间信息的短语--事件类时间短语的定义.事件类时间短语的识别对于信息抽取、信息检索、问答系统、文本摘要和数据挖掘等领域的研究都将具有很重要的意义.因为事件类时间短语的结构的特殊性,本文采用规则的方法进行识别,在封闭测试中Fβ=1值为91.6
在自然语言处理领域,从语义处理的角度来看,像词汇语义网这样高层次的知识库是保障正确的语义解释和语义关系的设置所必须的资源.本文就多语种词汇语义网构建中的概念及其关系表示、概念体系、语种转换、UNICODE编程等问题进行了初步分析,以期对多语种词汇语义网的构建起到积极的意义.
比较研究了决策树模型和最大熵模型在中文文本分类中的应用.利用分类训练集的文档类别标号已知,按类别进行文本的特征选择,去除了对分类任务作用不大的词语特征.在上述得到的特征集合下,对目前应用较多的决策树模型和最大熵模型,分别进行了特征词的二值情况下和加入特征词的频率信息的情况下的中文文本分类实验.实验结果显示,在相同的条件下最大熵的分类性能要优于决策树,最大熵模型的分类准确率要比决策树高近20%.另外