基于关系词搭配的汉语复句依存关系的层次体系的自动构建

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:q158743153
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会进入大数据时代,信息充斥着社会的每一个角落,人们对于信息的迫切需求,必将推动着中文信息处理的快速发展。目前,中文信息处理经过了字处理阶段,词处理阶段后,已经进入了句和篇章的处理阶段。汉语复句作为连接分句与篇章的桥梁,表达着丰富而复杂的语义信息,因而在中文信息处理领域具有极其重要的研究价值。汉语复句研究中的层次识别对计算语言学句法分析和复句信息工程的意义重大,但是复句本身的层次关系很难识别,仅依靠复句本身的层次关系来研究建立复句依存关系的层次体系是很难实现的,相反,研究建立复句依存关系的层次体系正是研究复句层次关系自动识别的基础。关系词作为标示复句内分句间逻辑语义关系的一个重要构件,它在很大程度上影响着分句的语义和层次关系的识别。所以,本文提出了基于关系词搭配的汉语复句依存关系的层次体系的自动构建方法,为复句层次关系的自动识别奠定基础。本文对汉语复句依存关系层次体系的自动构建进行了分析研究。首先,介绍了汉语复句依存关系层次体系的相关概念和理论。然后,通过对人工构建复句依存关系层次体系方法的分析,提出了计算机实现自动构建汉语复句依存关系层次体系的整体工作步骤,其中,通过先根据依存句法和标点符号对复句内分句进行初步划分,接着依据规则对伪分句进行过滤的方法来实现复句内分句的准确划分。最后,在复句上下文无关文法的描述基础上,提出了一种基于关系词搭配的移进-归约算法来确定分句间的依存关系,通过语言云LTP的单句句法分析器来确定分句内各成分间的依存关系,从而构建出汉语复句依存关系的层次体系。实验结果表明,利用本文提出的方法进行汉语复句依存关系层次体系的自动构建,准确率达84.08%。因此,本文所提出的自动构建汉语复句依存关系层次体系的方法是行之有效的。
其他文献
随着网络技术的发展,P2P迅速成为人们关注焦点。它打破了传统的C/S模式,网络中节点兼具了客户机与服务器的双重功能,从而避免了C/S模式集中服务带来的瓶颈问题,网络文件共享
大规模P2P (Peer-to-Peer)流媒体应用中,由于客户端的异构性、分布式和用户行为的个性化、随机性带来了QoS (Quality of Service)维护问题和扩展性问题。本论文主要研究优化
近年来,随着网络的迅猛发展,互联网在人们的生活中地位越来越重要,但针对网络用户的各种攻击也层出不穷,造成的损失和影响的范围也越来越大,网络安全问题越来越受到人们的重视。木
近年来,随着智能设备、移动无线通讯、传感器网络、普适计算、机器学习,中间件和Agent技术的发展,已经使普适计算环境成为现实。普适计算被认为是继主机计算模式、桌面计算模
随着集成Wi-Fi功能的终端产品日益增多,人们对无线宽带网络的依赖性逐渐增大。目前许多公共场所都已经部署Wi-Fi热点,为Wi-Fi网络的终端用户提供便利的互联网接入条件。但热点
在计算机安全领域中一个重要的挑战就是区分正常和潜在的有害行为的异常。半个世纪以来,研究人员用身份识别和阻挡特殊事件的方法来保护他们的系统。但是,当前持续壮大的IT系
随着科学技术的迅猛发展,科学计算可视化所涉及的领域越来越宽,对象越来越复杂,待处理的数据量越来越大,实时性要求越来越高。矢量场可视化作为科学计算可视化最具挑战性的重
近几年来,我国在公路、铁路、城市交通、跨海越江通道工程、水利水电工程等方面发展迅速。随之而来的工程项目也不断增多,其中隧道隧洞工程占了相当大的比例,然而这些工程往
耳鸣治疗仪应用系统是在传统耳鸣治疗方法的基础上,融入单片机技术,实现耳鸣检测、治疗,以及信息管理的综合系统。目前市面上的耳鸣治疗仪虽然在技术上实现了数字化控制,但是
计算机的普及与互联网的应用加速了信息的增长和传播,促进了信息产业的发展。当今信息的传播速度已经大大超过了人类的掌握能力,又反过来制约了信息产业的发展,新兴的电子商务也