汉语术语语义分析技术研究及其应用

来源 :沈阳航空航天大学 | 被引量 : 2次 | 上传用户:fdgerg454h4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语语义分析是自然语言处理的核心技术之一,也是对汉语的深层理解。汉语语义分析效果的提高对于信息检索和机器翻译都具有推动作用。随着科技的发展,术语也不断涌现,所以对术语语义分析的研究也有着重大的意义。本文对术语的特点进行研究,实现了汉语术语语义分析系统。该系统包括依存分析和语义分析两个部分,这两部分通过机器学习的方法实现。在语义分析的基础上实现了汉语术语翻译系统,并取得了较好的效果。具体内容如下:首先,对大量的汉语术语进行分析,发现术语大部分为名词性短语,而且术语用词的重复性低。针对上述两个特点,在依存分析阶段,本文选择适合术语的特征,利用支持向量机(SVM)训练得到依存分析模型,从而有效识别出了术语内部的依存关系。所选特征包括基本特征,互信息特征和知网第一义原特征。其次,提出了一种汉语术语语义分析方法。本文定义了14种语义关系,并利用CRF训练得到语义分析模型,该模型可以有效识别出两个词之间的语义关系。由于术语所涉及的语义关系范围较窄,所以该模型对于易混淆的类别分类能力较差。本文对于易混淆的类别采用SVM训练分类器,对CRF模型输出的2-best结果中的两个语义关系进行识别,确定词对最终语义关系。最后,将语义分析技术应用到了术语翻译。首先对术语进行依存分析,根据依存分析的结果抽取出结构化的短语,再利用传统的GROW-DIAL-FINAL方法抽取非结构化短语;之后利用提取的调序模板对源语言进行调序;最后利用摩西对已经调序的术语解码。实验结果表明语义分析方法的有效性,在大类语义关系和小类语义关系上正确率分别达到77.13%和69.05%。将语义分析结果应用到术语翻译,使翻译的效果有所提高。
其他文献
随着互联网和电子商务的发展,信息过载现象越发的严重,导致人们在寻找自己所需的信息时要耗费越来越多的时间与精力,有时候还可能迷失在众多信息之中,忘记自己真正需要的信息
传感器网络是由大量的集成了传感器、数据处理单元和通信模块的微小节点构成的全分布式网络。传感器网络管理系统对系统的资源配置、性能、故障和安全等提供一体化的管理机制
本文在对太阳能薄膜电池板制造自动化解决方案的结构和功能分析基础上,设计和实现了生产线监控面板,解决了自动化生产过程中的跟踪管理的问题。本文首先介绍了工厂自动化系统的
近年来,随着Internet快速发展,Web互联网络已经成为了一个巨大的、分布广泛的全球信息服务中心,提供了新闻、财经、商业、文化、教育等各种信息服务。互联网络上极度相关的页
在过去的几十年间,进化算法(EA,Evolutionary Algorithm)作为一种优化技术而广泛用于求解多目标优化问题(MOP,Multi-objective Optimization Problem)。这些问题中的多个目标
本论文根据ZigBee无线传感器网络项目的要求,以TinyOS嵌入式操作系统为软件平台,设计并实现了基于树状拓扑结构的Zigbee协议栈。论文介绍了当前无线传感器网络的研究进展和Zigb
随着计算机网络和多媒体技术的飞速发展,多媒体产品的复制和传播变得更加便捷,因而,如何保护多媒体信息的安全受到广泛的重视,数字视频水印技术更是成为国际上研究的热点。在H.26
随着计算机软件技术的发展,越来越多的企业应用软件来解决自己的核心问题。但是在软件长期持续的运行过程中,系统资源会由于运行错误的不断积累而逐渐耗尽,导致系统性能持续
随着计算机技术和网络技术的不断发展,网络安全问题受到越来越多的关注。传统的安全技术已经不能满足人们对网络安全的要求,入侵检测技术作为一种新型的积极主动的防御技术应
本文针对一个C/C++程序静态安全检查工具,设计并实现了基于自动机的安全检查机制,该机制可以使工具的使用者在外部自定义安全规则,动态地解析安全规则来检查源代码中存在的安全