基于句子语义结构的中文倾向性分析

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:chen_d031
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前针对中文倾向性分析多照搬英文倾向性分析中的方法;这些方法虽然也取得了一定的效果,但由于它们普遍没有考虑中文的特殊性所以效果提高有限。我们通过对中文句子语义结构进行深入分析提出了基于中文语义结构的中文句子直接态与间接态划分,并给出了一套完整的方法进行直接态和间接态子句抽取。并通过在多个领域中的实验验证直接态和间接态划分对倾向性分析有明显的改进效果。   本文的主要研究内容包括以下几点。首先通过对中文语义结构的研究得出中文句子语义结构的基本形式,并根据中文句子语义结构的基本形式以及这些基本形式与中文倾向性之间的关系提出了句子语义结构的直接态和间接态划分。并建立了各种语义结构形式与直接态和间接态的映射。然后我们给出了一套完整的系统进行中文直接态和间接态子句的抽取,从而把中文句子切分成子句并把其划分为直接态和间接态两类。最后我们把进行直接态和间接态划分应用到中文情感倾向性分析中去;并通过多组对比试验验证这种基于句子语义结构的划分对中文情感倾向性分析任务有很大改进作用。   本文的创新点为:1)把中文语义结构信息用于中文倾向性分析;2)提出了基于中文语义结构的直接态和间接态划分;3)使用标点,连接词,句长等把长句切分成多个有完整意义的子句。4)使用心理动词,起始词语,依存关系等建立一套完整的中文直接态和间接态子句抽取系统。
其他文献
在数量庞大,随机分布的无线传感器网络(WSN)中,面对复杂的种类繁多的应用,单个无线传感器节点的能力十分有限,很多情况下不足以承担一项任务,所以多个传感器节点之间以某种方式协
近年来,随着网络科学的兴起,基于网络和图挖掘的分析方法受到了越来越多的关注,并被广泛应用到生物、政治经济、电信、工程开发和社会生活的各个领域。数据挖掘和社会网络分析领
近年国内冰灾、地震、泥石流等自然灾害频发,给人民财产和生命安全带来极大损失。在这些自然灾害发生时,往往伴随着灾区通信网络瘫痪,通信瘫痪极大的影响外界救援和受灾群众
随着视频编解码技术的飞速发展,视频解码运算的高复杂度对于处理器的计算能力提出了重大挑战。以H.264标准为例,高压缩率使其解码器的计算复杂度比MPEG-2标准提高了近3倍。视
随着整个社会信息量爆炸性的增长,无论企业还是个人对存储的需求也越来越高,网络存储技术也得到了越来越广泛的应用。随着网络存储技术的长足的发展,人们提出了分级存储管理技术
互联网包含了海量的信息,搜索引擎成为了人们日益重要的信息检索工具。传统搜索引擎由于不能对网页语义进行理解,仅能依靠关键字匹配和PageRank为用户列举相关网页列表。而随着
无线传感器网是一种以数据为中心的网络,网络由大量的传感器节点和用于进行数据收集的sink节点构成。通过分布在物理环境中的传感器节点收集传感数据在通过多跳方式传送给sink
多媒体教学是指在教学过程中,根据教学目标和教学对象的特点,通过教学设计,合理选择和运用现代教学媒体,并与传统教学手段有机结合,共同参与教学全过程,以多种媒体信息作用于学生,形
伴随无线网络技术的迅速发展,移动终端的普及,随时随地的上网成为现实。然而无线网络受传输媒介限制,它的带宽和时延都无法满足用户的需求。尽管很多移动终端上有多个网络接口,但
随着世界信息化的飞速发展,网络中总数据量呈现出爆炸式的增长。同时,随着科技的不断发展,多数据终端时代也在加速到来的脚步。所有的这些现状,都使得软件研发面临严峻的考验