汉语比较句要素抽取技术研究与应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:yxjdyn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
比较是人们常用的表达方式,往往被用来表达对于事物的主观态度和情感。随着互联网技术的发展与普及,网络中包含着越来越多的比较语句,获取比较句中的比较要素对于情感分析、文本挖掘等任务有着重大的意义。国内外现有的比较句相关研究仍然处于起步阶段,比较句识别和比较要素抽取的方法还有很多可以探索的地方。本文以汉语比较句为对象,旨在探索一种有效的比较要素抽取方法。具体包含以下四方面的工作:(1)实现了一种基于词性标注信息的B ootstrapping半监督比较要素抽取方法,可以基于极少量人工标注的优质数据自动生成大量的要素抽取结果;(2)实现了一种基于支持向量机(Support Vector Machine,SVM)的比较句识别模型,探索了比较词、词性、块信息、分布式词向量以及要素特征对于比较句识别性能的影响,实验表明块信息特征和词向量特征分别在召回率和精确率上表现优异;(3)实现了 一种基于条件随机场(Conditional Random Field,CRF)的比较句要素抽取模型。探索了一系列基于比较句特点的要素抽取特征,进而通过主动学习的方法增加训练语料规模,最终获得较好的要素抽取性能;(4)结合比较句识别模型与要素抽取模型,实现了一个比较句要素抽取系统。
其他文献
目的:观察通塞脉微丸对大脑中动脉栓塞(MCAO)模型大鼠的保护作用。方法:用线栓法制备大鼠MCAO模型,缺血3 h后再灌注,观察通塞脉微丸不同剂量对模型大鼠脑含水量、神经功能缺损情
目的:建立以毛细管气相色谱法测定莪术残油中莪术醇、吉马酮和莪术二酮含量的方法。方法:采用气相色谱法:HP-5(0.32mm×30m)石英弹性毛细管柱,进样口温度250℃,氢火焰检测器(FID)28
<正>摘要目的探索多参数(MP)MR成像前列腺癌漏诊的重要原因。材料与方法此研究为回顾性单中心研究,经过伦理委员会批准并符合HIPAA,连续纳入100例病人,均行MP
DRASTIC方法是用于地下水防污性能评价的应用最为广泛的一种方法,但该方法在指标权重分配方面存在缺陷。本文在分析前人已有成果的基础上,提出了一种新的权重分配方法,认为合理
在20世纪这个新的音乐思潮竞相涌现的年代里,偶然性音乐占据了一个重要地位,它摆脱了序列式的完全控制走向了更大的自由,然而就在这自由中,它形成了一系列的偶然创作原则,这
高校"学生德育生活化"是将高校德育回归于生活,这是高校德育改革与发展的趋向,也是社会进步与国家富强的需要。本文从"德育生活化"的相关内涵剖析入手,解读国内外高校"德育生活化"
在控制行政责任的观念史中,一直存在着外部控制和内部控制两种争论。在实践当中,两者分别对应于制度机制与道德机制的运用。将其分别概括成“制度论”和“道德论”两种主张,