中文商品评论倾向性分析研究

被引量 : 14次 | 上传用户:kuaileyt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在电子商务大潮席卷世界的今天,如何快速、准确地收集到互联网上商品的评论信息,对商家掌握用户的喜好变化和潜在用户了解商品的流行趋势都具有重要的意义。如果单纯地依靠人工对这些评论性信息进行收集、分析和整理,显然是低效和昂贵的。而可以自动、有效地对这些信息进行处理的文本倾向性分析技术,已经成为当前自然语言处理领域中具有极高应用价值的研究热点。本文针对中文的商品评论倾向性分析系统所涉及的三项关键性技术:中文句子倾向性检测、商品属性词和评价情感词抽取以及情感词的极性判别展开了研究。(1)中文句子倾向性检测提出了一种利用自适应算法和多分类器融合框架的跨语言句子倾向性检测方法。首先,通过多翻译引擎服务将英文训练语料翻译为多份中文训练语料,以消除英文训练语料与中文测试语料的隔阂;其次,在多个分类器的训练过程中,引入了自适应算法,以提高分类器的精度;最后,对多个分类器进行融合,来提高分类结果的稳定性。在选用NTCIR英文语料作为训练语料、NTCIR中文语料作为测试语料时,句子倾向性检测的F-measure值达到了65.55%,接近实验设定的上限67.35%。(2)商品属性词和评价情感词抽取提出了一种基于词性关系模板的商品属性词和评价情感词同步抽取算法。为了测试该算法的有效性,设计了一套新的语料标注规范,并依据规范建立了相应的语料集。首先,通过有监督的序列规则挖掘算法从训练样本中挖掘出可能的词性依存关系模板;然后,利用高置信度的模板在测试样本中抽取出商品属性词和评价情感词二元组。在所设定的四个领域中进行实验,结果平均准确率达到54.18%,召回率为29.45%。(3)情感词的极性判别提出了一种基于PageRank算法的情感词极性判别方法。利用训练域种子情感词准确极性和测试域情感词临时极性来实现对测试域情感词的极性判别。实验结果表明,情感词的判别准确率可以达到90%以上。最后,综合上述研究,设计并实现了一套面向汽车领域的商品评论倾向性分析系统。
其他文献
同性恋是占今中外普遍存在的现象,甚至在某些国家的某个历史时期还形成为一种社会风气。社会对同性恋的态度经历了从宽容到罪孽,从罪孽到病态,从病态到正常的历史演变。自二
房地产行业作为经济周期发展的基础性行业,从1998年住房制度改革,2004年的低利率、低税收、放开土地交易等推动政策,再到2008年以后国家开始严控房价过快上涨、打击房地产投
目前光电化学池(PEC)制氢技术存在无法充分利用太阳能、高性能光阳极材料制备工艺复杂、光生电子传输机制尚不清楚等问题,基于此本文选取具有良好的可见光响应和电子传输性能
从产业链的角度来看,银行卡服务可以分解成发卡环节、收单环节以及跨行转接环节。围绕跨行转接服务,发卡环节和收单环节逐步演变成为发卡市场和收单市场。由于两大子市场终端
融资已成为我国金融租赁公司当前业务发展的一大瓶颈,对我国金融租赁公司融资方式的现状分析,指出其存在的问题,并通过对金融租赁公司融资手段的分类,分析了各类融资工具的具
本文简要地介绍了1981型精密模拟/数字声级计对各种噪声,尤其是对车辆噪声的测量,从设计到使用有其独创性。由于该仪器采用了最大值保持电路和数字显示,使待测噪声能实时准确
通过对湖南省城郊乡村体育现状进行了调查,结果发现城郊农民余暇时间长,对体育也有较高的认识水平,但体育参与的情况不容乐观.
目的:了解女大学生原发性痛经发生现状及其对心理、生命质量的影响情况,分析在校女大学生原发性痛经的相关因素,探讨女大学生原发性痛经的危险因素,为高校女大学生健康教育和
<正> 和其他大城市相比,北京"城"的概念要大得多,也模糊得多,以前是二环以内曰"城",现在则是铺张得无边无际,四环以内都是"城"了。出得"城"来,经颐和园径直向西,经过一些小村
听力作为一种接受型技能在二语习得及外语教学中占有十分重要的地位。研究表明听力理解一个复杂的认知心理过程,受到学习者内外各种因素的影响。其中,听力风格是关乎听力理解