基于Attention-Tree LSTM的电影评论情感分析研究

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:plcsolitary
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着国内影视行业的不断发展、人们对于精神层面需求的增加以及新冠疫情等因素,中国电影产业呈现出新态势、新格局。如今,电影不仅是人们消遣的一种娱乐方式,更是成为一个国家文化软实力的最主要标志之一。由于网络行业的快速发展,大量电影评论网站及平台应运而生。在这些影评网站和平台上,都有很多关于某部电影的评论,而这些评论中则蕴含着观影者对影片的主观情感倾向,这对广大观众做出正确的电影观看决策具有一定的借鉴意义。鉴于传统的基于词典和机器学习的情感分析技术难以对海量的文字进行有效的处理,本文利用深度学习技术对影评进行深入的研究,主要包括以下两部分:第一,基于 Tree LSTM(Tree-structured Long Short-Term Memory)模型对电影评论做情感分类。该模型包含了句法句式,能够精确地对复杂语句进行解析,并能从相对遥远的结点中获得更多的信息。主要工作包含:利用爬虫技术搜集了2021年具有影响力的《你好,李焕英》电影的评价资料,经过数据的预处理,获得了高质量的影评情感分析语料;对关键词进行描述性统计以挖掘影评深层次信息;采用Borderline-SMOTE方法处理数据不平衡问题;通过Python的第三方模块SnowNLP结合人工标注的方式来进行情感标注;基于LDA进行好评集与差评集的主题分析;使用GloVe方法训练并获取适合电影领域的词向量。通过与SVM、LSTM、Bi-LSTM等模型进行实验对比,Tree LSTM模型在情感分类中效果显著,实验表明该模型适用于电影领域。第二,为了进一步优化模型效果,解决Tree LSTM模型忽略句子表达的不同侧重点这一问题,本文提出一种新的方法Attention-Tree LSTM,该方法使用Tree LSTM模型抽取语义,对每个单词进行定位加权,再利用注意力机制来研究被抽取的语义特征所表现出的重点。为进一步验证模型的性能,本文采用数据量更大的公开数据集。在数据集处理方面,根据评分将评论数据分为很差、较差、一般、推荐、力荐五类。在情感五分类实验中,Attention-Tree LSTM模型的F1值可达到0.91372,比Tree LSTM模型的F1值高0.635%,从其余评价指标来看也均优于其他对比模型,实验表明该模型对电影评论有较高的分类能力。
其他文献
中华民族伟大复兴离不开文化的发展和传播,影视作品是文化对外传播的重要途径,海外上映的中国影片应致力于文化传播的有效性。基于中美德三国网络影评的自建语料库,运用Python情感分析技术从宏观层面对观众的情感态度和关注主题进行量化分析,在微观层面从批评隐喻视角对影片形象的构建进行质性分析可以发现,宏观层面上,中美德观众对影片评价呈现出高、中和两极分化的不同结果;微观层面上,中美德观众赋予影片完全不同的
百年之计,教育为本。随着我国经济的飞速发展,国家对于技术型人才的需求也越来越高。提高中等职业教育发展水平,推进高等职业教育的高质量发展,完善高层次应用型人才培养体系这一系列的目标都提上了日程。教师作为实现目标的重要力量,其专业理论与实践素养培育和发展对于整体的职业教育发展质量都至关重要。
20世纪90年代,互联网开始进入中国,并以迅雷之势迅速渗透到中国社会生活的各层面,对中国人的思想观念、经济活动以及生活方式等各个方面都产生了巨大的影响,甚至带来了翻天覆地的变化。以网络技术为基础,在其构建的网络空间中传递的信息大多带有意识形态属性,这些信息在开放的网络空间中自由地畅游,对人的思想观念造成的影响不可忽视。这些影响既包括积极的方面,又包含消极的方面。因此,我们需要尽可能最大程度地发挥网
韧性是为了应对复合型灾害风险而产生的治理理念。由于灾害或风险往往都是在社区层面被首先感知,因此理解社区韧性治理对有效应对突发公共事件具有重要意义。文章将社区视为由物理—社会—信息组成的三维空间,通过深入分析D社区应对某突发公共事件治理行动,识别基于三维空间的社区韧性关键要素,并在此基础上,深入分析社区韧性治理机制。主要结论如下:第一,“物理空间保证硬件水平”和“社会空间约束服务目标”使信息空间得以
教育是民族国家的一项最基本最重要的公共性实践活动,教育的国家价值的基本诉求是促进国家认同。在当代中国,国家认同面临着诸多挑战——民族认同与国家认同的矛盾,全球化趋势以及个人权利的至上性、价值观念的多样性均不同程度地解构了部分国民的国家认同感,这些国家认同挑战诉求于加强教育的国家认同价值。立足教育个人价值、社会价值乃至世界价值,加强引导教育个人价值、社会价值的实现统一于中华民族伟大中国梦实现的价值取
互联网技术日新月异,发展势头迅猛,整个互联网拓扑架构也越来越错综复杂,网络安全问题随之日益凸显。蜜网技术用来模拟易受攻击的计算机网络,是一种非常有效的网络攻击对抗机制,在众多行之有效的网络安全问题中脱颖而出。本文从网络安全防范防御措施及技术理论角度出发,研究复杂的互联网大环境中基于网络安全理论相关的模型,运用到了数种数学、经济学等常规学科来综合分析互联网网络安全问题,其中包括贝叶斯理论和博弈均衡理
<正>随着社会的不断改革和发展信息化的进程越来越快,我国国民经济的发展速度也越来越快。机械制造行业在发展的过程中要了解自动化技术的应用情况,分析机械制造自动化发展的基本特点。相关企业要遵循自动化发展的基本要求,全面加强自动化的制造水平。融入现代化的电子设备和技术,保证整体的发展方向。
期刊
“互联网+”时代,伴随大数据技术的迅猛发展及5G网络技术的推进,数据和知识呈现出几何式的增长趋势,作为数字移民时代的教师需要紧跟社会步伐,促进自身专业知识智慧发展。大数据驱动学习资源从“静”到“动”,生成性学习资源应运而生,并逐渐被应用于教师专业发展领域。该文立足于大数据驱动的背景和理论,构建教师专业智慧发展模型,并探究生成性学习资源促进教师智慧发展的实施策略。
英国当前使用的多重剥夺指数是40余年持续研究开发的综合性指标,是其中央与地方政府各级部门对更新区划定、更新政策制定与更新资金分配的重要依据,对改善相对贫困社区的物质环境、就业机会和公共服务水平起到十分积极的影响。本文首先梳理了该指数发展历程中的三个不同阶段与城市更新相结合的典型政策与更新行动,进而剖析了多重剥夺的理论基础和指数构建的具体方法与内容。重点聚焦多重剥夺指数在大伦敦“区域—地方—社区”各
小学语文是一门非常重要的学科,语文是学习的开始,是打下良好基础的开端。小学语文当中的古诗词学习也占据着重要的位置,古诗词蕴含了我国丰富的传统文化,蕴含一些深刻的哲学和道理,它可以有效提升学生的语文素养,丰富学生的内涵。新课标提出要注重小学语文的学科素养培养。要求教师不仅要帮助其能够良好的朗诵和背诵古诗,还要帮助他们能够深刻理解诗句当中的内容。