基于长短期记忆网络的新冠疫情微博情感分析研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:hanyancuiceo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络社交媒体的迅速发展和人们生活水平的提高,网络文本信息也在迅速发展。微博是目前中国最受欢迎的博客应用,任何时候都在产生大量的数据。这些数据包括大量关于网民感受和态度的信息,若能将情感分析技术应用到微博产生的大量文本信息中,宏观上可以监控和引导网民在舆情爆发前后的情绪走向,从而有关部门能及时采取措施进行防控。同时,文本主题分析,舆情分析也都是以情感分析为研究基础,发掘数据情感价值,有助于完善网络舆情监测系统。本文的主要研究工作如下:(1)新冠疫情评论数据采集和预处理。采用网络爬虫来采集新冠疫情微博文本数据,通过Selenium框架可以较好的模拟人为操作浏览器的行为以及对动态加载数据和加密数据处理来规避微博反爬虫机制,最后分析提取网页内容并保存到My SQL数据库中。数据预处理是对目标数据进行类别标注、数据清洗、分词、去除停用词等操作,以此得到了可用于建立模型的数据集。(2)微博文本情感分析模型训练。针对长序列训练过程中存在的梯度消失和梯度爆炸问题,本文改进了基于长短期记忆网络模型的情感分类方法,通过对epoch和dropout参数不断的调整和更换,寻求最适合本模型的参数。实验深入对比分析RNN循环神经网络、LSTM长短期记忆神经网络和GRU门控循环单元三种深度学习模型的情感分析效果,结果显示:LSTM模型对新冠疫情微博评论文本进行情感分类所取得的效果相比另外两种,提高了长期依赖能力,更好地保留了重要特征,能更准确地预测文本的情感倾向,为后续情感分析应用系统构建较好的模型。(3)情感分析应用。基于文本情感分析模型,针对应用需求,分析并设计了基于长短期记忆网络的新冠疫情微博评论文本情感分析系统。通过该应用系统的前端交互界面,为用户提供关于新冠疫情多角度可视化分析的途径。本文基于长短期记忆网络对微博新冠疫情文本情感分析进行了深入分析研究,可在网络舆情爆发前后做出有效的监控和决策,从而改善相关部门管理舆情相关的“未知-未知”风险的能力。
其他文献
自然语言理解作为构建人机对话系统的核心组成部分之一,具有非常重要的科学研究价值。而意图识别则是自然语言理解系统中的一项子任务,其准确性直接影响到了自然语言理解性能,进而影响人们对人机对话系统使用的体验。随着人机对话系统的不断发展和完善,越来越多的任务型人机对话系统不断地部署到人们的现实生活中,如智能手机助手、车载语音助手以及APP中的智能客服系统等等。然而,由于人类口头语言在现实场景中的随意性和简
RGBT目标跟踪是指通过结合可见光(RGB)和热红外(T)视频数据进行目标跟踪的新兴热点研究课题。多年来,基于单模态的目标跟踪技术取得重要突破,但是该类算法在面对一些较为复杂的场景或者极端条件下仍旧难以发挥良好的性能,例如光照不足、恶劣天气、背景杂乱和目标遮挡等。由于热红外成像能够很好克服上述挑战因素的影响,弥补可见光成像的不足,而可见光图像可以补充热红外成像中丢失的颜色和细节信息,因此,合理利用
随着信息社会的高速发展,网络这种数据结构存在于越来越多的现实情境,并在计算机及其相关领域得到广泛应用,对这些网络进行分析具有很高的学术价值和现实应用价值。值得注意的是,进行有效的网络分析一般依赖于对网络的表示方式。传统的对网络进行表示的方法通常是使用高维稀疏的向量,但现如今复杂网络中的连边数量和节点数量是可能达到数十亿,因此使用传统的网络分析方法在整个网络上进行计算和推理面临很多困难。网络表示学习
社会的不断进步和持续发展促使工业生产和生活环境的多样性也在不断增加。在物品的生产和使用过程中,产品表面发生异变从而导致缺陷的发生是不可避免的。因此,如何高效、准确的检测缺陷的发生,一直是人们不断思考的问题。缺陷检测是工业生产中无法避免且必要的一个环节。科学技术的进步和近年来深度学习技术的不断突破,使得机器视觉在各个应用场景的优势也越来越明显。本文以卷积神经网络为理论基础,针对工业产品表面缺陷自动检
轴承作为旋转机械的重要组成部件,其健康状况影响机械设备的正常运行。因此,轴承运行状况的监测和诊断对保证机械设备的正常运行有着极为重要的意义。本文以列车轴承和普通滚动轴承为研究对象,提出基于改进线性判别分析(Improved Linear Discriminant Analysis,ILDA)的状态特征提取方法和基于自适应线性判别分析(Adaptive Linear Discriminant Ana
相比于回归模型参数的人体重建方法,基于图卷积网络的重建方法避免了网络难以学习旋转表示的问题,但现有的图卷积网络重建工作仍然有收敛速度慢,模型点发散和复杂姿势下模型不准确的问题。针对该问题,本文提出重建准确三维人体的多模块多层次图卷积网络结构和基于模型整合的全身三维重建技术。全文主要包括以下三个部分:1.对近年来的人体三维重建技术进行调研。对相关工作进行分类讨论,介绍了各类方法的优势和缺陷,并根据现
属性网络是描述复杂现实世界的有效工具,其中的节点之间存在边,能够描绘纷繁复杂的关系。属性网络中的节点能够携带多种属性,如文本、音频和图像等丰富信息。属性网络表示学习旨在将属性网络中的网络结构和属性等信息保存在低维的向量空间中,为节点学习低维、高质量的表示向量。属性网络表示学习获得的表示向量可以应用到多种下游任务中,例如节点分类、链路预测和可视化等。当前属性网络表示学习方法可分为两类,一类是无监督的
临近预报一般是指对某一区域未来短时间内(0-2 h)的降水量或者强对流天气进行预报,在日常的气象灾害防范中有着极其重要的作用。我国位于东亚地区,濒临太平洋西海岸,大陆性季风气候显著,这就使得我国在夏秋两季饱受洪涝灾害侵袭的困扰,因此建立一个准确的临近预报系统对我国来说是迫切需要的。准确的降水临近预报系统不仅可以有效的指导人们的日常生活,出行以及户外活动,同时对于道路交通,空中运输以及气象灾害预警的
随着商标数据的爆炸式增长,国内外发生的商标近似侵权案件越来越多,如何从海量商标数据中准确地检索出近似商标,从而辅助用户对商标进行调整,提高商标注册成功率,成为商标领域值得研究的一个问题。目前,短文本相似度计算方法广泛用于商标领域中,现有中文商标相似度计算主要是从字形、拼音及含义这三个角度出发,在字形和拼音角度存在近似判定因素单一片面的问题,在含义角度存在同义词识别不准,知识库有限和相似度计算结果不
目前气象卫星在日常生活中发挥着越来越重要的作用,人们对于卫星观测的精度要求越来越高。随着近年来各国气象卫星发射数量的增多,对卫星场地辐射定标的简便性和可持续性也提出要求。传统的人工观测和单次或几次观测已不能满足卫星遥感器在轨定标和遥感数据定量化应用的需求,亟需将场地的地表和大气光学波段辐射特性观测推向全自动、连续观测的阶段。本文在此背景下,以敦煌卫星辐射定标场为实验场地,对布设在场内的自动化观测设