基于深度学习的语义分类及其在谣言检测中的应用研究

来源 :三峡大学 | 被引量 : 0次 | 上传用户:weike112121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今大数据时代下,互联网上遍布图像、语音、文本等各类数据信息,其中文本信息占重要地位。而根据文本的语义信息对其进行主题分类是文本挖掘、大数据领域的一项重要课题,便于人们对数据进行整理和分析,因此,语义分类技术具有极其重要的意义。与此同时,互联网的快速发展增加了谣言传播的速度和广度,“谣言泛滥”现象日趋严重,极大的影响了人们的生产生活和社会秩序。因此,对谣言进行检测也具有十分重要的意义。本文通过对目前流行的Text CNN、Bi LSTM、RCNN以及注意力机制进行了深入研究,发现Bi LSTM和Text CNN网络在语义分类领域取得了较好的应用效果,二者的结合可以充分发挥CNN的特征提取能力和Bi LSTM的上下文依赖能力,但缺点是没有体现出每个词语在文本中的重要程度,无法将注意力集中在重要的词上。为了解决此问题,本文提出一种基于Bi LSTM-Attention-CNN组合神经网络的文本语义分类模型。在Bi LSTM层之后加入注意力机制(Attention)提取输出信息的注意力分值;注意力层之后,连接k-max池化层,提取前k个重要的词,增强模型特征的表达能力;最后,连接Text CNN网络,发挥其特征提取优势,输出分类结果。实验在DBPedia、AGNews以及Sogou三种数据集上进行,实验结果表明:当k-max池化层中的k值设定为8时,本文提出的模型效果最佳,相较于其他网络模型,Bi LSTM-Attention-CNN组合神经网络模型分类准确率提高了1_~2个百分点。本文在提出Bi LSTM-Attention-CNN组合神经网络模型后,将其应用到谣言检测领域,使用该模型将谣言文本细分为如社会类谣言、时政类谣言、娱乐类谣言等10个主题类别的谣言。根据研究发现,每类谣言都有其相应的特征,因此,分类后在每个类别的谣言文本下再进行谣言检测。本文采用BERT预训练模型进行谣言检测,实验在中科院互联网虚假新闻数据集MCG-FNews上进行,实验结果表明:分类之后的检测正确率较分类之前有一定程度的提升。综上所述,本文在对目前流行的网络模型进行深入研究后,发现不同网络的优势没有得到整合,因此,提出本文的Bi LSTM-Attention-CNN组合神经网络语义分类模型,并应用到谣言检测领域,即将谣言数据集分为不同的主题类型谣言,在不同类型的谣言下使用BERT模型进行检测,提升检测效果。
其他文献
习近平新时代社会公平观是习近平新时代中国特色社会主义思想的重要内容之一,习近平新时代的社会公平观将马克思主义与中国具体国情相结合,更新了新时代社会公平观的时代内涵。十九大报告对新时代新的历史方位进行了明确的阐述,新时代社会不公问题逐渐凸显,人们对社会公平的诉求愈发强烈。习近平新时代社会公平观的完善与发展具有了重要的理论和实践价值。习近平新时代社会公平观的形成与发展离不开对中国传统文化中的公平观、马
节俭是我国优秀的传统美德。从古至今,节俭在我国发展过程中都起到了十分重要的推动作用。随着改革开放后,人们的物质条件和生活水平大大改善,全社会面目一新。但是人们的生活方式随着生活水平的提高发生改变后,对节俭的追求逐渐减少,这样的社会风气对高校大学生也有很大的影响。部分高校大学生节俭意识淡薄,甚至以奢侈浪费为荣,这已然成为不可忽视的问题。因此,结合新疆地区的现状,对大学生进行节俭意识培育有利于新疆大学
转速和载荷的变化使地铁牵引电机轴承信号在结构内部发生不同程度的耦合与畸变,导致不同类型故障的频段相互重叠,难以判断故障类型。针对复杂工况下难以准确诊断地铁牵引电机轴承故障类型的问题,本文提出一种将小波包分解、信息融合与卷积神经网络结合的地铁牵引电机轴承故障诊断方法,并设计了诊断方案来验证。试验中预制了6种故障轴承,以地铁牵引电机轴承实际运转转速2400RPM和实际载荷7k N为基准,结合试验台条件
在各国的劳动法上,劳动合同根据其终止的期限是否确定,可以分为固定期限劳动合同与无固定期限劳动合同,亦被称为定期劳动合同与无固定期限劳动合同,为简便起见,下文将这两类在劳动法中最为重要的劳动合同称为定期劳动合同与无固定期限劳动合同。我国在计划经济时代,实行的是国家统包分配工作的政策,使得用人单位及劳动者无法基于个人意愿行使自主选择权。为改变这样的状况,1995年我国施行《劳动法》,首次建立劳动合同制
随着我国高速铁路牵引供电技术的不断发展,现有继电保护方案暴露出越来越多的不足。例如,当线路发生永久性故障时,继电保护设备将使整条供电臂馈线失电,若不能及时恢复供电,将会对列车运行,系统安全等造成很大的影响。伴随着数字化牵引变电站的深入研究,建设具有高度自动化功能的牵引供电系统,对于提高系统可靠性、减少因长时间停电造成的经济损失具有十分重要的意义。本文针对京张智能高铁黄土店变电所至四营村分区所的典型
自古迄今,不论是北属时期还是自主时期,尽管有时因战争的影响而暂时停顿,只要载戢干戈,中越两国之间的关系很快就恢复友好。在此长久的历史过程中,中越两国人民在外交、经济
随着直流微电网的发展,直流断路器作为关键的保护设备受到业界的高度关注。但传统的机械式直流断路器在响应时间、电弧等方面的不足,降低了直流断路器的保护能力。为了达到直流断路器的性能要求,满足不同电压等级的应用需求,直流固态断路器(Soild-State Circuit Breaker,SSCB)具有快速准确的中断特性,更受到研究学者的青睐。本文结合第三代半导体Ga N器件的优势,研究了一种基于Ga N
MIMO(Multiple Input Multiple Output,MIMO)技术由于其在发射端和接收端均使用了多根天线,能够有效扩展系统容量,从被提出就开始引发了大量研究人员的关注,目前广泛使用的4G
随着现代通信的不断发展,现代通信系统朝着更高的信息吞吐量、更快的数据传输速率、更节能环保等多个方向发展,为了在有限的频谱带宽实现这些性能,现代通信系统采用更复杂的调制技术以提高频谱利用率、降低网络延迟,同时扩展新的频率范围以缓解现有频谱资源紧张。现代通信系统信号由于使用更复杂的调制技术而带来了更高的峰均比(PAR),对于射频前端而言,这意味着功率放大器需要在更低的功率回退点进行工作,以保证信号的线
油压减振器是铁道车辆悬挂系统中的阻尼部件,其动态阻尼特性对铁道车辆的运行稳定性、舒适性起着关键作用,研究油压减振器的动态阻尼特性及其影响因素,对优化油压减振器的产品设计、提高车辆动力学性能具有重要意义。以我国某高速动车组使用的抗蛇行油压减振器为研究对象,分析了油压减振器动态阻尼特性常规宏观理论存在的局限性,在建模与分析油压减振器静态刚度特性的基础上,建立了描述油压减振器动态阻尼特性的详细参数化模型