【摘 要】
:
随着移动互联网的蓬勃发展,社交网络逐渐占据了人们生活中至关重要的组成部分。如今,以微博为代表的社交网络平台汇聚了社会上各种信息。用户在微博等社交网络平台上爆料事件、传播消息、分享经验。以微博为代表的社交网络影响着每个人的日常生活,用户在网络上分享兴趣爱好、生活经历,产生了讨论街头时事、舆情热点等一系列的行为方式。以突发话题检测与追踪、话题关注度预测等技术手段为基础的突发话题查询与可视化系统在网络舆
论文部分内容阅读
随着移动互联网的蓬勃发展,社交网络逐渐占据了人们生活中至关重要的组成部分。如今,以微博为代表的社交网络平台汇聚了社会上各种信息。用户在微博等社交网络平台上爆料事件、传播消息、分享经验。以微博为代表的社交网络影响着每个人的日常生活,用户在网络上分享兴趣爱好、生活经历,产生了讨论街头时事、舆情热点等一系列的行为方式。以突发话题检测与追踪、话题关注度预测等技术手段为基础的突发话题查询与可视化系统在网络舆情分析任务中有着不可忽视的作用。突发话题查询借助突发话题检测与追踪技术辅助舆情分析系统高效地查询优质突发话题及后续信息,为相关部门和企业快速了解话题发展、及时做出舆论引导等决策提供有力支持。本文主要包括以下几个方面的工作:(1)针对微博这一典型社交网络平台,提出了基于时空特性的社交网络突发话题检测方法(BurstNBT)。BurstNBT利用时间突发性与地域突发性检测语料库中的突发词,过滤数据中的嘈杂噪声,然后对突发词集进行凝聚层次聚类,对候选突发词簇计算突发性得分并排序,高效准确地检测top K突发话题。实验结果表明,BurstNBT算法能够有效地检测出微博数据流中的突发话题,并且在话题检测准确率与话题表达可理解性上均要优于对比算法。(2)提出了基于语义扩展的社交网络突发话题追踪算法(SADV-SE)。SADV-SE算法通过构建维基知识库,对特征选择后的博文扩展语义特征。将博文由带权重的特征集转化为向量表征,通过话题向量与待追踪博文向量间相似度分类待追踪博文,并进行分类阈值的自适应学习和话题模型更新,持续进行待追踪博文的分类处理直到无待追踪博文。实验结果表明SADV-SE在准确率、召回率及F1值上均要优于对比算法。(3)提出了社交网络突发话题查询框架和社交网络突发话题关注度预测算法(MA-LSTM)。突发话题查询框架主要包含突发话题检测与追踪两部分,实现微博数据流中突发话题及其后续相关博文的查询。通过分析影响突发话题关注度的因素变量,建立话题内容特征、话题社交属性特征以及话题参与用户特征到话题关注度的映射,通过基于两层LSTM的神经网络建模,学习参数。实验结果表明,MA-LSTM算法能够有效地对微博突发话题关注度进行预测,实验结果在残差和相对误差上均要优于对比算法。(4)设计并实现了基于时空特性的社交网络突发话题查询与可视化系统。系统包括突发话题检测、突发话题追踪、突发话题关注度预测和突发话题查询与可视化四个模块:突发话题检测与追踪两大模块标识数据流中突发话题及其后续博文,关注度预测模块实现话题后续关注度的预测,查询与可视化模块为突发话题及其博文提供查询接口与可视化界面。该系统具有一定的实用价值,并验证了本文所提的系列算法的有效性。
其他文献
近年来,移动通信、物联网等新兴技术的发展极大地推动了互联网的进步,提高了人们的生活质量。在这其中,DNS域名服务器作为分布式服务系统承载着网络服务的访问入口,正发挥着越来越重要的作用。然而另一方面,互联网作为一个开放的平台来方便人们对信息的分享,但是关键基础设施DNS域名服务系统却是一个中心化的架构,其根服务器数量稀少而且分布不均匀,存在着集中解析霸权且不信任的问题。一旦根域名服务器中的域名信息被
在移动互联网时代,移动应用(APP)构成了现代人们日常生活中的基本要素。随着Android移动应用生态的蓬勃发展,恶意软件的数量和危害也与日俱增。恶意软检测作为保护移动应用用户的安全和隐私的关键环节,其重要性不言而喻。近年来,许多基于机器学习的恶意软件检测模型被提出并逐渐成为主流检测方法,然而当这些检测模型应用到真实环境中时往往会出现模型失效的现象。本文深入观察和分析模型失效现象,总结出数据非同分
汪曾祺的作品在20世纪80年代进入大众的视野,他的代表文章《受戒》等都呈现出一种清淡悠远的风格。但是较少有研究者注意到汪曾祺晚期作品风格及题材的变化,本文在阅读了相关文献之后,对汪曾祺晚期作品的风格及题材做简单说明,探究其晚期作品风格转变的原因。
近年来,无论是国内外中小学STEM教育热点向人工智能方向的转移,还是在线教育平台对人工智能相关内容的引进,都表明人工智能教育正呈现低龄化趋势。现阶段,国内外针对青少年开发的机器学习平台还处在初级阶段,普遍存在训练效率低、数据规模小的问题。在各类训练数据中,图像数据质量和算法选择对于模型性能的影响最为明显。而图像分类模型作为机器学习平台的重要组成部分,其数据要求高、训练成本高、训练周期长等特点,不能
用户对于通信系统的需求不断增加,远程手术、车联网、超高清视频传输等新的工业应用场景层出不穷,5G通信作为诸多现实问题的通信领域解决方案,一经商用就引起了各行各业的革命性变化。而随着最新一代的蜂窝通信技术的逐步普及,如何解决其先进网络架构中的一系列负载均衡问题,实现系统资源的合理调度正成为当前的研究热点。针对上述问题,本文对5G通信网中的资源分配问题做了相关研究,在分析其通信原理的基础上,搭建并改进
食物不仅是一种满足人们基本生存需求的"实物",同时,它还蕴含着一种生活态度和精神追求。无论是《受戒》中多次出现的自然清淡的"素食"意象,还是《异禀》中的不同"卤味",都再现了乡村小人物清淡的欢愉,透露出他们乐观豁达的人生哲学和朴素平淡的生活态度。在《受戒》和《异禀》中,简单的食物分别体现了出家人生活中的世俗烟火味和普通人平凡生活中的人情味,凸显出主人公在物质与精神、生存与生活、生理与心理层面达到一
随着信息科技的不断发展,电话通信成为了人们生活中必不可少的社交方式。在此情况下,随之衍生出的通信诈骗犯罪也在不断侵入人们的正常生活。通信诈骗作为一种新兴的犯罪方式,因其无现实接触且手法多样的特点,时常让人们防不胜防,给社会造成了巨大的财产损失。由于诈骗用户数据占比较低,且犯罪分子常模仿正常用户行为来规避拦截等原因,利用传统手段对通信诈骗行为进行识别拦截的效果欠佳,亟待人们提出更高效的方法来进一步解
经济的发展、产业变革的兴起开始推动工业制造业转型升级,与此同时,以互联网为代表的信息技术的发展极大改变了人们的生活,为传统产业变革带来了巨大机遇。当前工业正在向数字化、网络化、智能化发展,传统的工厂资源管理与计算方式显然已经不能满足生产场景中动态精细的生产需求,也难以处理多样大量的工业生产数据。因此,在动态的生产环境中对工业大数据实现数字化管理以及精准细粒度的预测是十分必要的。本文在充分调研工业互
无人平台的自主导航是一项极为复杂的问题,需要多种不同功能的模块来共同完成。其中的三维稠密地图构建模块是极其关键的一环。三维稠密地图的构建是计算机视觉(CV,Computer Vision)和机器人学方向的一个热门研究方向。为了满足无人设备能够安全进行导航或者执行更加高级的任务,我们的建图系统必须密集覆盖到真实场景中的所有环境信息,在保证精度的同时还要有足够的效率来节约内存资源。此外,为了能够适应不
为缓减矿产资源供应不足的矛盾,国家设立专用基金,增强矿产资源对经济社会可持续发展的保障能力和矿产资源对国民经济建设的保障水平,提高矿产资源的宏观调控能力,保障国家矿产资源的安全。随着经济和信息技术的不断发展,信息技术在国土资源管理中得到了广泛的应用。近年来,全国各级国土资源主管部门及地质资料馆藏机构高度重视地质行业基金项目的信息化建设工作。建立信息化监管系统,是进行经济建设和后续地质工作的依据和条