面向社交网络的科技领域事件检测系统的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:westy116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,社交网络已经成为人们关注、获取、发布信息的重要渠道。随着互联网的蓬勃发展,社交网络每天产生的信息在持续增多,从中提取有价值的信息已经成为一个重要的研究方向。这些信息可用于商业竞争、情报分析、舆情监控等领域。同时,越来越多的科研机构、科研人员通过社交网络发布信息,这些信息经常包含科技领域相关事件,且往往比新闻渠道发布更早。因此,通过对社交网络进行检测,从中提取有价值的科技情报也变得大有可为。在进行事件检测时,及时发现事件至关重要,因此,事件检测算法需要具有良好的运行效率。通过对科技领域事件检测算法和web技术的应用,可以将社交网络中的科技领域事件以简洁直观的形式展示给用户。本文研究了基于词库改进的科技领域事件检测算法,并结合数据采集技术、文本表示技术以及文本分类技术设计并实现了科技领域热点事件检测系统。本文的主要工作如下:(1)研究了事件检测相关技术,结合科技领域事件检测的特点,使用词库改进了基于局部敏感哈希的事件检测算法,称为FSD-improved算法。该算法通过将科技领域词库与基于局部敏感哈希(Locally Sensitive Hash,LSH)的事件检测算法相结合,提高了事件检测过程中LSH随机超平面划分子空间的效率,从而减少了随机超平面的使用个数以及哈希表的数量,实现了算法运行效率的提升。实验结果表明,当数据集大小为2000-150000篇文档时,相比于基于LSH的Petrovi’c事件检测算法,FSDimproved算法的运行效率提升了10.91%-74.47%,而事件检测的准确度几乎一致。(2)设计并实现了科技领域热点事件检测系统。该系统通过文本分类算法对社交网络数据进行分类,对分类后的科技领域相关数据使用FSD-improved算法检测热点事件,并将热点事件在基于Django框架实现的web系统中进行展示。该系统采用模块化、高可用、可扩展的架构模式,分为数据采集模块、文本分类模块、事件检测模块、事件展示模块,具有较好的性能和良好的用户体验,满足科技领域事件检测的需求。
其他文献
上海市纺织工会是上海纺织工人的群众组织。在新民主主义革命时期,上海纺织工人作为产业工人中人数最多、受压迫最深、革命性最彻底的群体,不可避免地承担了中国近现代发展的重任。在一次又一次艰苦卓绝的斗争中,中国共产党领导上海纺织工人组织为中国的解放事业建立了不朽的功勋。新中国成立以后,工人的政治地位迎来了历史的转变,上海纺织工人作为上海工人阶级的重要组成部分,其任之重不言而喻。新中国成立初期,上海市纺织工
并联机器人在工业生产线上有着广泛应用,其承重能力强、精确度高和性能可靠的优点有效地提高了生产效率并降低了生产成本。在机器人的运动控制中,轨迹规划方法的性能对机器人末端运动状况与机器人系统稳定性有着决定性的影响。以Par4并联机器人为研究对象,本课题从轨迹规划中速度函数模型的建立与位置插补算法的优化这两个角度进行研究,得到适合于不同工作条件的轨迹规划方法。最后搭建了人机交互平台,并进行了运动控制实验
随着智能终端的爆炸性增长以及物联网等新兴需求的兴起,世界各国已广泛开展了第五代移动通信(5th Generation Mobile Communication System,5G)关键技术的研究。与现有的移动通信系统相比,5G将在传输速率、无线覆盖、传输时延和用户体验等方面得到显著的提高,日益紧缺的频谱资源也将使得5G具有超高的频谱效率。在同一时频资源为多个用户提供服务的非正交多址接入(Non-o
[目的和意义]本研究收集了左金丸加味治疗GERD的随机对照研究,严格按照循证医学方法对这些文献进行质量评价与结果合并,为临床应用提供了更高强度的循证医学支持。并通过网络药理学方法揭示左金丸治疗GERD的潜在活性成分、关键靶点、主要通路,为后续理论、试验研究及新药开发等提供了参考。[方法]1.计算机检索 CNKI、WanFang Data、CBM、VIP、PubMed、Embase、Cochrane
学位
“民主衰落了吗?”在2015年一度成为重要的研究议题。作为第二次世界大战以来最为重要的政治现象,第三波民主化浪潮彻底改变了世界政治的版图。但自全球金融危机爆发以来,民主似乎在衰落。许多成熟的民主国家在经济方面表现不佳,民主质量下降;参与阿拉伯之春的国家的后续发展使“第四次民主化浪潮”的希望烟消云散;而在第三波民主化浪潮时期实现民主的6个东亚国家也出现了民主倒退的迹象。回首追溯,不难发现某些威权政权
经典无源光网络和量子无源光网络一直是接入网的研究热点。时分波分复用无源光网络具有传输速率高、通信距离长、可容纳用户多等优势,被认为是一种可以满足用户的长期带宽需求的接入网技术。然而,尽管无源光网络的架构一直在推陈出新,但是其安全问题却一直没有得到完全解决。相比于以太网无源光网络、千兆无源光网络等,时分波分复用无源光网络不仅在传输汇聚层增加了很多专用的帧信息,而且用户数量的增加也提升了系统被攻击的概
随着物联网的发展,如何在低性能、低带宽的嵌入式环境下实现类似PC可靠长连接服务已经成为物联网领域的研究热点之一。心跳机制是目前应用较为广泛的维持通信双方长连接的方式,在尽可能少资源占用的情况下,实现可靠长连接,其中心跳间隔的动态优化是关键所在。本文针对传统心跳机制中所存在的灵活性差,资源浪费严重等问题,尝试用基于改进教与学优化算法(teaching-learning-based optimizat
一站固定式双基合成孔径雷达(One Stationary Bistatic Synthetic Aperture Radar,OS-BSAR)系统的一个平台是运动的,而另一个平台是固定的,它是移变模式双基SAR系统的一种形式。这种系统配置简单,容易实现,可以获得丰富的地物信息,且接收机不发射信号,具有隐蔽性,安全性高。不同于移不变模式双基SAR,对于地面散射点,在成像过程中它的双基斜距有一个分量是
微弱信号检测技术的应用领域主要有计算机图像识别、故障诊断、生物医学等,它针对的对象多是被强噪声背景淹没的弱信号。传统的微弱信号检测方法旨在抑制或削弱噪声,但不可避免地也会削弱有用信号,从而使检测结果不理想。随机共振技术最早由Benzi在研究冰川气候问题时提出,其基本原理是利用系统、噪声和信号三者之间共同作用,使部分噪声能量转移到低频信号处以增强微弱信号,从而使噪声变废为宝。随机共振独特的信号处理方
随着集成电路工艺特征尺寸不断减小,逐渐趋向于1nm,量子效应开始影响电子的正常运动,器件面临失效。新兴技术被提出代替传统的互补金属氧化物半导体(Complementary Metal Oxide Semiconductor,CMOS);其中纳米技术作为有力的候选替代方案大多以择多逻辑(Majority Logic,ML)为主的。一方面,金融领域和商业领域的发展不仅要求高精度,而且要求高性能,现有的