基于人工免疫网络的微博社交圈挖掘算法研究

来源 :湖北大学 | 被引量 : 0次 | 上传用户:coniji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着WEB2.0时代中微博等在线社交网络平台发展的日益火热,越来越多的用户选择在微博中进行信息分享、关注互动和讯息发布,微博已聚集了大量的活跃用户和流动信息。如果能对用户在微博进行各种社交行为时产生的传播内容和社交信息进行分析,从微博庞大的虚拟在线社交网络中挖掘出用户对应的社交圈信息,不仅有利于社交网络结构的演化分析,而且在网络舆情分析和用户个性化推荐等领域也有着非常重要的作用。本文通过总结国内外研究现状后,认为微博社交圈挖掘的研究工作中存在微博数据获取、用户关系强度刻画及社交圈挖掘算法设计三大难点问题。免疫网络是人工免疫系统中的主要研究方向,因其具有自适应性强和效率高等特点,已被广泛应用于数据聚类和异常检测等领域中。本文以新浪微博平台的用户作为检测对象,结合在线社交网络中用户相似度的研究,提出一种融合用户社交信息和用户兴趣的相似度计算方法,刻画用户间的关系强度。在此基础上借鉴人工免疫网络的高内聚性和自适应性,将关系强度大的用户进行聚合,实现社交圈的划分。首先为解决数据来源问题,本文研究Web Scraper工具的用法,通过设定各种自定义的规则获取微博数据,该方法能够有效的采集各类网页的数据,具有爬取效率高、数据类型完善等优点,能够满足实验的需求。其次,对新浪微博用户关系进行分析,选取用户的博文内容作为用户的兴趣信息,用户的关注信息和粉丝信息作为用户的社交信息,进行用户相似度的计算,实现用户社交信息与兴趣相似度的融合,完成用户间关系的描述。接着建立以用户为节点、用户关系为连边、关系强度为权重的用户相似性网络。然后基于人工免疫网络思想将用户相似性网络中关系强度大的用户进行聚合形成社交圈。本文使用新浪微博的真实用户数据,将该文方法与其他社交圈挖掘方法进行了比较,结果表明该方法挖掘的社交圈在内聚度、紧密度和实用性上效果更好。
其他文献
P53(Tumor suppressor p53,TP53,TRP53)是由17号染色体上的TP53基因编码的蛋白,对细胞生长、分化、代谢及机体免疫具有重要调控作用。P53功能异常与多种人类疾病相关,如P53功
Delta机器人承载能力强,驱动安装简单,能够快速运动,被广泛的应用在食品、药品、电子等行业。Delta机构是一个耦合性很强的并联机构,建立精确地动力学模型比较困难,控制效果不是很理想。针对Delta机构的轨迹跟踪,结合前人的研究成果和自抗扰控制技术,对其进行优化,丰富了Delta机器人控制算法,为其产业发展提供了一定的理论支持。构造了Delta机构的几何模型,利用修正的G-K公式,求得它的自由度
本文主要从治理视角对地方高校行政服务能力提升进行了较系统的分析,认为高校行政服务能力的提升是高校治理的重要内容,是实现高校治理水平和治理能力现代化的题中之义。本文一共分为四个部分:第一部分是引论,首先从国内教育需求出发,以提高高校行政服务能力水平为目的,阐述本论文意义,梳理归纳国内外文献及研究的主要内容、方法;第二部分主要介绍高校行政服务能力的概念、主要概念之间的关系、地方高校行政服务能力提升的意
三维人脸逆渲染是真实感渲染和三维重建的重要分支,本文工作就是针对这一领域的难点问题展开研究,根据单张正面人脸照片在计算机中重建并渲染一个逼真的三维头像。由于人脸的生理和几何结构非常复杂,同时材质与光照特性也是千变万化,因此基于图像的三维人脸重建与渲染一直是图形图像领域的研究热点与难点。本文以特征学习为切入点,设计和实现了一套能够根据单张正面人脸照片进行全自动三维重建和实时渲染的算法框架,在人脸检测
随着人工智能技术的不断进步,增强现实技术也逐渐受到人们的关注。然而当前时代中增强现实技术更多的是基于二维目标识别或依赖标识物,这使得增强现实具有了一定的局限性,影响了增强现实技术的发展和应用。因此现实场景实时建立三维地图对增强现实技术来说就变得尤为重要。将 SLAM(Simultaneous Localization And Mapping)技术融合到增强现实领域,为增强现实技术提供必要的三维信息
近年来,随着科技不断发展,数字电视地面广播一直是无线通信邻域关注的热点之一。2006年,我国发布《数字电视地面广播传输系统帧结构、信道编码和调制》(DTMB)标准。DTMB系统
我国现阶段社会经济迅速发展、民主制度进步,带来了公民对知晓政府信息客观需求进一步扩大;同时伴随着政府信息公开工作的进一步开展,政府信息公开诉讼的数量也在不断上升。而在政府信息公开诉讼中,因政府答复“信息不存在”所产生的案件占有一定比例,我们将这一类案件称为信息不存在案件。在司法实践中审理此类案件时,出现了诸多问题:首先是政府信息不存在的概念不明确,主要体现在:行政机关错误适用该理由答复申请人的情况
光纤通信技术是一种使用光载波承载调制信息并利用光纤传输信号的有线通信方式,其在新数字通信时代中具有极其重要的地位。而马赫-曾德尔电光调制器凭借其各方面优秀特性,已经成为了光纤通信中应用最广泛的外调制器。调制器的偏置工作点漂移问题由于影响因素多样,成因复杂,在很长时间内成为制约光纤通信系统的一项障碍。本文围绕马赫-曾德尔调制器偏置电压自动控制技术展开相关研究:(1)调研了本课题研究背景以及相关领域国
随着科学技术的发展,第五代(5G)移动通信已经逐步开始进入人们的生活。为满足5G超高速数据传输速率、高可靠性和低连接延迟等需求,需要研究新型的无线空口波形。在过去几年中多种候选波形被各方提出,滤波的正交频分复用(F-OFDM)便是其中的一种。与4G采取的OFDM系统相比,F-OFDM系统在继承传统OFDM系统的一系列优点的前提下,具有高频带利用率、参数自由度高、带外泄露小等优点。而对F-OFDM系
后发国家在经济赶超阶段无不采用扭曲的经济政策,政策性负向扭曲生产要素价格是后发国家实现低价工业化并长期保持经济高速增长的重要条件。本文将成功实现赶超的经济体作为研究对象,测度各国生产要素价格的扭曲程度,并讨论扭曲对经济体投资、消费和经济增长的影响,进而总结出规律性特征。后发国家生产要素价格绝对扭曲与经济增长存在非线性关系,当经济体处于中低收入阶段,普遍存在压低生产要素价格来促进资本积累,实现工业化