基于节点影响力的复杂网络社区发现算法研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:saddd11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中诸多系统都可以用复杂网络进行描述,如社交网络、学术研究中的引文网络、新陈代谢网络、蛋白质网络,电力网络,交通网络,科学家合作网络、万维网、脑神经网络等,节点代表各系统的构成要素,边代表要素之间的联系。目前复杂网络研究主要从网络中观结构和微观结构展开,微观层面主要从定量分析个体节点重要性程度来揭示网络特性,中观结构体现在节点之间的聚类效应和社团探测。如何从这些看似无规律、大量、冗杂的数据中找到有价值的信息,利用定量分析方法度量大规模网络中节点重要程度,是复杂网络研究的中亟待解决的重要问题。  现有节点重要性评估方法由于对节点的重要性定义不统一,不同计算节点重要性的算法侧重点不经相同。有基于节点位置和邻居的局部算法,基于特征向量的全局算法和抗毁性测试的节点移除收缩法。特征向量中心性算法思路清晰,精度较高,在学术和现实应用中都得到了极大的重视,但是EC算法只考虑邻居节点的贡献而忽略其他节点,且忽略了传播过程中信息丢失。针对上面的分析,我们主要从计算节点影响力角度出发对EC算法进行改进,并在此基础上提出基于节点影响力的社区发现算法,全文的主要贡献概括如下:  (1)提出基于拓扑结构的可达中心性(Accessbility Centrality,AC)算法。首先提出基于拓扑结构进行信息传播的路径计算方法,得到每个节点传播到其他节点的所有路径,路径条数越多说明节点影响力越大,可以快速定位位于拓扑中心的重要节点;其次采用矩阵累加运算计算传染范围,加速节点收敛过程。在四个经典真实的Word网络、Email网络、Protein网络和Airport网络中对算法进行测试,验证算法的可行性。并与传统 EC 算法和 LeaderRank 算法等四个算法进行对比测试,分析此方法的性能。  (2)提出基于节点影响力的社区发现(Rational LPA Based Node Influence ,RLPBNI)算法。首先深入研究标签传播算法,根据节点影响力大小改进标签传播节点顺序;其次定义理性节点标签传播规则;最后在社区合并过程引入社区重叠度进行极大社区合并调整,提高算法精度。在真实网络和人工网络中进行测试,验证算法的可行性,并与LPA算法等传统算法进行对比测试。  (3)将AC、RLPBNI算法应用在领英社交网络数据中,测试算法对现实生活中社交网络实践应用,并最终对研究的结果进行相应的评价和分析。
其他文献
在知识经济时代,知识被认为是企业成长和获得持续性竞争优势所依赖的最重要的资源,知识管理也被摆在了组织管理的首要位置。知识共享作为知识管理的一个重要核心内容,成为当前管
选取我国2008-2017年30个省(市、 自治区)的面板数据,采用SYS-GMM模型,测算金融发展水平对产业结构升级的影响.结果发现:在模型回归分析中,金融发展规模和金融发展效率在产业
管理者是公司运营的主要战略制定者和决策人,主导着公司的生产活动和管理活动.本文通过2008-2017年沪深上市公司作为样本,区分了国有和非国有企业的CEO及CFO特征,通过回归分