论文部分内容阅读
现实世界中诸多系统都可以用复杂网络进行描述,如社交网络、学术研究中的引文网络、新陈代谢网络、蛋白质网络,电力网络,交通网络,科学家合作网络、万维网、脑神经网络等,节点代表各系统的构成要素,边代表要素之间的联系。目前复杂网络研究主要从网络中观结构和微观结构展开,微观层面主要从定量分析个体节点重要性程度来揭示网络特性,中观结构体现在节点之间的聚类效应和社团探测。如何从这些看似无规律、大量、冗杂的数据中找到有价值的信息,利用定量分析方法度量大规模网络中节点重要程度,是复杂网络研究的中亟待解决的重要问题。 现有节点重要性评估方法由于对节点的重要性定义不统一,不同计算节点重要性的算法侧重点不经相同。有基于节点位置和邻居的局部算法,基于特征向量的全局算法和抗毁性测试的节点移除收缩法。特征向量中心性算法思路清晰,精度较高,在学术和现实应用中都得到了极大的重视,但是EC算法只考虑邻居节点的贡献而忽略其他节点,且忽略了传播过程中信息丢失。针对上面的分析,我们主要从计算节点影响力角度出发对EC算法进行改进,并在此基础上提出基于节点影响力的社区发现算法,全文的主要贡献概括如下: (1)提出基于拓扑结构的可达中心性(Accessbility Centrality,AC)算法。首先提出基于拓扑结构进行信息传播的路径计算方法,得到每个节点传播到其他节点的所有路径,路径条数越多说明节点影响力越大,可以快速定位位于拓扑中心的重要节点;其次采用矩阵累加运算计算传染范围,加速节点收敛过程。在四个经典真实的Word网络、Email网络、Protein网络和Airport网络中对算法进行测试,验证算法的可行性。并与传统 EC 算法和 LeaderRank 算法等四个算法进行对比测试,分析此方法的性能。 (2)提出基于节点影响力的社区发现(Rational LPA Based Node Influence ,RLPBNI)算法。首先深入研究标签传播算法,根据节点影响力大小改进标签传播节点顺序;其次定义理性节点标签传播规则;最后在社区合并过程引入社区重叠度进行极大社区合并调整,提高算法精度。在真实网络和人工网络中进行测试,验证算法的可行性,并与LPA算法等传统算法进行对比测试。 (3)将AC、RLPBNI算法应用在领英社交网络数据中,测试算法对现实生活中社交网络实践应用,并最终对研究的结果进行相应的评价和分析。