复杂动态网络的链接预测

来源 :扬州大学 | 被引量 : 4次 | 上传用户:wly8213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络的链接预测问题已经引起各个领域的越来越多的关注,如社会学、人类学、信息科学和计算机科学。至今为止,链路预测研究的工作大部分是基于静态网络上的。在静态的网络中,部分网络结构是已知的,其目标是预测其他的潜在的链接。在这样的静态网络中,链路的产生通常建模为一次性事件,我们的主要关注点是某些未知或未来的事件发生的可能性。在动态复杂的网络中,时序的拓扑信息是设计实体之间的相似度函数的主要依据之一。但现有的动态网络链路预测的算法往往不能充分应用时序的拓扑信息。一般来说,基于静态图表示的链接预测方法不能处理在动态网络中重复出现的链接,也无法识别动态网络中的时间序列模式,而这两者是动态网络链接预测中所用到的主要信息。因此,有必要研究适用于预测动态网络链接的有效方法。据我们所知,以前很少有文献研究以链接发生频率的时间序列作为输入的链接预测工作。在本文中,我们研究设计整合时间和拓扑信息的有效方法来预测具有一定的不确定性、顶点具有属性等动态链接的网络的未来链接的有效方法。本文的主要贡献如下:(1)我们提出了通过整合网络中的时序信息、社区结构和节点中心度的动态网络链路预测的方法。该方法所使用的这些拓扑特征对于预测复杂网络的潜在链接是非常重要的。时序信息有助于分析动态网络中的节点出现链接的规律。而社区结构则使我们可以根据两个顶点是否共位于同一个社区,来分析他们之间的连接的紧密程度。一个节点的中心度是度量它在网络内相对重要性的指标,和它在复杂网络中是否会有未来的链接具有高度的相关性。我们通过节点的特征向量中心度预测它未来的重要性,并作为链接预测的重要信息。我们整合网络中包括社区结构和中心度等各种拓扑信息,结合时序信息生成更加接近网络实际的模型,在此基础上进行动态网络链接预测。(2)我们提出了一种在不确定动态网络中进行链接预测的方法。由于观察数据的不精确性、不完全性以及噪声数据的干扰,在现实世界的网络中,不确定性是一个自然的特征。在这样的网络中,每条边与一个指示其在网络中的存在的概率值相关联。因此,在不确定网络进行链接预测的问题和在确定性网络的链接预测有本质的不同,它更具有挑战性。我们提出了在不确定链接的动态网络中的链接预测的方法。在该方法中,预测问题被形式化为一个设计在不确定时序网络中的随机游走。该算法首先将在不确定的网络链路预测问题转换成在确定性的网络随机游走问题。然后对每一个节点建立一个子图,这个节点和它的邻居之间的相似性得分可以在围绕这个节点的子图内计算,以减少计算时间。(3)我们提出了一种解决顶点带属性的动态网络链接预测问题的方法。在很多实际网络中,顶点所代表的对象具有各种属性,这些属性值对链接预测有很高的参考价值。为此,我们提出了一种基于非负矩阵分解(NMF)的方法的对顶点带属性的动态网络进行链接预测。该方法从网络中的动态拓扑结构以及顶点属性信息中获取隐特征,以获得更高的预测结果。我们提出了进行非负矩阵分解的迭代算法,并证明了这些算法的收敛性和正确性。通过非负矩阵分解可得到反映网络重要的动态隐拓扑特征的低阶矩阵,集成了动态网络中的时序信息和全局拓扑信息,并能获得更准确的结果。我们在真实社交网络上的实验结果表明,该方法能够有效预测顶点带属性社交网络中未来的链接,并取得比其他类似的方法更高质量的预测效果。(4)我们提出了一种基于抽样的方法,对动态网络中某些感兴趣的顶点进行链接预测。在许多动态网络的实际应用中,我们仅需要预测与某些感兴趣的顶点相关的链接,即只需计算与用户感兴趣的顶点之间的相似性得分,而不是预测网络中所有顶点对之间的相似性。显然在这种情况下,我们并不需要使用传统的方法对整个网络进行链接预测。为此,我们提出了一种基于抽样的快速方法来预测在动态网络中相关的感兴趣的节点的链接。在该方法中,我们使用一个适当的衰减因子来对较近的网络拓扑信息赋予较高的权重。然后,我们用随机游走的方法以网络中所关注的节点为中心构造一个加权子图。我们选择这个子图的一个适当的大小,从而使得所估计的相似度误差限定在一个给定的阈值范围内。由于相似性得分可以在一个很小的子图内计算得到,该算法可以大大减少计算时间。该方法也扩展到预测整个网络的潜在链接,以达到较高的处理速度和准确性。由于所提出的方法能够集成网络时序信息和全局拓扑信息,因而能获得更准确的预测结果。上述本文所提出的所有方法都已经在不同的实际网络上进行了测试。我们通过实验来验证所提出方法的性能,并通过设置不同的参数值来分析他们的结果,同时还与其他类似的方法比较他们的性能。大量的实验结果表明,我们的方法可在较少的时间内获得比其他方法质量较高的预测结果。
其他文献
素质教育是无须"正名"为"全面发展教育"的,因为这本来是表述角度不同的两个概念,素质教育这一概念从理论上说没有错误。所谓"片面追求升学率"的"应试教育"长期以来危害青少年
研究了充电模式、放电模式、温度对镍氢(三圈霸道)电池和镍镉(天球360)电池性能的影响.采用标准充电模式时综合性能最佳;相同充放电模式下,镍氢电池的放电容量约为镍镉电池的
我国建筑企业在全球化竞争和经济下行压力下面临着各种不同风险,传统的独立而分散的风险管理方法已经无法满足当代企业的需要。提出建筑企业应实行集成的新型风险管理模式以
为避免制造业注塑产品加工时模具由于产品残留或滑块错位等原因损坏,设计了一种基于FPGA的远程视频监测系统,用于注塑产品加工的过程中模具工作情况的远程监测。本文在设计整
目的探讨围生期孕妇焦虑抑郁状况及心理干预效果。方法选取我院接受分娩的80例围生期孕妇资料进行分析,采用随机数字方法将围生期孕妇分为对照组和实验组,对照组采用常规方法
在分析改革创新我国流域治理模式与路径的必要性的基础上,从我国实际国情出发,基于生态文明价值导向,探索了我国基于生态文明的流域综合治理模式,指出了构建基于生态文明的流
目的:分析广西不同产地五月艾挥发油的主要化学成分,并与艾叶挥发油成分进行对比研究。方法:采用水蒸气蒸馏法分别提取艾叶和广西产五月艾中的挥发油,并通过气相色谱-质谱联
近年来,随着经济的发展,我国铁路建设也获得迅速的发展。在铁路运行的过程中,电力和信号是保障运行安全的最重要的两个因素。所以,本文对铁路电务施工的特征、内容和质量控制
经济的发展为变电站多样化的土建设计提供了更多的支持。本文分析了变电站在进行土建设计时需要注意的要点,并探究了变电站进行土建设计的优化策略,为变电站的设计研究和发展
目前,在我国,高速铁路主要包含四大核心技术,即轨道技术、动车技术、通信信号技术以及牵引供电技术。铁路通信作为一种不可或缺的重要安全基础设备,将会在科学力量的推动下向