论文部分内容阅读
为提高网格作业运行的成功率,研究了提高作业调度的可靠性的方法。研究表明,现有容错的网格作业调度算法多通过作业复制来降低节点的软硬件故障造成的作业失败的概率,它们既没有考虑作业的多个副本因共处的网络环境故障造成的同时失败,也没有考虑作业的多个副本由于所在节点缺乏相同的资源而同时失败。针对这一问题,提出了节点相似度的概念和计算方法,并将其应用到容错的网格调度算法中。提出的容错的调度算法将作业的多个副本分配到具有不同相似度的节点上运行,充分利用网格环境的分布性和异构性进一步减小作业失败的概率。