大规模复杂IT系统可靠性、性能、能耗关联建模理论及其优化技术研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:acdd5230351
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速,以云计算和大数据处理技术为代表的新一代信息化技术不断实现各类资源的整合和共享,以此形成了一种全新的大规模复杂IT系统(Large Scale Complex IT Systems,LSCITS)。相比传统的IT系统,其不仅需要有效地管理大规模、异构复杂的基础设施资源,同时也需要满足多样化的应用需求,尤其是可靠计算、高性能计算和节能减排的应用需求。为了实现大规模复杂IT系统下可靠、高效、节能的优化调度管理,基于理论模型的系统指标评估必不可少,但是,在已有的相关研究中,可靠性、性能和能耗指标往往被视为相互分离的指标进行分析,而忽略了这些指标间相互影响的可靠性-性能-能耗(Reliability-Performance-Energy,R-P-E)关联性;此外,大规模性的基础设施资源也对面向多目标优化的高效调度管理技术提出了新的挑战。针对这些存在的关键性问题,本文对两类典型的LSCITS(即云计算系统和大数据处理系统)进行了系统全面的R-P-E关联建模理论研究,同时将仿生自主神经系统(Bionic Autonomic Nervous Systems,BANS)的思想用于调度管理系统的设计中,并基于建立的关联模型进一步研究了可靠性、性能和能耗综合考虑的优化调度管理技术。论文的主要研究工作及创新性成果包括:1)提出了一种基于级层交互随机子模型的建模方法(Hierarchical and Interacting Stochastic Models,HISM)。面向传统服务系统迁移到云计算系统中的重要应用场景,建立了相应的R-P-E关联模型。在基础设施层首先建立了基于物理机和虚拟机失效修复行为的Semi-Markov可靠性模型,详细分析了虚拟化环境下特有的物理机失效所引发的多虚拟机失效的复杂共因失效问题;其次,在应用服务层,以可用资源量为条件参数建立了基于排队论的性能模型,根据模型详细分析了服务系统中重要的排队溢出和超时失效等事件;在系统状态监测层,详细分析了失效修复行为对系统动态能耗随机变化带来的影响,并建立了相应的系统能耗模型;最后,通过马尔可夫回报模型和贝叶斯理论提出了表征R-P-E关联性的期望性能和期望能耗等综合性评估指标,基于这些评估指标进一步提出了一种量化复杂P-E制约关系的新指标,即效能比(Performance-Energy Efficiency Ratio,PEER)。理论模型的分析结果通过仿真实验进行了验证,同时实验结果表明效能比指标可有效帮助云计算系统为迁移的传统服务系统选择更加合理全面的资源分配策略。2)根据HISM建模方法,进一步基于新兴的云服务系统(私有云服务系统和公有云服务系统)建立了相应的R-P-E关联模型。针对多类型失效下的及时修复需求,提出了一种由多修复行为组成的级层修复机制,并建立了相应的马尔可夫可靠性模型。在私有云服务系统的性能分析方面,为了实现对核心云调度器运行状态的分析,提出了一种新的Jackson排队网络模型,该模型不仅可以分析用户请求在核心云调度器的请求解析时间,还可以分析虚拟机在资源池中的服务时间;在公有云服务系统的性能建模方面,更是充分考虑了用户请求批量需求虚拟机的复杂行为特征。在云计算系统的能耗建模方面,不仅考虑了失效修复行带来的随机能耗变化情况,还考虑了服务用户时随机资源占用情况对系统动态能耗的影响。最后,通过仿真实验验证了云服务系统的R-P-E关联模型,并详细分析了资源分配决策变量影响下,云服务系统期望性能和期望能耗指标的重要变化趋势。3)提出了另一种基于拉普拉斯变换(Laplace-Stieltjes Transform,LST)的关联建模方法,建立了面向大数据处理系统的R-P-E关联模型。在面向复杂计算任务时,针对任务完成时间直接影响实际能耗量的重要问题,提出了一种考虑了理想任务完成时间限制、硬件失效、数据处理程序失效等多种因素的Semi-Markov可靠性模型,并通过LST关联建模方法实现了对期望任务执行时间和期望能耗的分析评估。在面向大数据量任务时,充分考虑了子任务切分和子任务冗余执行的复杂决策行为,并面向这种分布式冗余并行计算环境,设计了一种求解随机任务完成时间概率分布函数的算法,最后基于贝叶斯理论建立了R-P-E关联模型。实验结果表明了所建立的理论模型对复杂计算任务最优资源分配策略、大数据量任务最优切分和冗余执行策略的制定都有着重要的理论评估和分析作用。4)提出了基于R-P-E关联模型的多目标优化模型,并根据决策变量的类型和复杂性,设计了Pareto最优解分析、收敛算法、遗传算法等多种求解最优解的方法,并建立一种基于仿生自主神经系统(BANS)的新型云调度管理系统。在局部自主资源管理方面,基于用户请求到达率敏感性分析的方法,建立了一种描述资源分配策略最优性的“最优性分布图”,并进一步设计了基于最优性分布图的自主资源管理触发机制,通过动态自主的资源再分配行为可以在用户请求到达强度动态变化的环境下始终维持一种最优的资源分配策略;在全局请求调度方面,设计了一种新的基于最优性分布图的优化调度方法,从而避免了核心云调度节点对大规模复杂的基础设施资源进行繁琐的最优解搜索。实验结果显示基于BANS的云调度管理系统可以在系统期望纯利润上取得良好的优化效果,同时还有效提升了核心云调度节点搜索最优解的效率。
其他文献
<正> 长期以来人们应用Arnon法测定叶绿素含量。此法是将材料在80%丙酮溶液中研磨并经过滤或离心除去残渣后,测定提取液的光密度值来计算叶绿素含量。1979年J.D.Hiscox等提出
随着全球经济不断发展和一体化程度不断加深,以及“互联网+”概念的提出,IT服务行业近些年异军突起,各大IT服务提供公司都开始在全球范围布局生态链,寻求全球的外包服务供应
为了克服传统频率测量法不能满足等精度要求的缺点,提出一种基于FPGA的高速等精度频率测量系统的设计方案。系统由等精度频率测量FPGA模块和单片机主控电路2部分组成,利用FPG
绝对值方程Ax-|x|=b是一类不可微的NP-hard问题.在假设A的奇异值>1的条件下,给出一种新的求解绝对值方程的混合算法:遗传算法和模式搜索法相结合的一种方法.该混合算法充分发
综合了日本1993年活性炭发明专利中有关炭分子筛的制法、球状活性炭的制造方法、粘附有活性炭的蜂窝状结构体及其制造方法。
在全球信息化快速发展的大背景下,中国企业利用各种信息技术在管理水平和运营绩效方面取得了很大成效,与此同时,中国政府也深化改革,大力倡导信息化建设,推进电子政务发展,以
本文讨论了由It(?)随机微分方程表示的扩散过程的参数估计问题。主要研究内容分为四个部分。第一部分基于状态连续观测,讨论了遍历条件下连续时间扩散过程的参数估计问题,给
随着我国教育事业"十二五"建设的逐步深入,高等教育行业的IT应用、信息化建设逐步由加强由校园网建设、自动化办公等逐步深入到校园信息资源建设以及数字化校园建设,高校数字
在新兴媒体持续跟进、大众媒介众声喧哗的时代语境下,青春文学杂志坚持内容为王,紧紧把握校园、情感质素,同时注重明星效应与图像感知建构青春文学杂志的形式之美,将网络、微
基于水电厂水轮发电机组导轴瓦间隙调整中存在的问题,采用塞尺测间隙调整法和比例法对间隙调整数据不准确、调整工作不合理等问题进行了分析论证,得到了提高导轴瓦间隙调整工