论文部分内容阅读
近年来,随着信息技术的迅猛发展,数据呈现指数式的爆发增长,分布式存储系统应运得到飞速发展,随之而来的存储系统中的性能和安全问题也受到学术界和产业界的广泛关注。Hadoop Distributed File Syetem(HDFS)采用主从架构,作为Google File System(GFS)的一种开源实现,成为目前最受欢迎的一种分布式存储框架。然而,在当前的HDFS框架中,单一的NameNode节点已经无法满足日益增长的数据需求,虽然HDFS对其进行了相应的改进,但未能考虑元数据服务器作为NameNode节点负载均衡的问题。并且,当前的HDFS架构无法应对当前日益严重的数据泄露等安全问题。而拟态防御作为一种新的防御手段,可以有效地改变当前的网络安全格局,已经广泛的应用于各个方面,并得到了实际验证,因此,在当前的HDFS架构应用拟态防御的思想进行拟态化的改造具有十分重要的学术研究意义和实际应用价值。本文依托国家863计划课题“网络空间主动防御体系战略研究(续)”和上海市信息化发展专项资金项目,围绕面向大数据的分布式存储系统元数据管理技术研究,针对当前的HDFS架构存在的性能、安全等问题,结合Nginx反向代理的技术,对HDFS的架构进行了改进,针对HDFS架构中的元数据管理部分进行了代理改进,改进后的架构使得HDFS架构的性能和安全性得到了提升。主要创新点如下:1.针对当前的HDFS架构中元数据服务器不能负载均衡的问题,结合强化学习在自动决策问题上的优势,提出了一种基于强化学习的元数据动态负载均衡算法。通过在客户端和元数据服务器节点之间加入Nginx反向代理机制,利用Hsahing方法通过量化执行体之间的异构性进行元数据的初始分配,然后通过不断测量元数据服务器的各项资源利用率和延迟等信息,利用三个策略模块:策略选择机制网络,负载均衡机制网络与参数更新机制网络对元数据负载进行调整,实验表明,该负载动态均衡算法可以根据元数据服务器的性能动态的调整负载,并且在数据量突变的情况也有良好的适应性。2.针对当前HDFS架构存在的安全问题,结合拟态防御原理的DHR理念,利用Nginx反向代理技术对HDFS架构做出了调整改进,给出了实际的实现模型,得到了改进后的架构具有高安全性的验证结果。而调度环节作为拟态防御的重要环节,调度的结果直接影响了系统的性能和安全性。本文针对调度的现状提出了一种基于基于执行体异构度、性能和历史置信度的随机种子调度算法,将执行体异构性和性能作为调度的考虑因素,实验结果表明,所提出的调度算法的调度周期低于随机调度算法,但调度的执行体的异构性和性能优于随机调度算法,调度结果在安全性和性能之间达到了较好的动态平衡。3.针对拟态防御系统中关键的表决环节的任务特性,在现有算法的基础上,引入执行体间异构性作为决策因素,使表决算法能更加适用于拟态架构所面临的威胁场景。实验结果表明,与现有的一致表决算法相比,该模型能显著提高系统的安全性能,有效抑制共模逃逸的风险。