【摘 要】
:
为了应对越来越大的数据量和日益严重的网络安全问题,达到容灾容错的目的,数据备份技术显得日益重要。传统的数据备份主要通过单一存储介质实现,这种实现方法简单廉价,但是安
论文部分内容阅读
为了应对越来越大的数据量和日益严重的网络安全问题,达到容灾容错的目的,数据备份技术显得日益重要。传统的数据备份主要通过单一存储介质实现,这种实现方法简单廉价,但是安全性较低,且扩展性差。近年来兴起的以分布式技术,可以实现数据的分布式存储与运算,而Hadoop技术作为分布式技术的代表,其拥有的分布式文件系统可以充分利用节点资源,拥有多副本特性,具有良好的安全性、扩展性和效率。因此,基于数据备份技术高效率、高安全性的需求,可以利用Hadoop技术实现数据备份。根据Hadoop的特性和数据备份的需求,需要对Hadoop的HDFS系统进行改进。首先为了使数据备份系统充分利用系统资源,防止出现访问瓶颈,我们通过引入资源权重值,利用DataNode的心跳改进了HDFS系统的副本放置策略,使数据备份过程中对副本的放置更可控、可科学。然后结合到数据备份中大小文件共存的情况,达到在复杂文件情况下进行高效数据备份的目的,通过将小文件合并成大文件和二级索引表结合的方式,改进了HDFS系统在读写小文件时候的效率。同时通过实验验证对HDFS系统改进的合理性和优越性。根据改进的HDFS系统,本文接下来结合现有的网络安全管理级联系统,设计一个基于Hadoop的安管数据备份系统,并加以实现和测试。通过使用HDFS系统,数据备份具有整体性和统一性,同时根据HDFS系统的特点,备份的文件具有极高的安全性。进行数据恢复时,不同级别的安管系统都被赋予了不同的优先级,分配不同的资源进行有优先级、同时进行的数据恢复操作。与传统的数据备份和恢复相比,基于Hadoop的数据备份系统具有更高的效率和更好的安全性。
其他文献
互联网技术的快速发展,使得数据的重要性越来越明显。无论是研究机构,还是企事业单位对数据的重视程度都提升到了一个新的层面。如何从大量的数据中提取出对于研究或者企业有
当前世界经济增长较为缓慢,欧洲国家经济发展受欧债危机影响持续走低,美国至今未能完全走出次贷危机阴影,新兴经济体和发展中国家的高速增长明显放缓,世界经济总体呈现“弱增
柱塞泵是典型的往复机械。为了掌握往复式柱塞泵的工作状态,测取3S175系列柱塞泵正常工况和一些故障工况下液力端的振动信号,对其进行局域波时频处理后,得到了有价值的检测部
在互联网快速发展、广泛普及的时代下,非结构化数据(文本、图片、图像、视频等)呈爆炸式增长,人们花费在信息筛选的时间也越来越多,如何从大量的数据中挖掘出潜在有用的信息成为了学者们研究的热点。在这种情况下,本文关注文本数据的挖掘,利用聚类算法对文本数据进行组织、归类,发现有用的信息,减少人工整理文档的工作量,具有广泛的应用场景和深远的研究意义。本文聚焦于文本聚类应用,分析传统聚类算法的一些优势和不足,
试验旨在研究菜粕型日粮中添加植酸酶和木聚糖酶对肉鸡生长性能,小肠氨基酸、矿物质元素表观消化率的影响。选取健康、体重一致的1 d雌性AA商品代肉仔鸡480只,采用完全随机设
互联网在人们的工作生活中占有越来越重要的地位,网站,微博,论坛,QQ,电子邮件等网络应用成为人们重要的沟通方式和信息获取来源。多种服务模式共存,互联网已演化成为一个虚拟
1 临床资料患者,女,38岁,已婚,系广东深圳人,因“全身起红斑、鳞屑1月余”于2016年9月12日入院。患者自诉于一月前无明显诱因四肢起多个粟粒大小的淡红色的丘疹,上覆少许银白
大数据时代到来了,所有企业每天的信息储存量以ZB统计,越来越多的企业倾向于多层次的数据管理系统,将大量的数据转移到专业的数据管理平台,能够存储、计算和管理大规模数据的
铜在现代社会生产生活中扮演着重要角色,但目前对中国铜工业的监测预警却鲜有研究。对铜工业应用适合中国国情的指标体系和计量方法开展景气指数及预警系统研究,科学合理地反
电子地图服务是利用网络或手机功能和电子地图技术而开发的地图服务。随着电子地图的发展以及精确定位技术的日渐成熟,Google、百度、高德等互联网公司将工作重心放在了室内