基于Hadoop的地质灾害大数据挖掘框架建立及应用研究

来源 :昆明理工大学 | 被引量 : 2次 | 上传用户:lsyuanxue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类对地质灾害的重视,地质灾害监测的手段也更加多样化,对地质灾害的长期监测,带来了海量的监测数据,如何及时有效地对大规模的地质灾害数据进行分析,从而做到地质灾害的中长期预警,成为研究的热点。将大数据技术应用到地质灾害数据挖掘研究中,以实现地质灾害的中长期预警监测成为一种共识,在滑坡的中长期预警研究中,预测模型的运算效率对滑坡防控的及时性起着关键性的作用,研究发现,滑坡的中长期预警中存在两个主要问题:(1)在大数据背景下,面临大规模数据读写的时候,数据库的吞吐性能较低;(2)基于分布式的滑坡预测模型并没有针对算法的特性做效率优化等问题。针对于发现的问题,优化大数据技术下存储模型和地质灾害预测算法模型是本文的重点研究内容,使用优化后的方案建立基于Hadoop的地质灾害大数据挖掘框架,并对该挖掘框架做应用的可行性验证。建立基于Hadoop的地质灾害大数据挖掘框架包括:建立分布式计算环境,优化数据存储模型,优化地质灾害预测模型。主要内容如下:(1)在分布式计算环境建立后,为了使地质灾害挖掘框架有更强的实用性,需要优化数据存储模型,优化数据存储模型是地质灾害大数据挖掘框架可行性的基础。本文通过实验对比分析Mongo-Hadoop MapReduce和MongoDB MapReduce两者的数据吞吐性能差异,发现Mongo-Hadoop MapReduce比内置的MongoDB MapReduce在数据吞吐方面性能更好。选择Mongo-Hadoop MapReduce作为数据库的技术支撑,但是默认的数据库分割大小不适用于Mongo-Hadoop MapReduce,为了进一步优化数据存储,在数据分割方面做了进一步研究,发现当数据量在一定范围内,将数据分割在100MB以上,数据库的性能有一定的提升。(2)地质灾害预测模型优化是地质灾害大数据挖掘框架建立的重点工作内容,在滑坡的中长期预警研究中预测模型的运算效率对灾害防控是至关重要的。本文以空间数据挖掘中使用最为广泛的Apriori算法为例,原始的Apriori算法运行时会产生大量的频繁项集,当数据量过大时,硬件的压力会越大。基于MapReduce的Apriori算法主要通过计算模型进行优化,并未从算法层面做优化。本文从算法底层着手,提出一种基于MapReduce框架的IAprioriMR算法,使用Webdoc数据集为实验数据,验证IAprioriMR算法的运算效率,通过对比分析发现,优化后的IAprioriMR算法模型,相对于传统的并行AprioriMR算法,效率有了提升,随着MapReduce环境中节点的增加,优化的IAprioriMR算法在性能提升方面更为显著。(3)使用三江并流地区滑坡灾害数据验证优化后的地质灾害大数据挖掘框架是否可行。选取2000~2011年间的滑坡监测数据集作为训练模型,选取2012~2013年间的滑坡监测数据集作为测试数据。根据IAprioriMR的预测模型规则,设定监测点地下水位、降雨量、三江并流河流水位、滑坡监测点累计位移等为滑坡发生的诱导因素,滑坡发生为结果。2012~2013年间,三江并流地区共记录滑坡灾害21起,通过计算置信度大于0.7的规则,该挖掘框架成功判断出2012~2013年间的16次滑坡事故。本文建立的挖掘框架对地质灾害中长期预警研究有一定的可行性。
其他文献
在我们的日常生活中,很多孩子都有各自的烦恼,这些烦恼可能在家长和老师的眼里微不足道,但对于他们来说,常常因为没有人倾听或无处发泄而压抑在心里。一年级的学生人虽小,但情绪体
期刊
讨论了单兵系统的体系结构和信息要素,并结合单兵系统在联合作战中的应用例子,对其业务过程和信息流进行初步分析。然后通过IDEF1X方法,设计单兵系统基于关系数据库的数据模
基于硅蚀刻及软光刻复制模塑技术,制备了4种聚二甲基硅氧烷(PDMS)微柱阵列型拓扑结构基底,其微柱名义直径为4μm或10μm,名义间距为4μm或7μm,名义高度为4μm。考察了人肝癌
<正>奉贤:聚焦中小企业质量再提升9月3日,以"聚焦中小民营企业质量提升"为主题的2019奉贤区质量月活动在金汇镇拉开序幕。此次活动,集中展现了奉贤凝心聚力推动区内中小民营
分析了黑木耳生长的气象指标、气候生态条件及我国黑木耳生产地的气候、耳林资源;揭示了黑木耳主产区的资源优势及其利用。
随着物业管理行业的快速发展,率先获得核心竞争力的物业服务公司取得发展优势。同时,互联网+的应用,虚拟物业社区的兴起又为物业服务企业提供了新的发展机遇,业务规模和范围
采集浙江舟山秀山的滩涂海泥,通过水浸提、过滤、离心沉降处理制备水溶体系,采用BCS~Trolox法测定体系的总抗氧化性能,采用酪氨酸酶法评价体系的美白功效,研究了制备水溶体系时温
鸡腿菇又名毛头鬼伞,是真菌门鬼伞科鬼伞属的一种草腐土生菌类,因其形似鸡腿而得名。目前鸡腿菇全世界皆有分布,我国主要产于北方,近年来人工栽培技术越来越成熟。北方气候冬天寒
滨海地区地基土为软土,表层广泛分布的盐渍土更是具有盐胀、溶陷、腐蚀和吸湿软化等问题,未经固化或加固处理不能满足实际工程建设的要求。软土地基的固化处理一直是岩土工程界研究的一个重要问题,秸秆纤维作为优良的加筋材料,早在岩土工程中已有了一定的应用。但由于秸秆纤维具有易降解的特性,应用于实际工程中时工程性质劣化,在一定程度上阻碍了秸秆纤维加筋工程的应用与推广。近年来,一些专家和技术人员采用在秸秆纤维表面