气象数据的聚类分析及其可视化

来源 :华北理工大学 | 被引量 : 2次 | 上传用户:ode
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,伴随着气象行业现代化与信息化的不断推进,如何存储以及利用海量的气象资源,从中挖掘出有用的、有价值的信息就显得尤为重要,这也是提高天气预报正确率、灾情预警及时性等多方面问题的关键所在。聚类分析是将物理或抽象的对象集合分割成由类似的对象组成的多个类簇的过程。K-Means算法是一种基于空间欧式距离进行相似度划分的聚类算法,认为欧式距离越小的两个样本对象之间的相似程度会越高。但是经典K-Means算法在处理海量数据问题时,存在的初始点随机选取、噪声点影响以及算法效率与扩展性等问题。文中首先利用“最大化最小距离“思想优化K个初始中心点的选取工作;其次针对源数据集中噪声点影响这一问题,提出了样本质心以及样本密度两个概念,用以剔除源数据集中低密度区域内的噪声点;最后将优化后的K-Means聚类算法与Hadoop平台的Map Reduce分布式编程模型相结合,以解决经典K-Means聚类算法在处理海量数据问题时存在的算法效率以及扩展性等问题。实验阶段,首先采用数据加速比(Speedup)、伸缩率(Sizeup)和扩展率(Scaleup)三种指标评价HKM聚类算法性能,然后使用Grid Analysis and Display System系统将聚类结果以图表的形式进行可视化展示。
其他文献
城市内河具有供应水源、保护环境的生态功能,同时也担负着防汛、排涝、航运等作用,另外,城市内河也和旅游、娱乐、文化等相关联,为城市的发展做出了贡献。但随着经济和社会的
教具只有在课堂中充分发挥作用才能算作完美的呈现,教具的使用处理得恰到好处,即使是很简单的教具,也会让执教者智慧的火花成为课堂中的亮点。
目的:探讨小剂量和大剂量胰岛素治疗小儿糖尿病酮症酸中毒的疗效差异。方法:收集60例小儿糖尿病酮症酸中毒患儿,随机分成小剂量组和大剂量组,小剂量组给予胰岛素剂量0.05~0.1
随着加入WTO,竞争情报在我国企业中的作用日益重要,但资金、人才、技术等因素严重制约了企业竞争情报工作的开展,针对此状况,本文分析了基于SaaS的企业竞争情报服务模式的内
分别选取信阳毛尖、红碎茶、普洱熟茶为典型不发酵、全发酵及后发酵茶种,测定其醇提物及水提物中的主要成分,并以氧自由基的吸收能力(ORAC)和DPPH自由基的清除能力为指标,比
城市老旧街区由于人口集聚而且土地紧缺,普遍存在公共空间和公共设施缺乏的问题。基于相关理论方法并借鉴国内外相关经验,在步行空间统筹考虑交通通过性功能和交谈驻留等公共
<正> 昭乌达盟宁城县辽中京城址的西面,是一座东西走向的大山,在山头的南坡下是山头村,再往西约二公里是(口戈)斯营子,在这带大山南坡,过去常发现古墓葬。1959年春季当地老乡
目的了解诸城市中小学生营养状况,为学生营养不良及超重和肥胖现象的综合防治提供依据。方法根据《中小学生健康体检管理办法》等有关规定,于2010年对诸城市28628名中小学生
参与式教学以学习者为中心,应用灵活多样、直观形象的教学手段,鼓励学习者积极参与教学过程,加强教学者与学习者之间的信息交流和反馈,使学习者能深刻地领会和掌握所学的知识,并能