论文部分内容阅读
随着物联网技术和移动设备的迅猛发展和普及应用,时空数据规模急剧膨胀,如何对海量、多源异构的地理时空数据进行完整且高效地表达与管理迫在眉睫。常规的地理时空数据组织方法主要以点、线、面、体等要素对复杂地理实体进行表达,容易忽略地理实体的属性与语义之间的关联信息;同时,GIS多采用单机关系型数据库系统存储时空数据,其可扩展性与可靠性较差。因此,针对以上两个问题,本文将地理空间实体构成简化为最小逻辑单元---元语义对象,并结合Hadoop框架及其HBase列存储数据库、MapReduce并行运算模块,设计基于Hadoop的地理元语义对象时空数据模型,研究地理时空数据分布式存储与检索方法。论文主要对以下几个方面展开研究:(1)地理空间实体信息的对象化表达与封装方法。基于开源云平台Hadoop,并结合面向对象方法和语义约束模型将地理实体的构成分解为元语义对象(MSO)、组合语义对象(CSO)和聚合语义对象(ASO),对各类型语义对象的属性集、几何特征、方法集以及语义关系进行对象化表达,为地理时空数据组织提供理论方法支撑。(2)基于Hadoop的地理元语义对象时空数据模型构建方法。深入探讨元语义对象之间的空间度量关系、拓扑关系计算方法,确定元语义对象为时空信息最基本的组织单元,构建基于Hadoop的元语义时空数据模型(HSST_Model),通过模型表达元语义对象和时空对象的时间、空间以及属性信息。(3)Hadoop架构下地理时空数据组织方法。通过分析GIS时空数据特征,基于地理时空信息分布式存储框架,设计以元语义对象(MSO)为最小存储单元的HBase数据库物理存储结构,对时空对象存取方法作详细阐述,并构建VCP-Tree时空索引结构以提高时空数据查询效率。(4)HSST_Model模型在交通时空数据组织与查询中的应用。根据交通时空信息特点,利用基于Hadoop的元语义时空数据模型对交通时空数据进行组织与存储,最后通过实验验证VCP-Tree索引的数据存储与检索效率。本文通过构建基于Hadoop的地理元语义对象时空数据模型,并在此基础上研究时空信息分布式存储与检索方法,实现了大规模地理时空数据的有效组织与管理,为日益增长的复杂地理时空信息在计算机存储过程中出现的可扩展和可操作问题提供新的解决思路。