论文部分内容阅读
随着GIS和数据库技术在土地管理领域的飞速发展,人们可以方便的管理、查询、统计和存储土地利用数据,为土地评价、土地利用规划等工作提供了海量的数据保证。然而,由于土地利用源数据来源于多个部门,存在类型多样、尺度不一、关系复杂等特点,使得人们虽然拥有海量的土地数据,却无法准确、直接的从数据中获取相关土地管理领域的知识,势必造成“数据丰富,知识贫乏”的局面。如何从海量的土地利用数据中获取能够有效解决不同土地问题所需的知识和模式,就成为土地管理领域中一个亟待解决的问题。空间数据挖掘技术,作为数据挖掘技术的一个重要分支,可根据用户的需求和领域知识的引导,从海量的空间数据库中挖掘用户感兴趣的规律和模式,目前已经广泛应用于遥感分类、土地利用变化模拟等领域。土地评价是土地管理领域中的一个主要研究课题,可为土地利用规划、土地利用决策支持等提供基础数据,是根据评价目的和类型,基于影响土地质量的参评因子,对土地质量进行鉴定的过程。空间数据挖掘中的空间分类技术,是将原始空间数据集划分为训练数据集和测试数据集,利用空间分类算法构建分类模型对训练数据集进行训练获取条件属性与决策属性之间的一种映射关系,一般表现为空间分类规则,通过测试数据集测试合理后,用以指导未知样本的数据分类。根据土地评价和空间分类技术的相似性,本文试图从空间分类技术的角度构建土地评价模型,以土地评价参评因子和评价的结果分别作为条件属性和决策属性,利用分类算法训练土地评价参评因子与评价结果之间的关联关系作为指导其它地区的土地评价知识,这种方法不依赖土地评价因子的权重,有效的避免了主观随机性。通过模型训练空间分类规则,具体而言就是通过分类算法寻找出最能代表训练数据集的空间分类规则集合,是一个逐步寻优的过程,因此本文将群体智能优化算法中比较有代表性的蚁群算法引入土地评价空间分类规则挖掘中,并针对蚁群算法容易陷入局部最优的特点,使用免疫算法对其结果进行改进,从而实现土地评价、空间数据挖掘技术和群体智能优化算法三者的有机耦合。论文首先详细分析了土地评价理论方法的研究现状,归纳目前常用的土地评价方法以及存在的缺点,以土地评价、空间数据挖掘和群体智能优化算法的理论作为指导,将群体智能优化算法作为空间数据挖掘模型的训练算法,提出基于群体智能优化算法的土地评价分类规则挖掘思路。由于空间数据挖掘涉及到数据、知识、训练算法、模型测试等诸多方面的因素,结合土地评价领域知识以及GIS与空间数据挖掘的集成模式,确定了本文所使用的GIS、土地评价与空间数据挖掘的集成模式,设计了基于GIS的土地评价分类规则挖掘体系结构。该体系结构分为四层:数据层、知识层、挖掘层和人机交互层,是以土地评价和空间数据挖掘的耦合思想以及内部协作关系为指导来设构建的,数据层为挖掘层提供数据准备,挖掘层的各项任务被知识层中的算法库、知识库和模型库所限制和引导,用户作为挖掘层和知识层之间的通讯桥梁,通过发出指令的方式指导挖掘任务,计算机利用内部机制实现数据共享,并为用户提供友好的可视化表达。空间数据具有多样性、时空差异以及冗余性等特点,在进行土地评价分类规则挖掘之前,需要针对挖掘任务对土地评价多源异构数据进行数据整合,结合土地评价数据的特点,论文从土地评价数据转换、数据清理、数据集成和数据归约四个方面进行土地评价数据整合研究,针对不同的整合要求选用不同的算法来进行,构建了模型库、算法库支持下的土地评价数据整合体系。构建基于空间数据挖掘技术的土地评价模型是本文研究的关键,在空间分类模型构建思想的指导下,论文从数据结构设计、空间数据采样、分类模型训练、分类规则剪枝和分类模型测试等几个方面分别进行阐述。首先围绕选用的训练算法设计空间数据结构并依据采样原则将整合数据库分为训练数据集和测试数据集;然后详细阐述了人工蚁群系统、人工免疫系统以及土地评价分类模型的耦合思想,旨在将群体智能优化算法引入土地评价分类规则挖掘领域;由于通过蚁群算法和免疫算法训练提取的分类规则挖掘可能存在冗余属性和冗余规则,造成土地评价分类规则库不够简洁,在模型训练后,本文还采用规则属性修剪和冗余规则剔除两种规则剪枝策略,构建了基于免疫算法的土地评价分类规则剪枝体系,获取最终的土地评价规则集合;最后将最优土地评价规则集合进行测试,合理后则可进行推广应用。由于群体智能优化算法在土地评价分类规则挖掘中的应用也是本文研究的个重点,因此,论文还进一步对土地评价分类规则模型中所涉及的群体智能优化算法进行了具体的设计,针对蚁群算法和免疫算法的运行机理分别设计了输入层、挖掘层和输出层的三层算法结构,围绕算法的数学化描述、算法训练流程以及群体智能优化算子设计三个方面展开,结合土地评价的领域知识,对土地评价分类模型训练和规则剪枝过程中的蚁群算子和免疫算子进行了详细、系统的设计。为了证明所构建的体系结构、整合框架、挖掘模型和优化算法的合理性和可行性,论文最后使用广东省普宁市农用地定级为例,以Matlab程序设计语言为支撑,集成模型、算法,实现了普宁市农用地级别规则的自动挖掘,并进一步针对基本蚁群算法和基于免疫优化的蚁群算法的结果进行性能分析比较,选择基于免疫优化的蚁群算法提取的分类规则作为最终的农用地级别规则来引导测试数据集的分类,通过最终级别分布和分类精度,证明了本文构建的模型和设计的算法有效可行。论文还选用自然、经济和交通等方面的因素,以本文方法定级结果为依托,详细分析普宁市农用地定级结果与地貌类型、农业投入产出水平以及道路影响程度之间的关系。最后,在决策树和人工神经网络两种经典分类算法结果对比的情况下,总结了各种算法的优缺点,进一步证明了群体智能优化算法用于土地评价分类规则挖掘中的可行性。