基于群体智能优化算法的土地评价分类规则挖掘研究

被引量 : 7次 | 上传用户:xxuhhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着GIS和数据库技术在土地管理领域的飞速发展,人们可以方便的管理、查询、统计和存储土地利用数据,为土地评价、土地利用规划等工作提供了海量的数据保证。然而,由于土地利用源数据来源于多个部门,存在类型多样、尺度不一、关系复杂等特点,使得人们虽然拥有海量的土地数据,却无法准确、直接的从数据中获取相关土地管理领域的知识,势必造成“数据丰富,知识贫乏”的局面。如何从海量的土地利用数据中获取能够有效解决不同土地问题所需的知识和模式,就成为土地管理领域中一个亟待解决的问题。空间数据挖掘技术,作为数据挖掘技术的一个重要分支,可根据用户的需求和领域知识的引导,从海量的空间数据库中挖掘用户感兴趣的规律和模式,目前已经广泛应用于遥感分类、土地利用变化模拟等领域。土地评价是土地管理领域中的一个主要研究课题,可为土地利用规划、土地利用决策支持等提供基础数据,是根据评价目的和类型,基于影响土地质量的参评因子,对土地质量进行鉴定的过程。空间数据挖掘中的空间分类技术,是将原始空间数据集划分为训练数据集和测试数据集,利用空间分类算法构建分类模型对训练数据集进行训练获取条件属性与决策属性之间的一种映射关系,一般表现为空间分类规则,通过测试数据集测试合理后,用以指导未知样本的数据分类。根据土地评价和空间分类技术的相似性,本文试图从空间分类技术的角度构建土地评价模型,以土地评价参评因子和评价的结果分别作为条件属性和决策属性,利用分类算法训练土地评价参评因子与评价结果之间的关联关系作为指导其它地区的土地评价知识,这种方法不依赖土地评价因子的权重,有效的避免了主观随机性。通过模型训练空间分类规则,具体而言就是通过分类算法寻找出最能代表训练数据集的空间分类规则集合,是一个逐步寻优的过程,因此本文将群体智能优化算法中比较有代表性的蚁群算法引入土地评价空间分类规则挖掘中,并针对蚁群算法容易陷入局部最优的特点,使用免疫算法对其结果进行改进,从而实现土地评价、空间数据挖掘技术和群体智能优化算法三者的有机耦合。论文首先详细分析了土地评价理论方法的研究现状,归纳目前常用的土地评价方法以及存在的缺点,以土地评价、空间数据挖掘和群体智能优化算法的理论作为指导,将群体智能优化算法作为空间数据挖掘模型的训练算法,提出基于群体智能优化算法的土地评价分类规则挖掘思路。由于空间数据挖掘涉及到数据、知识、训练算法、模型测试等诸多方面的因素,结合土地评价领域知识以及GIS与空间数据挖掘的集成模式,确定了本文所使用的GIS、土地评价与空间数据挖掘的集成模式,设计了基于GIS的土地评价分类规则挖掘体系结构。该体系结构分为四层:数据层、知识层、挖掘层和人机交互层,是以土地评价和空间数据挖掘的耦合思想以及内部协作关系为指导来设构建的,数据层为挖掘层提供数据准备,挖掘层的各项任务被知识层中的算法库、知识库和模型库所限制和引导,用户作为挖掘层和知识层之间的通讯桥梁,通过发出指令的方式指导挖掘任务,计算机利用内部机制实现数据共享,并为用户提供友好的可视化表达。空间数据具有多样性、时空差异以及冗余性等特点,在进行土地评价分类规则挖掘之前,需要针对挖掘任务对土地评价多源异构数据进行数据整合,结合土地评价数据的特点,论文从土地评价数据转换、数据清理、数据集成和数据归约四个方面进行土地评价数据整合研究,针对不同的整合要求选用不同的算法来进行,构建了模型库、算法库支持下的土地评价数据整合体系。构建基于空间数据挖掘技术的土地评价模型是本文研究的关键,在空间分类模型构建思想的指导下,论文从数据结构设计、空间数据采样、分类模型训练、分类规则剪枝和分类模型测试等几个方面分别进行阐述。首先围绕选用的训练算法设计空间数据结构并依据采样原则将整合数据库分为训练数据集和测试数据集;然后详细阐述了人工蚁群系统、人工免疫系统以及土地评价分类模型的耦合思想,旨在将群体智能优化算法引入土地评价分类规则挖掘领域;由于通过蚁群算法和免疫算法训练提取的分类规则挖掘可能存在冗余属性和冗余规则,造成土地评价分类规则库不够简洁,在模型训练后,本文还采用规则属性修剪和冗余规则剔除两种规则剪枝策略,构建了基于免疫算法的土地评价分类规则剪枝体系,获取最终的土地评价规则集合;最后将最优土地评价规则集合进行测试,合理后则可进行推广应用。由于群体智能优化算法在土地评价分类规则挖掘中的应用也是本文研究的个重点,因此,论文还进一步对土地评价分类规则模型中所涉及的群体智能优化算法进行了具体的设计,针对蚁群算法和免疫算法的运行机理分别设计了输入层、挖掘层和输出层的三层算法结构,围绕算法的数学化描述、算法训练流程以及群体智能优化算子设计三个方面展开,结合土地评价的领域知识,对土地评价分类模型训练和规则剪枝过程中的蚁群算子和免疫算子进行了详细、系统的设计。为了证明所构建的体系结构、整合框架、挖掘模型和优化算法的合理性和可行性,论文最后使用广东省普宁市农用地定级为例,以Matlab程序设计语言为支撑,集成模型、算法,实现了普宁市农用地级别规则的自动挖掘,并进一步针对基本蚁群算法和基于免疫优化的蚁群算法的结果进行性能分析比较,选择基于免疫优化的蚁群算法提取的分类规则作为最终的农用地级别规则来引导测试数据集的分类,通过最终级别分布和分类精度,证明了本文构建的模型和设计的算法有效可行。论文还选用自然、经济和交通等方面的因素,以本文方法定级结果为依托,详细分析普宁市农用地定级结果与地貌类型、农业投入产出水平以及道路影响程度之间的关系。最后,在决策树和人工神经网络两种经典分类算法结果对比的情况下,总结了各种算法的优缺点,进一步证明了群体智能优化算法用于土地评价分类规则挖掘中的可行性。
其他文献
<正>李金生是江西省吉水县中医院主任中医师,全国第四批名老中医药专家学术经验继承工作指导老师。临证30余年,治学严谨,学验俱丰,擅长治疗内科病证,尤对肝病颇有造诣,尊古训
受贿犯罪是腐败的重要表现形式之一,历来是我国刑法打击的重点。目前,理论界对于受贿罪的研究颇多,但有些问题还有相当大的争议,需要深入研究。本文分八章对受贿罪进行了详细
余华是最激进的先锋派作家之一,而毕飞宇的创作也受到先锋文学的影响。通过对比发现,余华的《十八岁出门远行》和毕飞宇的《地球上的王家庄》两篇短篇在内容与形式上存在着可
新媒体是相对于传统而言的现代信息传播手段,新媒体改变了并重构了人们的信息交流方式,成为一种新的社会形态。分析新媒体的发展对现代高校大学生的就业影响,能够有助于辨别
最密切联系理论又称最强联系理论或最重要联系理论,是指在确定某一涉外民商事案件准据法时,法官应针对具体争议,在充分考虑州际或国际体制需要、法院地相关政策、有利益关系
数据仓库已成为解决金融行业中大量业务数据处理、汇总和分析的一种重要技术,而ETL (Extract-Transform-Load)过程在数据仓库的应用中起着关键作用。利用ETL过程可以把各个孤
中医药治疗乳腺癌化疗后恶心呕吐,以益气健脾、疏肝解郁、调和脾胃、扶正祛邪、补气降逆为治疗乳癌化疗呕吐的主要原则,应用中药、针灸、中成药等多种手段,疗效显著。
本文结合现代农村的经济发展背景,从经济管理的需求入手,探讨了农村地区的经济管理现状,提出了有针对性的优化策略,希望有助于我国农村经济体制的完善化。
近20年来,全球信用卡产业一直呈现出高速发展的态势,而随着我国经济的快速发展,信用卡在我国经济发展与社会生活中也必将扮演越来越重要的角色;加之信用卡产品利润高,并具有维
二氧化钛溶胶在光催化薄膜、染料敏化太阳能电池、光电化学传感器等方面有着重要的应用前景。目前多种溶胶的制备方法中存在两个问题,一是溶胶的液相主要是乙醇等有机溶剂,二