论文部分内容阅读
随着信息技术的不断变革,在城市建设中,园林绿化水平正在蓄力提升。党的十八大以来,园林绿化已经成为一门新兴的环境产业,其行业发展领域一直在不断地扩大。结合城市发展现状和人民生活品质的提升等因素,城市的园林建设在苗木的种类、质量、成活率等方面均有较高的要求,尤其是在苗木的资源以及设计能力方面将成为优势企业的核心竞争力。为了推动城市园林绿化这一新兴产业的发展,本文以城市园林绿化工程的主要原材料之一苗木为主要因素,围绕数据挖掘技术中的决策树算法开展研究,提出了一种改进的C4.5决策树算法,制定出林地宜植性预测系统。首先通过对连续属性的不同值在同一属性下的分布特点进行分析,将统计学中的正态分布特征原理与C4.5算法相结合,依据属性正态分布特征对连续属性进行离散化处理。设置分割点为未知数,利用正态分布特征函数的积分公式,计算未知数分割点。然后对分割点进行排序,结合Fayyad边界值原理,选取排序后相邻两类边界点处的属性取值作为测试属性值计算信息熵,建立林地宜植性预测模型。最后利用程序分别实现改进前后的C4.5算法并进行对比实验,经过理论分析和实验结果表明,改进后的C4.5算法在一定程度上提高了连续属性分类的准确率和决策树的构建速度,减少了算法的运行时间。进而结合数据可视化技术对近几年园林种植苗木的种植面积、产生的经济效益进行可视化转换,为政府在园林建设决策方面提供了有力的支持,有助于政府发展园林绿化这一新兴产业。为构建具有应用价值的林地宜植性预测系统,本文首先研究了预测系统的构成,对整个系统进行功能性需求分析与非功能性需求分析,其次对数据库进行了概要设计和详细设计,使用改进的C4.5算法构建决策树模型和预测模型。最后使用Java开发语言、B/S架构模式、Spring、Spring MVC、Hibernate框架实现林地宜植性预测系统,并找若干用户对系统进行功能测试。从而证明系统运行的稳定性和改进算法的可行性,为政府管理者提供综合分析与智力支持。