论文部分内容阅读
“质量即生命,责任重泰山”,工程质量一直都是工程建设过程中关注的焦点,而对工程项目建设过程的质量监督是保证工程质量的有效手段,传统的工程质量监督主要面向业务设计,面向决策支持的工程质量监督非常少。多年的工程质量监督管理的作中保存了大量的工程质量监督数据,如何有效利用海量的历史数据分析现状和预测未来,为监管部门提供决策支持,已经成为工程质量监督迫切需要解决的问题。本课题根据国内外决策支持系统的现状,结合贵州省工程质量监督的实际,采用数据挖掘技术和JAVA语言开发了一款针对工程质量监督管理的决策支持系统。本文通过阅读大量文献及技术文档,以拦河坝工程质量评定数据为分析对象,首先,对数据进行了预处理,在预处理的过程中,采用了去空值、去除离群点及属性规约的操作对数据进行处理。其次,采用C4.5算法基于WEKA平台对数据进行建模,对建模结果进行分析,针对C4.5算法先建树后剪枝会增加建模开销的问题,提出了在决策树创建过程中提前合并过拟合分支的改进算法,解决了决策树模型庞大和如何减少建模时间问题。通过实验验证,改进后的算法在模型准确率及模型精简程度上有明显的改善。最后通过对WEKA平台的二次开发将改进后的算法集成到了WEKA平台中,以决策树模型为依据总结出预测规则,将预测规则应用到了“工程质量监督管理决策支持系统”中,为工程质量监管部门提供决策支持。本研究通过对工程质量监督数据的分析,为质量监管部门指明了工程项目中各个子工程的而重要程度,使监管部门的监管工作更加有针对性,对未来工程质量的预测可以提前发现工程项目中潜在的问题,减少了工程事故的发生概率。