论文部分内容阅读
粗糙集理论模型是数据挖掘的有力工具,被广泛应用到机器学习、过程控制、知识获取、模式识别等领域,粗糙集理论可以运用属性约简发现数据表中的隐藏信息。在实际生产生活中,数据收集过程往往会遇到数据缺失、不确定、不完整的情况,使得最终收集到的不完备数据表无法直接应用经典粗糙集模型进行属性约简。因此,本文从不完备决策信息系统的填充及属性约简入手,对其展开相关研究。
本文以不完备决策信息系统为对象,对其缺失属性值的填充方法进行研究,并提出基于极大正域的变精度粗糙集属性约简定义,将其运用到填充后的信息系统中,从而进行属性约简。具体内容如下:
1.简述关于不完备信息系统填充方法的国内外研究进程,对现有经典粗糙集、变精度粗糙集属性约简定义进行分类和阐述,以期设计新的不完备信息系统填充方法,并将变精度粗糙集属性约简运用到填充后的信息系统中,从而确定文章主要研究内容。
2.对不完备决策信息系统的区分矩阵进行改进,提出贡献矩阵的概念,在其基础上给出属性贡献率、属性的属性值完备率等定义;再将属性的相对贡献率、属性值相对完备率与参数α,φ相结合,给出基于参数α,φ的属性重要度定义。
3.在基于参数α,φ的属性重要度的基础上给出重要属性及不必要对象的定义,并以决策表中属性值出现的频率为依据,给出相应的缺失值填充方法,将不完备决策信息系统转化为带权决策信息系统。
4.针对现有属性约简定义的不足提出变精度粗糙集模型中极大正域的概念,并给出基于极大正域的VPRS模型属性约简;同时,论证了基于极大正域的属性约简与已有几类属性约简间的关系;为方便应用,分别给出基于极大正域的属性约简的一般算法以及基于遗传算法的极大正域属性约简算法,分析了他们的优点与不足。
5.针对带权决策信息系统,首先给出保持相对正域不变的VPRS模型属性约简定义,再给出基于极大正域的VPRS模型属性约简定义及算法,最终选取UCI中的两个数据集验证了本文所提算法的可行性及有效性。
本文以不完备决策信息系统为对象,对其缺失属性值的填充方法进行研究,并提出基于极大正域的变精度粗糙集属性约简定义,将其运用到填充后的信息系统中,从而进行属性约简。具体内容如下:
1.简述关于不完备信息系统填充方法的国内外研究进程,对现有经典粗糙集、变精度粗糙集属性约简定义进行分类和阐述,以期设计新的不完备信息系统填充方法,并将变精度粗糙集属性约简运用到填充后的信息系统中,从而确定文章主要研究内容。
2.对不完备决策信息系统的区分矩阵进行改进,提出贡献矩阵的概念,在其基础上给出属性贡献率、属性的属性值完备率等定义;再将属性的相对贡献率、属性值相对完备率与参数α,φ相结合,给出基于参数α,φ的属性重要度定义。
3.在基于参数α,φ的属性重要度的基础上给出重要属性及不必要对象的定义,并以决策表中属性值出现的频率为依据,给出相应的缺失值填充方法,将不完备决策信息系统转化为带权决策信息系统。
4.针对现有属性约简定义的不足提出变精度粗糙集模型中极大正域的概念,并给出基于极大正域的VPRS模型属性约简;同时,论证了基于极大正域的属性约简与已有几类属性约简间的关系;为方便应用,分别给出基于极大正域的属性约简的一般算法以及基于遗传算法的极大正域属性约简算法,分析了他们的优点与不足。
5.针对带权决策信息系统,首先给出保持相对正域不变的VPRS模型属性约简定义,再给出基于极大正域的VPRS模型属性约简定义及算法,最终选取UCI中的两个数据集验证了本文所提算法的可行性及有效性。