基于粗糙集的分类算法研究

来源 :长沙理工大学 | 被引量 : 7次 | 上传用户:liyibo6941
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是利用分析工具从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中、事先未知、但又潜在有用的信息和知识。数据分类是数据挖掘的重要内容之一,目前用于分类的方法有很多,如粗糙集、决策树、贝叶斯网络、遗传算法等。粗糙集理论是波兰数学家Z. Pawlak于1982年提出的一种新的处理模糊和不确定性知识的数学工具。其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。决策树是通过一组无次序、无规则的实例推理出树表现形式的分类规则,它有易理解、易训练、易实施和通用性强等优点。粗糙集和决策树都是常用的分类方法,本文将两者相结合,取长补短,对数据进行分类挖掘,主要研究内容包括:1)对属性约简算法进行研究。大多数情况下,知识库存在冗余的属性,冗余属性既是对计算机资源的浪费(需要大量的存储空间),也会干扰人们做出正确而简洁的决策,所以有必要对属性进行约简。本文首先介绍了粗糙集中有关约简的相关概念,然后分析了几种典型的属性约简算法,最后提出了一种基于遗传算法的粗糙集属性约简算法,给出了算法的基本思想、详细设计过程、基本框架,并通过实例证明了本文算法能够快速有效地进行属性约简。2)对决策树分类方法进行研究。根据何种度量准则选择属性作为节点是决策树构造的一个关键问题。本文对现有的决策树算法进行研究,在原ID3算法的基础上,结合粗糙集理论和决策树基本原理,提出使用粗糙集理论选择属性作为节点来构造决策树,然后利用PEP后剪枝方法的优点,选择其为树剪枝,最后得出最简分类规则。
其他文献
传统的分布式协同设计系统都是使用客户服务器模式设计的,通过一个功能强大的服务器为组内成员提供协作。其主要的功能是实现文件与信息的共享。但是,这种体系结构不灵活,本
随着网络技术的迅速发展,在任何时候、任何地点接入信息网获得所需信息成为21世纪人类的普遍要求,移动计算技术使这种需求得以实现。由于移动计算环境与固定计算环境的差异,
随着网络技术的不断发展,网络应用不断丰富起来,从静态文件、图片的获取发展到动态多媒体文件的获取,尤其以高清晰的视频文件的下载占有很大比例,但是用户需要花费大量时间等
随着计算机和网络的快速发展,越来越多的嵌入式设备接入了互联网,嵌入式系统网络化程度的不断提高,其安全问题显得越来越重要。提高系统的安全性和可靠性是未来嵌入式系统的
可重构处理器是通用处理器与专用处理器的折中,同时具有通用处理器的灵活性与专用处理器的高能效。相比于细粒度可重构处理器FPGA,粗粒度动态可重构处理器(Coarse-grained Re
近些年来,计算机网络所面临的安全威胁越发引人关注。传统的入侵检测系统有较高的误报、漏报率,并且,对未知类型攻击不能很好的识别。虽然之后提出了入侵防御系统的概念,但是
电力工业的市场化改革正在全世界范围内展开,我国正处在“厂网分开,竞价上网”这一改革过程之中。由于电力需求以及电价的不确定性,发电商如何投标来最大化自己的利润,同时降低风
计算机的普及和网络的发展改变了教学模式,尤其是教学资源数字化、网络化成为一个必然的趋势。在这样的趋势下,产生了大量的教学资源,不仅包括传统的物理资源,还包括数字化的
随着现代网络的飞速发展,传统互联网络Internet和各种无线网络之间逐渐形成了互融共存的局面,其中包括无线Mesh网WMN,无线局域网WLAN、WiMAX、Wi-Fi,无线个域网WPAN,无线传感