基于邻域关系模糊粗糙集的分类方法研究与应用

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:skykingzx6103
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘、模式识别、机器学习等研究过程中,特征选择能够选择出代表整个数据集信息的子集。与处理完整的数据集相比,使用特征选择方法可以节省处理时间、提升效率。由于粗糙集理论能够处理原始数据集中的不精确、不确定以及模糊性信息,基于粗糙集的特征选择方法已经成为近年来研究的热点。本文主要在邻域粗糙集、模糊粗糙集以及特征选择和并行数据挖掘架构等理论与应用方面做了研究,提出邻域关系模糊粗糙集以及其特征选择算法;研究了邻域关系模糊粗糙集特征选择算法在医学图像分类中的应用;最后以邻域关系模糊粗糙集特征选择方法为基础,利用计算统一设备架构实现了乳腺X光图像的并行化特征选择。论文主要研究内容如下:(1)提出邻域关系模糊粗糙集模型以及相关理论方法。为探索粗糙集的泛化模型在模糊环境中的拓展,同时得出更加紧凑的分类模型,提升分类精度,减少处理数据的成本,文章提出了邻域关系模糊粗糙集(Neighborhood Relation Basis Fuzzy Rough Set,NR-FRS)模型以及其特征选择算法。该模型引入模糊化邻域关系来构造邻域关系模糊粗糙集的上、下近似,同时给出了模型在模糊化邻域近似空间的推理证明;其次,分析了模糊化邻域近似空间中特征子空间上的依赖性,并给出了模糊化邻域近似空间上正域和属性依赖度的定义;最后在UCI数据集上进行了实验,同邻域粗糙集特征选择算法相比,文章所提算法获得的属性数量随参数变化更加稳定,且平均分类准确率最好情况下提升了5.2%。(2)将邻域关系模糊粗糙集特征选择方法应用于乳腺X光图像的分类中。为了拓展文章所提出的邻域关系模糊粗糙集特征选择算法在实际数据集分类中的应用,将NR-FRS特征选择算法应用于乳腺X光图像特征数据集的分类中。数据集来源于乳腺X光图像标准数据集MIAS(Mammography Image Analysis Society),首先对初始图像进行预处理并提取纹理特征从而构造特征数据集,然后应用NR-FRS特征选择算法进行特征选择并输入给径向基核函数支持向量机,实验结果表明NR-FRS特征选择算法获得了最高82.16%的分类准确率,同基于邻域粗糙集的前向属性选择算法以及核主成分分析算法相比较提高了21.1%和27.2%。(3)计算统一设备架构下乳腺X光图像数据集并行化特征选择算法的实现。通过对乳腺X光图像特征数据集进行特征选择、分类的研究发现,其中存在一定程度的计算密集型任务。因而本文在大规模医学图像数据集上进行并行数据挖掘。文章采用基于计算统一设备架构(Compute Unified Device Architecture,CUDA)的并行思想处理医学图像的特征选择问题,从数据标准化和邻域粒子计算过程两点对特征选择进行了并行化,并对比了不同处理器(CPU和GPU)上的计算效率,研究了线程组织方式对计算时间的影响情况。实验结果显示,对于使用CUDA的并行化医学图像特征选择而言,整个过程的计算时间均获得了局部与整体的改善。
其他文献
本文主要围绕物流管理监控系统的设计应用而展开,主要研究了GPSONE技术、GIS地理信息系统、CDMA移动通信、嵌入式终端设备等多个相关内容。然后,根据我国的物流企业的需求,设
随着网络的发展和普及,数据信息急剧增长,为了获取有用信息,传统数据挖掘技术也在不断改变,其中,基于粗糙集的处理不确定性问题的方法,将粗糙集应用到数据挖掘中,由于其自身
结构健康监测(Structural Health Monitoring,简称SHM)是无线传感器网络极具代表性的应用之一,以桥梁结构健康监测系统为例,这类应用通常需要高密度地布置大量的传感器节点以覆盖
近几年,随着信息技术的飞速发展及广泛应用,数字化校园技术在国内各高校迅速发展,在实现为广大师生教学、科研、管理、生活服务的同时,也产生了大量的数据信息。对于如此庞大
学位
随着科技的进步,人们在通过各种渠道获取大量空间数据的同时对空间数据应用需求也日益增长,需要处理更大容量的空间数据,更快的数据传输速率和更快的处理速度也是必须的。这
现阶段,图像处理所解决的问题基本都是一些“病态”问题,即对相同目标采样每次得到的结果不同。这种随机性是由信道中存在的随机噪声对信号的影响产生的。如:大气信道、海流信
安全是物联网发展的基础,信任建模和管理是提高安全的手段之一,信任是以域为单位进行管理和评价的,但实际网络中,经常会发生本域找不到合适资源时,进行跨域调度。此时,信任模
智能交通系统中,交通视频中车辆的检测和跟踪一直是倍受重视的一个热点和难点问题,对其进行研究不仅是进一步车辆行为判断的需要,同时也能为智能交通系统提供许多必要的参数信息
树木是自然场景中不可或缺的重要组成元素,它的几何形状和拓扑结构的复杂性,决定了对它建模特别是形状逼真建模方法研究的挑战性。其中树杆作为树木拓扑形状的直接体现者,是树木
随着Web应用的日益广泛和Web开发技术的不断发展,开发者需要一种能够简化开发过程,降低开发难度,提高开发效率的框架。目前在Web开发中人们使用最多的框架大多数都是基于J2EE