【摘 要】
:
粒计算是美国San Jose State大学教授T.Y.Lin在1997年第一次提出,标志着涉及多学科的一个应用研究领域产生。粒计算是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度
论文部分内容阅读
粒计算是美国San Jose State大学教授T.Y.Lin在1997年第一次提出,标志着涉及多学科的一个应用研究领域产生。粒计算是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度的理论、方法、技术和工具的研究,是研究模糊的、不精确的、不完整的及海量的信息处理的一个新型的重要工具。数据挖掘是挖掘海量信息的重要工具,一些挖掘方法已逐渐趋向成熟。近年来,国外诸多学者对粒计算在数据挖掘中的应用进行了探讨与研究,提出了一些模型和方法,使粒计算在数据挖掘中得到了广泛的应用。粒计算理论对一些传统的数据挖掘方法进行了革新,粒计算采用粒度的思想来处理问题和解决问题。针对一个或某些问题或理论,来设计与构造粒或粒度,利用构造好的粒或粒度对问题进行计算,分析等,最终获得问题解。本文首先介绍了数据挖掘中的关联规则提取分析和文本聚类方法,然后系统地论述了粒计算理论及粒计算在数据挖掘中的应用情况,在此基础上,提出基于粒计算web文档聚类方法(WDCGrc)和基于粒计算高效挖掘决策型关系数据库中关联规则方法。基于粒计算web文档聚类方法,通过TF-IDF法则计算文档词条的权值,采取设定文档阈值和平均权值相结合的方法实行降维,抽取出每篇文档的主干词;建立了文档的主干词和二进制粒之间的转换,提出了基于粒计算提取文档间的关联规则算法来获取文档间的频繁项集,通过本文提出的聚类方法获得聚类结果。该方法具有一定的通用性。实验结果表明,该方法切实有效,聚类质量较好。基于粒计算从决策型关系数据集中快速提取关联规则方法,按照属性利用等价类对实体进行分类,利用分类后的属性值来构建粒,提出了基于粒计算提取决策型关系数据库的关联规则算法,来提取决策型关系数据集的关联规则,该方法弥补了目前提取关系数据库中关联规则的部分不足。
其他文献
资源描述框架(Resource Description Framework,简称RDF)是语义Web网所使用的基本标记语言,在诸多领域中有广泛应用。由于现有的本体抽取、标注方法和测量技术存在误差和噪声
本文在研究VoIP网关的组成及其特点、发展现状及趋势的基础上,针对接入线数可动态重组、软交换等功能需求,并结合具体产品的功能与性能的定位,提出了一种基于Infineon VINETI
本课题从研究应用于AOS系统的帧同步接口卡出发,分析和研究了AOS同步原理、算法与设计,PCI总线标准与设计和FPGA技术。随着科技的发展,同步技术在通信领域中起着越来越重要的
随着互联网技术的不断发展和移动通信的普及,人们希望以更灵活的方式随时接入互联网和企业网。移动IP技术应运而生并且不断发展,由于移动IPv4存在的缺点和不足,移动IPv6必将
P2P(Peer-to-peer)作为以文件共享为初始目的的应用,允许任意终端用户对等体(Peer)间通过Internet完成文件交换。在短短几年发展时间里,P2P应用已成为占用Internet流量的主要应
进入信息时代后,企业之间从单纯竞争关系转为竞争与协作关系,为此企业必须实现自身内部信息系统与外部伙伴的集成。Agent和web服务两种技术都为这种集成提供了良好的解决方案
随着Android开放配件协议的开放,Android设备可以方便的访问外设,形成强大的Android配件系统。由于Android音频配件越来越受到消费者的青睐,Android开放配件(AOA, Android Op
控制复杂系统是很多领域所共同面临的问题之一。现实世界中存在的很多复杂系统,可以用复杂网络加以描述,如计算机网络、电力与交通网络、生物网络、经济与金融网络、社会关系
随着计算机和网络技术的迅猛发展和广泛应用,高效、可靠的软件生产开发模式和开发过程成为国内外研究的热点。多引擎的体系结构就是多个引擎组成的松散的网络,通过多引擎间相互
航空电子系统是飞机重要的组成部分,在几十年的发展中,系统结构不断演变,经历了一个从分立式、联合式、综合化到高度综合化的发展过程。航空电子系统是现代化战斗机的重要组成部