神经网络在数据挖掘中的应用研究

来源 :河北工业大学 | 被引量 : 1次 | 上传用户:ez062009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘中的数据样本往往是一些带有噪声的、非线性的、杂乱的数据,神经网络处理这些数据具有一定的优势。同时在神经网络学习过程中,需要大量的数据以产生充足的训练和测试模式集,这又恰恰是建立在数据仓库或大型数据库上的数据挖掘所能提供的。鉴于数据挖掘与神经网络两者的优势互补,本文提出并研究了采用神经网络技术进行数据挖掘方法。 数据分类与预测作为一种重要的挖掘技术有着广泛的应用,在这一研究方向上目前已提出了多种分类方法,K—最邻近分类方法是其中典型的一种。面对大规模、高维的数据,如何建立有效的,可扩展的分类数据挖掘算法是数据挖掘研究的重要方向之一。本文在研究了Fuzzy ART(模糊自适应)聚类神经网络和BP神经网络的基础上,提出了一种改进的K最近邻分类算法,将Fuzzy ART聚类算法与BP神经网络的权值调整相融合改进K-最近邻分类技术,由于减小了训练集的数据量和去除了噪声数据,因此有效的降低了算法的运算量同时提高了预测精度。同时由于用神经网络对各个属性赋予不同的权重,不仅保证了Fuzzy ART聚类算法的准确性,而且提高了K-最近邻的分类预测精度。 针对多维离散时间序列的数据挖掘需要将数据转换为符号序列,本文提出了一个简单高效的多维离散时间序列符号化的方法,该方法用模糊自适应共振理论(Fuzzy ART)对时间序列进行聚类,实现离散时间序列的符号化;同时,通过属性相关性分析,忽略无相关或相关性小的属性,保证了聚类算法的精确度,为更好的实现数据挖掘做好准备。最后,通过对黄鹤山隧道交通流进行符号化实验,验证算法。 以上二种算法,均经过Matlab仿真实验验证算法的有效性。
其他文献
对建筑设备系统进行在线故障诊断具有重要的经济意义.针对独立的故障诊断系统初期投资大的缺点,本文提出了基于建筑设备监控系统的建筑设备系统在线故障诊断的方法——利用建
随着我国经济的发展,城市化进程的进一步加快,城市灯光景观愈来愈受到重视.本文分析了现有控制网络的优缺点及发展趋势;设计了基于Ethernet和CAN(Control Area Network)的混
本文将移动代理和WEB技术应用于网络管理,结合RMON、AgentX和网络监听技术,提出一个轻量级的网管模型,以解决现有模型存在的缺陷和问题。文章指出和介绍了本研究的意义和主要内
控制理论经历了经典控制理论和现代控制理论阶段,涉及的研究对象也从线性单回路系统、线性多变量系统到非线性系统。严格地讲,几乎所有的被控对象都是非线性的,线性性是在一
IPSec(Internet Protocol Security,互联网协议安全)协议具有高安全、高保密、有效防御外界攻击的特性,越来越受到业界的重视,并且其应用也日益广泛。由于个人电脑的迅猛增加
实现环境监测信息化管理是当今社会发展的必然趋势.环境监测信息系统的建设是一项庞大而复杂的系统工程,对环境监测科学、各类管理技术、信息系统建设工程和人员培训等方面的
磁悬浮技术是利用磁场力将物体悬浮于空间,使其与其它物体没有直接机械接触的一种新型支承技术。由于它具有无摩擦、无磨损、无污染、低噪声以及寿命长等优点,也是目前研究热门
在过去的十年中,科学计算正从主机集中转移到分布方式;近年来这一趋势更向着网格Grid计算延伸。网格时以资源共享为目的,支持对可计算资源的远程和并发的访问,用高速网络连接的地
热疗是近几年才出现的一种肿瘤治愈的新方法,是继手术、放射治疗、化学治疗和免疫疗法之后的第五大疗法.由于它的疗效可靠、稳定、毒副作用小,而被称为"绿色疗法".热疗效果的
本文对奥运物流的定义,组成内容,特点,运作过程与模式等作了理论上的分析,并以悉尼奥运会为实际案例,对其物流运作模式和过程进行详细的介绍。由上述分析可以得出的结论是市