一种改进的关联规则算法研究与应用

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:aku168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据挖掘技术迅速而深入的发展,关联规则及其相关技术也得到越来越多的学者和研究人员的关注。关联规则挖掘能从大量的数据集中挖掘出隐含的、对决策有潜在价值的项集之间的有趣关联和相关关系,其应用的背景也从最初的购物篮分析扩展到网络入侵检测、用户消费习惯分析、关联规则分类、交通事故模式分析、软件bug挖掘等。因此,对关联规则技术的研究具有重要的实际意义,本文选择了这一主题进行了分析和研究。本文首先介绍了数据挖掘领域的研究内容、挖掘的方法和技术、当前的研究现状以及应用和发展趋势,接着对关联规则挖掘技术中的经典算法(Apriori、FP-growth等)进行了概述、分析和总结,在此基础上提出了一种基于最大频繁项集的关联规则挖掘算法MFIP-Miner算法。该算法将数据库中的事务通过频繁模式树(FP-Tree)压缩存储,并充分利用频繁模式树的性质,严格控制在挖掘过程中递归调用的终结条件,从而达到提升算法的性能的目的。其次,本文完成了实验平台的搭建,选用R语言,在Eclipse +StatET编程环境中实现了 MFIP-Miner算法,并对比MFIP-Miner算法与FP-growth算法、Mafia算法在选定数据库上的运行效率。实验结果显示,该算法的性能具有优越性。最后,将MFIP-Miner算法运用于天气敏感性疾病预报系统中,完成了该系统的设计和实现,通过对该系统各模块的测试,验证了预报的准确性。
其他文献
近年来互联网发展速度一日千里,变化日新月异。电脑、手机的迅速普及和功能的强劲使得人们在足不出户的情况下就能通过互联网了解国内外资讯、查看新闻、关注娱乐时尚、获取
根据计算,到2020年中国国际移动通信频谱需求总量将达到1350~1810 MHz。截止到2014年底,中国为国际移动通信系统规划的频率总计达到687 MHz,还存在至少663 MHz的需求缺口。因
近年来外国投资者对中国的并购投资项目数量增长,并购金额逐年增加,我国已经成为世界主要国家投资的目标市场。但是针对大量的外资并购项目,我国没有专门的外资并购国家安全
集成学习是机器学习领域中首要热门方向。它是通过某种方式组合多个学习器解决同一问题并且能够显著提升整个学习系统的泛化性能。集成学习由最初的萌芽经过众多相关领域的研
在陆地无线通信系统中,由于各种障碍物、散射体以及传播路径上其他发射源的存在,传输信号可能会发生比较严重的畸变。受多径效应、高斯白噪声、同信道干扰及其他因素的影响,
随着无线通信的发展,协作通信扮演着越来越重要的角色,中继技术在协作通信研究中的地位更是举足轻重,为了克服中继技术中的同步问题,半双工中继就变得更受欢迎。最近提出的互
当今城市发展密集化、高层化,城市轨道的发展因其环保、效率高快速进入人们的生活。地铁施工环境比较复杂、技术要求越来越高,隧道施工过程是十分重要的。在减弱盾构机对接触土体的扰动方面、控制地表沉降这两个两方面,在工程的应用有很实际的参考作用。本文以合肥地铁一号线三期工程物-天区间为研究对象,研究隧道盾构施工的整个过程对地表沉降和预测变化趋势的影响。通过对数据的处理、Peck公式的推导和使用的FLAC 3
网络的飞速发展给人们生活带来了便利,与此同时,引发的信息爆炸让人们很难精确的定位所求的信息。由于自然语言的歧义性,对实体的语义进行消歧成了搜索的关键问题,而针对语义
背景癌症是威胁全球人类生命的最大杀手之一,是当前医学研究领域所面临的一个重大挑战。目前,提高肿瘤治疗过程中的有效性及准确性已成为突破当前肿瘤治疗瓶颈的关键问题。纳米科学的发展,为发展新型多功能纳米抗癌药物提供了可能。利用纳米材料作为药物载体或将活性纳米材料直接作为药物,可以提高药物的吸收利用率,实现高效靶向药物递送,延长药物消耗半衰期,并减少对正常组织的副作用,从而提高肿瘤治疗的有效性和准确性。乳
近年来,随着电子数码产品的迅速普及,消费类视频数据正在以一个迅猛的速度不断增长。采用人工观看的方式处理这些视频数据将会是一项低效且耗时的工作。因此,在视频检索、智