一个加权频繁项目集的支持度下界

来源 :第二十三届中国数据库学术会议(NDBC2006) | 被引量 : 0次 | 上传用户:sdfffasdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘是数据挖掘中很重要的研究方向之一,传统的关联规则挖掘方法主要基于支持度和可信度阈值,这些方法在挖掘过程中总是假设数据库中的每个项目具有相同的地位和作用,因而对每个项目作同等处理,这样导致挖掘结果常常包含大量的冗余、无用规则. 针对传统的关联规则挖掘方法存在的弊端,C.H.Cai等在文中提出了加权支持度关联规则挖掘问题,弥补了现有关联规则挖掘方法存在的不足,从而扩展了关联规则挖掘方法. 加权关联规则挖掘中由于权值参与到挖掘的全过程,权值对项目的支持度起加强和减弱作用,使一般的关联规则挖掘算法依赖的条件不再满足.不同权值分配,不同的加权支持度计算方法,导致挖掘方法不同,因此设计高效的加权挖掘算法是挖掘过程的关键.本文提出的加权频繁项目集支持度下界基于定义的加权支持度计算方法,该下界可以先将Ck中小于该下界的所有的项目集剪掉,从而缩小Ck项目集,降低了Ck产生过程的复杂度,从而提高挖掘效率。
其他文献
湿地被称为"地球之肾",具有独特的生态结构与功能.中国湿地面积约占全球湿地面积的10%,但近年来湿地面积逐渐萎缩,已造成了极为严重的生态恶果.因此总结以往湿地研究成果,确立
会议
水土资源配置与宏观经济发展相关数据网站(简称WSED)是课题"中国可持续发展数据体系化扩展与重组"的子课题"水土资源配置与宏观经济发展相关数据的更新与分析"的组成部分之一
会议
在大气科学数据库"十五"工作的基础上,探讨大气科学数据资料分析管理和应用系统的实现框架.介绍常用气象数据格式的使用,及其与数据分析和可视化软件接口的办法.研究数据处理
随着科学技术的发展和中国科学院各个研究所应用系统的高速建立,一种把这些宝贵研究资源整合的要求更加的迫切.E-Science计划要求对分布、异构的应用系统进行整合.现在利用SO
计算机网络的发展加快了企业和社会的信息化程度.它同时也带来了许多网络安全问题.本文全面分析了计算机网络中存在的不安全因素,并针对不安全因素提出了相应的安全策略,以期
Web使用信息挖掘就是利用数据挖掘技术从网络数据中发现用户的使用模式,以便于更好地了解网络用户的浏览行为和给用户提供更好的服务.本文主要研究了Web使用信息挖掘中的数据
会议
科学技术研究工作中存在大量临时、瞬时、可变的资源授权情况,目前有针对性的授权解决方案仍是一个热点.本文提出了基于特权委托的动态授权模型,并通过对XACML规范的扩展实现
近年来,一种新型数据形式数据流得到了广泛的应用和研究,数据流是持续快速到达的数据序列,数据量巨大,并且数据分布具有时变性.聚类是数据流处理的一个中心问题. 本文研究
会议
随着数据库系统的发展,数据的多维性已经广泛地存在于各种领域.由于人类没有对高维数据的空间猜想能力,不能对其产生直观的认识,因此可视化多维数据一般是寻找一种方法把多维
会议
新闻数据作为一种非常重要的数据对象,在网络和期刊报纸中广泛存在,对新闻数据的挖掘尤其是重要新闻事件的查找在日常生活中有非常广泛的应用.对于查找重要新闻事件,我们一般
会议