【摘 要】
:
随着大数据、云计算、人工智能的蓬勃发展,各行各业积累了大量数据,对海量数据的争夺和分析处理已经成为国家之间竞争的重要方面。在数据挖掘中,主要研究内容有关联、分类、
论文部分内容阅读
随着大数据、云计算、人工智能的蓬勃发展,各行各业积累了大量数据,对海量数据的争夺和分析处理已经成为国家之间竞争的重要方面。在数据挖掘中,主要研究内容有关联、分类、聚类等挖掘算法,其中关联规则挖掘可以高效挖掘出数据中隐含的有价值的、人们感兴趣的知识与规则,在实际数据处理中得到了广泛的应用,是目前的研究热点。本文对单机模式和分布式集群环境下的关联规则挖掘算法进行研究,主要内容包括:针对单机模式下效率较高的PrePost算法存在内存占用大、缺乏高效的连接和剪枝策略以及建树复杂等问题,提出了一种基于B-list的改进PrePost算法。改进PrePost算法利用B-list代表数据库中的项集,使用集合枚举树表示候选频繁项集的搜索空间并采用子集非频繁策略进行剪枝,研究了一种线性复杂度连接两个项集B-list的快速算法来计算项集的支持度。实验结果表明,在单机模式下改进PrePost算法具有更高的时间和空间效率,能够有效挖掘出隐藏在数据中的频繁模式。针对分布式集群环境下传统挖掘算法在挖掘大规模数据时存在时间效率过低和内存溢出等问题,将改进PrePost算法与Hadoop进行结合,提出一种基于Hadoop平台的大数据关联规则挖掘算法H_PrePost。H_PrePost利用MapReduce编程模型进行并行计算,使用一种负载均衡策略保证集群高效运行。由于大数据中存在大量频繁项集,使用kulczynski度量和不平衡比对所挖掘的频繁模式进行评估,以确保所挖掘模式具有实际应用价值。实验结果表明,H_PrePost算法可以有效挖掘大数据集中的频繁模式,能够满足分布式集群环境下对大数据进行关联规则挖掘的需要。
其他文献
随着全球经济的一体化,创业投资机构进行跨境投资的现象越来越普遍。跨境创业投资机构进入东道国后,需要在一个陌生环境下从零开始建设并提高自己在东道国的市场影响力,从网
灯盏细辛注射液(DZXX)广泛用于脑血管疾病的治疗,野黄芩苷是其主要活性成分。然而,DZXX中其他化学成分对野黄芩苷药代动力学的影响尚未完全明晰。本研究的目的是揭示DZXX中其
研究背景寨卡病毒(Zika Virus,ZIKV)属于黄病毒属正链RNA病毒家族。该病毒是一种典型的蚊媒传播的黄病毒,同时还可以通过母婴传播、性传播和血液传播。ZIKV以多聚蛋白的形式表
背景:抑郁症与维生素D缺乏有关。然而,很少有人注意到这种联系背后的神经基质。材料和方法:我们招募50例右利手的重度抑郁症(MDD)患者和36名年龄、性别相匹配的正常对照组作
表面等离激元是入射电磁波与金属表面的自由电子耦合引起的集体振荡形成的电磁波。表面等离激元具有的突破衍射极限的特点,使得其可以在亚波长尺度下传播,从而应用于大规模集成光路。金属表面等离激元结构简单,应用广泛,可以用于等离激元诱导透明、等离激元传感等方面。石墨烯表面等离激元将表面等离激元与太赫兹波段联系起来,降低了损耗,提高了传输效率,同时可以实现对其的调控。本文分别以金属表面等离激元和石墨烯表面等离
三大化石能源不可再生,储量有限,且分布具有明显的地域性,此外使用时还引发环境污染问题。因而,能源行业的发展重心逐渐向清洁的可再生能源倾斜。各国纷纷出台政策鼓励新能源
数据分类是数据挖掘、计算机视觉、机器学习等领域研究的重要内容。其中,基于少量已知标记获得全部数据标记的半监督分类在机器学习领域又称直推学习,是目前监督学习的基础。近年来提出的基于图的非局部算子的离散变分方法已成为数据多分类的有效建模方法,非局部Potts模型是该类方法的基础。该类模型采用与分类数目相同的标记函数划分数据类别,并引进单纯形约束以避免漏分和重分问题,计算复杂、效率较低。本文针对上述问题
多媒体是当今互联网世界无法缺少的信息载体,其中数字图像是军事、医学、经济等领域中十分重要的多媒体信息。如果没有对这些敏感信息实施安全有效的保护,会给个人或国家带来重大损失,因此图像加密技术成为了保护数字图像安全性的关键技术。在实际应用中,常需要对图像进行压缩处理来降低大量的图像数据给传输、存储和加密带来的负担。JPEG压缩图像良好的压缩性能使其成为使用最广泛的压缩图像。故而针对JPEG图像的加密方
Si基光互连的高效光源一般为III-V族激光器,但其工艺与Si-CMOS的工艺兼容性差,这一难题一直阻碍着其发展。同为IV族的Ge材料可以解决这一问题,因此Ge基激光器成为半导体激光器近年来研究的热点。其中GeSn激光器在Ge基激光器中极具应用潜力,这是由于GeSn材料能够通过高Sn组分转变为直接带隙材料,从而极大地提高其激光器发光效率。GeSn激光器的有源区材料(GeSn、SiGeSn)与结构是
目的:探寻卢秉久教授治疗非酒精性脂肪性肝病的用药规律,结合临床感悟,总结并传承卢秉久教授以温阳化气法治疗非酒精性脂肪性肝病的学术思想,为今后本病的中医治疗提供新的思