外包数据挖掘隐私保护算法研究和改进

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:longjayliu1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘旨在研究从大量的数据集合中,发掘出潜在的、有价值的信息或知识的过程,在商业决策、潜在客户分析等方面可以给企业带来巨大商业利益。但其对软、硬件资源有着较高要求,所以在具体实践中,大多数中小型企业或组织由于内部缺少必要的资源和专家,阻碍了其获得数据挖掘所带来的商业利益。此时,外包数据挖掘是一种很好的解决方式。然而,这必将涉及到信息安全与隐私保护问题。因此,作为数据挖掘一个新的分支,隐私保护数据挖掘技术研究变得越来越重要,特别是对外包数据挖掘中隐私保护技术的研究具有显著的实际意义。本文首先对PPDM技术的原理进行了深入分析,并从基本流程上比较了它与数据挖掘的异同,并且对典型PPDM技术进行总结,并指出它们在各类挖掘算法中的应用。其次,与一般PPDM技术不同,外包数据挖掘对隐私保护技术有着特殊的要求,本文对外包数据挖掘和其隐私保护技术进行研究,并提出了基于隐私保护的外包数据挖掘项目基本流程。最后,本文进一步对外包聚类挖掘和外包关联规则挖掘进行深入研究。在保证安全性和准确性的前提下,提出了外包聚类挖掘隐私保护技术的设计,完成了对现存三种外包关联规则隐私保护算法的分析,并且根据PPDM算法的评价标准,改进了其中的不确定一对多替换加密算法。本文设计的快速替换加密算法与原始算法相比,获得更高的变换效率,同时仍然保证了有效性和安全性,更适于实际应用。
其他文献
风电场由风力发电机组等设备组成,是一种典型的多域异构信息环境。不同厂商的风电机组具有各自的数据定义和通信模式,由此引起的数据和通信不兼容的问题阻碍了风电机组的有效监控,影响到电力生产,同时限制了风电设备的适用性,提高了运行和维护成本。本文针对多域异构环境下的信息兼容性问题展开研究。借鉴变电站自动化领域的成熟经验,利用面向对象的思想,应用IEC61400-25(风电场监控通信)规约的基本方法,提出了
随着城市现代化进程的不断推进,汽车尤其是私家汽车的数量迅速增长。汽车在给人们带来巨大便利的同时也带来了诸多问题。在此情况下,车牌识别系统应运而生并且发挥着越来越重
M元扩频通信系统具有占用带宽小、抗干扰能力强及隐蔽性能强等突出优点,在超宽带、水声及卫星等通信系统中得到了广泛应用。本文针对采用M元扩频的多用户通信系统,研究了信道
随着互联网的不断发展,在为我们的生活带来巨大便利的同时,现代网络所存在的各类脆弱性问题也使得我们不得不面对来自各方面的威胁和攻击,随之而来的安全风险也越来越大。网
盲信号分离是指在信号源和传输信道完全或部分未知的情况下,只利用传感器阵或天线阵的观测来分离、提取源信号的信号处理理论。近年来,它已成为信号处理领域的一个研究热点。盲
协作分集技术通过用户共享彼此的天线形成一个虚拟的多天线网络,从而获得发射分集以对抗无线信道中的多径衰落,可以有效地改善移动终端上行链路的性能。论文主要研究无线通信
随着信息时代的来临,人们处理信息更加智能化和高效化。传统的文档信息主要记录在纸质文档上,OCR技术实现了纸质文档信息的数字化,版面分析是OCR实现的前提。由于中文版面研
随着计算机的普及,互联网的发展和网民人数不断增加,网络在带给人们许多便捷的同时也带来一系列问题,传统的网络安全问题包括电脑病毒、盗窃帐号密码、黑客入侵和恶意网站等
近年来,随着各种移动设备的普及和用户应用需求的不断丰富,未来的移动通信网络必然向着网络容量更大、传输速率更高和频谱利用率更的方向发展。为了更好地增强网络负载能力,
智能家居又称智能住宅,是未来家居的发展趋势。智能家居兴起于上世纪80年代的欧美和日本等国家,90年代末引入我国,在我国尚处在发展初期,缺乏统一的标准和权威的产品。本文在