支持SQL查询的差分隐私保护模型研究

来源 :大连海事大学 | 被引量 : 1次 | 上传用户:duxiaoqingdu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的不断发展,挖掘数据中的有效信息变得越来越普及,从而导致挖掘信息过程中的隐私保护问题受到越来越多的关注。差分隐私作为一种新型的隐私保护模型,对隐私保护进行了严格的数学定义并提供了量化评估方法,使得在不同参数处理下的数据集提供的隐私保护程度具有可比性。因此,差分隐私理论被提出之后便迅速被业界认可,并逐渐成为隐私保护领域中的一个研究热点。目前,差分隐私在理论方面已经较为成熟,但是在实际应用中仍然有限。结构化查询语言(Structured Query Language,SQL)是现实世界中被广泛认可和普及的一种非过程化数据查询语言,具有灵活性高、功能强大的特点。SQL具有强大的灵活性的同时也增加了添加差分隐私保护的难度,导致SQL查询对差分隐私的支持度不够。为了扩展差分隐私在实际应用中的使用范围,提高SQL查询对差分隐私的支持度,本文提出一种对SQL查询添加差分隐私保护的方法。本文研究了SQL中常用聚集函数的差分隐私保护方法,并将SQL中的聚集函数分为两类。由于第一类聚集函数的函数值受数据集中的属性值大小影响,所以第一类聚集函数的全局敏感度较高,造成隐私保护后的结果可用性较差。为了提高发布结果的可用性,本文提出一种通过局部敏感度为SQL查询添加差分隐私保护的方法。针对第二类聚集函数提出一种在关系数据集下对SQL查询提供差分隐私保护的方法。该方法从关系代数的角度出发,通过关系代数限制SQL,解决了因SQL查询结构灵活所造成的问题。此外,关系数据集是一种高敏感度数据集,当更改其中一条记录时可能引起多条记录发生改变。针对这种情况,本文通过关系系数来度量数据之间相关性,在差分隐私保护过程中充分考虑相关性对隐私保护结果的影响,力求在满足差分隐私保护的前提下,提高发布结果的可用性。
其他文献
社交事件发布及参与平台越来越受到人们的关注,这种线上与线下相结合的全新方式不仅具有传统的线上交流功能,而且将网络社交放到了现实,其主要功能是为用户提供一种社交事件
随着工业生产设备的自动化水平不断提高,现代工业过程更趋向于集成化、复杂化和智能化。如何准确及时地排除生产过程中的故障,对于保证生产安全至关重要。近几年,传感器技术
近年来,随着定位技术的发展和附有GPS功能的智能设备的普及产生庞大规模的轨迹数据,同时,随着大数据处理方式的不断发展进步还有人们不断变化的市场需求,人们逐渐可以发现并
人工智能和计算机视觉等学科的飞速发展为数字图像处理的相关研究与应用提供了更为广泛的支撑。图像分割作为数字图像处理的重要研究之一,是模式识别、目标检测等领域的重点
信息时代数据量激增,有海量的数据需要加以分析和利用,数据聚类作为一种高效的数据分析方法得到广泛应用。由于传感器异常、数据传输不稳定、数据存储不完善等因素都可能造成
人工神经网络已经被证实在自然语言处理,语音信号处理,图像处理等领域都有着良好的表现,循环神经网络作为人工神经网络模型的一种,常被用于处理各类时序任务,这主要得益于它
现如今,随着科学技术的发展,爆炸式增长的数据信息涉及人类的各个领域。时间序列流数据作为众多数据类型中的一种时间序列模式数据,它是一个动态的数据集合,其大小随着时间的
超导材料在光照条件下能够产生光生电压的现象在多种超导材料中已经被观测到,但在不同的实验报道中结论不一,未能得出一个共同的理论来解释实验现象。在先前的研究中,钇钡铜
本文研究预裂加热条件下花岗岩岩板挤压破坏前应力的异常变化。选取花岗岩作为实验材料,经过加工成尺寸大致相等的岩板试件,在试件表面约束情况下,对岩板进行两次高温加热,通
新疆阿拉套山位于西天山北部,是中亚造山带的重要组成部分,该地区发育有大量的晚石炭世-早二叠世的花岗岩,目前对这些花岗岩的类型、岩浆演化以及成因还存在一定的争议。新疆