差分隐私保护的概率矩阵分解推荐算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:chrdi_xjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着互联网经济迅速发展,网络信息量增长趋势迅猛,使得用户有时很难从海量信息中快速筛选出自己感兴趣的信息。虽然一些搜索引擎(如百度、Google等)通过开发并采用一些特殊的搜索算法,能够根据用户输入的关键词实现针对性搜索,但是这种方式搜索到的结果往往无法满足用户快速获取所需信息的现实需求。推荐系统旨在根据用户的喜好直接推送其感兴趣的信息,这样能为用户大幅度减少筛选大量信息的工作量,为用户的生活与工作带来便利。推荐系统的核心部分就是推荐算法,高性能的推荐算法自然成为构建高品质的推荐系统的关键。然而,在推荐算法训练过程中需要使用到用户大量的历史数据(如评分记录、网页的浏览记录等),通过对用户的历史数据进行有效的分析,这样才能根据用户的喜好为用户提供相应的推荐服务,从而能提升用户对互联网的体验感,促进互联网经济的融合发展。但是,推荐算法的训练集包含了用户的隐私信息,随着隐私观念的提高,用户在享受网络服务时会担心自己隐私信息泄露。为此,有必要为推荐系统中的用户数据,提供安全的隐私保护。而近些年成为研究热点的差分隐私技术,通过加入可控的噪声保护用户个体隐私信息,不改变数据整体的模式特征,从而满足上述隐私保护和推荐服务需求。本论文主要围绕推荐方案的差分隐私保护机制展开研究,主要工作包含以下两个方面:(1)设计了一个基于个性化差分隐私保护的推荐方案(PDP-PMF)。首先结合概率矩阵分解推荐算法和差分隐私技术,提出了一种基于一般差分隐私保护的推荐方案(DP-PMF)。进一步,针对用户群体对隐私保护差异化的需求,本文开发了改进的采样机制,利用矩阵表达评分数据(符合有界差分隐私机制),提出了基于个性化差分隐私保护的PDP-PMF推荐方案。该方案实现了项目级别的隐私保护,满足用户的个性化隐私保护的需求。从理论的角度,对DP-PMF和PDP-PMF方案进行安全性分析,严格证明了其满足差分隐私机制。此外,本文实现了上述两个推荐方案,并在多种用户级别和隐私预算的分配,以及抽样阈值优化等方面开展一系列的实验,并与DP-MF方案和DP-CF方案进行对比,验证了PDP-PMF方案在推荐准确度方面的优越性。(2)设计了一种基于两阶段差分隐私保护的推荐方案。该方案特别适用于,在推荐过程中用户隐私信息可能泄露和推荐者不可信的情况。考虑到现有方案普遍忽略了推荐过程中用户隐私数据保护的问题,本文采用组合差分隐私技术和概率矩阵分解算法,构造了一个两阶段隐私保护的推荐方案。该方案在推荐者不可信的场景下,在推荐过程中对用户的数据提供安全有效的隐私保护。结合差分隐私的组合定理,从理论的角度证明了该方案的安全性。多组实验结果表明,该方案推荐的准确度优于相关的对比方案,并且其安全性高于对比方案。
其他文献
十九大报告立足于2035年基本实现社会主义现代化、2050年建成富强民主文明和谐美丽的社会主义现代化强国,明确要求加快推进农业农村现代化,并突出强调要坚持农业农村优先发展
我国科教兴国战略实施已久,事业单位的科研经费也是节节攀升。但是随之出现的科研经费挪作他用、随意开支等问题也是层出不穷。找出经费使用低效的原因并找到解决问题的方法
代谢生态理论(Metabolic Theory of Ecology)认为植物个体的代谢速率(包括呼吸异化速率和光合同化速率)与个体大小的3/4次方呈正比。自该理论提出以来,其异速指数(allometric
近年来,经济纠纷案件不断增多,给农发行法律事务工作提出了更高的要求。本文在对基层经济纠纷案件调研的基础上,分析了经济纠份案件现状和存在的问题,提出了实现经济纠纷案件
在中国北方的冬季,纷纷扬扬的雪花经常使大地银妆素裹,增添了无限风光,但同时也影响了人们正常的生活。以往,大家总是习惯于抛洒融雪剂来消除积雪,但在对环保要求越来越严格的今天
该文从海上油气田井产物流的提升、输送、处理,以及流程的控制、安全保护等需求出发,结合海洋工况的特点,以工艺、仪控、配管等专业作为切入点,说明了油气田地面工程设施如何从设
对目前普通高校田径教学中所面临的困境进行研究。结果表明田径教学困境的成因主要有:田径项目自身的特点、学生对田径运动文化内涵的理解不够、教学理念过于传统、教学考核单
目的:系统评价晚期非小细胞肺癌(NSCLC)患者XPDLys751Gln(A/C)和XPDAsp312Asn(G/A)多态性与以铂类药物为基础的联合化疗临床疗效的相关性,为临床提供循证参考。方法:计算机检索PubMed