面向推荐系统的矩阵填充算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:xiyouyou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网(特别是移动互联网)的迅猛发展以及移动设备的日益普及,无论是消费企业运营服务的商业模式还是人们日常生活中的娱乐休闲与消费习惯都发生了巨大变化。从消费企业运营服务商的角度来说,他希望迅速锁定消费人群,把消费者最感兴趣的商品和服务呈现给他们。从普通消费者的角度来说,他希望从海量的网上内容与服务当中迅速得到自己喜欢的产品与服务。由于互联网迅猛发展所带来的用户规模与网上内容服务的爆炸性的增长,不仅让消费企业运营服务商锁定消费人群的任务变得越来越具有挑战性,而且普通消费者在获取自己感兴趣内容与服务的时候倍感困难。因此,无论是对消费企业运营服务商还是普通消费者来说,推荐服务都变得越来越有必要,而矩阵填充技术是构建现代推荐系统的核心技术之一。所谓矩阵填充技术,指的是在矩阵有残缺值的位置上填充元素值的方法。其在大规模推荐系统上的应用面临许多新的挑战。例如,为了推提高荐算法的鲁棒性,人们希望在推荐系统中应用凸优化矩阵填充算法,然而传统的凸优化矩阵填充算法往往在存储效率和计算效率上都有较大的不足,难以应用于大规模的矩阵填充。其次,对大规模推荐系统而言,在整个大规模数据集上调节参数非常耗时耗力,而以往的矩阵填充算法在小样本数据集上调节获得的最佳参数在大规模应用上往往表现很差。因此,对传统的矩阵填充算法来说,获得在大规模数据集上仍然表现良好的模型参数是困难的。最后,在社交媒体上如何利用用户评分矩阵对用户兴趣进行建模仍然是一个值得深入研究的问题。本文围绕矩阵填充技术在大规模推荐系统中的应用中存在的问题进行深入研究,主要贡献如下所述。首先,针对矩阵迹模有界约束凸优化矩阵填充问题提出了一阶低秩的优化算法,解决了传统求解方法应用在大规模推荐矩阵填充时存储和计算效率低下.的问题。本文解决方案的创新之处在于将原始的凸优化矩阵填充问题的半正定约束转化为低秩的矩阵分解问题。由此,我们可以通过在一个新的、由原来的矩阵迹模约束转化得到的、球型空间中搜索新矩阵分解问题的解。同时理论分析发现当满足一定条件得时,新矩阵分解问题的局部最优解可以用于构造原矩阵填充问题的全局最优解,即获得原凸优化问题的解,以及原问题解的秩。其次,针对过去矩阵填充算法在大规模推荐问题应用中参数调节困难的问题,提出一种参数对评分矩阵规模不变的矩阵分解方法,在大规模评分矩阵中随机采样出一个子评分矩阵,用于参数调节与学习分解方差,然后再将获得的最佳分解方差参数用于原始大规模评分矩阵的分解。特别的,该算法可以使用过去的任何矩阵分解方法在随机采样出的子评分矩阵上估计最佳的分解方差参数,然后利用所得到的最佳分解方差参数在原始的大规模评分矩阵上进行快速有效的矩阵分解。最后,本文进行了大量实验,验证了本文所提出方法在利用在子评分矩阵上所获得的最佳分解方差参数的情况下,在原始大规模评分矩阵上可以获得到非常好的矩阵分解结果。最后,研究了在社交媒体上利用用户评分矩阵对用户兴趣进行建模的问题。首先,本文提出将社交用户的总体兴趣分解为个体兴趣和共同兴趣两部分。其次,在兴趣分解中引入隐式多维用户兴趣关系。再次,提出一个新的DisSUP社交网络评分矩阵分解模型,该模型不但可以用于推断社交媒体用户的总体兴趣和个体兴趣,还可以用于推断用户之间的多维社交兴趣关系。除此之外,将所提出的模型应用于三个实际场景,分别是社交媒体评分预测应用,小众品味内容推荐应用和社交网络1-跳最有影响力用户识别应用。最后,爬取了2个大规模的真实社交媒体评分数据对所提出的算法进行了实验验证,实验结果表明,本文所提算法相比之前的算法在准确率方面有很大提高。
其他文献
图像配准作为模式识别和图像处理领域中的一个基本课题,在计算机视觉、遥感技术、图像融合、图像超分辨率重构和医学图像处理等很多领域都有着广泛地应用。随着应用技术的发
我国政府购买养老服务已实施近二十年,随其不断的推进,各级财政部门所拨付的资金也越来越多,但养老服务质量却不尽人意,故为了保证养老服务购买的公平和服务质量,需要加强对
形态分析与形态小波分析技术是数字图像处理的重要核心技术,随着形态分析与形态小波分析理论研究的不断深入和应用范围的不断扩大,出现了一些亟待解决的问题。如数字空间中结
位置社交网络的广泛使用与其规模的不断扩大使得地点推荐系统成为时下热门应用之一。地点推荐系统即为用户推荐那些他可能感兴趣地点的系统,其中地点通常指真实存在于城市中
随着互联网技术及相关产业的迅猛发展,数据正以前所未有的规模急速增加,数据是与自然资源、人力资源一样重要的战略资源;掌控数据资源的能力是国家数字主动权的体现。因此数
视觉目标跟踪(Visual object tracking, VOT)技术是计算机视觉的一个基础和关键的研究方向,近年来一直是学术界和产业界关注的热点之一。尽管近年来国内外研究者在目标跟踪上
目标识别是视觉系统的基本目的。如何从复杂场景中识别目标则是更加重要和困难的问题。局部不变性特征具有尺度和旋转不变性,对视点变化、光线变化以及噪声等仿射畸变都具有
随着互联网技术的飞速发展和互联网应用的不断普及,互联网资源成为当前规模最大、内容最丰富、使用最广泛的信息来源。为了有效地从这些海量数据中检索到需要的信息,搜索引擎
在社会经济快速发展的背景下,城市化进程的步伐也在不断加快,从而使建筑行业得到了较大的发展空间,但同时火灾发生的几率也在不断增加,且发生的形式也越来越多样化,对灭火救