论文部分内容阅读
近年来,随着互联网(特别是移动互联网)的迅猛发展以及移动设备的日益普及,无论是消费企业运营服务的商业模式还是人们日常生活中的娱乐休闲与消费习惯都发生了巨大变化。从消费企业运营服务商的角度来说,他希望迅速锁定消费人群,把消费者最感兴趣的商品和服务呈现给他们。从普通消费者的角度来说,他希望从海量的网上内容与服务当中迅速得到自己喜欢的产品与服务。由于互联网迅猛发展所带来的用户规模与网上内容服务的爆炸性的增长,不仅让消费企业运营服务商锁定消费人群的任务变得越来越具有挑战性,而且普通消费者在获取自己感兴趣内容与服务的时候倍感困难。因此,无论是对消费企业运营服务商还是普通消费者来说,推荐服务都变得越来越有必要,而矩阵填充技术是构建现代推荐系统的核心技术之一。所谓矩阵填充技术,指的是在矩阵有残缺值的位置上填充元素值的方法。其在大规模推荐系统上的应用面临许多新的挑战。例如,为了推提高荐算法的鲁棒性,人们希望在推荐系统中应用凸优化矩阵填充算法,然而传统的凸优化矩阵填充算法往往在存储效率和计算效率上都有较大的不足,难以应用于大规模的矩阵填充。其次,对大规模推荐系统而言,在整个大规模数据集上调节参数非常耗时耗力,而以往的矩阵填充算法在小样本数据集上调节获得的最佳参数在大规模应用上往往表现很差。因此,对传统的矩阵填充算法来说,获得在大规模数据集上仍然表现良好的模型参数是困难的。最后,在社交媒体上如何利用用户评分矩阵对用户兴趣进行建模仍然是一个值得深入研究的问题。本文围绕矩阵填充技术在大规模推荐系统中的应用中存在的问题进行深入研究,主要贡献如下所述。首先,针对矩阵迹模有界约束凸优化矩阵填充问题提出了一阶低秩的优化算法,解决了传统求解方法应用在大规模推荐矩阵填充时存储和计算效率低下.的问题。本文解决方案的创新之处在于将原始的凸优化矩阵填充问题的半正定约束转化为低秩的矩阵分解问题。由此,我们可以通过在一个新的、由原来的矩阵迹模约束转化得到的、球型空间中搜索新矩阵分解问题的解。同时理论分析发现当满足一定条件得时,新矩阵分解问题的局部最优解可以用于构造原矩阵填充问题的全局最优解,即获得原凸优化问题的解,以及原问题解的秩。其次,针对过去矩阵填充算法在大规模推荐问题应用中参数调节困难的问题,提出一种参数对评分矩阵规模不变的矩阵分解方法,在大规模评分矩阵中随机采样出一个子评分矩阵,用于参数调节与学习分解方差,然后再将获得的最佳分解方差参数用于原始大规模评分矩阵的分解。特别的,该算法可以使用过去的任何矩阵分解方法在随机采样出的子评分矩阵上估计最佳的分解方差参数,然后利用所得到的最佳分解方差参数在原始的大规模评分矩阵上进行快速有效的矩阵分解。最后,本文进行了大量实验,验证了本文所提出方法在利用在子评分矩阵上所获得的最佳分解方差参数的情况下,在原始大规模评分矩阵上可以获得到非常好的矩阵分解结果。最后,研究了在社交媒体上利用用户评分矩阵对用户兴趣进行建模的问题。首先,本文提出将社交用户的总体兴趣分解为个体兴趣和共同兴趣两部分。其次,在兴趣分解中引入隐式多维用户兴趣关系。再次,提出一个新的DisSUP社交网络评分矩阵分解模型,该模型不但可以用于推断社交媒体用户的总体兴趣和个体兴趣,还可以用于推断用户之间的多维社交兴趣关系。除此之外,将所提出的模型应用于三个实际场景,分别是社交媒体评分预测应用,小众品味内容推荐应用和社交网络1-跳最有影响力用户识别应用。最后,爬取了2个大规模的真实社交媒体评分数据对所提出的算法进行了实验验证,实验结果表明,本文所提算法相比之前的算法在准确率方面有很大提高。