论文部分内容阅读
随着互联网技术的研究与发展、互联网应用广泛推广,全球的数据量正在以指数级的速率增长,信息过载的现象越来越严重,为了更加有效地使用这些互联网数据,推荐系统已经广泛运用到网购、音像、电子书报杂志、信息检索、新闻等领域中。一个互联网应用或者说互联网产品的推荐系统的优劣,甚至会影响这款产品的用户粘性。作为推荐系统的核心组成部分,推荐算法在整个系统中举足轻重的地位也就不言而喻了。作为一种简单、高效的算法,协同过滤技术已经成为现在市场中最主流也是最成功的一种技术,但是该技术仍然存在许多待解决的问题,例如:用户稀疏性导致的推荐性能大幅下降、冷启动问题以及传统算法中没有考虑用户的偏好的变化等问题。针对上述传统协同过滤中的不足之处,本文对其进行深入学习与讨论,包括:传统基于用户和项目的算法的研究与分析、分析一种基于用户与内容项目的混合协同过滤技术以及基于逐步遗忘的协同过滤技术的研究等。在学习与分析前人的研究结果的前提下,作者对于该技术进行了更深入的研究,以下是本文研究内容概要:1.概述个性化推荐系统的研究背景;分别介绍个性化推荐相关的数据挖掘、信息过滤等技术;分析常用的几种协同过滤算法的推荐过程及各自的优缺点;最后比较分析不同个性化推荐算法的优缺点;最后论述现阶段推荐系统存在的问题,为下一步的改进算法实验做铺垫;2.对于传统协同过滤技术进行分析研究,并进行相应的工程实现,得到的数据留存,与接下来提出的改进算法的结果做比较分析;3.提出一种基于用户-项目的混合协同过滤改进技术,减少数据稀疏对相似度计算的影响,并与传统协同过滤结果进行比较分析,验证该算法在推荐结果上的改进之处;4.考虑逐渐遗忘对于用户评分的影响,研究遗忘曲线在个性化推荐中的作用提出一种基于逐步遗忘的协同过滤改进算法,并与传统协同过滤结果进行比较分析,验证该算法在推荐结果上的改进之处。