论文部分内容阅读
传统的推荐系统(Recommendation System,简称RS)可以通过用户、项目的历史评分记录来学习到用户潜在的个性化偏好和项目潜在属性特征,从而帮助用户快速准确地定位到目标内容。但是对于刚进入市场的新项目,因为没有或缺少足够的历史记录信息,传统的推荐系统往往会遭遇经典的项目冷启动问题,这对于新项目的市场引入和推荐推广都有严重影响。因此,完善项目冷启动推荐,挖掘新项目的属性特征并实现个性化推荐是非常具有研究意义的。项目冷启动推荐模型往往需要利用项目的额外辅助信息来对项目属性特征进行挖掘。本论文致力于通过项目的描述文本信息及项目相关性信息来对冷启动项目进行特征建模,并且进一步结合带有时间戳的历史评分记录来引入时间动态特性,从而设计出科学有效的项目冷启动推荐模型。本论文从提到的三个方面着手,以推荐系统的评分预测准确性作为评价指标,对项目的冷启动推荐进行了深入探索,主要的创新点及研究成果如下:(1)统计数据显示,用户和项目的评分都展现出了强烈的时间动态特性,用户对项目的评分与用户、项目彼时所处的时间状态紧密相关。为了给出用户在特定推荐时刻对项目最为可能的预测评分,本文将时间动态特性引入到项目冷启动推荐模型中,针对用户和项目不同的时间动态的特点,对它们进行了不同粒度的动态建模。(2)多媒体资源服务平台的项目通常会附带有相关的项目描述文本,这类文本信息是对项目内容的简介说明,反映了项目的内容特征。本文选用卷积神经网络来挖掘项目描述文本中的属性特征,并将它们注入到项目冷启动推荐模型中。提取到的文本特征有助于理解项目的属性内容及对冷启动项目特征进行刻画,从而能突破传统推荐系统面对冷启动项目时的局限性。(3)对于有少量历史记录的非完全冷启动项目,本文进一步挖掘项目间的相关性关系。基于词嵌入领域中利用词共现频率构建相关性矩阵的方法,针对本文特定的数据集,我们提出一个修正的相关性度量方法,以充分考虑不同项目间的评分差异,然后通过共享的项目潜在因子表示将标准的矩阵分解模型和相关性矩阵进行关联建模。(4)本文针对不同冷启动场景提出了两个全新的项目冷启动推荐模型TmTe-CCS(Time,Text,Complete Cold Start)和TmTeCo-ICS(Time,Text,Item Correlation,Imcomplete Cold Start)。这两个模型融入了时间、文本、相关性等特征,能有效突破项目冷启动对推荐性能的限制。本文在真实的数据集上评估了提出的两个模型,实验结果表明,本文提出的两个模型与现存优秀的模型相比,能够进行更有效的项目冷启动推荐。