论文部分内容阅读
随着计算机网络的迅猛发展,社会化标签系统成为众多新型网络应用的不可或缺的一部分,并因其操作便捷、操作简单等优点深受互联网用户的喜爱。标签推荐系统可以推荐相应的标签给用户,既方便了用户的操作又提高了系统标注的质量,但是会产生大量富含价值的数据,从而形成“用户-资源-标签”的三维模型。目前的标签推荐算法基本都是借鉴传统的推荐算法,将这种三维关系拆分成二维关系来解决,而这种转换过程容易导致用户信息的描述模糊、语义丢失、标签的个性化信息减弱的问题,进而限制了个性化推荐的效果。针对现有方法存在的不足,本文以Cite ULike数据集为研究对象,提出了一种基于LDA模型的个性化标签推荐模型LTR。该模型运用主题模型的思想解决社会化标签系统的推荐问题,为了更加合理地设计推荐模型,首先对社会化标签系统、主题模型和LDA等相关知识进行了更深一层的探索。其次提出综合考虑用户、标签、资源和资源的语义信息,从话题语义层面来挖掘用户和资源、标签和资源、资源之间的内在联系,构建了基于主题模型的社会化标签推荐模型LTR。本文在CiteULike真实数据集上进行了两组的相关对比实验,从两个角度分别验证该算法的推荐效果:(1)固定推荐长度下,比较LTR算法与目前的主流的HOSVD、FolkRank、DirectBin25、SK5、Popitem、UCTM、Majdi’s Method方法的准确率、召回率和F1值,验证该算法的推荐效果;(2)不同密度的数据集下,计算LTR算法在稀疏数据集和相对紧密的数据集下,推荐长度从少至多逐渐递增过程中的准确率、召回率和F1值,验证该算法各阶段的推荐效果。实验结果说明LTR算法在考虑了具有丰富语义信息的摘要文本下,发挥了涵盖用户意识的个性化标签来增强推荐的准确性,不但能为用户提供个性化推荐,而且相比现有算法能获得更好的推荐效果,一定程度上解决了用户兴趣提取不准确问题和在稀疏数据的情况下,LTR推荐能力更有优势。