一种基于用户信任度的改进协同过滤算法研究与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:chenjun7575
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,信息井喷式的增长以及网络的迅速普及,搜索引擎和个性化推荐系统成为人们获取信息最流行的两个工具。然而当部分信息难以简单描述或用户难以精确描述自己的需求信息时,搜索引擎的作用显得很无力,这时人们对个性化推荐系统的需求更加明显。协同推荐相比其他推荐系统有着很大的优势,然而也存在着一些问题阻碍着系统的精确性和个性化,譬如稀疏性问题,冷启动问题,可拓展性问题等。本文针对稀疏性和个性化推荐的准确度问题提出了一种基于用户信任度的协同推荐系统,主要研究内容如下:(1)概述个性化推荐的背景、意义以及研究进展;分析常用的个性化推荐系统的推荐过程及各自的优缺点;最后指出当前的推荐技术的挑战及研究热点,为进一步研究提供理论依据。(2)针对传统协同过滤算法当中的用户相似度算法只考虑了用户评分一个维度来衡量用户相似度的问题,本文引入用户信任度,通过计算用户直接信任度和间接信任度获得用户的综合信任度,再将综合信任度与传统用户相似度的计算方法融合,最后提出一种改进的相似度算法,对基于传统的相似度最近邻居预测评分进行修正,得到目标用户更准确的最近邻居。(3)为了缓解协同过滤推荐系统冷启动,稀疏性问题,本文引入用户特征信息如年龄,性别等,构建用户特征信息矩阵。针对传统K-means算法聚类结果受初始中心点的影响较大的问题,提出最大距离法改进K-means算法。接着对用户特征信息属性进行加权,通过改进的聚类算法对加权的用户特征信息进行聚类,在离线阶段可以初始化出相似度较高的聚类用户,同时降低了系统在线推荐时的负荷,提高了系统的可拓展性。(4)将本文方法在MovieLens数据集上进行多次对比试验,与基于传统的K-means用户聚类的协同过滤算法进行比较,采用召回率,准确率以及平均绝对误差等指标进行评估,实验结果表明本文提出的改进算法的推荐效果更优。
其他文献
价格是市场中经济活动参与者相互沟通信息的方式。在经济社会里,没有价格,经济就无法运转,价格竞争影响着市场竞争,公平的价格竞争是保障市场秩序的关键所在。但目前市场上诸
随着管孔类零件在汽车、航空航天等批量制造行业中的大量使用,对于此类零件的检测提出了高精度、高效率的要求。为了保证设备的可靠运行以及减少因为配合问题带来的危害,管孔
作为信息安全领域相互对抗的两种技术,信息隐藏与隐写分析技术在互联网信息安全的急切需求中快速地发展了起来。借助于图像进行信息隐藏可以解决多种互联网信息安全性问题,例
RFID技术是一种非接触的自动识别技术,具有高效、可靠、识别距离远、多点识别等优点,已经被广泛应用到商业物流和交通管理等领域。但是当多个电子标签同时对阅读器的寻呼做出
信息技术发展的今天,任何企业的发展都离不开信息技术,企业信息化建设的地位在企业的发展过程中越来越重要。而企业的信息化建设从根本上来讲无非就是管理决策上的信息化,业
随着网络技术高速发展和移动通信技术的不断成长,移动设备成为人们生活中一个重要组成部分,如:手机、IPad、电子钥匙等,给人们的生活带来巨大的便捷,人们可以随时随地的进行
光器件在硅基衬底上的集成是目前光电集成领域的研究热点。采用传统的拾取/放置装配方式对光功能微元件进行集成容易受粘结效应的影响。自组装技术具有的非接触特点能够很好
各大高校的学生在专业课程的学习过程中都需要做大量的实验,现有的用于实验教学的方法通常是在实验室中操作真实的实验设备,这种方法存在着不方便、不经济、危险性大等缺点,
由于视频监控系统能够为社会安全管理、执法监管以及人们的日常生产生活提供丰富而有用的信息,所以得到了广泛的应用。然而视频监控系统的摄像采集设备无时无刻地采集监控数
茶叶是贵州省第三大重要的经济作物之一,是农村重要的收入来源。近些年来,贵州茶叶种植面积快速增大,种植面积排名全国第一。形成了都匀毛尖、湄潭翠芽、绿宝石、遵义红、雷山清明茶、普安红等著名黔茶品牌深受茶客青睐。茶叶在推动贵州农业经济发展中做出了巨大贡献。因此,从生态地球化学角度,探明贵州久安碎屑岩、雷山变质岩分布区茶园岩石土壤元素地球化学特征,摸清茶叶品质差异性及分析控制茶叶品质的主要地质因素,对贵州