基于深度学习的可解释性推荐研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:liongliong568
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,受益于互联网和智能终端设备的迅速发展,各种应用不断涌现,但同时也带来了数据的爆炸式增长。为解决互联网上的信息过载的问题,推荐系统被提出并进一步推动了各类电商服务平台的创新和应用。为了使用户更好地理解推荐模型和结果,可解释性推荐正逐渐成为推荐系统研究领域的热点。在可解释推荐系统中,推荐模型不仅给出推荐列表,同时对推荐结果进行解释。基于此背景,本文尝试在深度学习技术中,首先利用层次注意力网络充分提取文本特征,以获得精准的用户和物品的表示。然后利用注意力网络和门控循环单元来融合显式特征和隐式特征,为推荐结果生成解释性的自然语言句子。本文的主要工作内容包括:
  1.针对现有推荐系统文本特征提取不充分且使用包含很多冗余信息的文本特征直接表示用户和物品的不足,本文提出了群体智慧引导的层次注意力模型HANCI。首先,该模型提出了群体智慧引导的特征重要性,将现有工作中的文本特征替换为用户观点感知的群体智慧特征来表示物品。其中,群体智慧特征定义为从物品的所有评论中提取的特征,这些特征并不完全等同于用户关注的特征。因此,本文提出了特征的重要性,用于从群体智慧特征中提取用户关心的特征,以表示用户对商品的个性化偏好。其次,本文基于评论文本的多层次分析,设计了一个层次注意力网络,通过探索单词的重要性、评论的有用性和特征的重要性,提取出更丰富、更精确的用户个性化偏好和物品特征。最后,本文在三个公开可访问的数据集上验证了该模型可以提升推荐系统评分预测的准确率,并且可以提供单词层级和评论层级的解释。
  2.针对Retrieval类型可解释中提供的评论涉及隐私问题且深度学习黑匣子难以解释高维隐特征的不足,本文提出了一个基于显式和隐式特征生成自然语言句子的可解释性推荐模型GNLE。首先,该模型利用自然语言处理工具从目标物品的所有评论中提取显式特征,然后设计了显式特征感知的注意力模块分别提取用户偏好的显式特征和物品的亮点特征,接着融合该显式特征和深度神经网络提取的隐式特征作为用户和物品的表达。其次,从推荐和解释的两个任务出发,通过引入门控循环单元作为可解释的句子生成器,利用超参λ平衡两个任务。该句子生成器以用户的表示、物品的表示和预测的评分作为第一个隐藏状态的输入,以目标用户和物品的所有评论作为上下文,生成的句子作为推荐结果的解释。最后,为了验证GNLE的有效性,本文对两个可公开访问的数据集Electronics和Movies_and_TV进行了广泛的实验。结果表明,本文提出的GNLE模型利用显式特征感知注意力和上下文感知门控循环单元句子生成器可以提高评分预测的准确率,同时生成易于理解的解释。
其他文献
[摘 要]为了满足企业和行业从业者对外交流的需求,专门用途英语的教与学成为近年的研究热点。文章对“中国大学慕课”学习平台上的相关课程进行了分析,认为课程应该关注语言技能训练、思维能力培养和满意个性化学习等方面,建议教师根据平台特点为课程增加语言技能环节、设计培养思维的模拟情境,同时平台应该基于学习者需求开发个性化学习功能。   [关键词]专门用途英语;线上教育;语言技能;思维训练;个性化学习  
期刊
交通流数据体量大,结构复杂,具有很强的非线性特征。如何有效利用海量的交通流数据,对城市交通进行准确实时的短时预测是一个富有挑战性且意义巨大的问题。传统的浅层交通流短时预测算法无法完全发掘交通流数据中蕴含的规律,无法对交通流数据进行准确地预测。深度学习算法可以自动学习交通流数据中的非线性特征,进而对交通流数据进行精准地预测,近些年被广泛关注。随着大数据技术的发展,依靠并行化技术,复杂的深度学习算法的
随着信息时代高速发展,信息数据急剧增长,图像作为信息数据传递与共享的有效载体尤为显著。安全监控,医学诊断,卫星定位等领域都需要对图像进行处理与分析。现实生活中由于硬件设备,计算精度,环境等影响因素,使得人们获取到的图像质量不足以满足其需求,如何获取高质量图像就成为了科学家亟待攻克的难题。针对该问题,学者们提出了许多优秀的解决算法。实践证明基于卷积神经网络的图像超分辨率算法远远优于其它解决算法,并成
[摘 要]网络时代,教师利用新媒体积极开展教学活动,基于职教云和QQ群分屏直播课堂简单易学,被应用到各职业学校的教学实践中。职教云加直播课堂,突破了教学的时空限制。文章分析了职教云和QQ群分屏直播课堂的建立过程,并对教学实践进行了思考,为今后直播课堂的发展提供参考。   [关键词]直播课堂;职教云;QQ群分屏直播   [中图分类号]G564 [文献标识码]A [文章编号]1008-76
期刊
OpenStack是一个开源的云计算框架,提供了存储、计算和网络服务,并逐渐成为云计算基础设施及服务的事实标准,同时,其安全性也越来越受到重视。外部渗透、蠕虫和分布式拒绝服务(Distributed Denial of Service,DDoS)等攻击对云平台造成巨大威胁。在传统的基于泛洪的高速率DDoS攻击方面,已有大量研究成果,但近年来出现的低速率DDoS攻击,具有流量小和隐蔽性强的特点,对云
在光纤传感技术中,光纤法布里-珀罗传感器具有体积小,制作简单,抗电磁干扰等优点,并且可以测量温度、应变、加速度等多种物理量。随着越来越多结构精细的法布里-珀罗传感器的诞生,法布里-珀罗解调的研究也越来越深入。根据法布里珀罗干涉光谱的干涉特性,法珀腔长决定了干涉的周期,这个干涉的周期信号会附加一个相位,那么干涉光的总相位就包括了腔长和附加相位两个未知量。一般解调过程都是先求出光谱总相位再来计算腔长,
[摘 要]在信息化时代,社区教育数字化学习平台是各地开展社区教育工作的重要载体,在时间和空间上突破了对学习的许多限制,体现出社区教育的诸多功能。文章以湘潭乐学社区平台为例,对社区教育数字化学习平台建设进行了实践探索。   [关键词]社区教育;数字化学习平台;路径;能效   [中图分类号]G77 [文献标识码]A [文章编号]1008-7656(2021)03-0059-03   引言
期刊
[摘 要]当今互联网的发展日新月异,拓展了人类的生产、生活空间。社区教育的发展需要数字化技术的支撑,跨区域社区教育数字化学习平台的建设是实现“人人可学、处处能学”的有效途径。通过调整管理机制、共建共享资源、拓展两地产业数字化合作、两地交流社区教育资讯等途径,加强社区教育数字化平台的共建共享,促进两地社区教育工作的快速、稳健地发展。   [关键词]社区教育;共享共建;数字化资源   [中图分类号
期刊
[摘 要]为了解国内学习投入的研究现状, 文章以中国知网数据库从2011年到2020年近十年收录的2404篇学习投入相关的论文为研究对象,采用文献计量分析方法,运用CiteSpace 软件对发文时间、研究结构、作者和关键词進行可视化分析,结果发现:国内该领域研究的文献数量总体呈上升趋势;研究结构主要集中于高等院校;相关作者较多,但合作研究不够紧密;研究热点集中于定义、影响因素和中介变量等方面。  
期刊
数字图像是传递信息的重要载体,但是在采集或传递过程中易受到噪声、遮挡或像素丢失等多种形式的干扰。由于设备、时间等限制因素,在无法重新获取原始清晰图像的情况下,如何应用图像处理算法对所获取低质量图像进行干扰修复以还原出潜在高质量图像,已经成为研究者们极为关注的问题。图像修复技术通常利用低质量图像及其低质形成原因等信息,即其也称为低质量图像的先验条件,恢复或重建出消除噪声、移除遮挡或补全丢失像素的清晰图像,从而提高图像质量,使其能够应用于后续识别分类、语义理解等场景中。针对小样本、单样本图像数据的退化过程、对