面向电商知识图谱的规则学习模型研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:eire
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
规则学习是数据挖掘中应用前景广泛的领域,一直以来都备受关注。针对有特定数据结构的电商知识图谱的规则生成任务,流行的关联规则挖掘算法虽然应用简单且具有可解释性,但无法用于挖掘特定数据结构的关联规则。而目前主流的基于知识图谱的规则学习算法大都都针对分布均匀的稠密知识图谱,且其基于图遍历搜索的特性也让这类算法在大规模知识图谱上会遇到明显的效率问题。用于知识图谱推理的表示学习方法则大都侧重推理结果,无法生成对人友好的高质量推理规则。因此,本文针对电商领域的场景挂载规则生成的任务,从知识图谱的角度出发,将已有的商品的属性项P(Property)和属性值V(Value)及其对应场景构造成一个针对挂载关系的知识图谱。同时将挂载问题构造成链接预测问题,引入注意力机制,提出了一种基于知识图谱表示学习的规则学习模型,利用场景和挂载关系的表示得到商品属性的权重,从现有数据中生成规则,用于挂载新的商品,提高商品挂载的效率,降低人工成本。同时,本文也从强化学习的角度出发,将商品挂载问题构造成分类问题,将规则生成问题构造成序列决策问题,提出了一种基于强化学习的规则学习模型,训练一个智能体来选择规则的Body部分,在奖励函数中加入规则长度项以生成长度较短的规则。且由于商品数据序列长度较长,智能体需要探索的序列决策空间较大,为了让模型可以尽可能探索更多的空间,本文也应用了包括Rollouts,Reward Baseline以及加入信息熵在内的方法来帮助模型训练,取得了不错的效果。
其他文献
随着视频等多媒体业务在总流量中的占比逐渐提升,用户对于网络的需求也逐步发生变化从端到端资源的共享到内容分发和获取。而当前基于端到端通信模式的TCP/IP架构显然难以应对当前用户需求的转变,加上路由器缓存和计算能力的提升,信息中心网络(Information Centric Networking,ICN)架构被提出。在ICN中,通过在网络层命名数据实现了名址分离,网内基于内容名路由,并且支持在核心网
近年来,我国民办教育市场发展较为迅速,拓展教育培训是民办教育培训的一个新的方向,但大多数的拓展教育培训企业尚未发展成熟,其营销管理缺乏科学性,而且行业没有统一的标准体系,整体的营销管理体系还不够完善。目前关于拓展教育培训公司的营销管理案例较少,相关的经验也比较缺乏。而如何解决这些问题,是理论和实践工作中亟待解决的问题之一。本论文主要采用描述性研究法和调查研究法对R公司营销的现状开展研究,结合营销策
针对KNN文本分类方法中不考虑特征词关联的问题,提出一种改进方法.这种方法基于对体现词和类别间相关程度的CHI统计值分布的分析,应用向量聚合技术很好地解决了关联特征词的
近年配电网电能质量得到了广泛关注,但由于投资等因素,电能质量监测点只能有限配置,局部的电能质量水平难以获取。同时,随着智能电网的建设,用电信息采集系统已实现了“全覆
目的:通过研究甘肃地区汉族健康人群和2型糖尿病(T2DM)中SLC30A8(溶解性载体家族成员8基因)单核苷酸多态性(SNPs)rs13266634、rs11558471位点的基因型分布情况,探讨SLC30A8基
<正>儿童的健康心理是他们健康成长的基础,是他们学习科学知识的保证。心理教育工作的最大障碍就是无法深入与学生的内心世界,与他们实现零距离的沟通,预防和矫正学生的各种
会议
目的观察滋阴活血汤联合阿德福韦酯治疗代偿期乙型肝炎肝硬化的临床疗效。方法选取我院2015年2月—2016年3月期间收治的代偿期乙型肝炎肝硬化患者50例,随机分成2组,每组25例
以"公司+农户"为主要形式的农业产业化经营,是加快建设现代化农业的有效措施,推进农业产业化是转变农业增长方式的现实选择。而龙头企业是产业化组织中的核心,产业化的发展关键