【摘 要】
:
电商搜索广告中的查询语义理解和广告排序问题一直都是学术界和工业界研究的热点,两者是相互依存的关系,排序是最终目的,而只有做好查询短语的语义理解才能实现精准广告排序,两者缺一不可。其中语义理解的关键技术有查询意图预测和查询语义扩展,而排序过程涉及到广告相关性计算和广告点击率预估。语义理解的精度直接影响到返回给用户的广告质量和广告排序的精度,而传统的基于概率的方法虽能一定程度上理解用户的查询语义,但是
论文部分内容阅读
电商搜索广告中的查询语义理解和广告排序问题一直都是学术界和工业界研究的热点,两者是相互依存的关系,排序是最终目的,而只有做好查询短语的语义理解才能实现精准广告排序,两者缺一不可。其中语义理解的关键技术有查询意图预测和查询语义扩展,而排序过程涉及到广告相关性计算和广告点击率预估。语义理解的精度直接影响到返回给用户的广告质量和广告排序的精度,而传统的基于概率的方法虽能一定程度上理解用户的查询语义,但是不够精细。本文的语义理解方法通过提取强有力的特征来描述用户的查询,其中通过引入MCI(mutual click intent)来描述两个查询项之间的关联度,通过改进的PageRank算法来计算查询项的贡献度,进而提取出与关联度、贡献度相关的特征,再将提取出的两类特征应用进分类器中,实现精准预测用户查询意图。另外,针对贡献度求解模型中查询有向图可能存在无用有向边干扰算法迭代的问题,采用“剪枝”操作去除掉查询有向图中的无用有向边,提升贡献度值求解的精度,并最终提升查询意图预测分类器的性能。同时为了检索出更多相关的广告,方法基于Word2Vec模型做了查询的语义扩展。随后,我们设计了一系列实验来证明“剪枝”操作能提高分类器的性能以及语义理解方法可以有效检索出更多更加相关的广告。广告排序的精度直接影响到用户的查询体验和广告商、广告媒介的直接经济利益。而影响广告排名的主要因素有广告相关性、预期广告点击率和广告商出价等,经过综合分析,本文基于GBDT模型实现广告点击率预估,基于贡献度求解模型和标准TF-IDF模型计算广告相关性。另外,对查询的语义理解操作使得进入排序模块的查询不是单一的查询短语,而是一个查询短语集合,因此在排序过程需要解决多查询条件下的广告排序问题,本文给出的解决方案是使用在查询意图预测过程中得分最高的查询子短语,即最能代表用户查询意图的查询子短语代替当前检索的查询短语参与广告排序的计算。基于以上过程得到各影响因素的值之后,应用于排序公式实现广告排序。实验结果表明该方法是有效的。
其他文献
从能流对比分析角度出发,通过阐述从空调房间提取热量到最终排放到室外大气环境系统的整体能流情况,建立了分别以水冷冷水机组和风冷冷水机组为冷源集中空调系统的能流数学模
目的对小儿眼科短小手术患者予以瑞芬太尼联合七氟烷麻醉,以此观察瑞芬太尼联合七氟烷的临床效果。方法选择2016年9月至2018年9月本院收治的200例小儿眼科短小手术患者,按麻
目的探讨结扎脐带时机对重度子痫前期患者产程及新生儿的影响。方法回顾性分析2017年6月至2018年9月本院收治的55例重度子痫前期患者病例资料,根据结扎脐带时间的不同分为观
借助Solid Works软件集成的Flow Simulation系统,对新型空气净化箱体内部的气流进行模拟分析,根据其内形成的速度流线分布,不断优化箱体内均流结构的设计,以确定合适的均流结
目的 探讨风险管理提升腹膜透析中心管理质量的方法。方法 2017年组建医护共同参与的腹膜透析风险管理小组,建立风险管理体制,分析腹膜透析中心的风险问题,针对存在的相关问
目的观察超声电导药物透入联合当归四逆汤治疗肩周炎的临床应用效果。方法选择136例在本院进行肩周炎治疗的患者,按治疗时间先后顺序分为对照组及观察组各68例,对照组给予患者常规综合理疗;观察组给予超声电导药物透入联合当归四逆汤治疗,对比分析患者应用不同治疗方案的临床效果。结果观察组患者给予超声电导药物透入联合当归四逆汤治疗后总有效率为94.2%,对照组患者给予常规理疗及传统针灸疗法后总有效率为76.5
目的评价远隔缺血预处理(RIPC)对轻度认知功能障碍(MCI)患者非体外循环冠脉搭桥手术(OPCABG)后认知功能的影响。方法择期行OPCABG患者60例,年龄范围为65~80岁,美国麻醉医师协会(ASA)分级II或III级,术前经蒙特利尔量表(MoCA)、简易智力状态量表(MMSE)、痴呆量表(CDR)和日常生活能力量表(ADL)被判定为MCI。采用随机数字表法,将患者分为两组:对照组(C组,n
目的对比分析国产和进口恩替卡韦治疗慢性乙型肝炎的成本和疗效。方法选取本院2016年9月至2018年3月应用恩替卡韦抗病毒治疗的慢性乙型肝炎患者110例,分为国产药组及进口药组