基于堆叠方法的在线评论排序研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:cai8211306
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
受在线评论的评论质量参差不齐以及评论数量爆炸式增长的影响,消费者已经开始逐渐转变评论阅读的方式,从大范围阅读评论转变为只阅读顶端少数几条或十几条评论。在目前实际的评论领域中,对评论进行简单的分类排序,其粗略的排序结果已经不符合当今需求,而对评论进行简单的回归排序,其全局的排序结果又不够精确,也不满足目前消费者阅读评论的需求。针对现有评论排序研究在目前实际需求中存在的不足,通过将分类排序和回归排序进行有效的组合,并且将堆叠方法应用于排序模型中,提出了基于堆叠方法的排序模型,该模型不仅考虑了分类排序的排序结果粗略问题,同时也考虑了回归排序的排序结果分散问题。此外,还考虑了应用堆叠方法以提升模型的效果。基于堆叠方法的排序模型由基于堆叠方法的分类器与基于堆叠方法的回归器组合形成,在线评论首先通过堆叠分类器进行分类,筛选得到评论中的高质量评论,然后高质量评论通过堆叠回归器进行回归,产生高质量评论的排序结果。通过在两个真实的在线零售平台商品的评论数据集Amazon Fine Food Reviews与Amazon reviews:Kindle Store Category上的实验表明,堆叠方法在分类器中的应用在AUC、Precision、Recall、F1-score四个分类评价指标上均优于分类基模型,堆叠方法在回归器中的应用在NKTD、NDCG@5、NDCG@10、NDCG@15四个排序评价指标上均优于回归基模型,基于堆叠方法的排序模型在四个排序评价指标上均优于Light GBM回归排序模型与RF-X-LGB堆叠模型。
其他文献
中国社会正步入人口老龄化阶段,中老年人罹患脑卒中疾病的患者日益增多;交通意外与工作事故也带来大量肢体运动功能受损患者;日常运动损伤以及长时间的伏案键盘操作也造成大量手/腕部关节劳损的患者。手腕的康复训练是众多肢体运动功能受损患者康复治疗过程中不可缺少的环节。针对这一现实需求,结合人体手腕运动特点,本文提出一种面向人体手腕康复训练,集驱动-感知一体化的软体致动器设计与运动学建模方法。针对本文提出的具
锂(Li)二次电池广泛应用于大规模储能、车载动力电池、便携电子设备等领域。传统的石墨负极材料的理论比容量为372 m Ah g-1,难以满足高比能二次电池的需求。金属Li的理论比容量为3860 m Ah g-1,电化学势为-3.04 V(vs.标准氢电极),是一种极具发展潜力的负极材料。然而,金属Li负极循环过程中的金属Li枝晶生长、死Li、体积的无限膨胀以及固态电解质界面膜(SEI)的不稳定性等
项目投资是企业发展的重要途经,投资决策的科学性直接关系到企业的业绩和经营的可持续性。传统的投资决策方法不能很好地处理风险投资项目的不确定性、不可逆性和竞争性,因而往往导致错误的决策。期权博弈论克服了传统投资决策方法的局限与不足,是一种更为科学的现代投资决策方法。期权博弈投资决策分析的基本思路是在市场不确定和竞争条件下,企业通过综合考虑影响项目价值的各种因素,分析求解项目投资的最佳时机和最优产量水平
习近平同志在中国共产党第十九次全国代表大会上的报告里指出:"必须坚持一个中国原则,坚持‘九二共识’,推动两岸关系和平发展,深化两岸经济合作和文化往来,推动两岸同胞共同反对一切分裂的活动,共同为实现中华民族的伟大复兴而奋斗"1。在习近平新时代中国特色社会主义思想中,对海峡两岸关系发展的大政方针,是构成新时代坚持和发展中国特色社会主义的基本方略之一。1979年1月1日,全国人民代表大会常务委员会
会议
机器人技术进入医疗领域,改变了传统的手术方式,进一步推动了机器人技术理论的发展。针对脊柱微创手术特点以及传统脊柱微创手术中存在的问题,课题组设计了一套框架式微创手术机器人系统,用以辅助医生进行脊柱微创手术操作。本系统包括虚拟手术系统、遥操作系统和机器人控制系统。本文在框架式微创手术机器人平台搭建完成的基础上,提出一套适用于临床手术的高精度控制方法,具体内容划分如下:1)分析脊柱微创手术所需的手术空
近些年来,随着生活质量的提高,人们对于自身健康越来越重视。睡眠状况作为人体健康重要组成部分,也得到了更多人的重视。目前市面上也出现了很多对人体睡眠的感知设备,例如智能手环可以随身检测睡眠质量。但是这些检测都是接触式的,对于日常生活会带来不便,无法长期监测。故需要一些非接触式的感知手段对人体进行监测。目前利用从商品Wi Fi设备中检索到的信道状态信息(CSI)进行呼吸检测的潜力巨大。然而,现有的方法
纤维增强复合材料比强度高、比模量高、热稳定性好,同时具备一定的阻尼减振能力,因此被广泛应用于航空航天、汽车工业、体育器械与兵器工业等重要领域。工程实际中存在大量利用该类型材料制成的典型复合薄板结构件,如太阳能帆板、航空发动机风扇叶片以及大型风力机叶片等,随着它们的结构越来越复杂、工作环境越来越苛刻,由此引发的振动超标、磨损、疲劳失效等故障问题也越来越突出。因此,研究纤维增强复合薄板振动特性的先进测
材料隐身是在外形隐身的基础上进一步降低目标雷达散射截面(Radar Cross Section,RCS)的重要途径。频率选择表面(Frequency Selective Surface,FSS)作为一种新型隐身材料较传统材料在功能实现方式上更加多样化,在设计上具有更高的灵活性。目前关于频率选择表面的研究大多是平板反射率性能以及小角度30°范围内的单站RCS缩减。本文将结合频率选择表面阻抗层和金属反
在大数据时代,如何有效地对大数据处理的结果进行展示具有重要意义。目前针对大规模图数据处理的Web可视化系统需要消耗大量CPU资源完成计算和渲染,在展示大量图数据时受到浏览器性能的限制,导致效率较低。许多工具库通过不断优化算法,在布局性能上有了很大提升,然而渲染方面仍然效率不足。相比于CPU,图形处理器(Graphics Processing Unit,GPU)更适合处理大规模运算,但是在GPU上的
光纤陀螺仪是基于Sagnac效应的高精度角速度传感器,具有体积小、成本低、寿命长、功耗低、动态范围大等一系列优点,在航空、航天、陆地、航海等军用、民用领域都具有广泛的应用。然而,光纤陀螺关键元器件几乎都是从美国进口,国产率远远达不到95%的要求,设计具有自主知识产权的光纤陀螺专用芯片具有重要的意义。本文针对干涉式闭环光纤陀螺数字控制电路进行优化集成,设计光纤陀螺数字控制专用芯片,以满足光纤陀螺电路