面向计算广告学的影响最大化及阻隔方法研究

来源 :武汉大学 | 被引量 : 1次 | 上传用户:gj12345678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近十年来,Internet、社会网络、手机等信息技术的使用对广告行业产生了重大而深远的影响。它们不仅使广告的投放变得更容易、更便宜,其产生的大量用户数据也为广告策略的定量分析提供了机会。2008年在ACM-SIAM研讨会上提出的计算广告学,旨在通过用户数据提高广告收益,引起了信息学、计算机科学和传播学的高度重视。目前,相关研究大都关注于“一对一”场景下的广告投放,而对“一对多”投放研究不足。为此,本文将从数据驱动的角度,对广告“一对多”投放中的影响最大化和影响阻隔问题进行研究。本论文主要贡献可概括如下:1)提出了面向团体的影响最大化方法在社会网络中,影响最大化问题在病毒营销、疾病防治和在线推荐等多个方面具有较强的应用背景。现有工作主要关注高影响力个体的选择,不能有效的定位高影响力社群团体。然而,高影响力社群的发现在区域疾病防治和户外商业活动组织等方面有重要的作用。针对该问题,本文从团体粒度研究了影响传播,并形式化定义了面向团体的影响力最大化问题,旨在发现网络中具有影响力的top-k社群团体。为描述团体粒度的影响传播过程,我们从团体间的影响关联入手,首次提出了一种基于关联的团体影响级联模型。而后,我们在该模型上给出了一种近似的top-k影响力团体选择算法,并证明该算法能返回(1-1/e)的最优解。在人工数据集和真实数据集的实验结果显示,我们的方法能高效选择具有影响力的团体组合。2)提出了基于社会化浏览的影响最大化方法社会化浏览是由社会网络产生的一种全新的信息检索方式。针对该场景下的广告投放应用,本文提出基于社会化浏览的影响最大化问题(Social BrOwsing based InFluence MaximizatioN,SOFN)。与传统 IM 问题不同的是,SOFN 问题的影响力定义与用户访问广告的代价有关,其目的在于通过减少用户搜索广告的代价来最大化提高广告在检索中曝光率。为求解该问题,本文分别利用动态规划算法和矩阵运算对目标函数进行计算,并相应给出了两种贪心近似算法DpSel、MatrixSel。其时间复杂度分别为O(kCn2m)、O(kCnm)。此外,我们还通过建立候选结点边际收益的上界,提出了剪枝算法BoundSel。该算法能够显著加速MatrixSel算法的贪心过程。本研究在多个真实网络上进行了实验:分别从效果、效率、可扩展性、内存消耗几个方面对本文提出的算法进行了验证。结果显示,MatrixSel算法在时间开销和空间开销上明显好于度数优先算法和采样算法。3)提出了轨迹驱动的高影响力广告牌选址方法许多国际户外广告公司,如Larma和APN,利用车流量来评估广告牌的影响力。然而,这种做法常导致粗粒度估计和不理想的广告投放方案。本研究从真实车辆运行轨迹入手,首次研究了轨迹驱动的高影响力广告牌选址问题(TIP),旨在最大化广告牌对轨迹影响。受制于广告牌定价不同和其间影响力重叠两方面的挑战,TIP被证明是NP-hard的。为在有限时间内求解该问题,我们提出了基于划分的框架PartSel。PartSel首先利用车辆轨迹的局部特征将广告牌划分为影响相对独立的集合,而后采用枚举与贪心的组合方法对各个集合进行局部选择,最后通过动态规划算法将局部解合并成全局解。由于局部解相较全局解更容易计算,PartSel大大降低了计算开销,同时还能提供常数因子的近似保证。此外,我们还在PartSel的基础上进一步提出了 LazyProbe方法。该方法通对低边际影响的广告牌进行剪枝来加速PartSel的计算,且并不影响被优化算法的近似性能。实验表明,该方法的效果相对基于车流量的选址方法提升了 99%。而且该方法是一个空间选址的通用框架,可推广到解决汽车充电桩和便利店的选址问题中。4)提出了在线虚假广告影响阻隔方法在线网络的虚假广告的传播不仅导致金融财产的损失,而且可能威胁人身安全。为构建可靠的信息传播平台,本文采用建立(k个)保护结点方式来最大化阻隔用户对虚假广告的浏览,并提出了在线虚假广告影响阻隔问题(DeceptiveAds blocKing Placement,DAK)。与谣言控制的研究不同,在DAK问题中虚假广告对用户的影响是通过随机游走模型描述的,而非影响级联模型。据我们所知,本文是第一个从算法角度研究虚假广告阻隔机制的工作。理论分析表明,DAK问题具有子模性。因此,我们提出了两种基于蒙特卡洛模拟的贪心算法,该算法可以保证在常数(1-1/e)内逼近最优解。为减少MC模拟空间消耗,我们提出了一种基于排序的启发式方法RanSel,仅使用线性空间就可以高效求解DAK。实验表明,本文方法可以在合理的时间内取得满意的结果。
其他文献
对于三至六岁的孩童来说,幼儿园是培养他们感性思维和行动力的重要场所,因此,幼儿园课程和活动设计会在很大程度上影响幼儿将来在学校和社会的成长,需要不断丰富课程和活动的
推荐系统在辅助用户进行各种决策过程发挥日益重要作用,例如商品推荐,音乐试听或新闻阅读推荐,在Amazon.com,Taobao.com,YouTube,Netflix,Yahoo,JD.com,Last.fm和IMDB等流行
偏序集分拆作为经典分拆在偏序集上的推广,是计数组合学的一个重要研究对象。著名组合数学家Stanley于1972年首先引入偏序集分拆这一概念,从而统一了许多经典的组合结构,包括
“一带一路”建设是构建人类命运共同体的重大举措,是构建全球治理体系的重大实践。但是影响“一带一路”建设的安全威胁也日益凸显,安全问题成为“一带一路”能否顺利推进的
上世纪七十年代以来,人们就从理论和实验两个方面开始了对高温高密等极端条件下核物质特性的研究。从那时起,高能重离子碰撞就成为现代物理学发展的前沿之一。自2000年BNL的
某酸性蚀刻废液和碱性蚀刻废液混合得到沉淀物——Cu(OH)Cl,过滤后该沉淀物可与浓H2SO4反应生成CuSO4产品,而残留废水中的Cu^2+可通过Na2S去除。实验室小试结果表明,当该酸性和碱性
生态环境是人类社会存在和发展的基础,是关系我国民生的重大社会问题。我国经过改革开放40多年的发展,经济实力有了显著提高,但是在经济发展过程中也给环境带来了一些污染。
习近平总书记于2017年10月18日在党的十九大报告中正式提出了乡村振兴战略,"产业兴旺、生态宜居、乡风文明、治理有效、生活富裕"是其总要求。周家庄乡作为全国唯一一个仍实
列宁在《怎么办?》中阐述的无产阶级政党建设的思想,在无产阶级政党建设思想史上具有重要的历史地位,丰富和发展了马克思主义政党学说。在当时提升了俄国社会民主党人的思想境界,奠定了新型无产阶级政党的思想基础,推动了俄国无产阶级革命和国际共产主义运动。《怎么办?》中提出的党建思想,在新时代条件下,对于中国共产党推进全面从严治党依然有着重要的启迪作用,启示我们在无产阶级政党的建设中,要与时俱进,实现党的创造
热应激是指动物机体对外界或内部的各种刺激所产生的非特异性应答反应的总和。这些刺激包括温度变化、电离辐射、过度疲劳、饥饿、运输、饲料突变、感染以及中毒等。已有研究