爱奇艺效果广告的个性化探索与实践
|
导读: 随着大数据和人工智能的技术进步,数字营销行业也在不断变化。得益于雄厚技术实力,爱奇艺效果广告得到蓬勃发展,实现了海量触达、定向精准、效果显著的广告投放,为广告主提供跨平台、多终端的网络推广服务。本次我将分享爱奇艺效果广告个性化方面的思考与实践,聚焦广告排序算法,希望能为大家带来一些启发。 包括以下三部分:
▌爱奇艺效果广告算法 - 背景 & 架构 1. 广告资源位
如上图所示,爱奇艺主要的资源位可以用双引擎来概括,即信息流和框内:
2. 计费方式 oCPX (optimized CPX) 业务是 oCPC (optimized Cost Per Click) 和 oCPM (optimized Cost Per Mille) 两种计费方式的统称,是从 CPX 业务演进而来,这里的 CPX 代表的是以点击计费和真实观看计费。
CPX 时代广告主投放广告是以点击作为计费方式,但广告主的真实诉求是点击后的转化行为。例如上图,一个 App 的广告,用户点击后的下载、安装、付费,这些转化行为才是广告主真正关注的。广告主为了提升从点击到转化的概率,会做很多离线优化,例如定向 20-30 岁女性或定向喜欢《亲爱的热爱的》电视剧的用户。但这样做可能会产生很多问题,比如定向粒度过细,目标人群少,导致广告放量效果不佳。 为解决上述问题,oCPX 的业务诞生了,优化目标从点击变成了后续的转化行为,广告主只需在投放广告时设置转化目标以及这个目标下的出价,其他的事情由算法模型来解决。 3. 算法难点
oCPX 业务对算法挑战难题主要为上图三点:
4. 个性化广告推荐流程
5. 排序逻辑
粗、精排的排序逻辑依照 eCPM (effective Cost Per Mille),也就是千次展示平台的预期收益来排序,其计算公式如上图所示,eCPM= 点击率×转化率×出价×智能出价因子。 6. 线上训练推理流程
如上图自下而上: 1. 现场特征,相较离线特征,现场特征能真实还原线上环境。 2. 第二步进入模型训练,会有 FM 分天模型、FM 在线学习、深度学习和强化学习等。 3. 完成模型离线训练后推送至线上,结合离线、实时特征进行在线推理。 ▌点击 & 转化率预估 - 核心问题 1. 特征工程
从周期来划分特征可分为实时、短期和长期。
2. 在线学习
天下武功唯快不破,时效性对模型来说是非常重要的。当前线上使用的基于 FTRL 的 FM 模型,实时消费线上 Kafka 流的数据,分钟级进行模型更新。由于线上模型是分钟级更新,线上要有一套监控体系,一旦线上指标出现异动,比如上图举例的 AUC 低于离线分天训练的备用的模型,会进行线上模型与备用离线模型自动切换。 3. 深度学习
为了提高模型准确率和泛化能力,上线了深度学习,当前采用的是 Wide&Deep 的模型,并进行了离线模型调优和线上性能优化,以满足广告场景下对高 QPS 以及高稳定性需求。 4. 高维稀疏 在转化率预估场景下,会遇到数据高维稀疏问题。举个例子,在做偏差校准的时候,会出现很多分桶里面一个正样本都没有,进而导致这些分桶最终的预估转化率结果为零。为解决这个问题,采用的方法是动态分桶大小,根据当前广告下历史正样本数量,动态决定分桶宽度以及分布。 同时,转化率预估场景有滞后性问题,例如以 APP 作为推广目标的广告主设置转化目标为付费,但从用户点击广告到最终付费可能会经历很长的时间。传统的做法是设立时间窗口对这条样本进行跟踪,窗口内完成转化目标即打上正样本标签,反之则当作负样本看待,但很明显这么做有很多问题。为解决这个问题采用了一种替代方案,当点击产生时,我们将样本当作负样本来看,当转化行为完成后,这个样本就视为正样本,当然这里会进行适当的权重调整。 此外,还有转化率阶跃的问题,即转化数据集中到来,正样本突然增多,转化率预估可能从万分之几直接到百分之几。这样就会造成转化数据到来前广告放量不足,到来后爆量问题。为了解决这个问题引入非目标的转化数据作为正样本使用,比如转化目标是付费,我们可以引入下载、激活等也作为加权降权后的正样本来消费。 ▌智能出价 - 博弈 & 共赢 1. 成本控制
智能出价的基本功能是进行成本控制,保证广告的实际成本在目标成本附近。并在此基础上尽可能多拓量。所以这里存在成本和放量的博弈。所使用的方法是在 eCPM 上乘一个智能出价因子,这个因子是实际成本与目标成本的函数输出,比如上图实际成本大于目标成本时,因子小于 1,用更廉价的流量来拉低成本,反之大于 1,提高竞争能力获取更多流量。 2. 流量优选
上面介绍了基础版本的智能出价方案,但这样会产生一些问题,比如放量过程中的订单,可能以高价格获得了低质的流量而导致效果不佳,反之可能错过高质量流量。解决方法是做流量粒度下的智能出价 ,即考虑成本的同时也考虑流量质量,就是上图 g 函数,考虑成本参数的同时也加入流量质量参数。 |
时间:2019-10-19 23:57 来源: 转发量:次
声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。