通往创新之巅:互联网技术架构创新案例和实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

CTR预估问题广泛存在于互联网主流应用的方方面面,是计算广告,特别是在线视频广告领域的核心问题。它涉及到视频广告的投放、预测和很多的增值业务。

FreeWheel在此基础上,结合自身的业务特点,将计费模式抽象为X-event,将传统的CTR预估问题转化为xTR问题,并构建了一个强大的xTR预测系统,用于优化在线广告投放策略。

本文将详细介绍FreeWheel在构建一套广告领域xTR预测系统的全过程,以实例解答怎么解决在系统构建过程中遇到的机器学习问题,并总结了在实现xTR预测系统中的一些经验与教训。全文分四部分:首先是xTR问题的由来,然后介绍xTR系统架构,最后针对xTR的问题定义,介绍我们如何利用机器学习技术实现特征工程,以及模型训练与优化。

xTR问题的由来

在搜索广告领域,大多会采用点击计费(CPC)的方式进行流量变现,由此衍生出了CTR的预估问题。相对于搜索广告,视频广告的产品形态和计费方式都有着很大的不同。传统的视频广告大多会以CPM的方式来计费,也就是说会按照用户观看广告的次数来结算。

对于FreeWheel来说,广告订单分为合约广告与竞价广告两种,为适应不同客户不同的结算方式需求,从初始的按照CPM计费发展到在广告投放过程中按照不同事件发生次数方式计费,即CPx-event方式。因此,我们给出xTR定义:相对于CTR,我们将点击泛化为任意一种事件,既包括传统CPM中的Impression事件,也包括在广告投放过程中发生的任意一种事件,对这些事件发生概率进行估计,就是xTR(x-through rate)预估问题。

首先,CPx-event需要预先注册到整个系统之中。假设我们的客户可口可乐公司希望按照MOAT 50% In-View Measurable Impressions方式结算(MOAT是一家广告分析公司,提供的主要服务是追踪广告的真实触达,即网络广告是否真的会被用户看到)。50% In-View Measurable Impressions表示可口可乐广告至少50%部分被用户看到,才算一次有效触达。

CPx-event通过以下方式注册:

1.可口可乐公司希望按照MOAT提供的监控方式结算,首先他要到广告主管理系统中注册该事件。注册之后,会在数据库中写入这样一条数据,17是对应事件编号;

2.广告服务器每天会增量同步数据库信息,将可口可乐公司新的结算方式加载进来;

3.前端视频播放器与广告服务器建立第一次连接时,会将播放器类型等信息发送给广告服务器,广告服务器根据播放器类型等信息记录当前Context支持事件类型;

4.在视频播放过程中,广告服务器利用xTR模型估计某个广告17号事件发生概率,并且不断向用户投放广告。在投放某个广告期间,如果17号事件发生,播放器会向第三方分析公司发送事件Callback,经过分析,播放器再决定是否向FreeWheel的广告服务器发送事件Callback;

5.当视频播放结束,广告服务器统计所有行为并将广告投放日志存储到大数据平台。一方面与广告主结算,另一方面,xTR基于这些数据建模和离线训练结果决定是否更新线上CPx-event模型,新的线上模型会改进下一次广告投放策略。