一、作弊的产生原因
这里首先说明一下移动广告业,广告主在APP上的广告位发布自己品牌的链接,根据用户点击或者用户点击之后激活(激活的行为可能是用户注册、用户产生UGC、用户进行消费,或者是其他的,不同的应用需具体的判定)的比重,给APP的广告位结算。
这样看来,广告主借助“移动广告”对其应用进行推送无非是想要在榜单(点击、下载)及效果(激活、留存)上取得成绩。APP广告位又想更多的变现,所以作弊的行为就应运而生了。
具体的来讲,2013年开始,大批的网赚类应用的出现以及App Store刷榜冲榜的强烈需求为作弊行为提供了最根本的根基。与此同时,移动广告投放的监测技术门槛较高,后台数据结构繁冗复杂,监测维度指标较多等情况的存在,又给移动广告投放过程中衍生的作弊行为提供了持续发展的动力。
二、作弊的种类
依照广告主关注的两个维度,点击及激活,作弊的种类也被分为这两种。
点击作弊
点击作弊是成本较低也比较容易的一种方式,一般可以利用大量测试机或者模拟器直接发送,也有一些是雇佣或者激励式诱导用户来进行大量点击。通过分析点击数据的日志,会发现有几种现象:
- IP离散度密集:由于作弊是通过模拟器或者雇佣用户进行大量点击,那么就会出现同一个IP反复点击广告的情况出现。
- 时间周期反复:同IP离散度密集的原理一样,作弊用户会在一个固定的时间周期内频繁的点击广告(发送请求)
下面两点的现象针对于大量的使用模拟器进行点击作弊
- 非移动端发送为模拟器发送:为节省成本,在非移动端,会在一个电脑上部署很多个服务器,进行点击作弊
- 无法取到移动端的UA信息:UA的全称为User Agent,中文名为用户代理,它是一个特殊字符串头,使得服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等。
激活作弊
移动广告的效果除了点击之外,更多的是效果数据,即后续的激活。常见手段部分与点击作弊的方法一致,比如说测试机或模拟器模拟下载,还有像通过移动人工或者技术手段修改设备信息、破解SDK方式发送虚拟信息、模拟下载激活等等。
激活作弊的现象当然就也包括:
- IP离散度密集
- 时间周期反复
- 模拟器发送
- 归因时间差不符合逻辑:正常情况下用户从点击去广告,到产生激活行为,是需要阅览了解的,需要一定量的时间,若这个时间太短,我们可以认为是异常。
三、作弊的防护
点击作弊
在梳理点击作弊防护的方法之前,我们先摆出来一些重要的指标。
点击率 = 点击次数 / PV
点击率是一个判断是否有无点击作弊的关键的方法,一个网站的广告点击率过高,可以直接判定为作弊了。
点击率 / 单个IP的点击率
若这个数值过高,大概大于3,我们就可以认为,这个IP值的用户可能存在点击作弊
防范点击作弊的方法,有以下几点
- Cookie排重:基于本地cookie的解决方法。Cookie上会记录着用户的信息,可以在用户请求数据的时候先调用户的cookie,防止同一设备多次点击同一广告。
- IP防止作弊:刷点击的时候,肯定不只用同一设备,所以除了Cookie排重外,也可以基于IP来排重。
- 异常数据黑名单:对于反复出现的IP,我们要进行黑名单管理,把这些经常刷点击的IP拉进黑名单。
激活作弊
- 激活IP排重:与点击同理,同IP段的多次激活也应标记为异常激活。
- 归因时间差作弊:归因时间差即指从点击到下载激活的时间。正常情况下用户从点击去广告,到产生激活行为,是需要阅览了解的,需要一定量的时间,若这个时间太短,我们可以认为是异常。
- SDK加密防护:对传输激活的SDK进行加密处理,提高其破解作弊的成本。
关联作弊
简单的可以这样认为,被标记为点击作弊的用户,在激活作弊也有可能是异常的,这样的关联可以让我们更轻松的发现潜在的作弊用户。将点击作弊与激活作弊关联在一起,也是一种有效的防护措施。
四、未来的反作弊发展方向
与大数据结合的防作弊预测分析模型
举一个简单的例子来说,一个广告的两个重要的指标,点击和激活,是在同一个流程下的。用户在网站上看见了广告,点进去流量,发现有兴趣,进行了激活,用户流量成功从网站的广告位迁移到广告主的应用上。整个流程在正常(无作弊)的情况下,用户从点击广告,到完成激活,会有一个整体的时间。刚才我们讨论这个整体的时间过短,会认为是作弊行为,这是从微观上看这个数据指标。
从宏观上看,整体的时间应该会服从一个数学分布。我们可以根据这个数学分布模型,进行异常区域的检测。比如说在8月1日到8月22日这一时间段,有一个IP段(因为作弊会是一个组织性行为,可能是在某一个IP段出现规律性,而不是一个单独的IP)的模型分布与正常的模型不符,我们就可以针对于这个网段进行检测,发现作弊的组织。
扫一扫 微信咨询
商务合作 联系我们