京东反作弊系统的运行原理
了解系统反作弊
- 排名忽上忽下,没有周期规律。
- 排名推进很慢。
- spu下SKU索引跳动,同时排名明显下降。
SKU的索引原则
IP特征识别
京东反作弊系统的识别方式最主要的一方面是进行数据的“列判断”,而不是单一“行判断”。
我们称这种“列判断”方式为:异常行为特征识别。
本次以IP举例,详细说明IP相关的列判定。
Shop1包含:sku1和sku2
Shop2包含:sku5
Shop3包含:sku6
其中,sku2,sku5,sku6产生的订单行为中都包含ip=“192.16.11.10”,但是账号不同。这代表,在同一个IP下,有很多相似组合账号在平台下单。这样的行为不符合正常的客户行为,订单就容易被识别为虚假交易订单。
sku1产生的订单中的IP与其他订单的IP没有重复,判定为正常订单。
平台每天产生上百万订单,IP的替换方式导致了IP段的局限性,大批量订单出现IP重复。所以,单一uv对我们的SKU产生的订单行为都不会被系统判定(不含人为),而是进行全平台的订单数据分析后,在每一列下进行判定。
网络层特征
下面介绍网络层特征(IP,MAC等)替换方式,通常采用VPN、代理服务器、VPS、DVPN(动态VPN)等方式进行替换,以上四种方法并无本质上的区别,都是通过利用服务商提供的IP替换自己真实IP。实现效果主要依赖于服务提供商自身的IP地址资源丰富程度。
举例来说:
(1)如果你的VPN服务提供商有100个公网IP资源,只有你1个用户在使用,那么你的IP重复几率为1%;如果你的VPN服务提供商有1000个公网IP资源,却有100个用户在使用,那么你的IP重复几率为10%。
(2)因为IP资源的短缺,虽然VPN软件名称各有不同,譬如:91、591、游戏类等,但是这些软件服务商的资源有可能相同,导致大量软件的IP重叠,最高重复率可达90%以上。
(3)DVPN的情况比较特殊,部分DVPN使用了P2P技术,所以公网IP资源和用户数量是正相关的。此类型属于种子型VPN。就像过去我们使用的BT。如果每个挂机的人都是下单者,那么IP的重复率是100%,非常危险,千万别往坑里跳。
所以,选择VPN(代理服务器、VPS、DVPN同理)的关键有两点:服务商的公网IP较多;使用该服务商的“同行”较少。