带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(2) https://developer.aliyun.com/article/1247947?groupCode=taobaotech
举个例子
以Push投放对内容阅读篇数的影响为例。我们对于ID = 1,2,3的用户投放Push(T=Y),ID为4,5,6的用户则不进行干预。
1.以ID =1的用户为例:假如投放Push后,她的阅读篇数是9(Y1),而假如不投放,她的篇数是7(Y0);这两者都是潜在结果,只有站在上帝视角才能同时看到两个结果
2.因为我们真的对她投放了push,因此观察到的真实结果就是阅读篇数为9。(‘不投放时篇数为7’这个事实就永远不得而知了)
接下来我们站在“上帝视角”解释一下ATE和ATT的计算。在上帝视角下,我们可以同时观测到每个用户的两个潜在结果,算出两种因果效应分别为ATE=1.2>0 和 ATT=1.7>0。因此,push确实是可以提升用户的阅读篇数的,这个结论就符合常理了。ATE和ATT的具体计算过程如下:
假如我们失去了“上帝视角”,ATE和ATT就没法用上面的公式来计算了,因为对于每一个用户的两个潜在结果,总是有一个是观察不到的。这时候离线因果推断就派上用场啦!
什么时候用,怎么用?
条件允许的情况下,ab test是最佳的因果推断方法之一。但ab test也有自己的局限性:
1. ab test不可进行:比如我们不能强迫一组用户‘吸烟’,另一组用户‘不吸烟’去观察吸烟对健康的危害;
2.ab test成本太高:当线上实验的选择太多,而产品的流量/时间成本是有限时,逐一对每一个实验都进行测试显然不现实,此时通过离线数据进行因果推断可以帮助我们科学地预判不同实验策略的‘前途’,让我们可以优先尝试前途更加光明的实验;
带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(4) https://developer.aliyun.com/article/1247944?groupCode=taobaotech