带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(7) https://developer.aliyun.com/article/1247939?groupCode=taobaotech
基于双重差分法 - 计算业务增量价值:
双重差分法:在满足基线期平行趋势假设的基础上,估计策略影响的平均处理效应。以下图为例,两家开在不同地区的店铺A/B,假设店铺A,B 满足平行趋势假设,且A家参与了大促(打广告),B家没有。考虑到时间变量对于两个店铺带来的共同影响,需要求两次差值才能正确估计广告对A带来的效益提升,即所谓双重差分。DID= (A2-A1)-(B2-B1),也可以用模型来拟合DID。
1.在3D样板间的case中,因为潜客是用PSM挖掘后再随机分组的,所以认为满足平行趋势假设,DID可行;
2.PSM+DID也是常见的搭配,一起使用可以避开各自的局限性,起到1+1>2的效果;在后续的文章会展开。
通过DID计算线上3周的实验数据表明,加购率提升了6.73%,加购件数提升了1.26件,淘宝时长增长了17.26分钟。
总结
观察性因果推断方法有很多,文章主要介绍了PSM、贝叶斯概率图、DID这几种方法,可将文章分享的实践方法作为因果推断分析中的一种参考。 观察性因果推断仍有许多局限之处,数据驱动产品任重道远。不迷信任何一种算法,多种分析方法论的结合+实际经验方为上策。希望这篇文章可以起到抛砖引玉的作用,引起大家对因果推断的兴趣,引发更多讨论,一起学习、共同成长。也希望可以认识一些正在做因果推断的小伙伴。
参考资料
Judea P, & Dana M.. The Book of Why.
Hernán, M. A., & Robins, J. M. Causal Inference: What If.
王乐. 概率图模型之贝叶斯网络. https://zhuanlan.zhihu.com/p/30139208
有哪些相关性不等于因果性的例子?. (n.d.).https://www.zhihu.com/question/66895407
Caliendo, M., & Kopeinig, S. (2008). Some Practical Guidance for the Implementation of PSM. Journal of Economic Surveys, 31–72(22(1)).
imai, K., Keele, L., Tingley, D., & Yamamoto, T. (2011). Unpacking the Black Box of Causality: Learning about Causal Mechanisms from Experimental and Observational Studies. American Political Science Review, 105(4).
团队介绍
大淘宝技术-家装家居数据科学团队基于淘系全域数据,利用多维分析、归因分析、运筹优化、博弈论、因果推断等分析和挖掘方法,设计合适的分析和算法解决方案,对淘宝,天猫家装家居垂直行业的权益效率提升、用户留存等问题建模分析,实验用户规模及用户粘性的增长。