01年度精选技术栈内容数据算法篇 / 技术经典总结技术人的百宝黑皮书2022版大淘宝技术出品因果推断:效应估计的常用方法及工具变量讨论作者:景里、北澄出品:大淘宝技术数据算法篇日常工作中很多的策略/产品的效果是无法设计完美的随机实验的,要求我们从观察性数据中去(拟合随机试验)发现因果关系、测算因果效应。因果推断简介作者个人理解:因果推断本质上回答的问题:谁是因?谁是果?这个因会导致多大的果?抽象为两大问题即为:因果发现+因果效应估计。对应到我们日常的业务策略、产品迭代中,因(某个策略、ui改版、产品迭代)会导致多大的果(点击率提升多少?笔数提升多少),回答这类“干预”问题的黄金准则是随机控制实验(Randomized Control Trial),这一点已成为当今自然科学家和社会科学家的共识。但是日常中,我们很多的策略/产品的效果是无法设计完美的随机实验的,这就要求我们从观察性数据中去(拟合随机试验)发现因果关系、测算因果效应。推荐语:个性化推荐在双11大放异彩,随着内容化和商品理解的深入,对算法提出了新的要求。淘宝技术通过融合多模态信息的内容召回模型更好兼顾了推荐的泛化性,通过改善召