带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(4)

简介: 带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(4)

带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(3) https://developer.aliyun.com/article/1247946?groupCode=taobaotech




因果推断是通过特定的方法对观察性数据控制混杂变量以拟合随机试验。所有的方法的核心思想,都离不开控制混杂(control confounding variables)。在上文小明高考的例子里,我提到过要寻找‘一模一样的小明2号’,而‘一模一样’的目的就是为了控制混杂变量。只有在控制了两者混杂变量一致,仅有高考分数不同的情况下,我们才能计算高考分数对工资收入的影响。


混杂变量是指对于‘因’和‘果’都有影响的因素,忽视它们会对结果带来致命的偏倚;对小明和小明2号来说,需要控制的混杂变量有:上过的学校,遇见过的老师,自己的学习、睡眠时长,等等等等,因为这些都会影响高考的分数(因),也会影响未来的收入(果)。但是例如小明的头发颜色、身高这种特征并不会对于因果变量有什么影响,无需控制。所以在实践中很关键的一点,就是判断到底需要控制哪些混杂,才能让你认为小明和小明2号是‘同质’的。判断混杂因子并没有一个标准方法,而是需要结合对业务的深度理解。不同的数据类型、场景会有不同的适用方法,下面是一些常见的判断标准和对应方法:


image.png

混杂(W)的典型结构:同时作用于X和Y。


image.png


image.png

常见方法一览


离线因果推断在淘宝3D化价值分析上的实战


这部分主要介绍大淘宝技术-家装家居数据科学团队在淘宝3D化项目中对项目的价值分析上的实战,通过这一实例帮助大家对因果推断如何运用有更直接的认识。




带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(5) https://developer.aliyun.com/article/1247942?groupCode=taobaotech

相关文章
|
算法
带你读《2022技术人的百宝黑皮书》——基于特征全埋点的精排ODL实践总结(1)
带你读《2022技术人的百宝黑皮书》——基于特征全埋点的精排ODL实践总结(1)
带你读《2022技术人的百宝黑皮书》——基于特征全埋点的精排ODL实践总结(1)
带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(5)
带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(5)
|
测试技术
带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(3)
带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(3)
107 0
|
图计算
带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(6)
带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(6)
|
数据挖掘
带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(1)
带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(1)
109 0
带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(2)
带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(2)
|
算法 决策智能
带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(8)
带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(8)
带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(7)
带你读《2022技术人的百宝黑皮书》——因果推断实战:淘宝3D化价值分析小结(7)
|
监控 算法 API
带你读《2022技术人的百宝黑皮书》——基于特征全埋点的精排ODL实践总结(8)
带你读《2022技术人的百宝黑皮书》——基于特征全埋点的精排ODL实践总结(8)
|
机器学习/深度学习 智能设计 自然语言处理
带你读《2022技术人的百宝黑皮书》——基于特征全埋点的精排ODL实践总结(9)
带你读《2022技术人的百宝黑皮书》——基于特征全埋点的精排ODL实践总结(9)