带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(11)

简介: 带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(11)

带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(10) https://developer.aliyun.com/article/1247898?groupCode=taobaotech



工具变量与其他方法比较


工具变量和我们前面讨论的(需要识别出所有混杂因子的)方法至少在三个方面不同:


1.就算数据是无限的,工具变量也需要模型假设,而此时逆概率加权与标准化不需要。 如果我们有人群中每个人的治疗、结局、以及混杂数据,我们就能用非参数化的逆概率加权和标准化两种方法估计治疗的因果效应均值。而在工具变量中,我们仍然需要模型去估计治疗的因果效应。在数学上,同质性等价于将结构模型中的所有乘积项参数设定为0,也就是说,工具变量方法不存非参数的形式(工具变量不是唯一没有非参数形式的方法,断点回归分析等方法也没有非参数形式) 。


2.稍微违反条件(1)至(4)会造成不可预测的极大偏移。工具变量的一个理论基础是效应估计中的分母会扩大分子中的效应。因此,当这些条件不成立的时候,或者是一个弱工具变量的时候,就可能导致不可预测的极大偏移。工具变量的效应估计对假设条件的变化非常敏感,这一特质使得工具变量对于圈外人来说是一种非常危险的方法,同时也再一次强调了敏感性分析的重要性(Baiocchi等在他们2014年的论文中讨论了量化工具变量敏感性的方法) 。


3.能使用工具变量的理想情形相较于其他方法来说更不常见。我们讨论过,工具变量主要用于有大量未测混杂、有一个二分变量A 、以及有一个很强的因果性工具变量 Z 的情形之中,同时还需要同质性/或单调性成立。这些限制使得工具变量只能用于简单的因果推断情形当中,比如比较 A = 1 与 A = 0 的效应。


总结


本文对因果推断中效应估计的各类方法进行了介绍,主要包括对需要识别出所有混杂因子的PSM、CEM、IPTW、DID、SCM、Uplift model、RDD等方法的简单介绍,以及对 不需要识别出所有混杂因子 的工具变量方法的深入讨论。因果推断依赖于假设的明确性,以及对各种假设的详细剖析。工具变量所需的假设和其他方法不同,因而成为一种吸引人的新方法。然而,因为工具变量对假设的要求非常严格,所以使用工具变量的时候,我们需要对它的种种限制保持警惕(虽然这一提醒对所有因果推断方法都适用)。期待因果效应的估计在我们的讨论之后,有更多的同学能一起参与学习与研究、迎得更好的发展~~


参考文献


1. Causal Inference: What If

2. 数据分析 36 计(9):倾向得分匹配法 (PSM) 量化评估效果分析,PSM

3. A Survey on Causal Inference,IPTW/IPW

4. 因果推断文献解析|A Survey on Causal Inference(3),IPTW/IPW

5. 合成控制法 (SCM): 只有一个实验对象的政策评价,SCM

6. Instruments, Randomization, and Learning about Development

7. 断点回归(regression discontinuity design)学习笔记 ,RDD

8. 工具变量 (Instrumental variables) 的作用到底是什么?,IVTutorial in Biostatistics: Instrumental Variable Methods for Causal Inference,IV


团队介绍


商业机器智能部应用当下大数据、AI的前沿技术,服务于淘系十亿消费者、千万商家,支撑内容互动、用户增长、商家私域、创新业务等十几个海量流量业务场景。


其中,数据智能团队基于淘系全域数据,利用多维分析、归因分析、运筹优化、博弈论、因果推断等分析和挖掘方法,设计合适的分析和算法解决方案,对手淘内各场景的权益效率提升、用户留存等问题建模分析,实现用户规模

及用户粘性的增长。

相关文章
|
机器学习/深度学习 人工智能 分布式计算
因果推断:效应估计的常用方法及工具变量讨论
日常工作中很多的策略/产品的效果是无法设计完美的随机实验的,要求我们从观察性数据中去(拟合随机试验)发现因果关系、测算因果效应。
1857 0
因果推断:效应估计的常用方法及工具变量讨论
|
SQL 算法 搜索推荐
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(1)
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(1)
142 1
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(4)
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(4)
100 1
|
机器学习/深度学习 分布式计算 C++
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(3)
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(3)
198 1
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(10)
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(10)
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(9)
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(9)
100 0
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(8)
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(8)
111 0
|
知识图谱
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(5)
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(5)
139 0
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(2)
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(2)
117 0
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(6)
带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(6)
107 0