带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(8)

简介: 带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(8)

带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(7) https://developer.aliyun.com/article/1247901?groupCode=taobaotech



如果不存在对抗者,那单调性成立,这是因为工具变量 Z 的取值变大,要 么A 不变、要么也导致 A 的取值变大 (配合者)。只有对对抗者来说, Z 取值变大会导致 A 取值变小。或者换句话说,如果对所有人有 ,那么单调性成立。


现在我们将上一小节中的同质性替换为单调性,让单调性成为我们的第四个条件。那么工具变量的效应估计就不再image.png。在单调性下,工具变量的效应估计等于配合者中的因果效应均值,也即

image.png


简单而言,工具变量的效应估计的分子,也即 Z 对 Y 的因果效应,就等于本小节四个不同分组中 Z 的效应的加权平均。然而,在都会接受治疗与都不会接受治疗这两组中, Z 对 Y 的效应为0,这是因为 Z 对 Y 的因果效应需要通过 A ,而 A 的取值 在这两组中是固定的。同时,在单调性条件下,不存在对抗者。因此,工具变量的效应估计的分子,就是配合者中 Z 对 Y 的因果效应——也就是配合者中 A 对 Y 的因果效应——再乘以配合者所占的比例。而配合者所占的比例,就等价于工具变量的效应估计中的分母。


(配合者中的因果效应均值是一个子群体中的因果效应,可能与整个人群的因果效应不尽相同。)


在观察性研究中,如果不存在对抗者,我们就可以通过工具变量估计配合者中的治疗效应。 然而严格而言,在观察性研究中不存在配合者或对抗者,这是因为观察性研究中没有治疗分配, 也就不存在配合或不配合。在我们戒烟的例子中,配合者指的是住在香烟价格高的州就戒烟、而 住在香烟价格低的州就不戒烟的人。与之相反,对抗者指的是住在香烟价格高的州就不戒烟、而 住在香烟价格低的州就戒烟的人。如果不存在对抗者且因果性工具变量是二分变量,那么 2.4kg 就是配合者中的效应估计。


在 1990 年代,用单调性替代同质性被视为工具变量方法的救星。主要是因为同质性在大多数情形中并不可信,而单调性则更可信。不过,单调性假设下的工具变量也有很多缺点:


1. 单调性假设下的工具变量不能估计整个人群的因果效应,而只能估计配合者中的因果效应(类似CATE,Condi tional Average Treatment Effect)。

2. 其次,在观察性研究中,单调性假设也并非总是成立。

3. 最后,将人群根据配合程度分成四组这一做法可能并不合理(在许多现实情景中,配合者是劣定的)。


(Deaton等在2010年的paper中这样评价配合者中的效应:“这偏离了我们的初衷。原本光线很强,能照耀各个角落。但现在我们控制了光线能照射的地方,然后宣称这就是我们一直以来希望看到的东西。”)


总而言之,如果我们只关心配合者中的因果效应,那在只涉及两个分组的双盲随机试验中, 单调性就是一个合适的假设。然而,当情形更加复杂或涉及观察性研究,即使我们的工具变量是真正的因果性工具变量,我们也需要倍加小心。



带你读《2022技术人的百宝黑皮书》——因果推断:效应估计的常用方法及工具变量讨论(9) https://developer.aliyun.com/article/1247899?groupCode=taobaotech

相关文章
|
人工智能 运维 Linux
一文了解IntelliJ IDEA如何使用git上传代码到GitHub(附常见问题解决方案)
一文了解IntelliJ IDEA如何使用git上传代码到GitHub(附常见问题解决方案)
876 0
|
机器学习/深度学习 PyTorch 算法框架/工具
RGCN的torch简单案例
RGCN 是指 Relational Graph Convolutional Network,是一种基于图卷积神经网络(GCN)的模型。与传统的 GCN 不同的是,RGCN 可以处理具有多种关系(边)类型的图数据,从而更好地模拟现实世界中的实体和它们之间的复杂关系。 RGCN 可以用于多种任务,例如知识图谱推理、社交网络分析、药物发现等。以下是一个以知识图谱推理为例的应用场景: 假设我们有一个知识图谱,其中包含一些实体(如人、物、地点)以及它们之间的关系(如出生于、居住在、工作于)。图谱可以表示为一个二元组 (E, R),其中 E 表示实体的集合,R 表示关系的集合,每个关系 r ∈ R
2634 0
|
机器学习/深度学习 图计算 图形学
同构图、异构图、属性图、非显式图
同构图(Homogeneous Graph)、异构图(Heterogeneous Graph)、属性图(Property Graph)和非显式图(Graph Constructed from Non-relational Data)。 (1)同构图:
4120 0
同构图、异构图、属性图、非显式图
|
弹性计算 API Python
如何利用通义千问查询阿里云资源
本篇文章详细阐述了如何利用LangChain框架构建一款Python工具,该工具能够调用通义千问大模型来查询和获取阿里云资源信息。
|
网络安全 开发工具 数据安全/隐私保护
解决 Enter passphrase for key ‘/Users/dzm/.ssh/id_rsa‘:
解决 Enter passphrase for key ‘/Users/dzm/.ssh/id_rsa‘:
5073 0
|
存储 分布式计算 监控
阿里云服务器实例经济型e、通用算力型u1、计算型c8i、通用型g8i、内存型r8i详解与选择策略
在阿里云现在的活动中,可选的云服务器实例规格主要有经济型e、通用算力型u1、计算型c8i、通用型g8i、内存型r8i实例,虽然阿里云在活动中提供了多种不同规格的云服务器实例,以满足不同用户和应用场景的需求。但是有的用户并不清楚他们的性能如何,应该如何选择。本文将详细介绍阿里云服务器中的经济型e、通用算力型u1、计算型c8i、通用型g8i、内存型r8i实例的性能、适用场景及选择参考,帮助用户根据自身需求做出更加精准的选择。
|
存储 Python
数据包络分析(Data Envelopment Analysis, DEA)详解与Python代码示例
数据包络分析(Data Envelopment Analysis, DEA)详解与Python代码示例
|
存储 缓存 Linux
在Linux中,buffer和cache如何区分?
在Linux中,buffer和cache如何区分?
|
机器学习/深度学习 人工智能 物联网
探索云平台:构建未来计算的基石
本文旨在深入探讨云平台的基本概念、核心优势及其在现代IT架构中的关键作用。我们将从云计算的起源讲起,逐步解析云平台的运作机制,并通过具体案例展示其如何推动企业创新和效率提升。无论是创业者还是资深技术专家,了解云平台的本质和发展动向,都是把握未来科技趋势的重要一步。
554 2
|
弹性计算 运维 数据安全/隐私保护
【雾锁王国开服】阿里云一键部署雾锁王国联机服务器详细教程
阿里云提供雾锁王国服务器搭建教程,借助计算巢服务,用户可在3分钟内创建Enshrouded游戏服务器。8核32G服务器1个月109元,3个月327元;4核16G10M带宽1个月30元,3个月90元。需先注册并实名认证阿里云账号,然后通过傻瓜式一键部署入口进行购买和设置,包括地域、购买时长、服务器参数等。部署完成后,分享服务器信息给游戏伙伴,即可开始游戏。详细教程和更多配置信息可在阿里云ECS产品页查看。
588 0