为什么

目录
- 前言
- 导言:思维胜于数据
- 第一章 因果关系之梯
- 第二章 从海盗到豚鼠:因果推断的起源
- 第三章 从证据到因:当贝叶斯牧师遇见福尔摩斯先生
- 第四章 混杂和去混杂:或者,消灭潜伏变量
- 第五章 烟雾缭绕的争论:消除迷雾,澄清事实
- 第六章 大量的悖论!
- 第七章 超越统计调整:征服干预之峰
- 第八章 反事实:探索关于假如的世界
- 第九章 中介:寻找隐藏的作用机制
- 第十章 大数据,人工智能和大问题
- 致谢
- 参考文献
书评
非常精彩,开辟了统计学之外一片广袤的因果推断领域,因果图极其简洁直观地破解了许多统计思维的迷雾。至于如何画出因果图则为纯理论研究提供了一个接口,使得理论和实证的结合前景光明。已经迫不及待要读作者更加公理化的另一本书是如何建立起具有完备性的 do 算子演绎系统了!
2021-10-28
书摘
- 这些模型带有形成了一个循环的箭头。我在本书中没有讨论这些模型,但是它们在一些学科(例如经济学)中相当重要。
- 1995 年到 1998 年间,我向美国各地数以百计的计量经济学学生和教师提出了以下问题,也就是每个上过经济学基础课程的学生都要解决的经典供求方程:1.如果报告价格为 P=p 0,则需求 Q 的期望值是多少?2.如果我们设置价格为 P=p 0,则需求 Q 的期望值是多少?3.已知目前的价格是 P=p 0,如果我们将价格设在 P=p 1,则需求 Q 的期望值是多少?读者应该能意识到这些问题分别来自因果关系之梯的三个层级:预测关联、干预和反事实。正如我所料,普通学生回答问题 1 没什么问题,一位(足够杰出的)教授能够解决问题 2,而没有人能回答问题 3。
- 虽然近因的含义非常模糊,但充分因的含义则相当精确。使用反事实符号,我们可以定义充分性概率或 PS(probability of sufficiency)为 P(YX=1=1|X=0,Y=0)。这一定义有助于我们想象这样一种情况,X=0 且 Y=0,即被告没有向受害者开枪,且受害者没有跑到钢琴下。然后我们要问的是,在这种情况下,被告射击(X=1)导致结果受害者跑到钢琴下(Y=1)的可能性有多大?这要求我们进行反事实的判断,但我认为大多数人都同意,这种结果出现的可能性非常小。直觉和《模范刑法典》都表明,如果 PS 太小,我们就不应该判被告犯谋杀罪,导致了 Y=1。
- X=0=0|X=1,Y=1)与 P(YX=0=0|X=1)就是不一样的。
- 除了简称中间的字母不同外,结构方程模型(SEMs)与结构因果模型(SCMs)的另一个重要区别是,结构因果模型中的因果关系不一定是线性的。结构因果模型分析所用到的方法对非线性函数、线性函数和离散变量、连续变量同样有效。
- 下面,我们来说明如何利用因果图来判断(条件的)可忽略性。以一组匹配变量 Z 为条件,要确定对于结果 Y 来说 X 是否可忽略,我们只需要测试 Z 是否阻断了 X 和 Y 之间的所有后门路径,同时,Z 的成员都不是 X 的后代即可。就这么简单!
- 对于同一个体,我们能观察到的潜在结果永远不会超过 1 个。这件事虽然显而易见,但仍然非常重要。统计学家保罗·霍兰德曾经称之为“因果推断的基本问题”,这一名称现在已深入人心。如果我们真的能在问号处填写内容,那我们就可以回答所有的因果问题了。
- 另外还需要注意,潜在结果,或反事实,是在个体层面而非总体层面上定义的。
- 在第四章,我们讨论了随机对照试验,它被广泛誉为医学临床试验的“黄金标准”。我们还看到了一些适用于观察性研究的方法,其中处理组和对照组的成员不是随机分配的。对此,如果我们可以采集到能够阻断所有后门路径的变量(集)的数据,我们就可以使用后门调整公式来估算出干预效果。如果能找到一个被混杂因子“屏蔽”的前门路径,我们就可以引入前门调整。如果我们愿意接受线性或单调性假设,那么我们就可以使用工具变量(假设该变量可以在因果图中找到,或研究者可以根据试验设计提出一个合适的变量)。此外,那些真正富有冒险精神的研究者还可以用 do 演算或其衍生算法,绘制出一条通往干预之峰山巅的新路线。
- 总而言之,工具变量是一个重要的工具,它能帮助我们揭示 do 演算无法揭示的因果信息。do 演算强调的是点估计,而非不等式,因此不适用于如图 7.12 所示的情况,因为在那个例子中我们所能得到的都是不等式。而同样重要的是,相比工具变量,do 演算具有更大的灵活性。因为在 do 演算中,我们不需要对因果模型中函数的性质做任何假设。而如果我们的确有足够的科学依据证实类似单调性或线性这样的假设的话,那么像工具变量这种针对性更强的工具就更值得考虑。
- 第一,工具变量 Z 独立于混杂因子吗?Z 的随机化确保了这一问题的答案是肯定的。(正如我们在第四章看到的,随机化是确保变量不受任何混杂因子影响的好方法。)第二,从 Z 到 Y 有直接路径吗?常识告诉我们,接受一个特定的随机处理(Z)不可能直接影响人体的胆固醇水平(Y),所以这个问题的答案是“没有”。第三,Z 和 X 之间是否存在强关联?我们应该借助数据来回答这个问题,而数据显示,答案是肯定的。记住,每次使用工具变量之前,我们都必须先回答出上述三个问题。
- 的确存在一些非常出色的公理系统是不完备的,比如概率论中描述条件独立性的菲利普·戴维公理。
- 综上所述,后门调整公式和后门标准就像硬币的正反面。后门标准告诉我们哪些变量集可以用来去除数据中的混杂。统计调整公式所做的实际上就是去混杂。
- 最后,为了去除 X 和 Y 中的混杂,我们只需要阻断它们之间的每个非因果路径,而不去阻断或干扰所有的因果路径就可以了。更确切地说,我们将后门路径(back-door path)定义为所有 X 和 Y 之间以指向 X 的箭头为开始的路径;如果我们阻断了所有的后门路径(因为这些路径允许 X 和 Y 之间的伪相关信息在管道中流通),则我们就完成了对 X 和 Y 的去混杂。如果我们试图通过控制某一组变量 Z 来实现这一点,那么我们还需要确保 Z 的任何成员都不是 X 的后代,否则我们就可能部分或完全地关闭这条 X 与 Y 之间的因果路径。
- 我们观察到的是给定处理效应的条件概率 P(Y|X),我们要问自然的问题是 X 和 Y 之间的因果关系,该因果关系可以通过干预概率 P(Y|do(X))获得。如此一来,混杂就可以简单地定义为导致 P(Y|X)≠P(Y|do(X)),即两个概率出现差异的所有因素。是不是很简单明了?
- 请注意,所有指向肥料的箭头都已被清除,这反映了农民在决定使用何种肥料时只听从于抽签结果。同样重要的是,图示中没有从随机抽签指向产量的箭头,因为农作物并不能读懂抽签的结果。(对于农作物来说,这是一个相当安全的假设,但对随机化试验中的人类受试者来说,这就是一个应予以严肃考虑的问题了。)
- 一旦我们理解了随机对照试验起作用的原因,我们就没有必要再将之奉若神明,把它当作因果分析的黄金标准,要求所有其他方法都必须以此为参照。恰恰相反,我们会领悟到这一统计学家所谓的黄金标准实际上源自更基本的原则。
- 我们将 A 描述为根节点,并不是说 A 的发生不存在起因。实际上,几乎没有任何变量符合这种描述。我们真正的意思是,A 的任何先验的因都可以被适当地概括为先验概率 P(A),其中 A 为真。例如,在“疾病→检测”的例子中,家族病史就可能是一个病因。但是,只要我们确信家族病史不会影响变量“检测”(在已知“疾病”的状态的前提下),我们就不必将它表示为图示中的一个节点。但是,如果“疾病”的一个因也直接地影响了“检测”,那么这个因必须在图示中明确地表示出来。
- 3.A→B←C。这是最让人着迷的一种接合形式,被称作“对撞”(collider)接合。
- 2.A←B→C。这种接合形式被称为“叉”接合,B 通常被视作 A 和 C 的共因(common cause)或混杂因子(confounder)。混杂因子会使 A 和 C 在统计学上发生关联,即使它们之间并没有直接的因果关系。
- 1.A→B→C。这种接合形式是被称为“链”接合或中介接合的最简单的表现形式。
- 只看表中“烟雾=1”那些行数据的做法,被称为“以某个变量为条件”或“对某个变量进行控制”。同样地,若已知烟雾的值,我们就可以说火灾和警报是条件独立的(conditionally independent)[3]。
- 然而,在努力将因果关系的概念数学化(这本身就是一个值得称道的想法)的过程中,哲学家过早地诉诸其所知的唯一一种用于处理不确定性的语言,即概率语言。在过去的十多年的大部分时间里,他们都在致力于纠正这个大错,但遗憾的是,即便是现在,计量经济学家仍以“格兰杰因果关系”(Granger causality)和“向量自相关”(vector autocorrelation)之名追随着类似的理念。
- 为了弥合第三层级与前两个层级之间的差距,我们需要构建一个基础性的解释因果过程的模型,这种模型有时被称为“理论”,甚至(在构建者极其自信的情况下)可以被称为“自然法则”。简言之,我们需要掌握一种理解力,建立一种理论,据此我们就可以预测在尚未经历甚至未曾设想过的情况下会发生什么——这显然是所有科学分支的圣杯。
- 好的预测无须好的解释,就像猫头鹰不明白老鼠为何总是从 A 点跑到 B 点,但这不改变它仍然是一个好猎手的事实。
- 第一层级是观察能力,具体而言是指发现环境中的规律的能力。在认知革命发生之前,这种能力为许多动物和早期人类所共有。第二层级是行动能力,涉及预测对环境进行刻意改变后的结果,并根据预测结果选择行为方案以催生出自己期待的结果。只有少数物种表现出了具备此种能力的特征。对工具的使用(前提是使用是有意图的,而不是偶然的或模仿前人)就可以视作达到第二层级的标志。然而,即使是工具的使用者也不一定掌握有关工具的“理论”,工具理论能够告诉他们为什么这种工具有效,以及如果工具无效该怎么做。为掌握这种理论,你需要登上想象力这一层级。第三层级至关重要,它让我们为发起农业领域和科学领域的更深层次的革命做好了准备,使得我们人类对于地球的改造能力发生了骤变。