方法工具
因果推断入门:RCT、DID、RDD 与 IV 的核心逻辑
系统梳理现代因果推断三大核心方法——双重差分、断点回归、工具变量——的识别假设、 适用场景与主要批评,附参考文献清单。
蓝灯书会整理 2026年4月10日
# 因果推断入门
## 1. 随机对照实验(Randomized Controlled Trial, RCT)
**核心本质**:RCT 被广泛视作社会科学因果推断的核心本质与“黄金标准”(Gold Standard)。由于消除了由于人为选择而引入的各类偏差,当下的绝大多数观察性研究拟实验设计(如 DID、RDD、IV 等),其核心识别逻辑都是为了在纯观察数据中逼近或“模仿”(Mimic)RCT 的随机分配机制。
**核心假设/要素**:
- 真正的随机分配机制(Random Assignment)。
- 确保实验组与对照组在所有可观测和不可观测的特征上达到统计学意义上的期望均衡。
**适用场景**:
- 田野实验、行为干预实验、机制设计实验以及部分公共政策试点。
## 2. 双重差分(Difference-in-Differences, DID)
**核心识别假设**:平行趋势假设(Parallel Trends Assumption)
- 处理组与控制组在处理前的潜在结果趋势平行
- 无法直接检验,通常通过安慰剂检验(事件前趋势)提供支撑
**适用场景**:
- 政策自然实验(如某政策在特定时间点在部分地区实施)
- 城市研究中的典型应用:土地制度改革、基础设施建设影响评估
**主要问题**:
- 干扰性处理(SUTVA 假设)
- 处理时间异质性(Callaway & Sant'Anna, 2021)
- 预处理趋势差异
## 3. 断点回归(Regression Discontinuity Design, RDD)
**核心识别假设**:处理分配在断点两侧局部随机化
- 没有人能精确操纵驱动变量(Running Variable)
- 借助 McCrary (2008) 密度检验进行验证
**适用场景**:
- 行政截止规则(考试分数、人口门槛、绩效考核线)
- 城市研究中的应用:城市规模门槛效应、行政边界识别
## 4. 工具变量(Instrumental Variables, IV)
**有效工具变量的三个条件**:
1. 相关性:工具与处理变量高度相关
2. 外生性:工具不直接影响结果变量
3. 排他性:工具只通过处理影响结果
**城市研究中的常见工具变量**:
- 地形/地理特征(坡度、河流)
- 历史人口/建设密度
- Bartik 型工具