财政学

第3讲：实证分析的逻辑——我们怎么知道政策有没有用？

朱奇

2026年03月18日

本讲内容

为什么需要实证分析？ ——没有实证，政策方向可能全错
为什么不能只靠理论或举例？ ——两种替代方法的致命缺陷
大数据让实证分析更强大？ ——从"故事"到"证据"
相关 ≠ 因果 ——建立直觉警觉：六个有趣的例子
反事实：因果推断的灵魂 ——"如果没有这个政策，会怎样？"
三种准实验方法的直觉 ——DiD、RDD、IV，从原理到方法
中国财政观察 ——2024年减税降费效果评估实例

Part 1 为什么需要实证分析？

没有实证基础，政策方向可能全错

1.1 一个“扎心”的真相：为什么会好心办坏事

我们在上两讲建立了财政学的规范目标：

弥补市场失灵
提升帕累托效率
实现公平分配（罗尔斯主义、共同富裕……）

这些目标听起来无可厚非。但是——

⚠️ 关键问题

如果我们对"政策实际上会产生什么效果"判断错误，那么再崇高的规范目标也会导向错误的政策，甚至适得其反。

目标正确 ≠ 政策正确。规范分析告诉我们"想要什么"，实证分析告诉我们"实际上会发生什么"。

1.2 三个"目标正确、结果相反"的案例

案例一：租金管制

规范目标：帮助低收入群体负担得起租房（公平目标）
政策手段：政府规定房租不得超过某一上限
实际后果：
- 房东减少出租意愿 → 市场上出租房源减少
- 房东停止维护房屋质量（反正租不愁）
- 低收入者更难找到房子，而非更容易
实证证据：Diamond et al.（2019）对旧金山的研究发现，租金管制使租房供给减少了15%，长期反而推高了整体租金水平。

案例二：最低工资

规范目标：保障低收入劳动者的基本生活（公平目标）
政策手段：规定雇主支付的最低时薪
理论预测（简单供需模型）：最低工资高于均衡工资 → 劳动需求下降 → 失业率上升
实际情况远比理论复杂：
- Card & Krueger（1994）对比新泽西和宾夕法尼亚快餐业——提高最低工资后就业没有下降
- 部分研究显示雇主通过压缩利润而非裁员来应对
- 但另一些研究发现对青少年就业有负面影响
结论：效果取决于劳动市场结构，没有实证分析，规范判断无从落地

案例三：计划生育政策的误判

规范目标：控制人口增长，实现人均资源改善（发展目标）
主流预测（1970—80年代）：人口若不控制，将"爆炸式"增长拖累经济
政策手段：独生子女政策（1980—2015年）
实际后果：
- 出生率下降速度超出预期
- 人口老龄化提前到来
- 劳动力供给萎缩，"人口红利"消失
- 性别比失衡带来深层社会问题
政策180度转向：2015年放开二孩，2021年放开三孩，2024年再次鼓励生育

三个案例的共同教训

规范目标（应该做什么）决定方向，实证分析（实际会发生什么）决定方案。缺少后者，前者可能南辕北辙。

Part 2 为什么不能只靠理论或举例？

两种替代方法的致命缺陷

2.1 替代方案一：纯理论分析

理论模型很优美。经济学理论的魅力在于：用极少的假设，推导出精确的结论。

但理论分析有一个根本弱点：

💡 一次性总量税（Lump-sum Tax）的故事

我们在上讲学过：第二福利定理指出，一次性总量税（每人缴纳固定金额、与收入无关）是理论上最优的税种——

不扭曲劳动供给
不扭曲消费和储蓄
效率损失为零

理论上完美无缺。

1990年英国撒切尔人头税：完美理论的现实崩溃

撒切尔政府实施了接近"一次性总量税"的人头税（社区税）：

每个成年人缴纳相同金额，与收入、房产无关
从效率角度：几乎没有超额负担，是"教科书级别"的好税
现实结果：100万人上街抗议，数十万人拒绝缴税，骚乱遍及全国
政治结局：撒切尔于1991年被迫辞职，人头税随即废除

理论分析的致命缺陷

理论模型中的人是"代表性个体"——他们没有愤怒，没有公平感，不会上街。

真实的人不只优化效用函数，他们还有价值判断、公平直觉和政治行动能力。

→ 纯理论分析"听上去很完美，一实行就出问题"。

2.2 替代方案二：举例分析（案例研究）

案例研究也是重要的研究方法，但它有一个软肋：

🎯 案例的代表性问题

你举一个例子，我就能举一个反例。

谁赢？谁的例子更"典型"？这个问题无法在案例层面回答。

真实争论：增加教育支出能提高学业表现吗？

支持者的例子：

芬兰在大幅提高教师待遇和教育投入后，PISA 成绩多年位居全球前列。

→ 结论：增加教育支出有效！

反对者的例子：

美国自1970年代以来，人均教育支出增加了3倍以上，但PISA成绩几乎没有改善。

→ 结论：教育支出无效！

注记

PISA（国际学生评估项目，OECD主办，每三年测试全球15岁学生的阅读、数学和科学素养）

两个例子都是真实的，结论却完全相反。

根本原因：芬兰和美国在文化背景、师资质量、教育制度上存在巨大差异。案例的"典型性"无法自证。

→ 需要系统性的实证研究，而非依赖个别案例。

2.3 大数据时代：实证分析变得更强大

传统实证研究的困境：数据稀缺，样本量小，统计功效不足。

大数据时代的三大突破：

行政数据（Administrative Data） 税务记录、医保报销、企业注册、学生学籍……这些数据覆盖全量人口，而非抽样，消除了抽样偏差。

Raj Chetty 的团队用美国全部纳税记录（数亿条）研究社会流动性——这在以前根本不可能。
准实验机会增多 政策试点制度（中国的"先行先试"）、政策阈值（贫困县认定标准）、政策时间差，都是天然的准实验素材。大数据让研究者能够精确定位断点两侧的对比样本。
机器学习辅助控制 面对成百上千个混淆变量，传统回归力不从心；机器学习可以自动筛选最重要的控制变量，提升估计精度。

2.4 三种方法的比较

表 1

方法	优势	致命缺陷	在财政中的角色
纯理论分析	逻辑严密，结论精确提供直觉框架	假设与现实脱节人头税式悲剧随时可能发生	提供分析框架和方向性判断
案例/举例分析	生动具体，易于理解贴近现实	代表性不足一个反例即可推翻结论	辅助说明激发直觉
系统实证分析（含大数据）	覆盖面广，可量化支持因果推断	数据获取难，技术门槛高仍需理论指引	核心证据基础政策评估主力

本课程的方法论立场：理论提供框架 → 案例激活直觉 → 实证分析是最终裁判。

Part 3 相关 ≠ 因果

建立警觉：六个有趣的例子

3.1 先从荒诞开始——巧克力与诺贝尔奖

图 1

真正的原因：人均 GDP 高的富裕国家，既消费更多巧克力，又有更好的科研环境。这是遗漏变量（omitted variable）在作祟。

3.2 冰淇淋与溺水：最经典的虚假相关

观察：每年夏季，冰淇淋销量和游泳溺亡人数同步上升。

荒谬结论：禁止销售冰淇淋可以减少溺亡事故？

真实原因：气温升高（第三变量）同时导致了两个结果——

\[\text{气温升高} \rightarrow \begin{cases} \text{冰淇淋需求} \uparrow \\ \text{游泳人数} \uparrow \rightarrow \text{溺亡风险} \uparrow \end{cases}\]

冰淇淋和溺亡之间没有任何因果关系，但相关系数可能高达 0.8 以上。

3.3 财政领域的真实陷阱

陷阱一：消防车悖论

统计数据：消防车出动次数越多 → 火灾损失越大（正相关！）
荒谬结论：削减消防车可以减少火灾损失？
真实原因：遗漏变量——火灾规模。大火同时引发更多消防车出动和更大损失。

陷阱二：教育支出与成绩

统计数据：富裕地区教育支出高，学生成绩也高（正相关）
错误结论：增加教育支出提高成绩
真实原因：家庭背景和社区资本同时影响支出和成绩

→ 核心问题：是钱的效果，还是"有钱人的孩子本来就学得好"？

陷阱三：转移支付与GDP增速（反向因果）

统计数据：获得大量中央转移支付的省份，GDP 增速反而较低
错误结论：转移支付阻碍了经济增长？
真实原因：反向因果（Reverse Causality）——正是因为经济增速低，这些省份才获得了更多转移支付！

\[\text{经济落后} \rightarrow \text{获得更多转移支付}\] \[\text{不是：} \quad \text{转移支付} \rightarrow \text{经济落后}\]

3.4 相关性的"陷阱地图"

3.5 一句话总结

Joshua Angrist（2021年诺贝尔经济学奖）

"相关不等于因果。这是现代社会科学最重要的一句话。"

这不是统计学的技术细节，而是思维方式的根本转变。

在你看到任何"A 导致 B"的政策主张时，第一反应应该是： "有没有可能，是 C 同时导致了 A 和 B？"

Part 4 反事实：因果推断的灵魂

"如果没有这个政策，会怎样？"

4.1 生活中的反事实问题

你感冒了，吃了感冒药，三天后好了。

问题：是感冒药治好了你，还是你自己好的？

要回答这个问题，你需要知道：如果你没有吃药，三天后会不会也好了？

这就是反事实（Counterfactual）——一个你永远无法直接观测到的"平行世界"。

对应到政策评估

某省2022年实施了一项教育均衡政策，2024年该省农村学生入学率从72%升至81%。

问题：这9个百分点，是政策的功劳吗？

→ 你需要知道：如果没有实施这项政策，2024年该省的入学率会是多少？

→ 这个"没有政策的世界"，就是反事实。它永远无法被直接观测。

4.2 反事实问题的数学表达

对于每个个体 \(i\)（一个县、一家企业、一个学生），定义：

\[ \begin{aligned} Y_i(1) &= \text{接受政策时的结果（可观测）} \\ \\ Y_i(0) &= \text{未接受政策时的结果（反事实，不可观测）} \\ \end{aligned} \\ \] 个体处理效应：

\[\tau_i = Y_i(1) - Y_i(0)\]

根本困境：\(Y_i(1)\) 和 \(Y_i(0)\) 不能同时被观测——每个个体要么接受了政策，要么没有。

这被称为因果推断的根本问题（Fundamental Problem of Causal Inference）（Holland，1986）。

所有实证方法，都是在想办法重建那个不可观测的反事实。

4.3 找"替代品"：对照组的逻辑

既然同一个个体的反事实不可观测，我们能不能找另一群人来代替它？

粗暴方案：直接比较接受政策的人和没接受的人。

问题：接受政策的人和没接受的人，本来就不一样！

例：自愿参加职业培训的工人，本来就更有上进心；他们日后的高收入，到底是培训的功劳，还是他们本来就更优秀？

→ 这叫选择偏差（Selection Bias），是因果识别的头号敌人。

解决方向：找到一个足够"像"处理组的对照组，使得两者之间的差异只来自是否接受了政策，而不是来自其他系统性差异。

这就是所有准实验方法的共同目标。

4.4 最理想的解决方案：随机实验（RCT）

随机对照实验（Randomized Controlled Trial，RCT）——因果推断的"黄金标准"。

将研究对象随机分配到处理组和控制组
随机化确保两组在所有方面（包括不可观测的特征）都平均相似
两组之间唯一的系统性差异，就是是否接受了政策
因此，两组结果的差异，就是政策的纯因果效应

问题：在财政政策中，随机实验几乎无法实施——

不能随机选一半城市征增值税、另一半不征
不能随机决定哪些孩子上公立学校、哪些不能
伦理和政治上都行不通

→ 经济学家需要另辟蹊径：准实验方法。

Part 5 三种准实验方法

直觉优先，技术细节其次

5.1 方法总览：三种"替代随机"的策略

准实验方法的共同思路：在现实中寻找接近随机的分配机制，用它来重建反事实。

flowchart LR
    A["❓ 我们想要
    随机实验"] -->|"现实中
    无法实施"| B["寻找准实验机会"]
    B --> C["双重差分 DiD
    政策分批推进
    产生时间差"]
    B --> D["断点回归 RDD
    政策有明确阈值
    产生门槛效应"]
    B --> E["工具变量 IV
    找一个外生推力
    间接识别因果"]
    C --> F["✅ 重建反事实
    估计因果效应"]
    D --> F
    E --> F

    style A fill:#1a3a5c,color:#fff
    style F fill:#375623,color:#fff
    style C fill:#2e75b6,color:#fff
    style D fill:#7030a0,color:#fff
    style E fill:#843c0c,color:#fff

5.2 双重差分法（DiD）：先讲人话

💬 用一句话解释 DiD

找一个"本来命运差不多"的对照组，看政策实施后，两组的命运是否开始分叉。

分叉的幅度，就是政策的效果。

生活类比：

你的双胞胎兄弟吃了一种新减肥药，你没吃。
你们的体重原本走势完全一样（"平行趋势"）。
一年后，他瘦了10斤，你胖了2斤。
减肥药的效果 = \((-10) - (+2) = -12\) 斤。
之所以要减掉你的变化（+2斤），是因为即使不吃药，体重也会因为其他原因变化。

5.3 DiD 的核心假设与可视化

核心假设：平行趋势（Parallel Trends）

如果没有政策，处理组和控制组的结果变量会以相同斜率随时间变化。

图 3

5.4 DiD 的数学表达

\[\hat{\tau}^{\,\text{DiD}} = \underbrace{\bigl(\bar{Y}_{\text{处理,后}} - \bar{Y}_{\text{处理,前}}\bigr)}_{\text{处理组：政策前后差}} - \underbrace{\bigl(\bar{Y}_{\text{控制,后}} - \bar{Y}_{\text{控制,前}}\bigr)}_{\text{控制组：同期自然变化}}\]

用回归方程表达：

\[Y_{it} = \alpha + \beta_1 \cdot \text{Treated}_i + \beta_2 \cdot \text{Post}_t + \underbrace{\delta \cdot \bigl(\text{Treated}_i \times \text{Post}_t\bigr)}_{\text{DiD核心系数，即政策效果}} + X_{it}'\gamma + \varepsilon_{it}\]

\(\delta\) 就是我们最关心的因果效应估计量。

🇨🇳 中国财政研究中的 DiD 机会

中国的"政策试点制度"天然适合 DiD：政策先在部分城市/县试点，其余地区稍后推广。这个时间差，就是 DiD 的识别来源。

5.5 断点回归设计（RDD）：先讲人话

💬 用一句话解释 RDD

政策有一道"门槛"：分数差一分，人生可能截然不同。门槛两边的人几乎一样，却命运各异——这个差异，就是政策的效果。

生活类比：

高考分数线：580分上一本，579分上二本
这两个孩子几乎一样聪明、一样努力
但一个进了985，一个进了普通本科
比较他们10年后的收入差异，就能估计"上985的因果效应"
之所以要用紧邻阈值的样本，是因为离阈值越远，两组就越不可比

5.6 RDD 的核心直觉与可视化

关键洞见：在阈值（断点）两侧，个体除了是否跨过阈值之外，几乎完全可比。政策资格的分配在断点附近是近似随机的。

图 4

5.7 RDD 的财政应用：贫困县认定

🇨🇳 国家级贫困县认定与转移支付

断点：人均 GDP 低于某阈值 → 认定为国家级贫困县 → 获得大量专项转移支付

研究设计：

比较人均 GDP 恰好低于阈值的县（获得政策）与恰好高于阈值的县（未获政策）
这两类县在经济发展水平上几乎相同
两者在公共服务质量、教育支出、道路建设上的差异 → 就是转移支付的因果效应

RDD 的适用条件：

存在一个清晰的、可量化的政策阈值
个体无法精确控制自己是否跨越阈值（否则存在"操纵"问题）

5.8 工具变量法（IV）：先讲人话

💬 用一句话解释 IV

如果政策的实施受到混淆因素的干扰，就找一个'外部推力'——它能推动政策的实施，但自身与结果没有直接关系。通过这个'外部推力'，间接测量政策的因果效应。

经典案例：越战征兵抽签与退伍军人收入（Angrist，1990）

研究问题：参军服役是否影响退伍后的长期收入？
内生性问题：自愿参军的人可能本来就有特殊背景（爱国、冒险、经济条件差……），他们的收入差异未必是"参军"造成的
工具变量：越战期间美国政府用生日抽签决定征兵顺序
- 1到365个号码随机对应每一个生日，抽到小号码的人优先被征召
- 抽签结果与个人能力、家庭背景完全无关——这正是"外生性"的直觉
- 抽到"坏号"→ 被迫参军（工具影响处理变量：相关性）
- 抽签号码本身不直接决定收入（排他性约束）
结论：Angrist 发现参军使退伍军人的年收入降低约15%——这是真正的因果效应

为什么抽签是好工具变量？

老天掷骰子，不看你爸是谁。随机性是工具变量外生性最强的保证。

这也正是 Angrist 获得2021年诺贝尔奖的核心贡献之一——他把"自然发生的随机事件"变成了识别因果效应的利器。

5.9 IV 的逻辑结构

flowchart LR
    Z["🎲 工具变量 Z
    抽签号码
    （纯随机，与个人
    能力完全无关）"] -->|"第一阶段
    抽到坏号→被迫参军
    相关性强且可验证"| D["📋 政策干预 X
    是否参军服役"]
    D -->|"第二阶段
    估计因果效应"| Y["📈 结果变量 Y
    退伍后长期收入"]
    C["⚠️ 混淆变量（不可观测）
    个人能力、家庭背景
    经济动机、爱国情怀"] -.->|"污染
    自愿参军者
    本来就不同"| D
    C -.->|"污染"| Y
    Z -.->|"❌ 排他性约束
    抽签号码不直接
    影响退伍后收入"| Y

    style Z fill:#843c0c,color:#fff
    style C fill:#c55a11,color:#fff
    style D fill:#2e75b6,color:#fff
    style Y fill:#375623,color:#fff

工具变量需满足两个条件：

相关性（Relevance）：\(Z\)（抽签号码）与 \(X\)（是否参军）显著相关——抽到坏号的人确实更多参了军
外生性（Exclusion Restriction）：\(Z\) 只通过 \(X\) 影响 \(Y\)——抽签号码本身不直接影响退伍后收入，只通过"是否被征召"这条路径起作用

5.10 三种方法的横向比较

表 2

方法	核心直觉	关键假设	适用情形	中国财政案例	因果可信度
随机实验 RCT	硬币决定谁受政策	随机分配	可以人为设计政策分配	极少（部分社保试点）	⭐⭐⭐⭐⭐
双重差分 DiD	找命运本来差不多的对照组	平行趋势（政策前走势相同）	政策分批次推进、有时间差	试点城市 vs 非试点城市	⭐⭐⭐⭐
断点回归 RDD	利用政策门槛两边的比较	断点两侧个体可比	政策有明确数值阈值	贫困县认定、税收优惠阈值	⭐⭐⭐⭐
工具变量 IV	找一个间接推力	工具外生且相关	政策受内生变量影响	地形/距离影响基础设施支出	⭐⭐⭐

Part 6 实证研究的标准流程

五步走，缺一不可

6.1 标准五步流程

flowchart LR
    S1["Step 1
    提出因果型
    研究问题"] --> S2["Step 2
    构建理论机制
    （为什么会发生？）"]
    S2 --> S3["Step 3
    识别策略
    （如何重建反事实？）"]
    S3 --> S4["Step 4
    数据收集与
    计量估计"]
    S4 --> S5["Step 5
    稳健性检验
    与政策解读"]

    style S1 fill:#1a3a5c,color:#fff
    style S2 fill:#2e5a88,color:#fff
    style S3 fill:#843c0c,color:#fff
    style S4 fill:#375623,color:#fff
    style S5 fill:#7030a0,color:#fff

💡 Step 3 是核心，也是最难的一步

识别策略的质量，决定了整个研究的可信度。区分'相关分析'与'因果推断'的分水岭，正在于此。

6.2 Step 1：提出因果型研究问题

类型	示例	能否指导政策？
描述性问题	中国教育支出占GDP比重是多少？	❌ 否（只描述现状）
相关性问题	教育支出高的省份，学生成绩更高吗？	⚠️ 不确定
因果型问题	增加教育支出，能否提高学生的长期收入？	✅ 是

好的因果问题的格式：

"如果我们做了X（而不是不做X），Y会改变多少？"

练习：以下哪个是因果型问题？

① 贫困县的公共服务水平比非贫困县低吗？
② 转移支付能否改善贫困县的公共服务水平？
③ 哪些省份财政赤字率最高？

6.3 Step 3 重点：识别策略如何选择？

flowchart TD
    Q["你的研究问题"] --> A{"政策有没有
    明确的数值阈值？"}
    A -->|"有
    （如分数线、收入阈值）"| RDD["✅ 优先考虑 RDD"]
    A -->|"没有"| B{"政策是分批次
    推进的吗？"}
    B -->|"是
    （有时间差）"| DiD["✅ 优先考虑 DiD"]
    B -->|"不是"| C{"能找到外生的
    工具变量吗？"}
    C -->|"能"| IV["✅ 考虑 IV"]
    C -->|"不能"| OLS["⚠️ 只能做OLS回归
    （承认因果识别的局限性）"]

    style Q fill:#1a3a5c,color:#fff
    style RDD fill:#7030a0,color:#fff
    style DiD fill:#2e75b6,color:#fff
    style IV fill:#843c0c,color:#fff
    style OLS fill:#666,color:#fff

6.4 稳健性检验：好研究主动接受挑战

一个可信的实证研究，必须主动回应以下质疑：

质疑	应对方法
核心假设（如平行趋势）不成立？	检验政策前的历史趋势；安慰剂检验
样本选择不同，结论会变？	换不同样本、不同时间段重复估计
还有其他同期政策干扰？	安慰剂检验（把假断点、假时间设在无政策时期）
个体是否在操纵政策分配？	McCrary 密度检验（RDD）；检验协变量平衡

一篇好的实证论文，是这样的：

"我知道你们会有疑问，我已经替你们想到了，结论依然成立。"

而不是："我发现了一个相关关系，希望你们相信它是因果的。"

Part 7 中国财政观察

实证研究速递：2024年减税降费效果评估

观察：中国实证研究的独特机会

有利条件：

幅员辽阔，省际/县际政策差异大，天然提供准实验机会
试点制度（先行先试）创造时间差 → 多期 DiD
丰富的行政数据（税务、海关、企业注册）
近年来行政数据逐步向学术界开放

挑战：

政策执行参差不齐，'名义政策' ≠ '实际执行'
部分数据仍不公开或难以获取
政策往往打包推出，难以分离单一政策效果
地方数据质量参差不齐

观察：研究设计示范

研究问题：2023—2024年延续优化的小微企业增值税免税政策（月销售额10万元以下免征），是否促进了小微企业的存活率和营业收入？

研究设计

要素	内容
识别策略	RDD（明确阈值：月销售额10万元）
断点	10万元/月的销售额阈值
处理组	月销售额 8—10 万的企业（受政策覆盖）
控制组	月销售额 10—12 万的企业（未受覆盖，但几乎同等规模）
结果变量	企业存活率（12个月）；月均营业收入
数据来源	国家税务总局小规模纳税人数据（通过财政部研究机构获取）

观察：识别威胁与应对

最大的担忧：企业是否会故意把销售额压低到9.9万以获得免税？

图 5

观察：政策启示与局限

若研究发现政策效果显著（处理组存活率更高）：

提供了减税政策有效性的因果证据，支持政策续期
可进一步分解：效果在哪些行业、哪些地区更强？（异质性分析）
结合成本（税收收入损失）估算政策净效益

局限性的诚实声明：

RDD 仅能估计断点附近（8—12万月销售额区间）的政策效果——不能直接推广到更大规模企业
短期存活率改善，不一定意味着长期经济效益提升
样本期若有疫情后恢复等宏观因素，需要额外的稳健性检验

2021—2024年诺贝尔经济学奖与因果推断革命

图 6

本讲的整体逻辑

flowchart TD
    A["规范分析
    （应该做什么？）"] -->|"必须建立在"| B["实证分析
    （实际上会发生什么？）"]
    B --> C{"三种方法各有局限"}
    C --> D["纯理论
    → 与现实脱节
    人头税悲剧"]
    C --> E["案例举例
    → 代表性不足
    一个反例就推翻"]
    C --> F["系统实证
    → 大数据时代
    更强、更可信"]
    F --> G["因果推断的核心
    相关 ≠ 因果
    反事实是灵魂"]
    G --> H["三种准实验方法"]
    H --> I["DiD
    找平行对照组"]
    H --> J["RDD
    利用政策门槛"]
    H --> K["IV
    找外生推力"]
    I & J & K --> L["可信的因果效应估计
    支撑政策判断"]

    style A fill:#1a3a5c,color:#fff
    style L fill:#375623,color:#fff
    style D fill:#843c0c,color:#fff
    style E fill:#843c0c,color:#fff
    style F fill:#2e75b6,color:#fff

本讲思考题

规范分析的地基：有人说"我们知道租金管制的规范目标是帮助穷人，所以这是好政策"。请用本讲的框架，指出这句话的逻辑缺陷，并说明需要哪类实证证据才能评判这一政策。
相关 vs. 因果：某市报告"凡是获得政府创业补贴的企业，三年后存活率高达80%，远高于未获补贴企业的60%"。请识别：①这是相关关系还是因果关系？②存在哪种因果识别陷阱？③如何设计一个准实验来检验补贴的真实效果？
方法选择：以下三个研究问题，分别最适合用哪种准实验方法（DiD/RDD/IV）？请说明理由。
- ① 个税免征额从3500元提高至5000元，是否增加了劳动供给？
- ② 2019年部分城市试点的"营业执照秒批"改革，是否促进了创业？
- ③ 政府基础设施支出对GDP增长的因果效应？（提示：基础设施支出和GDP是相互影响的）
理论vs.实证：撒切尔人头税的故事告诉我们什么？如果中国要推行房产税，你认为哪些实证问题是政策设计者必须先回答的？
大数据的价值：为什么大数据（尤其是行政数据）让财政政策评估变得更可信？它解决了什么问题，又带来了哪些新挑战？

课后作业

寻找你身边的"虚假相关"

请搜索或观察一个日常生活或新闻中出现的"A 与 B 正相关"的说法，然后：

写出这个相关关系的陈述（例："每年花更多钱买保健品的人，寿命更长"）
识别可能的遗漏变量：是什么第三因素同时影响了 A 和 B？
如果要验证 A 对 B 的因果效应，你会选择哪种方法？需要什么数据？

提示：可以从以下领域寻找：医疗与健康、教育与收入、财政政策与经济增长、地方政府支出与民众满意度。

下讲预告

第4讲：公共选择理论

中间投票人定理：为什么民主制度总是产生"中庸"政策？
投票悖论：多数规则可以循环，没有稳定的"社会偏好"
选民的理性冷漠：为什么大多数人不去投票，却不是"愚蠢的"？
中国案例：听证会与公众参与预算——制度设计如何影响政策结果？

课前预习建议

2025年某市召开出租车调价听证会，到场的12位"消费者代表"中有8位实际上是出租车司机家属。

这是偶然，还是必然？带着你的判断来上第4讲。

谢谢！

第3讲：实证分析的逻辑——我们怎么知道政策有没有用？

"相关不等于因果。这是现代社会科学最重要的一句话。"

——Joshua Angrist，2021年诺贝尔经济学奖得主

朱奇｜锦城大学 • 财会学院