▶️ 查看代码
| Unique | Missing Pct. | Mean | SD | Min | Median | Max | Histogram | |
|---|---|---|---|---|---|---|---|---|
| wage | 449 | 0 | 957.9 | 404.4 | 115.0 | 905.0 | 3078.0 | |
| educ | 10 | 0 | 13.5 | 2.2 | 9.0 | 12.0 | 18.0 | |
| exper | 22 | 0 | 11.6 | 4.4 | 1.0 | 11.0 | 23.0 | |
| tenure | 23 | 0 | 7.2 | 5.1 | 0.0 | 7.0 | 22.0 | |
| IQ | 80 | 0 | 101.3 | 15.1 | 50.0 | 102.0 | 145.0 |
第4讲:Markdown 语法
2026年03月25日
提示
本讲只讲一件事:Markdown。我们将用 Wooldridge 教材中"教育对工资的影响"这个经典例子,从头写一篇完整的学术小论文,在写作过程中学会所有基础语法。
轻量级标记语言
Markdown 是由 John Gruber 于 2004 年创建的轻量级标记语言。
核心理念:用「易读易写的纯文本格式」撰写文档,然后转换为 HTML、PDF、Word 等多种格式。
渲染后的样子
教育是影响工资的核心因素。 本文使用 wage2 数据集进行分析。
重要
Markdown 的哲学是内容与格式分离:你专注于写什么,Markdown 负责它看起来怎样。这与 Word 的"所见即所得"恰好相反——Markdown 是"所想即所得"。
Markdown 的优势
常见使用场景
| 场景 | 工具 |
|---|---|
| GitHub 项目说明 | README.md |
| 学术论文/报告 | Quarto / R Markdown |
| 课程讲义(本课件!) | Quarto + RevealJS |
| 技术博客 | Hugo / Jekyll |
| 数据分析报告 | R Markdown |
| 交互式笔记本 | Jupyter Notebook |
注记
本课件就是用 Quarto(Markdown 的超集)写的。 你现在看到的每一张幻灯片,背后都是纯文本的 .qmd 文件。
标题 · 段落 · 强调 · 列表
渲染效果
# H1 → 文章总标题(最大)
## H2 → 一级节标题
### H3 → 二级节标题
#### H4 → 三级节标题(较小)
注记
三条规则:
# 号后面必须有一个空格:# 标题 ✓ #标题 ✗Markdown 源码
渲染效果
教育是影响个人收入的核心因素之一。Mincer(1974)的研究奠定了人力资本理论的基础。
本文使用 Wooldridge(2016)教材中的 wage2 数据集,探讨受教育年限对月薪的影响。
行末加两个空格
可以在段落内换行。
警告
最常见的错误:直接按回车换行,在 Markdown 里不会产生新段落!必须空一整行才是新段落,或者行末加两个空格才能强制换行。
Markdown 源码
渲染效果
受教育年限的影响在 ceteris paribus(其他条件不变)的假设下进行估计。
本研究发现:每增加一年教育,月薪平均上升约 8%,该结果在 1% 水平显著。
数据集为 wage2,共有 935 个观测,关键变量为 educ(受教育年限)。
提示
三种强调的使用时机:
*斜体* 或 _斜体_:外文术语(ceteris paribus)、书名、需要轻微强调的词**加粗** 或 __加粗__:核心结论、重要数字、关键概念`行内代码`:变量名(educ)、函数名(lm())、文件名(wage2.csv)无序列表(- / * / +)
效果:
注记
嵌套列表用 2 个或 4 个空格缩进,不要用 Tab;有序列表的数字可以全写 1.,Markdown 会自动编号。
围栏代码块 · LaTeX 数学公式
用三个反引号(```)开始和结束,并在开头指定语言名称:
渲染后会显示带语法高亮的代码块:
注记
语言标识(r、python、bash、sql、text)让渲染引擎对代码进行语法高亮。不加语言标识也能显示代码块,只是没有颜色。
Markdown 使用 LaTeX 语法书写数学公式,这是学术写作的国际标准。
行内公式:用单个 $ 包裹
渲染效果:Mincer(1974)的工资方程为 \(\ln(w_i) = \alpha + \beta_1 s_i + \beta_2 x_i + \beta_3 x_i^2 + \varepsilon_i\),其中 \(s_i\) 为受教育年限,\(x_i\) 为工作经验年数。
| 效果 | 代码 | 效果 | 代码 |
|---|---|---|---|
| \(\alpha, \beta, \gamma\) | \alpha, \beta, \gamma |
\(\hat{\beta}\) | \hat{\beta} |
| \(x^2, x^{10}\) | x^2, x^{10} |
\(\bar{x}\) | \bar{x} |
| \(x_i, x_{ij}\) | x_i, x_{ij} |
\(\tilde{x}\) | \tilde{x} |
| \(\sum_{i=1}^{n}\) | \sum_{i=1}^{n} |
\(\varepsilon\) | \varepsilon |
| \(\frac{a}{b}\) | \frac{a}{b} |
\(\infty\) | \infty |
| \(\sqrt{x}\) | \sqrt{x} |
\(\neq, \leq, \geq\) | \neq, \leq, \geq |
| \(X^\top\) | X^\top |
\(\ln, \log\) | \ln, \log |
提示
不需要背住所有符号!遇到不会写的公式,在 Myscript 上画出符号就能找到对应的 LaTeX 代码。
表格对齐 · 块引用 · 超链接 · 脚注
| 和 - 画出来渲染效果:
| 变量 | 含义 | 均值 | 标准差 |
|---|---|---|---|
| wage | 月薪(美元) | 957.9 | 404.4 |
| educ | 受教育年限 | 13.5 | 2.2 |
| exper | 工作经验(年) | 11.6 | 4.4 |
| tenure | 在职年限(年) | 7.2 | 5.5 |
注记
对齐规则::--- 左对齐(文字列);:---: 居中;---: 右对齐(数字列)。数字列右对齐是学术表格的惯例,方便对比大小。
块引用(>)
教育的回报不仅体现在工资上,还体现在就业稳定性、职业发展和非货币收益中。
——Wooldridge, Introductory Econometrics, 2016
超链接
数据来源于 Wooldridge R 数据包。
水平分割线:用三个或以上的 -、* 或 _ 单独成行
转义字符:在特殊符号前加 \ 可以显示原始字符
需要转义的字符:\ * _ # [ ] ( ) { } . ! + - =
提示
什么时候需要转义? 当你想在正文中显示 *、#、` 等 Markdown 特殊字符的字面意思时,就在它前面加一个反斜杠 \。
把所有语法融入一篇学术小论文
接下来,我们用 Markdown 从头写一篇完整的学术小论文:
论文题目
《教育对工资的影响:来自 NLSY 的证据》
数据
Wooldridge(2016)教材附带的 wage2 数据集,来自美国全国青年纵向调查(NLSY),包含 935 名男性劳动者在 1980 年的观测记录。
论文结构
# 教育对工资的影响:来自 NLSY 的证据
## 一、引言
### 1.1 研究背景
### 1.2 研究问题
## 二、数据与变量
### 2.1 数据来源
### 2.2 描述统计
## 三、实证模型
## 四、主要结果
## 五、结论
## 参考文献
# 教育对工资的影响:来自 NLSY 的证据
**作者**:张三
**日期**:2026年3月27日
---
## 一、引言
### 1.1 研究背景
教育是人力资本理论(*human capital theory*)的核心议题之一。
**Mincer(1974)**首次将受教育年限与工作经验纳入工资方程,
确立了现代劳动经济学的基本分析框架。
> 教育投资的私人回报率在发达国家约为 6%–10%,
> 在发展中国家更高,可达 10%–15%。
> ——Psacharopoulos & Patrinos, 2018
### 1.2 研究问题
本文的核心问题是:**每多接受一年教育,月薪平均增加多少?**
本文利用 `wage2` 数据集($N=935$)进行 OLS 估计。数据来自 Wooldridge R 数据包 中的 wage2 数据集,原始来源为美国全国青年纵向调查(NLSY)。
表1列示了主要变量的描述统计。
| Unique | Missing Pct. | Mean | SD | Min | Median | Max | Histogram | |
|---|---|---|---|---|---|---|---|---|
| wage | 449 | 0 | 957.9 | 404.4 | 115.0 | 905.0 | 3078.0 | |
| educ | 10 | 0 | 13.5 | 2.2 | 9.0 | 12.0 | 18.0 | |
| exper | 22 | 0 | 11.6 | 4.4 | 1.0 | 11.0 | 23.0 | |
| tenure | 23 | 0 | 7.2 | 5.1 | 0.0 | 7.0 | 22.0 | |
| IQ | 80 | 0 | 101.3 | 15.1 | 50.0 | 102.0 | 145.0 |
样本中受教育年限的均值为 13.47 年, 月薪的均值约为 958 美元1。
参考 Mincer(1974)的经典设定,基准工资方程为:
\[ \ln(\text{wage}_i) = \beta_0 + \beta_1 \cdot \text{educ}_i + \varepsilon_i \tag{1} \]
其中:
在基准模型基础上,依次加入工作经验及其平方项:
\[ \ln(\text{wage}_i) = \beta_0 + \beta_1 \text{educ}_i + \beta_2 \text{exper}_i + \beta_3 \text{exper}_i^2 + \beta_4 \text{tenure}_i + \varepsilon_i \tag{2} \]
用 R 语言估计模型(2)的代码如下:
library(jtools)
model1 <- lm(log(wage) ~ educ,
data = wage2)
model2 <- lm(log(wage) ~ educ + exper + I(exper^2) + tenure + IQ,
data = wage2)
export_summs(model1, model2,
model.names = c("模型1", "模型2"),
coefs = c("教育年限" = "educ",
"工作经验" = "exper",
"工作经验^2" = "I(exper^2)" ,
"当前任职年限" = "tenure",
"智商" = "IQ"))| 模型1 | 模型2 | |
|---|---|---|
| 教育年限 | 0.06 *** | 0.06 *** |
| (0.01) | (0.01) | |
| 工作经验 | 0.02 | |
| (0.01) | ||
| 工作经验^2 | -0.00 | |
| (0.00) | ||
| 当前任职年限 | 0.01 *** | |
| (0.00) | ||
| 智商 | 0.01 *** | |
| (0.00) | ||
| N | 935 | 935 |
| R2 | 0.10 | 0.18 |
| *** p < 0.001; ** p < 0.01; * p < 0.05. | ||
本文的主要发现如下:
回报率的经济含义:假设某人当前月薪为 1000 美元,多读一年书预期月薪将上升约 60 美元。
提示
完整论文的文件只有一个 .md 文件,打开就是纯文本,用任意编辑器即可编辑。用 Pandoc 或 Quarto 一行命令就能把它转换成 PDF、Word 或网页。
| 语法 | 效果 |
|---|---|
# H1 ## H2 ### H3
|
标题层级 |
**加粗** / *斜体*
|
加粗 / 斜体 |
`行内代码` |
行内代码(变量名、函数名) |
```` |
代码块(带语言高亮) |
$公式$ / $$公式$$
|
行内 / 独立数学公式 |
- 无序 / 1. 有序
|
列表(可嵌套,用2空格缩进) |
\| A \| B \| + \|---\|---\|
|
表格(:--- 左对齐,---: 右对齐) |
> 引用文字 |
块引用 |
[文字](URL) |
超链接 |
[^1] / [^1]: 内容
|
脚注 |
--- |
水平分割线 |
| 空一行 | 新段落(最核心的规则!) |
Markdown 是什么:轻量级纯文本标记语言;核心理念是内容与格式分离;一次编写,多处发布(HTML / PDF / Word)
标题与段落:# 号控制标题层级,# 后必须有空格;空一整行才是新段落,直接回车不换段
强调与代码:**加粗** 表达核心结论;*斜体* 用于术语和书名;`反引号` 标记变量名和函数名;三重反引号 + 语言名创建代码块
数学公式:$...$ 行内公式;$$...$$ 独立居中公式;使用标准 LaTeX 语法,学术写作必备技能
表格与引用:用 | 和 - 绘制表格;:---: 控制对齐;> 块引用;[文字](URL) 超链接;[^1] 脚注
R Markdown:Markdown 的超集;代码块嵌入可执行 R 代码;行内代码自动嵌入计算结果;本讲所学 Markdown 语法完全通用,直接平移
> 插入一段学术引用,在研究问题句中对核心问题加粗wage、educ、exper 三个变量,文字列左对齐,数字列右对齐$$...$$ 写出公式(2)的完整 Mincer 扩展方程(含经验平方项).Rmd 文件:YAML 头部设置标题和作者,用代码块加载 wage2 并运行 summary(),用行内代码在正文中嵌入样本量和均值## 参考文献 下的无序列表),用 Markdown 正确标注斜体书名、期刊名,至少包含本讲提到的三篇文献第5讲:数据导入、清洗与整理(tidyverse 初步)
readr / readxl:高效读取 CSV、Excel 等多种格式数据tidyr:宽表变长表,pivot_longer() / pivot_wider()
dplyr:数据操作的"瑞士军刀"
filter()、select()、mutate()、summarise()、group_by()
|>(%>%)提示
学完第5讲,你就能用 R + Markdown 写出一份真正「端到端」的数据分析报告——从读取原始数据到输出 PDF 报告,全程可重复。
第4讲:Markdown 语法
「写作是思维的镜子;Markdown 让你专注于思维本身,而非格式的打磨。」
数据挖掘与R语言 | 第4讲:Markdown 语法