第14章 - 用频率学派和贝叶斯学派两种视角解析两信封悖论

# 两个信封问题 (The Two Envelopes Problem) ## 1. 悖论表述 **设定**：两个外观相同的信封，分别装有金额 $x$ 和 $2x$。随机选择一个信封（记为 $A$），打开前决定是否交换另一个信封（记为 $B$）。 **错误的推导（悖论核心）**：设信封 $A$ 中的金额为 $A$。 1. 若 $B$ 是较多的那个，则 $B = 2A$（概率 0.5）。 2. 若 $B$ 是较少的那个，则 $B = A/2$（概率 0.5）。 3. 计算交换后的期望收益 $E[B]$： $E[B] = 0.5 \times (2A) + 0.5 \times \left(\frac{A}{2}\right) = 1.25A$ **结论**：因为 $1.25A > A$，似乎无论手中金额是多少，交换总是更有利。这违背了问题的对称性。 --- ## 2. 频率学派解析：变量与常量的混淆悖论的根源在于代数符号的**偷换概念**。公式中的 $A$ 被错误地视为一个标量常量，而实际上它是一个依赖于状态的随机变量。 ### 符号定义 * **$x$ (常量)**：较小信封的金额（客观真值，固定不可变）。 * **$A$ (随机变量)**：手中信封的金额。 ### 状态分析我们不能在同一个求和公式中直接提取 $A$，因为 $A$ 在两种情况下的物理意义不同： | 情况 | 概率 | 手中 $A$ 的值 | 另一封 $B$ 的值 | 交换收益 ($B-A$) | | :--- | :--- | :--- | :--- | :--- | | **拿到小份** | 0.5 | $x$ | $2x$ | $+x$ | | **拿到大份** | 0.5 | $2x$ | $x$ | $-x$ | ### 正确的期望计算基于客观常量 $x$ 计算交换的净收益期望 $E[\Delta]$： $E[\Delta] = 0.5 \times (2x - x) + 0.5 \times (x - 2x)$ $E[\Delta] = 0.5(x) + 0.5(-x) = 0$ **结论**：交换的期望收益为 0。错误推导中的 $1.25A$ 实际上混合了“$A=x$ 时的 $2A$”和“$A=2x$ 时的 $A/2$”，这两个项不能在以 $A$ 为基准的系统中直接相加。 --- ## 3. 贝叶斯学派解析：先验分布与观测如果在不知道 $x$ 具体数值的情况下讨论，问题转化为对参数 $x$ 的估计。 ### 悖论的隐式假设推导 $P(B=2A|A) = P(B=A/2|A) = 0.5$ 隐含了一个前提：**先验分布是均匀的**。即假设 $P(x) \propto 1$ 在 $(0, \infty)$ 区间上。 * **数学谬误**：这是一个**非正规先验 (Improper Prior)**，其积分发散，无法归一化。在现实中不存在这样的概率分布。 ### 引入正规先验 (Proper Prior) 假设 $x$ 服从某个合理的先验分布（如正态分布或指数分布），当观测到 $A$ 时，后验概率不再是 0.5/0.5： * 若 $A$ 极小，则 $B=2A$ 的后验概率较大（倾向于换）。 * 若 $A$ 极大，则 $B=A/2$ 的后验概率较大（倾向于不换）。 * 对所有可能的 $A$ 进行加权平均后，总期望收益仍为 0。 ### 不看信封时的推翻 (No Peeking) 若不观测 $A$，利用**全期望公式 (Law of Total Expectation)** 可直接反证悖论。设 $E[B|A]$ 为给定 $A$ 时 $B$ 的条件期望。若悖论成立，即对任意 $A$ 都有 $E[B|A] = 1.25A$： $E[B] = E[ E[B|A] ] = E[ 1.25A ] = 1.25 E[A]$ 由对称性知 $E[B] = E[A]$（盲选两信封地位相同）。 $\therefore E[A] = 1.25 E[A]$ 此方程仅在 $E[A] = 0$ 或 $E[A] = \infty$ 时成立。 **结论**：除非信封金额的期望值为无穷大（如圣彼得堡悖论），否则 $E[B|A] = 1.25A$ 不可能恒成立。 --- ## 4. 方法论总结：如何区分变量与常量在统计建模中，区分“状态 (State)”与“观测 (Observation)”至关重要。 | 维度 | 频率学派视角 | 贝叶斯学派视角 | | :--- | :--- | :--- | | **参数 (如信封金额 $x$)** | **常量 (Constant)** 客观存在，不随观测改变。 | **随机变量 (Random Variable)** 具有概率分布，代表认知的不确定性。 | | **数据 (如手中金额 $A$)** | **随机变量 (Random Variable)** 随抽样过程变化。 | **常量 (Fixed Data)** 一旦观测到，即为固定值，用于更新后验。 | | **判定法则** | **重复实验检查**： 重置实验后数值是否变化？ 否 $\rightarrow$ 常量；是 $\rightarrow$ 变量。 | **时间/因果检查**： 数值是在随机事件前确定的（先验）还是后产生的（数据）？ |