# 两个信封问题 (The Two Envelopes Problem) ## 1. 悖论表述 **设定**: 两个外观相同的信封,分别装有金额 $x$ 和 $2x$。随机选择一个信封(记为 $A$),打开前决定是否交换另一个信封(记为 $B$)。 **错误的推导(悖论核心)**: 设信封 $A$ 中的金额为 $A$。 1. 若 $B$ 是较多的那个,则 $B = 2A$(概率 0.5)。 2. 若 $B$ 是较少的那个,则 $B = A/2$(概率 0.5)。 3. 计算交换后的期望收益 $E[B]$: $E[B] = 0.5 \times (2A) + 0.5 \times \left(\frac{A}{2}\right) = 1.25A$ **结论**:因为 $1.25A > A$,似乎无论手中金额是多少,交换总是更有利。这违背了问题的对称性。 --- ## 2. 频率学派解析:变量与常量的混淆 悖论的根源在于代数符号的**偷换概念**。公式中的 $A$ 被错误地视为一个标量常量,而实际上它是一个依赖于状态的随机变量。 ### 符号定义 * **$x$ (常量)**:较小信封的金额(客观真值,固定不可变)。 * **$A$ (随机变量)**:手中信封的金额。 ### 状态分析 我们不能在同一个求和公式中直接提取 $A$,因为 $A$ 在两种情况下的物理意义不同: | 情况 | 概率 | 手中 $A$ 的值 | 另一封 $B$ 的值 | 交换收益 ($B-A$) | | :--- | :--- | :--- | :--- | :--- | | **拿到小份** | 0.5 | $x$ | $2x$ | $+x$ | | **拿到大份** | 0.5 | $2x$ | $x$ | $-x$ | ### 正确的期望计算 基于客观常量 $x$ 计算交换的净收益期望 $E[\Delta]$: $E[\Delta] = 0.5 \times (2x - x) + 0.5 \times (x - 2x)$ $E[\Delta] = 0.5(x) + 0.5(-x) = 0$ **结论**:交换的期望收益为 0。 错误推导中的 $1.25A$ 实际上混合了“$A=x$ 时的 $2A$”和“$A=2x$ 时的 $A/2$”,这两个项不能在以 $A$ 为基准的系统中直接相加。 --- ## 3. 贝叶斯学派解析:先验分布与观测 如果在不知道 $x$ 具体数值的情况下讨论,问题转化为对参数 $x$ 的估计。 ### 悖论的隐式假设 推导 $P(B=2A|A) = P(B=A/2|A) = 0.5$ 隐含了一个前提:**先验分布是均匀的**。 即假设 $P(x) \propto 1$ 在 $(0, \infty)$ 区间上。 * **数学谬误**:这是一个**非正规先验 (Improper Prior)**,其积分发散,无法归一化。在现实中不存在这样的概率分布。 ### 引入正规先验 (Proper Prior) 假设 $x$ 服从某个合理的先验分布(如正态分布或指数分布),当观测到 $A$ 时,后验概率不再是 0.5/0.5: * 若 $A$ 极小,则 $B=2A$ 的后验概率较大(倾向于换)。 * 若 $A$ 极大,则 $B=A/2$ 的后验概率较大(倾向于不换)。 * 对所有可能的 $A$ 进行加权平均后,总期望收益仍为 0。 ### 不看信封时的推翻 (No Peeking) 若不观测 $A$,利用**全期望公式 (Law of Total Expectation)** 可直接反证悖论。 设 $E[B|A]$ 为给定 $A$ 时 $B$ 的条件期望。若悖论成立,即对任意 $A$ 都有 $E[B|A] = 1.25A$: $E[B] = E[ E[B|A] ] = E[ 1.25A ] = 1.25 E[A]$ 由对称性知 $E[B] = E[A]$(盲选两信封地位相同)。 $\therefore E[A] = 1.25 E[A]$ 此方程仅在 $E[A] = 0$ 或 $E[A] = \infty$ 时成立。 **结论**:除非信封金额的期望值为无穷大(如圣彼得堡悖论),否则 $E[B|A] = 1.25A$ 不可能恒成立。 --- ## 4. 方法论总结:如何区分变量与常量 在统计建模中,区分“状态 (State)”与“观测 (Observation)”至关重要。 | 维度 | 频率学派视角 | 贝叶斯学派视角 | | :--- | :--- | :--- | | **参数 (如信封金额 $x$)** | **常量 (Constant)**<br>客观存在,不随观测改变。 | **随机变量 (Random Variable)**<br>具有概率分布,代表认知的不确定性。 | | **数据 (如手中金额 $A$)** | **随机变量 (Random Variable)**<br>随抽样过程变化。 | **常量 (Fixed Data)**<br>一旦观测到,即为固定值,用于更新后验。 | | **判定法则** | **重复实验检查**:<br>重置实验后数值是否变化?<br>否 $\rightarrow$ 常量;是 $\rightarrow$ 变量。 | **时间/因果检查**:<br>数值是在随机事件前确定的(先验)还是后产生的(数据)? |