## 为什么需要向量空间
$\mathbb{F}^{m \times n}$(矩阵集合)在加法和标量乘法下表现良好,但不构成[[Field 域]]——矩阵乘法不交换、非零矩阵未必可逆、非方阵甚至不能相乘。那它**是**什么?我们需要一个名字来称呼"拥有加法和标量乘法、满足一组自然公理、但不要求元素之间能互相乘除"的代数结构。这个名字就是**向量空间**。
定义向量空间不是为了抽象而抽象。$\mathbb{R}^n$(列向量)、$\mathbb{F}^{m \times n}$(矩阵)、$\mathcal{P}(\mathbb{F})$(多项式)、连续函数空间——这些对象的元素形态各异,但它们的加法和标量乘法遵守**同一套规则**。向量空间的定义把这套公共规则提取出来:对抽象向量空间证出的任何定理,同时适用于所有这些具体对象。**证一次,用无数次。**
---
## 定义
设 $V$ 为一个集合,$\mathbb{F}$ 为一个域。在 $V$ 上定义两种运算:
- **加法**:取 $\vec{x}, \vec{y} \in V$,产出 $\vec{x} + \vec{y} \in V$
- **标量乘法**:取 $\lambda \in \mathbb{F}$、$\vec{x} \in V$,产出 $\lambda \vec{x} \in V$
若 $V$ 对两种运算**封闭 (closed)**,且以下八条公理对所有 $\vec{x}, \vec{y}, \vec{z} \in V$ 和所有 $\lambda, \mu \in \mathbb{F}$ 成立,则称 $V$ 为 $\mathbb{F}$ 上的**向量空间 (vector space)**。$V$ 的元素称为**向量 (vector)**,$\mathbb{F}$ 的元素称为**标量 (scalar)**。
**加法公理**
- **A1.** $\vec{x} + \vec{y} = \vec{y} + \vec{x}$(交换律)
- **A2.** $(\vec{x} + \vec{y}) + \vec{z} = \vec{x} + (\vec{y} + \vec{z})$(结合律)
- **A3.** 存在 $\vec{0} \in V$ 使得对所有 $\vec{x}$ 有 $\vec{x} + \vec{0} = \vec{x}$(零向量存在)
- **A4.** 对每个 $\vec{x}$,存在 $-\vec{x}$ 使得 $\vec{x} + (-\vec{x}) = \vec{0}$(加法逆元存在)
**标量乘法公理**
- **M1.** $\lambda(\vec{x} + \vec{y}) = \lambda\vec{x} + \lambda\vec{y}$(标量乘法对向量加法的分配律)
- **M2.** $(\lambda + \mu)\vec{x} = \lambda\vec{x} + \mu\vec{x}$(标量加法对向量缩放的分配律)
- **M3.** $1 \cdot \vec{x} = \vec{x}$(用 1 缩放不改变向量)
- **M4.** $(\lambda\mu)\vec{x} = \lambda(\mu\vec{x})$(连续缩放可合并)
公理的结构值得注意:A1–A4 管理向量之间的加法,M1–M4 管理标量对向量的作用,**M1 和 M2 是桥梁**——它们把域的算术(标量的加法和乘法)与向量空间的几何(向量的加法和缩放)绑在一起。
---
## 向量空间与域的关系:不是退化,而是分工
向量空间不是丢失了乘法的域。两者是**不同种类的对象**,扮演不同角色。
**域是算术**:它提供标量,是计算发生的地方。**向量空间是几何**:它提供舞台,是移动、拉伸、投影、变换发生的地方。域的乘法是**内部的**($\mathbb{F} \times \mathbb{F} \to \mathbb{F}$),向量空间的标量乘法是**外部的**($\mathbb{F} \times V \to V$)——标量从域中来,作用于向量空间,但两个向量之间没有乘法。
这种"缺失"恰恰是向量空间的力量所在。域对自身的维数为 1——它是一条线。向量空间可以有维数 2、3、100、$\infty$。子空间、基、零空间、正交补、特征空间——整套几何机器之所以能存在,正是因为向量空间**放弃了**内部乘法,从而打开了高维几何的空间。
精确的数学关系是:**每个域都是自身上的向量空间**,但向量空间几乎从不是域。域是特例——一个恰好还携带了内部乘法的向量空间。向量空间是更宽广、更灵活的概念。
---
## 具体例子
**$\mathbb{R}^n$ 及逐分量运算。** 向量是实数的 $n$ 元组,加法逐分量进行,标量乘法将每个分量乘以同一标量。八条公理全部由 $\mathbb{R}$ 的域性质逐坐标保证。
**$\mathbb{F}^{m \times n}$(矩阵)及矩阵加法和标量乘法。** 这里"向量"是 $m \times n$ 矩阵。运算与 $\mathbb{R}^n$ 完全相同——逐元素加法、逐元素缩放。$\mathbb{F}^{m \times n}$ 和 $\mathbb{F}^{mn}$ 作为向量空间是**同构的**:一个 $3 \times 5$ 矩阵有 15 个元素,展开成长度 15 的列向量,加法和标量乘法的行为完全一致。矩形排列是为矩阵乘法服务的,而矩阵乘法不属于向量空间结构。
这揭示了一个重要的概念区分:"**向量**"不等于"一列数"。向量是**向量空间的元素**。当向量空间为 $\mathbb{R}^{3 \times 5}$ 时,一个 $3 \times 5$ 矩阵就是合格的"向量"。
**零空间 (null space)。** 对任何 $m \times n$ 矩阵 $A$,齐次方程组 $A\vec{x} = \vec{0}$ 的解集 $W = {\vec{x} \in \mathbb{R}^n \mid A\vec{x} = \vec{0}}$ 构成 $\mathbb{R}^n$ 的子空间。验证:零向量属于 $W$($A\vec{0} = \vec{0}$);若 $A\vec{x} = \vec{0}$ 且 $A\vec{y} = \vec{0}$,则 $A(\vec{x}+\vec{y}) = A\vec{x} + A\vec{y} = \vec{0}$,从而 $\vec{x}+\vec{y} \in W$;若 $A\vec{x} = \vec{0}$,则 $A(\lambda\vec{x}) = \lambda A\vec{x} = \vec{0}$,从而 $\lambda\vec{x} \in W$。
具体例子:$A = \begin{pmatrix} 1 & 2 & -1 \ 0 & 1 & 3 \end{pmatrix}$。方程组给出 $x_2 = -3x_3$,$x_1 = 7x_3$。解集为 $W = {t(7, -3, 1)^T \mid t \in \mathbb{R}}$——$\mathbb{R}^3$ 中过原点的一条直线。
**零和向量 (zero-sum vectors)。** $W = {\vec{x} \in \mathbb{R}^n \mid \sum x_i = 0}$。这构成子空间:两个零和向量之和仍是零和的,标量缩放保持零和性质。条件 $\sum x_i = 0$ 等价于 $\mathbf{1}^T \vec{x} = 0$(其中 $\mathbf{1} = (1,1,\ldots,1)$),所以 $W$ 就是行向量 $\mathbf{1}^T$ 的**零空间**。
在金融中,若 $x_i$ 表示在资产 $i$ 上的美元头寸,$\sum x_i = 0$ 意味着**做多的金额等于做空的金额**——这就是**美元中性 (dollar neutral)** 组合。子空间结构告诉你:任意两个美元中性组合相加或缩放后仍是美元中性的,线性代数的全套工具(基、维数、投影)可以直接应用于这个约束集。