矩阵乘法的四种视角 - 第二种和SVD密切相关

# 矩阵乘法的四种视角通常我们学到的矩阵乘法定义只是一个计算规则，而另外三种视角则带有更强的几何直观，能帮我们看清乘法的本质。 ### 基础准备设矩阵 $A$ 和 $B$ 分别为： $A = \begin{bmatrix} a & b \\ c & d \end{bmatrix}$，$B = \begin{bmatrix} e & f \\ g & h \end{bmatrix}$ 按照标准乘法规则： $AB = \begin{bmatrix} ae+bg & af+bh \\ ce+dg & cf+dh \end{bmatrix}$ --- ### 视角 1：元素视角（点积视角）这是学校里教的最基础的方法： $[AB]_{ij} = A \text{ 的第 } i \text{ 行} \cdot B \text{ 的第 } j \text{ 列}$ 这种方式一次只关注结果矩阵中的一个数字（标量）。 --- ### 视角 2：列视角（线性组合视角） **核心思想：$AB$ 的第 $j$ 列，本质上是 $A$ 作用于 $B$ 的第 $j$ 列。** 如果我们单独观察结果的第一列并进行分解： $\begin{bmatrix} ae+bg \\ ce+dg \end{bmatrix} = e\begin{bmatrix} a \\ c \end{bmatrix} + g\begin{bmatrix} b \\ d \end{bmatrix}$ 你会发现：结果的每一列，其实都是 **$A$ 的各列按照 $B$ 中对应元素进行加权后的“线性组合”**。 **在 SVD（奇异值分解）中的应用：** 在计算 $U\Sigma$ 时，由于 $\Sigma$ 是对角阵，它的第 $j$ 列只有对角线上有一个值 $\sigma_j$。根据列视角，$U\Sigma$ 的第 $j$ 列就是 $U$ 的列的线性组合，结果直接等于 $\sigma_j \mathbf{u}_j$。这直观解释了为什么 $A\mathbf{v}_i = \sigma_i \mathbf{u}_i$。 --- ### 视角 3：行视角 **核心思想：$AB$ 的第 $i$ 行，本质上是 $A$ 的第 $i$ 行在操作整个 $B$。** 把结果的第一行拿出来分解： $\begin{bmatrix} ae+bg & af+bh \end{bmatrix} = a\begin{bmatrix} e & f \end{bmatrix} + b\begin{bmatrix} g & h \end{bmatrix}$ 这意味着：结果的每一行，都是 **$B$ 的各行按照 $A$ 中对应元素进行缩放后的叠加**。 --- ### 视角 4：外积视角（秩-1 矩阵求和）我们可以把整个矩阵乘法拆解为： $AB = \begin{bmatrix} a \\ c \end{bmatrix}\begin{bmatrix} e & f \end{bmatrix} + \begin{bmatrix} b \\ d \end{bmatrix}\begin{bmatrix} g & h \end{bmatrix}$ 在这种视角下，$AB$ 是由一系列 **“秩为 1 的矩阵”** 相加得到的。每一个分量都是 $A$ 的第 $k$ 列与 $B$ 的第 $k$ 行的外积。这种观察方式能让我们一眼看清乘积矩阵的秩（Rank）是如何构成的。 --- ### 总结对照表 |**视角**|**固定对象**|**得到的结果**| |---|---|---| |**元素视角**|一对行列 $(i, j)$|一个孤立的数值（标量）| |**列视角**|$B$ 的第 $j$ 列|$AB$ 的第 $j$ 列| |**行视角**|$A$ 的第 $i$ 行|$AB$ 的第 $i$ 行| |**外积视角**|共有索引 $k$|一个秩-1 矩阵；最终累加成结果| 这四种视角背后的算术逻辑完全一致，区别只在于我们如何“打包”这些计算步骤。