# 矩阵乘法的四种视角 通常我们学到的矩阵乘法定义只是一个计算规则,而另外三种视角则带有更强的几何直观,能帮我们看清乘法的本质。 ### 基础准备 设矩阵 $A$ 和 $B$ 分别为: $A = \begin{bmatrix} a & b \\ c & d \end{bmatrix}$,$B = \begin{bmatrix} e & f \\ g & h \end{bmatrix}$ 按照标准乘法规则: $AB = \begin{bmatrix} ae+bg & af+bh \\ ce+dg & cf+dh \end{bmatrix}$ --- ### 视角 1:元素视角(点积视角) 这是学校里教的最基础的方法: $[AB]_{ij} = A \text{ 的第 } i \text{ 行} \cdot B \text{ 的第 } j \text{ 列}$ 这种方式一次只关注结果矩阵中的一个数字(标量)。 --- ### 视角 2:列视角(线性组合视角) **核心思想:$AB$ 的第 $j$ 列,本质上是 $A$ 作用于 $B$ 的第 $j$ 列。** 如果我们单独观察结果的第一列并进行分解: $\begin{bmatrix} ae+bg \\ ce+dg \end{bmatrix} = e\begin{bmatrix} a \\ c \end{bmatrix} + g\begin{bmatrix} b \\ d \end{bmatrix}$ 你会发现:结果的每一列,其实都是 **$A$ 的各列按照 $B$ 中对应元素进行加权后的“线性组合”**。 **在 SVD(奇异值分解)中的应用:** 在计算 $U\Sigma$ 时,由于 $\Sigma$ 是对角阵,它的第 $j$ 列只有对角线上有一个值 $\sigma_j$。根据列视角,$U\Sigma$ 的第 $j$ 列就是 $U$ 的列的线性组合,结果直接等于 $\sigma_j \mathbf{u}_j$。这直观解释了为什么 $A\mathbf{v}_i = \sigma_i \mathbf{u}_i$。 --- ### 视角 3:行视角 **核心思想:$AB$ 的第 $i$ 行,本质上是 $A$ 的第 $i$ 行在操作整个 $B$。** 把结果的第一行拿出来分解: $\begin{bmatrix} ae+bg & af+bh \end{bmatrix} = a\begin{bmatrix} e & f \end{bmatrix} + b\begin{bmatrix} g & h \end{bmatrix}$ 这意味着:结果的每一行,都是 **$B$ 的各行按照 $A$ 中对应元素进行缩放后的叠加**。 --- ### 视角 4:外积视角(秩-1 矩阵求和) 我们可以把整个矩阵乘法拆解为: $AB = \begin{bmatrix} a \\ c \end{bmatrix}\begin{bmatrix} e & f \end{bmatrix} + \begin{bmatrix} b \\ d \end{bmatrix}\begin{bmatrix} g & h \end{bmatrix}$ 在这种视角下,$AB$ 是由一系列 **“秩为 1 的矩阵”** 相加得到的。每一个分量都是 $A$ 的第 $k$ 列与 $B$ 的第 $k$ 行的外积。这种观察方式能让我们一眼看清乘积矩阵的秩(Rank)是如何构成的。 --- ### 总结对照表 |**视角**|**固定对象**|**得到的结果**| |---|---|---| |**元素视角**|一对行列 $(i, j)$|一个孤立的数值(标量)| |**列视角**|$B$ 的第 $j$ 列|$AB$ 的第 $j$ 列| |**行视角**|$A$ 的第 $i$ 行|$AB$ 的第 $i$ 行| |**外积视角**|共有索引 $k$|一个秩-1 矩阵;最终累加成结果| 这四种视角背后的算术逻辑完全一致,区别只在于我们如何“打包”这些计算步骤。