重构线性代数（一）：基石与视界 —— 向量与线性空间

重构线性代数 (一)：基石与视界 —— 向量与线性空间

在传统的大学课堂上，线性代数往往被教成了一门“算术课”——如何计算矩阵相乘、如何用高斯消元法解方程、如何套公式求逆矩阵。但如果只停留在数字的机械运算上，当你面对计算机图形学、机器学习或高级算法时，你会感到寸步难行。

本系列旨在为你建立线性代数的几何直觉。我们不仅要知道怎么算，更要知道这些数字在“空间”中到底意味着什么。

一切的起点，我们先从向量 (Vector) 开始。

一、向量的三种面孔

对于“什么是向量”，不同领域的人有截然不同的看法：

1. 物理学家的视角：向量是空间中的一个箭头。它决定于两个属性：长度和方向。只要这两个属性不变，你在空间中怎么平移这个箭头，它都是同一个向量。

2. 计算机科学家的视角：向量是有序的数字列表。比如房价预测中的一个向量 [面积, 卧室数, 楼层] = [120, 3, 5]，它纯粹是一个数据结构。

3. 数学家的视角：数学家试图统一前两者。向量可以是任何东西，只要保证两个向量可以相加，且向量可以与标量（实数）相乘，并且这些操作满足一定的规律即可。

我们的几何视角：在建立直觉时，我们采用物理学家的“箭头”模型，但加上一个限制：所有向量的起点都固定在坐标系的“原点 (Origin)”。这样，一个向量就完美对应了空间中的一个点（箭头的终点），而这个点的坐标（如 $ (3, 2) $）就是这个向量的唯一标识。
< img src="https://upload.wikimedia.org/wikipedia/commons/thumb/1/15/Vector_components.svg/500px-Vector_components.svg.png" alt="alt" style="max-width:100%; height:auto; border-radius:8px; margin: 16px 0;" />

_(图：固定在原点的向量，其终点坐标即为向量的代数表示)_

二、空间是如何被“撑”起来的？

1. 基底向量 (Basis Vectors)

在我们的二维平面中，坐标 $ (3, 2) $ 到底是什么意思？其实，它隐含了一个前提：我们选择了两个极其特殊的“参考向量”。通常，我们称指向 X 轴正方向的单位向量为 $ \hat{i} $ (i-hat，通常是 $ [1, 0] $)，指向 Y 轴正方向的单位向量为 $ \hat{j} $ (j-hat，通常是 $ [0, 1] $)。

< img src="https://upload.wikimedia.org/wikipedia/commons/thumb/f/f6/Standard_basis_2D.svg/500px-Standard_basis_2D.svg.png" alt="alt" style="max-width:100%; height:auto; border-radius:8px; margin: 16px 0;" />

_(图：二维平面中最经典的默认基底 $ \hat{i} $ 和 $ \hat{j} $)_

所谓的坐标 $ (3, 2) $，本质上是在说： “把 $ \hat{i} $ 拉伸 3 倍，把 $ \hat{j} $ 拉伸 2 倍，然后把它们首尾相加。”

数学表达式为：

$$ \begin{bmatrix} 3 \\ 2 \end{bmatrix} = 3 \hat{i} + 2 \hat{j} $$

这两个特殊的向量 $ \hat{i} $ 和 $ \hat{j} $，就是我们默认坐标系的基底 (Basis)。

2. 线性组合 (Linear Combination)

对两个向量进行标量乘法（拉伸 / 压缩 / 反向）和向量加法，产生新向量的过程，被称为线性组合。如果有向量 $ \vec{v} $ 和 $ \vec{w} $，以及任意实数 $ a $ 和 $ b $，那么 $ a\vec{v} + b\vec{w} $ 就是它们的一个线性组合。

< img src="https://upload.wikimedia.org/wikipedia/commons/thumb/e/e0/Vector_addition_head_to_tail.svg/500px-Vector_addition_head_to_tail.svg.png" alt="alt" style="max-width:100%; height:auto; border-radius:8px; margin: 16px 0;" />

_(图：通过首尾相接，我们可以直观地看到向量是如何相加组合的)_

3. 张成空间 (Span)

现在，给你两个向量 $ \vec{v} $ 和 $ \vec{w} $，并允许你让 $ a $ 和 $ b $ 取尽世界上所有的实数，你能组合出多少种不同的向量？所有这些能够被组合出来的向量集合，被称为这两个向量的 张成空间 (Span)。

如果 $ \vec{v} $ 和 $ \vec{w} $ 不共线：它们的线性组合可以覆盖整个二维平面。我们说，这两个向量张成了整个二维平面 ($ \mathbb{R}^2 $)。
如果 $ \vec{v} $ 和 $ \vec{w} $ 共线（在同一条直线上）：无论你怎么拉伸和相加，它们的结果都被死死地锁在这一条直线上。它们的张成空间就是一条直线。
如果是两个零向量：它们的张成空间仅仅是原点本身。

核心直觉：基底，就是能够“张成”整个空间的一组向量。

三、信息的冗余与维度的坍缩

这就引出了线性代数中极其核心的一对概念：线性相关 (Linear Dependence) 与 线性无关 (Linear Independence)。

假设我们现在有三个二维向量：$ \vec{v}_1, \vec{v}_2, \vec{v}_3 $。既然 $ \vec{v}_1 $ 和 $ \vec{v}_2 $ 已经足够张成整个二维平面了，那么第三个向量 $ \vec{v}_3 $ 对于“撑起空间”这件事来说，完全是多余的（冗余信息）。

因为 $ \vec{v}_3 $ 既然在这个平面内，它就一定能被表示为 $ \vec{v}_1 $ 和 $ \vec{v}_2 $ 的某种线性组合（即 $ \vec{v}_3 = a\vec{v}_1 + b\vec{v}_2 $）。

< img src="https://upload.wikimedia.org/wikipedia/commons/thumb/c/cd/Coplanar_vectors.svg/500px-Coplanar_vectors.svg.png" alt="alt" style="max-width:100%; height:auto; border-radius:8px; margin: 16px 0;" />
_(图：三个向量如果共面，说明它们线性相关，其中一个完全可以由另外两个组合而来)_

线性相关：如果一组向量中，至少有一个向量可以被其他向量的线性组合表示出来。这意味着这个向量没有为张成空间贡献任何“新的维度”。如果去掉它，张成的空间大小不会改变。

线性无关：如果一组向量中，没有任何一个向量可以由其他向量组合而成。每一个向量都为张成空间贡献了一个全新的维度。

降维打击（坍缩）：想象在三维空间中有三个向量。如果它们线性无关，它们能张成整个 3D 空间（体积）；如果其中一个与另外两个共面（线性相关），它们张成的空间就会被“拍扁”成一个 2D 平面；如果三个全共线，空间就坍缩成了一条 1D 直线。

四、维度与坐标的相对性

有了上面的概念，我们就可以给“基底”下一个极其严谨的定义： 一个空间的基底，是一组严格满足以下两个条件的向量：

1. 它们必须能够张成整个空间（Span the space）。

2. 它们必须是线性无关的（没有冗余）。

基底中包含的向量个数，就是这个空间的维度 (Dimension)。

坐标只是某种基底下的“表象”

大多数人认为 $ (3, 2) $ 就是那个物理存在的箭头。这是错的。 箭头是客观存在的几何实体，而 $ (3, 2) $ 仅仅是一串“密码”或“说明书”。

这本说明书写着：“请取 3 个第一个基向量，加上 2 个第二个基向量。” 如果你使用默认的 $ \hat{i}, \hat{j} $ 作为基底，你会得到一个箭头。但如果外星人使用另一组基底（比如 $ \vec{b}_1, \vec{b}_2 $），按照同一本说明书 $ (3, 2) $ 去组合，拼出来的将是完全不同的另一个物理箭头！

反过来，空间中同一个客观存在的箭头，在我们的眼里坐标是 $ (3, 2) $，在外星人的基底下可能坐标就变成了 $ (-1, 4) $。

终极奥义：坐标系并不是绝对的。矩阵本质上就是一本“外星人字典”，用于在不同的基底（坐标系）之间，对这些“坐标表象”进行翻译和转换。

在下一篇文章《重构线性代数 (二)：矩阵的真正物理意义》中，我们将揭开矩阵的面纱。你会发现，矩阵根本不是枯燥的数字表格，它是对空间进行拉伸、旋转和切变的终极动作！

Hotkeys

菜单

分享

重构线性代数（一）：基石与视界 —— 向量与线性空间