Harris
发布于 2026-03-24 / 12 阅读
0
0

重构线性代数(一):基石与视界 —— 向量与线性空间

重构线性代数 (一):基石与视界 —— 向量与线性空间


在传统的大学课堂上,线性代数往往被教成了一门“算术课”——如何计算矩阵相乘、如何用高斯消元法解方程、如何套公式求逆矩阵。但如果只停留在数字的机械运算上,当你面对计算机图形学、机器学习或高级算法时,你会感到寸步难行。


本系列旨在为你建立线性代数的几何直觉。我们不仅要知道怎么算,更要知道这些数字在“空间”中到底意味着什么。


一切的起点,我们先从向量 (Vector) 开始。


一、 向量的三种面孔


对于“什么是向量”,不同领域的人有截然不同的看法:


1. 物理学家的视角:向量是空间中的一个箭头。它决定于两个属性:长度和方向。只要这两个属性不变,你在空间中怎么平移这个箭头,它都是同一个向量。


2. 计算机科学家的视角:向量是有序的数字列表。比如房价预测中的一个向量 [面积, 卧室数, 楼层] = [120, 3, 5],它纯粹是一个数据结构。


3. 数学家的视角:数学家试图统一前两者。向量可以是任何东西,只要保证两个向量可以相加,且向量可以与标量(实数)相乘,并且这些操作满足一定的规律即可。


我们的几何视角: 在建立直觉时,我们采用物理学家的“箭头”模型,但加上一个限制:所有向量的起点都固定在坐标系的“原点 (Origin)”。 这样,一个向量就完美对应了空间中的一个点(箭头的终点),而这个点的坐标(如 $ (3, 2) $)就是这个向量的唯一标识。
< img src="https://upload.wikimedia.org/wikipedia/commons/thumb/1/15/Vector_components.svg/500px-Vector_components.svg.png" alt="alt" style="max-width:100%; height:auto; border-radius:8px; margin: 16px 0;" />

_(图:固定在原点的向量,其终点坐标即为向量的代数表示)_


二、 空间是如何被“撑”起来的?


1. 基底向量 (Basis Vectors)


在我们的二维平面中,坐标 $ (3, 2) $ 到底是什么意思? 其实,它隐含了一个前提:我们选择了两个极其特殊的“参考向量”。通常,我们称指向 X 轴正方向的单位向量为 $ \hat{i} $ (i-hat,通常是 $ [1, 0] $),指向 Y 轴正方向的单位向量为 $ \hat{j} $ (j-hat,通常是 $ [0, 1] $)。


< img src="https://upload.wikimedia.org/wikipedia/commons/thumb/f/f6/Standard_basis_2D.svg/500px-Standard_basis_2D.svg.png" alt="alt" style="max-width:100%; height:auto; border-radius:8px; margin: 16px 0;" />

_(图:二维平面中最经典的默认基底 $ \hat{i} $ 和 $ \hat{j} $)_


所谓的坐标 $ (3, 2) $,本质上是在说: “把 $ \hat{i} $ 拉伸 3 倍,把 $ \hat{j} $ 拉伸 2 倍,然后把它们首尾相加。”


数学表达式为:

$$ \begin{bmatrix} 3 \\ 2 \end{bmatrix} = 3 \hat{i} + 2 \hat{j} $$

这两个特殊的向量 $ \hat{i} $ 和 $ \hat{j} $,就是我们默认坐标系的基底 (Basis)


2. 线性组合 (Linear Combination)


对两个向量进行标量乘法(拉伸 / 压缩 / 反向)和向量加法,产生新向量的过程,被称为线性组合。 如果有向量 $ \vec{v} $ 和 $ \vec{w} $,以及任意实数 $ a $ 和 $ b $,那么 $ a\vec{v} + b\vec{w} $ 就是它们的一个线性组合。


< img src="https://upload.wikimedia.org/wikipedia/commons/thumb/e/e0/Vector_addition_head_to_tail.svg/500px-Vector_addition_head_to_tail.svg.png" alt="alt" style="max-width:100%; height:auto; border-radius:8px; margin: 16px 0;" />

_(图:通过首尾相接,我们可以直观地看到向量是如何相加组合的)_


3. 张成空间 (Span)


现在,给你两个向量 $ \vec{v} $ 和 $ \vec{w} $,并允许你让 $ a $ 和 $ b $ 取尽世界上所有的实数,你能组合出多少种不同的向量? 所有这些能够被组合出来的向量集合,被称为这两个向量的 张成空间 (Span)


如果 $ \vec{v} $ 和 $ \vec{w} $ 不共线:它们的线性组合可以覆盖整个二维平面。我们说,这两个向量张成了整个二维平面 ($ \mathbb{R}^2 $)。
如果 $ \vec{v} $ 和 $ \vec{w} $ 共线(在同一条直线上):无论你怎么拉伸和相加,它们的结果都被死死地锁在这一条直线上。它们的张成空间就是一条直线。
如果是两个零向量:它们的张成空间仅仅是原点本身。
核心直觉:基底,就是能够“张成”整个空间的一组向量。

三、 信息的冗余与维度的坍缩


这就引出了线性代数中极其核心的一对概念:线性相关 (Linear Dependence)线性无关 (Linear Independence)


假设我们现在有三个二维向量:$ \vec{v}_1, \vec{v}_2, \vec{v}_3 $。 既然 $ \vec{v}_1 $ 和 $ \vec{v}_2 $ 已经足够张成整个二维平面了,那么第三个向量 $ \vec{v}_3 $ 对于“撑起空间”这件事来说,完全是多余的(冗余信息)


因为 $ \vec{v}_3 $ 既然在这个平面内,它就一定能被表示为 $ \vec{v}_1 $ 和 $ \vec{v}_2 $ 的某种线性组合(即 $ \vec{v}_3 = a\vec{v}_1 + b\vec{v}_2 $)。


< img src="https://upload.wikimedia.org/wikipedia/commons/thumb/c/cd/Coplanar_vectors.svg/500px-Coplanar_vectors.svg.png" alt="alt" style="max-width:100%; height:auto; border-radius:8px; margin: 16px 0;" />

_(图:三个向量如果共面,说明它们线性相关,其中一个完全可以由另外两个组合而来)_


线性相关:如果一组向量中,至少有一个向量可以被其他向量的线性组合表示出来。这意味着这个向量没有为张成空间贡献任何“新的维度”。如果去掉它,张成的空间大小不会改变。
  • 线性无关:如果一组向量中,没有任何一个向量可以由其他向量组合而成。每一个向量都为张成空间贡献了一个全新的维度

  • 降维打击(坍缩): 想象在三维空间中有三个向量。如果它们线性无关,它们能张成整个 3D 空间(体积);如果其中一个与另外两个共面(线性相关),它们张成的空间就会被“拍扁”成一个 2D 平面;如果三个全共线,空间就坍缩成了一条 1D 直线。

    四、 维度与坐标的相对性


    有了上面的概念,我们就可以给“基底”下一个极其严谨的定义: 一个空间的基底,是一组严格满足以下两个条件的向量:


    1. 它们必须能够张成整个空间(Span the space)。


    2. 它们必须是线性无关的(没有冗余)。


    基底中包含的向量个数,就是这个空间的维度 (Dimension)


    坐标只是某种基底下的“表象”


    大多数人认为 $ (3, 2) $ 就是那个物理存在的箭头。这是错的。 箭头是客观存在的几何实体,而 $ (3, 2) $ 仅仅是一串“密码”或“说明书”。


    这本说明书写着:“请取 3 个第一个基向量,加上 2 个第二个基向量。” 如果你使用默认的 $ \hat{i}, \hat{j} $ 作为基底,你会得到一个箭头。 但如果外星人使用另一组基底(比如 $ \vec{b}_1, \vec{b}_2 $),按照同一本说明书 $ (3, 2) $ 去组合,拼出来的将是完全不同的另一个物理箭头!


    反过来,空间中同一个客观存在的箭头,在我们的眼里坐标是 $ (3, 2) $,在外星人的基底下可能坐标就变成了 $ (-1, 4) $。


    终极奥义:坐标系并不是绝对的。矩阵本质上就是一本“外星人字典”,用于在不同的基底(坐标系)之间,对这些“坐标表象”进行翻译和转换。

    在下一篇文章《重构线性代数 (二):矩阵的真正物理意义》中,我们将揭开矩阵的面纱。你会发现,矩阵根本不是枯燥的数字表格,它是对空间进行拉伸、旋转和切变的终极动作


    评论