线性代数笔记

0. 概要

主要记录一些比较重要的结论及一些概念的几何意义
参考书籍: Linear Algebra and Its Applications (<<线性代数及其应用>> 机械工业出版社)

1. 线性代数中的线性方程组

  1. 齐次方程$A\pmb{x}=0$(其中$A$是$m\times n$的矩阵)有平凡解的充要条件是: 方程至少有一个自由变量

    平凡解即非零解
    也就是矩阵$A$代表着从高维空间到低维空间的映射(三维空间映射到二维平面)
    此时所有解组成高维空间里一个过零点的直线/平面等(解组成的空间的维度等于高低维度的维度差)

  2. 对于非齐次方程$A\pmb{x}=b$(其中$A$是$m\times n$的矩阵)来说,其解集可以通过将$A\pmb{x}=0$的解集平移向量$p$得到,其中$p$为$A\pmb{x}=b$任意一个特解.

    此结论适用的条件是$A\pmb{x}=b$至少有一个特解

  3. 有$R^n$中的一组向量${v_1,v_2,\dots,v_p}$.
    如果存在不全为 0 的一组权${c_1,\dots ,c_p}$使得$c_1v_1+c_2v_2+\dots +c_pv_p=0$
    则称这组向量线性相关,否则称其线性无关

    矩阵$A$的各个列向量线性无关的充要条件是$A\pmb{x}=0$只有平凡解
    线性无关代表 $n$ 个向量可以张成一个 $n$ 维的空间

    如果一个集和$S={v_1,\dots ,v_p}$线性相关则 S 中至少一个向量是其他向量的线性组合(在其他向量张成的空间中)
    若 S 线性相关且$v_1\ne 0$,则某个$v_j(j>1)$是其前面向量${v_1,\dots ,v_{j-1}}$的线性组合

    线性相关时会有向量是其他向量的线性组合,但是不是所有向量都是其他向量的线性组合

  4. 线性变换

    映射(变换)$T$是线性的,若

    1. 对 T 定义域的一切$\pmb{u} ,\pmb{v}$有$T(\pmb{u}+\pmb{v})=T(\pmb{u})+T(\pmb{v})$
    2. 对 T 定义域的一切$\pmb{u}$和数字$c$,有$T(c\pmb{u})=cT(\pmb{u})$
  5. 线性变换的矩阵表示

    设$T:R^n\rightarrow R^m$为线性变换,则存在唯一矩阵 $A$,对 $\forall x\in R^n$,有 $T(x)=Ax$
    此时矩阵$A$是$m\times n$矩阵,其值为$A=[T(e_1),\dots ,T(e_n)]$,其中 $e_i$ 为 $R^n$ 中单位矩阵的第 $i$ 列
    $A$ 称为变换 $T$ 的标准矩阵

2. 矩阵代数

  1. 矩阵的转置

    若干个矩阵乘积的转置等于他们转置的乘积,但相乘的顺序正好相反
    $(ABC)^T=C^TB^TA^T$

  2. 矩阵的逆

    若干个可逆矩阵乘积的逆等于若干个矩阵逆的乘积,但相乘的顺序正好相反
    $(ABC)^{-1}=C^{-1}B^{-1}A^{-1}$

    若矩阵$A$可逆,则其转置矩阵也可逆,且$(A^T)^{-1}=(A^{-1})^T$

    不可逆矩阵又称为奇异矩阵,可逆矩阵又称为非奇异矩阵

    若$A$可逆,则$[A\ I]$行等价于$[I\ A^{-1}]$

  3. 子空间

    $R^n$中的一个子空间$H$具有三个性质:uu

    1. 包含零向量 u
    2. 对于$H$中任意向量$\pmb{u}\ \pmb{v}$,向量$\pmb{u}+\pmb{v}$属于$H$
    3. 对于$H$中任意向量$\pmb{u}$和标量$c$,向量$c\pmb{u}$属于$H$

    换句话说子向量对加法和乘法封闭

    矩阵$A$的零空间是$A\pmb{x}=0$所有解组成的集和,记为$Nul\ A$
    $m\times n$矩阵$A$的零空间是$R^n$的子空间

  4. 子空间的基

    $R^n$中子空间$H$的一组基是$H$中的一组线性无关向量,其生成$H$
    当这些线性无关向量都是形如$e=(0,\dots ,1,\dots ,0)^T$时,其称为标准基

  5. 矩阵的秩

    定义矩阵$A$的秩($rank\ A$)为$A$的列空间的纬度
    秩定理:如果一个矩阵$A$有$n$列$rank\ A + dim\ Nul\ A=n$

3. 行列式

  1. 如果$A$为三角矩阵,则$det\ A$等于$A$对角线上元素的和

  2. 行列式运算性质

    设$A$是一个方阵

    1. $A$某一行的倍数加到另一行上得到矩阵$B$,则$det\ A=det\ B$
    2. $A$任意两行互换得到矩阵$B$,则$det\ A=-det\ B$
    3. 若$A$任意一行乘以 k 倍得到矩阵$B$,则$det\ A=k\cdot det\ B$
    4. $det\ A=det\ A^T$
    5. $det\ AB=det\ A \times det\ B$
    6. 一般来说,$det\ (A+B)\ne det\ A + det\ B$
  3. 克拉默法则

    设$A$是一个可逆的$n\times n$矩阵,对$R^n$中的任意向量$\pmb{b}$,方程$A\pmb{x}=\pmb{b}$的唯一解可以通过下列公式计算

  4. 伴随公式与求逆公式

    设$A$为$n\times n$的可逆矩阵,设$A_{ij}$为$A$除了第$i$行和第$j$列以外元素组成的子矩阵
    令 $C_{ij}=(-1)^{i+j}det\ A_{ij}$,称$C_{ij}$是$A$的一个余因子
    称下列矩阵为$A$的伴随矩阵 $adj\ A$

    逆矩阵公式:

  5. 行列式的几何意义

    方阵行列式的几何意义:矩阵各列向量组成的几何体的体积(面积)

    由$det\ AB=det\ A \times det\ B$得,$AB$的体积$=$$A$的体积$\times B$的体积

4. 向量空间

  1. 向量空间

    向量空间是一些向量组成的非空集合$V$
    在这个集合上定义了两个运算:加法和标量乘法(标量取实数)
    同时其内任意向量$\pmb{u}\ \pmb{v}\ u\pmb{w}$以及任意标量$c\ d$服从以下条件:

    1. $\pmb{u}+\pmb{v}$属于$V$
    2. $\pmb{u}+\pmb{v}=\pmb{v}+\pmb{u}$
    3. $(\pmb{u}+\pmb{v})+\pmb{w}=\pmb{u}+(\pmb{v}+\pmb{w})$
    4. $V$存在一个零向量$\pmb{0}$使得$\pmb{u}+\pmb{0}=\pmb{u}$
    5. 对于任意$\pmb{u}$,存在$-\pmb{u} \in V$使得$\pmb{u}+(-\pmb{u})=0$
    6. $c\pmb{u}$属于$V$
    7. $c(\pmb{u}+\pmb{v})=c\pmb{u}+c\pmb{v}$
    8. $(c+d)\pmb{u}=c\pmb{u}+d\pmb{u}$
    9. $c(d\pmb{u})=(cd)\pmb{ud}$
    10. $1\pmb{u}=\pmb{u}$

    向量空间$V$的一个子空间是其满足如下条件的子集$H$:

    1. $V$中的零向量也在$H$中
    2. $H$对加法封闭
    3. $H$对乘法封闭
  2. 零空间

    对于矩阵$A$,称$A\pmb{x}=0$的解集为$A$的零空间,写作$Nul A$

  3. 列空间

    $m\times n$的矩阵$A$的列空间是其所有列向量的所有线性组合组成的集合,记为$Col\ A$
    若$A=[\pmb{a_1},\dots,\pmb{a_n}]$,则$Col\ A = Span{\pmb{a_1},\dots,\pmb{a_n}}$

  4. 生成集定理

    令$S={\pmb{v_1},\dots,\pmb{v_p}}$是$A$中的向量集,$H={\pmb{v_1},\dots,\pmb{v_p}}$

    1. 若$\pmb{v_k}$是$S$中其他向量的线性组合,则把其去掉后的$S$仍能生成$H$
    2. 若$H\ne {\pmb{0}}$,则$S$的某一个子集是$H$的一组基
  5. 矩阵的秩

    $A$的秩即$A$列空间的维度
    秩定理: $m\times n$ 的矩阵$A$行空间和列空间的维度相等,且 $rank\ A+dim\ Nul\ A = n$

5. 特征值与特征向量

  1. 特征值与特征向量

    设$A$是$n\times n$的矩阵,$\pmb{x}$是非零向量
    若存在$\lambda$使得$A\pmb{x}=\lambda \pmb{x}$存在平凡解
    则称$\lambda$是$A$的特征值,$\pmb{x}$称为对应于$\lambda$的特征向量

    $det(A-\lambda A)=0$称为$A$的特征方程,其解为$A$的特征值

  2. 特征空间

    $\lambda$是$A$的特征值,当且仅当$(A-\lambda I)\pmb{x}=0$存在平凡解
    上述方程的所有解构成的空间称为$A$对应于$\lambda$的特征空间
    (所有对应于$\lambda$的特征向量加上零向量)

  3. 特征值与特征向量的性质

    1. 三角矩阵的对角线元素是其特征值
    2. 矩阵不相等的特征值对应的特征向量(集合)线性无关
    3. 矩阵行列式的值等于其特征值的乘积
  4. 矩阵相似

    设$A\ B$都是$n\times n$的矩阵,如果存在一个可逆矩阵$P$,使得$P^{-1}AP=B$,则称$A$相似于$B$
    矩阵的相似关系具有反身性(相似于自己),对称性(互相相似),传递性

    相似矩阵具有如下性质:

    1. 相似矩阵的秩相等
    2. 相似矩阵的行列式值相等
    3. 相似矩阵的迹相等
    4. 相似矩阵的特征值相等(特征向量一般不相等)

    矩阵相似的几何意义:两个相似矩阵是同一个线性变换在不同基下的表示(这么看上面的性质就合理了)

  5. 对角化

    如果矩阵$A$相似于对角矩阵,即存在可逆矩阵$P$和对角矩阵$D$,使得$A=PDP^{-1}$,则称$A$可对角化

    对角化定理:
    $A$可对角化的充要条件是其有$n$个线性无关的特征向量
    此时$P$的列向量是$A$的$n$个线性无关的特征向量,$D$对角线元素是对应的特征值

    设$A=PDP^{-1}$,其中$D$为$n\times n$的对角矩阵,若$R^n$的基$\beta$由$P$的列向量组成,则称$D$是变换$\pmb{x}\mapsto A\pmb{x}$的$\beta -$矩阵

  6. 复特征值

    将矩阵特征值扩充至复数域
    原本的实数特征值表示矩阵作用在某一方向向量时的倍乘作用,复数特征值增加了旋转作用

    设$A$是$2\times 2$的实矩阵,有复特征值$\lambda = a-bi(b\ne 0)$及其对应的复特征向量$v$
    则$A=PCP^{-1}$,其中

    关于复数矩阵和复数特征值(向量)比较难以想象…回头再仔细看

  7. 幂算法求严格占优特征值(主特征值)

    设$A$为$n\times n$的矩阵,其特征值$\lambda _1$的绝对值比其他特征值的绝对值都要大(严格大)
    设其特征值为$\lambda_p$,对应的特征向量为$v_p$
    假设$\pmb{x} \in R^n,\pmb{x}=c_1v_1+,\dots ,c_nv_n$
    则$A^k\pmb{x}=c_1(\lambda_1)^kv_1+\dots +c_n(\lambda_n)^kv_n$
    假设$c_1 \ne 0$,令等式两边同时除以$(\lambda_1)^k$

    在 $k \rightarrow \infin$ 时 $(\lambda_1)^{-k}A^k\pmb{x}\rightarrow c_1v_1$.
    也就是$k$足够大的时候,$A^k\pmb{x}$的方向与$v_1$或者$-v_1$几乎一致

    具体算法:

    1. 选择一个最大分量为 1 的初始向量$\pmb{x}$
    2. 对$k=0,1,…$
      1. 计算 $A\pmb{x}_k$
      2. 设 $\mu_k$是 $A\pmb{x}_k$ 中绝对值最大的分量
      3. 计算 $\pmb{x}_{k+1}=(\frac{1}{\mu_k})A\pmb{x}_k$
    3. 几乎对任意 $x_0$,序列 ${\mu_k}$ 近似于主特征值, ${\pmb{x}_k}$ 近似于对应的特征向量
  8. 逆幂法

    在对矩阵的某一个特征值有比较好的初始估值后,可以使用逆幂法进行更精确的计算
    设矩阵$A$的特征值为$\lambda_1,\lambda_2,\dots,\lambda_n$,我们对$\lambda_p$有估值$\alpha$
    令$B = (A-\alpha I)^{-1}$ p
    可以证明$B$的特征值分别是$\frac{1}{\lambda_1-\alpha},\frac{1}{\lambda_2-\alpha},\dots,\frac{1}{\lambda_n-\alpha}$
    $\lambda_i$在$A$中对应的特征向量正是$\frac{1}{\lambda_i-\alpha}$在$B$中对应的特征向量
    又因为$\alpha$是对$\lambda_p$的估值,所以$\frac{1}{\lambda_p - \alpha}$是$B$的严格主特征值
    根据幂乘法计算$\frac{1}{\lambda_p - \alpha}$及其对应的特征向量,即可得到对应的$A$中的特征值与特征向量

    具体算法

    1. 选择一个非常接近$\lambda$的$\alpha$
    2. 选择一个最大分量为 1 的初始向量 $\pmb{x}_0$
    3. 对$k=0,1,…$
      1. 从 $(A-\alpha I)\pmb{y}_k = \pmb{x}_k$ 中解出 $\pmb{y}_k$
      2. 设 $\mu_k$ 是 $\pmb{y}_k$ 中绝对值最大的分量
      3. 计算 $v_k = \alpha + (\frac{1}{\mu_k})$
      4. 计算 $\pmb{x}_{k+1} = (\frac{1}{\mu_k})\pmb{y}_k$
    4. 几乎对任意 $x_0$,序列 ${v_k}$ 近似于特征值 $\lambda$, ${\pmb{x}_k}$ 近似于对应的特征向量

6. 正交性与最小二乘法

  1. 正交补

    如果向量$\pmb{z}$与$R^n$的子空间$W$中任意向量都正交,则称$\pmb{z}$正交于$W$
    与$W$正交的所有向量的集合称为$W$的正交补,记作$W^\bot$
    ($W^\bot$是$R^n$的一个子空间)

    假设$A$是$m\times n$矩阵,则$A$行空间的正交补是$A$的零空间,$A$列空间的正交补是$A^T$的零空间
    即$(Row\,A)^{\bot} = Nul\,A\ ,\ (Col\,A)^{\bot} = Nul\,A^T$

  2. 正交基

    一个 $m\times n$ 矩阵 $U$ 具有单位正交列的充要条件是 $U^TU=I$

  3. 格拉姆-施密特方法

    格拉姆-施密特方法是求$R^n$的非零子空间正交基/标准正交基的算法

    对$R^2$的子空间$W$的一个基$\pmb{x}_1,\dots,\pmb{x}_p$
    定义

    则${\pmb{v}_1,\dots,\pmb{v}_p}$是$W$的一个正交基
    此外,

    化简得到的正交基即可得到标准正交基

  4. 矩阵的 $QR$ 分解

    如果$m\times n$矩阵$A$的列向量线性无关,那么$A$可以分解成$A=QR$
    $Q$是一个$m\times n$矩阵,其列向量形成$Col\,A$的一个标准正交基
    $R$是一个$$n\times n$的上三角可逆矩阵,且在对角线上的元素为正数

    $QR$分解过程:

    1. 根据格拉姆-施密特方法求出一组$Col\,A$的一组标准正交基作为$Q$
    2. 由于$R$标准正交,则$Q^TQ=I$,所以$Q^TA = Q^TQR = IR = R$,求出$R$

    根据格拉姆-施密特的公式,可以证明 2 中求得的$R$是上三角可逆矩阵,对角线元素为正数,且是唯一的

  5. 最小二乘法

    如果$m\times n$的矩阵$A$和向量$\pmb{x}$属于$R^n$,则$A\pmb{x}=\pmb{b}$的最小二乘解就是$R^n$中的$\hat{\pmb{x}}$使得

    对于所有$\pmb{x}$成立
    (最小二乘法求得的解是$b$在空间$A$上的投影解出来的解)

    假设$\hat{\pmb{x}}$是最小二乘解,则$\pmb{b}-A\hat{\pmb{x}}$与$R^m$空间正交(也就是$A\pmb{x}$所在的空间)
    此时$A^T(\pmb{b}-A\hat{\pmb{x}})=\pmb{0}$
    化简得到$A^TA\pmb{x}=A^Tb$,这个方程称为$A\pmb{x}=\pmb{b}$的法线方程
    方程$A\pmb{x}=\pmb{b}$的最小二乘解集与$A^TA\pmb{x}=A^Tb$的非空解集一致

  6. 最小二乘法的性质与定理

    设$A$是$m\times n$的矩阵,则下列条件逻辑等价

    1. 对于$R^m$中的任意$\pmb{b}$方程$A\pmb{x}=\pmb{b}$有唯一最小二乘法
    2. $A$的列是线性无关的
    3. 矩阵$A^TA$是可逆的

    满足上述条件之一的(也就是全部满足…),最小二乘解有如下表示:

    结合$QR$分解,最小二乘解还可以用如下表达式计算:

  7. 内积空间

    内积空间等于向量空间加上内积运算$\langle\pmb{u},\pmb{v}\rangle$,内积运算的性质如下:

    1. $\langle\pmb{u},\pmb{v}\rangle=\langle\pmb{v},\pmb{u}\rangle$
    2. $\langle\pmb{u+v},\pmb{w}\rangle=\langle\pmb{u},\pmb{w}\rangle+\langle\pmb{v},\pmb{w}\rangle$
    3. $\langle\pmb{cu},\pmb{v}\rangle=c\langle\pmb{u},\pmb{v}\rangle$
    4. $\langle\pmb{u},\pmb{u}\rangle \ge 0$且$\langle\pmb{u},\pmb{u}\rangle=0$的充要条件是$\pmb{u}=\pmb{0}$
  8. 不等式

    定义内积空间向量的范数$\lVert \pmb{u}\rVert = \sqrt{\langle\pmb{u},\pmb{u}\rangle}$,有如下不等式:
    柯西-施瓦兹不等式:$|\langle\pmb{u},\pmb{v}\rangle| \le \lVert \pmb{u}\rVert\lVert \pmb{v}\rVert$
    三角不等式:$\lVert \pmb{u} + \pmb{v}\rVert \le \lVert \pmb{u}\rVert + \lVert \pmb{v}\rVert$

7. 对称矩阵和二次型

  1. 一些概念的定义

    特征空间:同特征值的特征向量张成的空间,包括零向量(但零向量不是特征向量)
    正交对角化:存在正交矩阵$P,满足P^{-1}=P^T$和一个对角矩阵$D$使得$A=PDP^{-1}$
    矩阵的谱:矩阵特征值的集合

  2. 对称矩阵

    对称矩阵定义为满足 $A^T=A$ 的矩阵

    其有如下性质:

    1. 对称矩阵不同特征空间的任意两个特征向量正交
    2. 矩阵$A$可正交对角化的充要条件是$A$是对称矩阵
  3. 谱定理

    $n\times n$的对称矩阵$A$具有如下性质:

    1. $A$有$n$个实特征值(包括重复的特征值)
    2. 对于一个特征值$\lambda$,其对应的特征空间维数等于其作为特征方程根的重数
    3. 特征空间互相正交
    4. $A$可正交对角化
  4. 谱分解

    设$A=PDP^{-1}$,其中$P$的列是$A$的正交特征向量$\pmb{u}_1,\dots,\pmb{u}_n$
    则$A = \lambda_1\pmb{u}_1\pmb{u}_1^T + \lambda_2\pmb{u}_2\pmb{u}_2^T + \dots + \lambda_n\pmb{u}_n\pmb{u}_n^T$
    称这种$A$的表示方法为谱分解

  5. 二次型

    $R^n$上的二次型是一个定义在$R^n$上的函数,其表达式可以表示为$Q(\pmb{x}) = \pmb{x}^TA\pmb{x}$
    其中$A$是$n\times n$的对称矩阵,此时称$A$为关于二次型的矩阵
    二次型的分类:

    1. 正定二次型:对于所有$\pmb{x}\ne\pmb{0}$有$Q(\pmb{x})\gt0$
    2. 半正定二次型:对于所有$\pmb{x}\ne\pmb{0}$有$Q(\pmb{x})\ge0$
    3. 负定二次型:对于所有$\pmb{x}\ne\pmb{0}$有$Q(\pmb{x})\lt0$
    4. 半负定二次型:对于所有$\pmb{x}\ne\pmb{0}$有$Q(\pmb{x})\le0$
    5. 不定二次型:对于所有$\pmb{x}\ne\pmb{0}$,$Q(\pmb{x})$既有正值也有负值
  6. 二次型的变量代换

    如果$\pmb{x},\pmb{y}$是$R^n$上的向量,$P$是可逆矩阵,$P$的列向量是$R^n$的一组基底
    称$\pmb{x} = P\pmb{y}$或$\pmb{y} = P^{-1}\pmb{x}$是变量代换.
    其中$\pmb{y}$是相对于$P$列向量基底的$\pmb{x}$的坐标向量

    用变量代换处理二次型$\pmb{x}^TA\pmb{x}$
    $\pmb{x}^TA\pmb{x} = (P\pmb{y})^TA(P\pmb{y}) = \pmb{y}^TP^TAP\pmb{y} = \pmb{y}^T(P^TAP)\pmb{y}$

  7. 主轴定理

    设$A$是一个$n\times n$的对称矩阵,则存在一个变量代换$\pmb{x} = P\pmb{y}使得二次型$\pmb{x}^TA\pmb{x}$变成不含交叉乘积项的二次型$\pmb{y}^TD\pmb{y}$
    其中 P 的列称为二次型$\pmb{x}^TA\pmb{x}$的主轴

  8. 奇异值分解(SVD)

    奇异值分解可以看作正交对角化的推广
    对角化把矩阵分解成(坐标系转换)(拉伸)(坐标系逆转换)三个连续的过程(坐标系转换时不改变原图形的体积,即特征值为 1)
    而(坐标系转换)和(坐标系逆转换)则要求坐标系转换是可逆矩阵
    而正交对角化要求(坐标转换矩阵)是正交矩阵

    奇异值分解把矩阵变换分解成(旋转)(拉伸)(旋转)三个连续过程(旋转过程是正交矩阵,同时特征值都是 1)
    可以参考马同学|知乎

    奇异值:
    如果矩阵不是方阵则无法求特征值,奇异值是其推广
    假设$m\times n$的矩阵$A$,则$A^TA$必定是对称矩阵且可以正交对角化
    设${\pmb{v}_1,\dots,\pmb{v}_n}$是$A^TA$的特征向量,且都是单位正交的,$\lambda_1,\dots,\lambda_n$是对应的特征值
    则定义矩阵$A$的奇异值是$A^TA$特征值的平方根(假设为对应的$\sigma_1,\dots,\sigma_n$)
    直观来看$A$的奇异值就是$A\pmb{v}_i$的长度

    假设$A$有$r$个非零奇异值,其对应的$A^TA$中的特征向量为${\pmb{v}_1,\dots,\pmb{v}_r}$
    则${A\pmb{v}_1,\dots,A\pmb{v}_r}$是$Col\,A$的一组正交基,且$rank\,A=r$

    定义一个$m\times n$的”对角矩阵”$\Sigma$:

    其中$D$为对角矩阵,其对角线元素为$A$的非零奇异值
    定义$m\times n$的矩阵$A$的奇异值分解为:$\Sigma = U\Sigma V^T$
    矩阵$U$为$m\times m$的正交矩阵,称其列向量为左奇异向量
    矩阵$V$为$n\times n$的正交矩阵,称其列向量为右奇异向量

  9. 奇异值分解的步骤

    1. 将矩阵$A^TA$对角化,得出$A^TA$的特征值和单位特征向量${\pmb{v}_1,\dots,\pmb{v}_r}$
    2. 根据$A^TA$的特征值得到$\Sigma$(开方得到对角线元素$\sigma_1,\dots,\sigma_n$)
      $A^TA$的单位特征向量即右奇异向量,得到$V$
    3. 将${A\pmb{v}_1,\dots,A\pmb{v}_r}$单位化后得到左奇异向量$\pmb{u}_i = \frac{A\pmb{v}_i}{\sigma_i}$,得到$U$

8. 向量空间的几何学

  1. 仿射组合

    仿射组合是线性组合的一种特殊情况
    仿射组合即在线性组合的条件上加上一条:所有权值相加为 1
    对于$R^n$中的向量$\pmb{v_1},\pmb{v_2},\dots,\pmb{v_p}$存在不全为 0 标量$c_1,c_2,\dots,c_p$使得

    直观上看:

    • 单个向量的仿射组合是其本身的点
    • 两个向量的仿射组合是其两点所在的直线(线性组合是两个向量组成的平面)
    • 三个向量的仿射组合是其三点所在的平面(线性组合是三个向量张成的空间)

    集合$S$中点的所有仿射组合称为$S$的仿射包(或仿射生成集),记为$aff\,S$

    $R^n$中的点$\pmb{y}$是$\pmb{v_1},\pmb{v_2},\dots,\pmb{v_p}$的一个仿射组合,当且仅当$\pmb{y}-\pmb{v_1}$是$\pmb{v_2-v_1},\dots,\pmb{v_p-v_1}$的线性组合

    直观想象(假设在三维空间中)$\pmb{v_2-v_1},\dots,\pmb{v_p-v_1}$的线性组合表示$\pmb{v_1},\pmb{v_2},\dots,\pmb{v_p}$仿射平面平移至原点后的平面(假设称为$P$)
    而如果$\pmb{y}$在原本的仿射平面上,则$\pmb{y}-\pmb{v_1}$则是原本仿射平面上直线平移到原点处的直线,理应在平面$P$上,反之亦然
    (只是直观想象,不是数学证明)

  2. 仿射集合

    如果对于任意实数$t$和任意$\pmb{p},\pmb{q} \in S$,都有$(1-t)\pmb{p}+t\pmb{q} \in S$
    则称集合$S$是仿射的

    $S$是仿射的,当且仅当$S$中每个点的仿射集合都属于$S$
    即当且仅当$S=aff\,S$,S 是仿射的

  3. 关于仿射的一些概念定义

    (在原书 449 页)

    1. $R^n$中的一个集合$S$被平面$\pmb{p}$平移后得到$S+\pmb{p} = {\pmb{s}+\pmb{p}:\pmb{s} \in S}$
    2. $R^n$中的一个平面是$R^n$子空间的一个平移(应该是任意一个平面都可以通过平移子空间得到)
    3. 如果一个平面是另一个平面的平移,则两个平面是平行的
    4. 一个平面的维度是其对应的平移之前的子空间的维度
    5. 一个集合$S$的维度记为$dim\,S$,其等于包含$S$的最小的平面的维度
    6. $R^n$中一条直线是一个维度为$1$的平面
    7. $R^n$中的一个超平面是维度为$n-1$的平面
  4. 仿射的性质

    当且仅当$S$是一个平面的时候,一个非空集合$S$是仿射的
    对于$R^n$中的点$\pmb{v}$,定义其标准齐次形式是$R^{n+1}$中的点$\widetilde{v}=\left[\begin{aligned}&\pmb{v} \&1\end{aligned} \right]$
    对于$R^n$中的点$\pmb{y}$,其是$\pmb{v_1},\pmb{v_2},\dots,\pmb{v_p}$的一个仿射组合当且仅当$\pmb{y}$的标准齐次形式在$Span{\widetilde{v}_2,\dots,\widetilde{v}_p}$中(证明略)

  5. 仿射相关

    以下各个条件逻辑等价:

    1. $S$是仿射相关的
    2. $S$中有一个点是其他点的仿射组合
    3. $R^n$中的集合$\pmb{v_2-v_1},\dots,\pmb{v_p-v_1}$是线性相关的
    4. $R^{n+1}$中的集合${\widetilde{v}_2,\dots,\widetilde{v}_p}$是线性相关的
  6. 重心坐标

    仿射坐标对应的坐标是线性坐标系中的线性坐标,定义如下:
    令$S={\pmb{v}_1,\dots,\pmb{v}_k}$是$R^n$中 的一个仿射无关集,则对$aff\,S$中的每一个点$\pmb{p}$有唯一的表达式

    其中的系数的系数$c_1,c_2,\dots,c_k$称为$\pmb{p}$的重心坐标/仿射坐标

  7. 重心坐标/仿射坐标的几何意义

    假设有三角形$\triangle ABC$,$P$为三角形中的一个点
    $P$对于$A,B,C$三个点的重心坐标是$(p_a,p_b,p_c)^T$

    首先是重心坐标的物理意义:
    在$A,B,C$三个点上分别放置质量分别为$m_a,m_b,m_c$的三个质点,同时限定$m_a+m_b+m_c=1$
    则当$m_a=p_a,m_b=p_b,m_c=p_c$时,三角形$\triangle ABC$的重心刚好在$P$点

    然后是几何意义:
    连接$P$点与$ABC$三点,则$S_{\triangle PBC}:S_{\triangle PAC}:S_{\triangle PAB} = p_a:p_b:p_c$

  8. 凸组合

    仿射组合的约束条件:

    凸组合增加了一个限制: $c_i\ge 0,1\le i \le p$

    一个集合$S$中所有凸组合的集合称为$S$的凸包,记为$conv\,S$
    (直观上看,两个向量形成的凸组合是线段,三个向量形成的凸组合是三角形)

    对于两个向量形成的凸组合称为线段(线段是一个集合):$\pmb{y} = (1-t)\pmb{v}_1 + t\pmb{v}_2,0\le t \le 1$
    写作$\overline{\pmb{v}_1\pmb{v}_2}$

    称一个集合$S$是凸的,则对于每个$\pmb{p},\pmb{q} \in S$,$\overline{\pmb{p}\pmb{q}} \subseteq S$

    集合$S$是凸集,当且仅当$S$中的点的凸组合在$S$中
    即$S$是凸集,当且仅当$S=conv\,S$