线性代数
本笔记基于上海交通大学 马俊老师 2023-2024 学年秋季学期教学内容进行整理。
第 1 章 线性方程组与矩阵
1.1 线性方程组的消元法
数域
- 数集:设 \(F\) 为一个数集,如果 \(F\) 中任意两个数作某种运算的结果仍属于 \(F\),称数集 \(F\) 对这种运算封闭。 \[ \mathbb {N} \subset \mathbb {Z} \subset \mathbb {Q} \subset \mathbb {R} \subset \mathbb {C} \]
- 数域:设 \(F\)
是包含 0 和 1 的数集,若 \(F\)
对四则运算封闭,则称 \(F\)
为一个数域,记为 \(F\).
- 任何数域必定包含有理数域
线性方程组
线性方程组:形如 \[ \begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1\\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = b_2\\ \qquad\vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = b_m \end{cases} \]
的方程组称为一个 \(m\) 行 \(n\) 列的线性方程组,简记为 \(m \times n\) 的线性方程组或线性系统。其中,\(a_{ij},b_i \in F\);\(i=1,2,\cdots,m\);\(j=1,2,\cdots,n\);\(x_1,x_2,\cdots,x_n\) 为未知变量,\(a_{ij}\) 表示第 \(i\) 个方程中第 \(j\) 个未知数 \(x_j\) 前面的系数,\(b_i\) 称为第 \(i\) 个方程的常数项.
方程组的解与解集:
- 若存在一组数 \(c_1,c_2,\cdots,c_n \in F\) 满足方程组每个方程,则称 \(x_1 = c_1,x_2 = c_2,\cdots,x_n = c_n\) 为该方程组的一组解或一个解,记为 \((c_1,c_2,\cdots,c_n)\)。
- 方程组的全体解所构成的集合称为该方程组的解集。
同解方程组:如果两个方程组的解集相同,则称这两个方程组为同解方程组或称两个方程组同解.
线性方程组的消元法(高斯消元法):
- 把第一个变量的系数不为 0 的方程作为方程组的第一个方程,用第一个方程的倍数加到其余方程,使其余方程的第一个变量消失,化为新方程组;
- 在新方程组中,选择第二个变量的系数不为 0 的方程作为新方程组的第二个方程,用此第二个方程的倍数加到下面其余方程,使第二个变量消失;
- 继续这样的步骤,有限步之后得到阶梯状结构的方程组;
- 观察此阶梯状结构方程组中的最后一个非零方程,从而可判断方程组解的情况:唯一解、无解、无穷多解
1.2 矩阵的概念和矩阵的初等行变换
矩阵
矩阵:由 \(m\times n\) 个数 \(a_{ij}\in F\) 排成的 \(m\) 行 \(n\) 列的数表,形如 \[ \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{pmatrix} \quad 或 \quad \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{bmatrix} \]
称为域数 \(F\) 上一个 \(m\times n\) 的矩阵,记为 \((a_{ij})_{m×n}\) 或 \([a_{ij}]_{m×n}\)。其中每个数称为矩阵的一个元素,\(a_{ij}\)表示第 \(i\) 行第 \(j\) 列交叉位置上的元素,也说成 \((i,j)\) 位置上的元素。
- 通常也用大写的黑体英文字母 \(\boldsymbol{A},\boldsymbol{B},\boldsymbol{C},\dots\) 表示矩阵,如矩阵 \(\boldsymbol{A}_{m\times n}\) 或 \(\boldsymbol{A}=(a_{ij})_{m \times n}\).
- 特别地,\(1 \times 1\) 的矩阵与数等同,即 \((a)_{1 \times 1}=a\)
增广矩阵:若线性方程组对应系数矩阵为 \(\boldsymbol{A}=(a_{ij})_{m \times n}\),常数项列向量为 \(\boldsymbol{b}=(b_1,b_2,\cdots,b_m)^T\),则将系数矩阵与常数项列向量并列组成的矩阵称为该线性方程组的增广矩阵,记为: \[ \tilde{\boldsymbol{A}} = \left( \begin{array}{cccc|c} a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\ a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} & b_m \\ \hline\vphantom{\Big|} & & \text{系数矩阵} & & \text{常数项} \\ \end{array} \right) \]
矩阵相等:设矩阵 \(\boldsymbol{A} = (a_{ij})_{m \times n}\),\(\boldsymbol{B} = (b_{ij})_{s \times t}\)。如果 \(m = s\),\(n = t\),则称矩阵 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 同型。若矩阵 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 同型,且 \(a_{ij} = b_{ij}\),则称矩阵 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 相等,记作 \(\boldsymbol{A} = \boldsymbol{B}\)。
常用矩阵
零矩阵:元素全为零的矩阵称为零矩阵,记为 \(\boldsymbol{O}_{m \times n}\) 或 \(\boldsymbol{O}\).
行矩阵和列矩阵: 仅有一行(列)的矩阵,称为行(列)矩阵,也称为行(列)向量.
方阵: 行数和列数相同的矩阵。\(n\) 阶方阵记为 \(\boldsymbol{A}_{n}\),其中从 \((1,1)\) 位置到 \((n,n)\) 位置的直线称为方阵的主对角线。主对角线上的元素称为主对角元。
对角矩阵: \(n\) 阶方阵 \(\boldsymbol{A} = (a_{ij})_n\) 中,\(a_{ii} = 0\),\(i \neq j\),称 \(\boldsymbol{A}\) 为对角矩阵,简称对角阵,即 \[ \boldsymbol{A} = \begin{pmatrix} a_{11} & & \\ & a_{22} & \\ & & \ddots & \\ & & & a_{nn} \end{pmatrix} \]
未标出的元素为 \(0\),简记为 \(\boldsymbol{A} = \operatorname{diag}(a_{11},a_{22},\cdots,a_{nn})\).
单位矩阵: 主对角元均为 \(1\) 的对角矩阵称为单位矩阵,记为 \(\boldsymbol{E}_n\) 或 \(\boldsymbol{I}_n\),即 \[ \boldsymbol{E}_n = \begin{pmatrix} 1 & & \\ & 1 & \\ & & \ddots & \\ & & & 1 \end{pmatrix}\]
数量矩阵:主对角元全相等的对角矩阵称为数量矩阵,记为 \(k \boldsymbol{E}_n\),其中 \(k \in F\),即 \[ k \boldsymbol{E}_n = \begin{pmatrix} k & & \\ & k & \\ & & \ddots & \\ & & & k \end{pmatrix}\]
三角矩阵:主对角线上方(下方)元素全为零的方阵称为上(三)角矩阵
- 上三角矩阵: \[ \boldsymbol{A} = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ & a_{22} & \cdots & a_{2n} \\ & & \ddots & \vdots \\ & & & a_{nn} \end{pmatrix},a_{ij} = 0,i > j \]
- 严格上三角矩阵:主对角元也为 0 的上三角矩阵,即 \(a_{ij} = 0,i \geq j\)
- 下三角矩阵与严格下三角矩阵类似,此处略
对称与反对称矩阵:
- 对称矩阵:若方阵 \(\boldsymbol{A}\) 满足 \(\boldsymbol{A} = \boldsymbol{A}^\intercal\),则称 \(\boldsymbol{A}\) 为对称矩阵,即 \(a_{ij} = a_{ji}\)
- 反对称矩阵:若方阵 \(\boldsymbol{A}\) 满足 \(\boldsymbol{A} = -\boldsymbol{A}^\intercal\),则称 \(\boldsymbol{A}\) 为反对称矩阵,即 \(a_{ij} = -a_{ji}\),且 \(a_{ii} = 0\)
矩阵的初等行变换
- 矩阵的初等行变换:
- 交换矩阵的两行: \(r_i \leftrightarrow r_j\)
- 某一行乘以非零常数: \(k r_i \quad (k \neq 0)\)
- 某一行加上另一行的若干倍: \(r_j + k r_i\)(注意不能写成 \(k r_i + r_j\))
- 行阶梯形矩阵与简化行阶梯形矩阵:
- 行阶梯形矩阵(简称:阶梯形矩阵):
- 所有零行(元素全为零的行)都在非零行的下方;
- 每个非零行的首个非零元(称为该行的主元)位于其前一行主元的右侧。
- 简化行阶梯形矩阵(简称:简化阶梯形矩阵、行最简形、规范阶梯形、厄密特(Hermite)标准形):
- 是阶梯形矩阵;
- 主元均为 \(1\) ;
- 主元所在列的其他元素均为 \(0\)。
- 任何一个矩阵都可经过初等行变换化为阶梯形矩阵或简化阶梯形矩阵.
- 行阶梯形矩阵(简称:阶梯形矩阵):
1.3 线性方程组解的判别与求法
解的判别
- 高斯消元法:线性方程组对应的增广矩阵 \(\tilde{\boldsymbol{A}}\)
通过初等行变换化为一个(简化)阶梯形矩阵,通过(简化)阶梯形矩阵求解线性方程组的方法,称为线性方程组的高斯消法.
- 线性方程组的高斯消元法得到的新方程组与原方程组同解.
- 解的判别:对于 \(m \times
n\) 的线性方程组,设其增广矩阵化成阶梯形有 \(r\) 个非零行,对应系数矩阵部分有 \(s\) 个非零行,则:
- 一般地,线性方程组有解的充要条件是 \(s =
r\),且:
- \(s = r = n\),有唯一解;
- \(s = r < n\),有无穷多解;
- \(s < r\),无解.
- 对于齐次线性方程组,由于其增广矩阵的最后一列全为零,所以初等行变换在这一列不会引进非零元,从而增广矩阵经初等行变化到阶梯形矩阵时,其非零行必是系数矩阵的非零行,即
\(s=r\) 总是成立。因此有如下推论:
- \(s=n\),有唯一零解;
- \(s<n\),有无穷多解;
- \(m<n\),必有非零解.
- 一般地,线性方程组有解的充要条件是 \(s =
r\),且:
解的求法
- 非齐次线性方程组的求解:
- 对增广矩阵作初等行变换化到阶梯形;
- 判断解的情况;
- 有解时,进一步作初等行变换化到简化阶梯形;
- 若有唯一解,可直接写出;
- 若有无穷多解,写出简化阶梯形对应的方程组,从而确定自由未知量,写出所有解(称为一般解)
- 齐次线性方程组的求解:
- 对系数矩阵进行初等行变换化到阶梯形;
- 判断解的情况;
- 若只有零解,则直接写出;
- 若有非零解,则写出简化阶梯形对应的方程组,从而确定自由未知量,写出所有解(称为基础解系)
第 2 章 矩阵
2.1 矩阵的运算
矩阵的线性运算
- 数乘:设矩阵 \(\boldsymbol{A}=(a_{ij})_{m \times n}\),\(k \in F\),称矩阵 \((ka_{ij})_{m \times n}\) 为矩阵 \(\boldsymbol{A}\) 与数 \(k\) 的数量乘积,简称数乘,记为 \(k\boldsymbol{A}\)。特别地,将 \((-1)\boldsymbol{A}\) 记为 \(-\boldsymbol{A}\),称为矩阵 \(\boldsymbol{A}\) 的负矩阵.
- 加法:设矩阵 \(\boldsymbol{A}=(a_{ij})_{m \times n}\),\(\boldsymbol{B}=(b_{ij})_{m \times n}\) 是两个同型矩阵,则称矩阵 \(\boldsymbol{C}=(a_{ij}+b_{ij})_{m \times n}\) 为矩阵 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 的和,记为 \(\boldsymbol{A}+\boldsymbol{B}\),称矩阵 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 的差为 \(\boldsymbol{A}-\boldsymbol{B}=\boldsymbol{A}+(-\boldsymbol{B})\).
- 线性性质:设 \(\boldsymbol{A},\boldsymbol{B},\boldsymbol{C}\)
为数域\(F\) 上的同型矩阵,\(k\),\(l\)
\(\in F\),则
- \(\boldsymbol{A} + \boldsymbol{B} = \boldsymbol{B} + \boldsymbol{A}\)(加法交换律)
- \((\boldsymbol{A} + \boldsymbol{B}) + \boldsymbol{C} = \boldsymbol{A} + (\boldsymbol{B} + \boldsymbol{C})\)(加法结合律)
- \(\boldsymbol{A} + \boldsymbol{O} = \boldsymbol{O} + \boldsymbol{A} = \boldsymbol{A}\)
- \(\boldsymbol{A} + (-\boldsymbol{A}) = \boldsymbol{O}\)
- \(1\cdot\boldsymbol{A} = \boldsymbol{A}\)
- \(k(l\boldsymbol{A}) = (kl)\boldsymbol{A} = (lk)\boldsymbol{A} = l(k\boldsymbol{A})\)
- \(k(\boldsymbol{A} + \boldsymbol{B}) = k\boldsymbol{A} + k\boldsymbol{B}\)
- \((k + l)\boldsymbol{A} = k\boldsymbol{A} + l\boldsymbol{A}\)
矩阵的乘法
- 定义:设数域 \(F\) 上的矩阵 \(\boldsymbol{A} =(a_{ij})_{m \times n}\),\(\boldsymbol{B} =(b_{ij})_{n \times s}\),则称矩阵 \(\boldsymbol{C} =(c_{ij})_{m \times s}\) 为矩阵 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 的积,记为 \(\boldsymbol{C} =\boldsymbol{A}\boldsymbol{B}\),其中 \[ c_{ij} = \sum_{k=1}^{n} a_{ik} b_{kj} \]
- 乘法性质:设矩阵 \(\boldsymbol{A}_{m \times n},\boldsymbol{B}_{n
\times s},\boldsymbol{C}_{s \times t}\),\(k \in F\) 为数,假设以下运算均可进行,则:
- \(\boldsymbol{A}\boldsymbol{O}_{n \times s} = \boldsymbol{O}_{m \times s}\),\(\boldsymbol{O}_{s \times m}\boldsymbol{A} = \boldsymbol{O}_{s \times n}\)
- \(\boldsymbol{A}\boldsymbol{E}_n = \boldsymbol{A}\),\(\boldsymbol{E}_m\boldsymbol{A} = \boldsymbol{A}\)
- \(\boldsymbol{A}(\boldsymbol{B}\boldsymbol{C}) = (\boldsymbol{A}\boldsymbol{B})\boldsymbol{C}\)(乘法结合律)
- \((k\boldsymbol{A})\boldsymbol{B} = k(\boldsymbol{A}\boldsymbol{B}) = \boldsymbol{A}(k\boldsymbol{B})\)
- \(\boldsymbol{A}(\boldsymbol{B} + \boldsymbol{C}) = \boldsymbol{A}\boldsymbol{B} + \boldsymbol{A}\boldsymbol{C}\)(左分配律),\((\boldsymbol{A} + \boldsymbol{B})\boldsymbol{C} = \boldsymbol{A}\boldsymbol{C} + \boldsymbol{B}\boldsymbol{C}\)(右分配律)
- 相乘可换:若两个矩阵 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 满足 \(\boldsymbol{A}\boldsymbol{B} = \boldsymbol{B}\boldsymbol{A}\),则称 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 相乘可换。
方阵的幂
- 定义:设 \(n\)
阶方阵 \(\boldsymbol{A}_n\),则 \(k\) 个 \(\boldsymbol{A}\) 相乘称为 \(\boldsymbol{A}\) 的 \(k\) 次幂,记为 \(\boldsymbol{A}^k =
\underbrace{\boldsymbol{A}\boldsymbol{A}\cdots\boldsymbol{A}}_{k \text{
个}}\).
- 规定 \(\boldsymbol{A}^0 = \boldsymbol{E}\).
- 幂的性质:设方阵 \(\boldsymbol{A}_n\),\(k,l \in \mathbb{N}\),则
- \(\boldsymbol{A}^k\boldsymbol{A}^l = \boldsymbol{A}^{k+l}\)
- \((\boldsymbol{A}^k)^l = \boldsymbol{A}^{kl}\)
- \(\boldsymbol{E}^k = \boldsymbol{E}\)
- 一般地,\((\boldsymbol{A}\boldsymbol{B})^k \neq \boldsymbol{A}^k\boldsymbol{B}^k\)
- 由函数决定的方正的多项式:设 \(f(x) = a_m x^m + a_{m-1} x^{m-1} + \cdots + a_0\) 是域数 \(F\) 上关于 \(x\) 的 \(m\) 次多项式,\(A\) 是方阵,\(E\) 为与 \(A\) 同阶的单位矩阵,称 \(f(A) = a_m A^m + a_{m-1} A^{m-1} + \cdots + a_0 E\) 是由 \(f(x)\) 决定的方阵 \(A\) 的多项式。
矩阵的转置
- 定义:设数域 \(F\) 上的矩阵 \(\boldsymbol{A} =(a_{ij})_{m \times n}\),则称矩阵 \(\boldsymbol{A}^T =(a_{ji})_{n \times m}\) 为矩阵 \(\boldsymbol{A}\) 的转置矩阵,记为 \(\boldsymbol{A}^T\) 或 \(\boldsymbol{A}^\prime\).
- 转置的性质:设 \(\boldsymbol{A},\boldsymbol{B},\boldsymbol{C},\boldsymbol{A}_1,\boldsymbol{A}_2,\cdots,
\boldsymbol{A}_m\) 均为矩阵,\(k \in
F\),假设下列运算均可进行,则:
- \((\boldsymbol{A}^T)^T = \boldsymbol{A}\)
- \((\boldsymbol{B} + \boldsymbol{C})^T = \boldsymbol{B}^T + \boldsymbol{C}^T\)
- \((k\boldsymbol{A})^T = k\boldsymbol{A}^T\)
- \((\boldsymbol{A}_1 \boldsymbol{A}_2 \cdots \boldsymbol{A}_m)^T = \boldsymbol{A}_m^T \cdots \boldsymbol{A}_2^T \boldsymbol{A}_1^T\)
- 若 \(\boldsymbol{A}\) 是方阵,则 \((\boldsymbol{A}^m)^T = (\boldsymbol{A}^T)^m\)
- \(\boldsymbol{A} 为对称矩阵 \Longleftrightarrow \boldsymbol{A}^T = \boldsymbol{A}\),\(\boldsymbol{A}\) 为反对称矩阵 \(\Longleftrightarrow \boldsymbol{A}^T = -\boldsymbol{A}\)
方阵的迹
- 迹:设 \(n\) 阶方阵 \(\boldsymbol{A} =(a_{ij})_n\),则称 \(a_{11} + a_{22} + \cdots + a_{nn}\) 为方阵 \(\boldsymbol{A}\) 的迹,记为 \(\operatorname{tr}(\boldsymbol{A}) = \sum_{i=1}^n a_{ii}\).
- 迹的性质:设 \(\boldsymbol{A},9\boldsymbol{B}\) 均为 \(n\) 阶方阵,\(k
\in F\),则:
- \(\operatorname{tr}(\boldsymbol{A} + \boldsymbol{B}) = \operatorname{tr}(\boldsymbol{A}) + \operatorname{tr}(\boldsymbol{B})\)
- \(\operatorname{tr}(k\boldsymbol{A}) = k\operatorname{tr}(\boldsymbol{A})\)
- \(\operatorname{tr}(\boldsymbol{A}\boldsymbol{B}) = \operatorname{tr}(\boldsymbol{B}\boldsymbol{A})\)
- \(\operatorname{tr}(\boldsymbol{A}^T) = \operatorname{tr}(\boldsymbol{A})\)
2.2 方阵的行列式
行列式的定义
二阶行列式:设二阶方阵 \(\boldsymbol{A}=(a_{ij})_{2\times 2}\),称 \[ \left| \begin{array}{cc} a_{11} & a_{12} \\ a_{21} & a_{22} \\ \end{array} \right| = a_{11} a_{22} - a_{12} a_{21} \]
为二阶方阵 \(\boldsymbol{A}\) 的行列式,称为二阶行列式,记为 \(|\boldsymbol{A}|\) 或 \(\operatorname{det}\boldsymbol{A}\),相应的 \(a_{ij}\) 称为该行列式的元素。通常用字母 \(D\) 来表示行列式。
三阶行列式:三阶方阵 \(\boldsymbol{A}=(a_{ij})_{3\times 3}\) 的行列式 \[ |\boldsymbol{A}| = \left| \begin{array}{ccc} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \\ \end{array} \right| = a_{11} \left| \begin{array}{cc} a_{22} & a_{23} \\ a_{32} & a_{33} \\ \end{array} \right| - a_{12} \left| \begin{array}{cc} a_{21} & a_{23} \\ a_{31} & a_{33} \\ \end{array} \right| + a_{13} \left| \begin{array}{cc} a_{21} & a_{22} \\ a_{31} & a_{32} \\ \end{array} \right| \]
n 阶行列式:
- 余子式:设 \(n\) 阶行列式 \(D = |a_{ij}|_n\),去掉第 \(i\) 行第 \(j\) 列所余下的 \((n-1)\) 阶行列式称为元素 \(a_{ij}\) 的余子式,记为 \(M_{ij}\)
- 代数余子式:定义 \(A_{ij} = (-1)^{i+j} M_{ij}\),称为元素 \(a_{ij}\) 的代数余子式
- 行列式的定义:对 \(n\) 阶行列式 \(D
= |a_{ij}|_n\)
- 按第 \(i\) 行展开有 \[ D = \sum_{j=1}^n a_{ij} A_{ij} = a_{i1} A_{i1} + a_{i2} A_{i2} + \cdots + a_{in} A_{in} \]
- 按第 \(j\) 列展开有 \[ D = \sum_{i=1}^n a_{ij} A_{ij} = a_{1j} A_{1j} + a_{2j} A_{2j} + \cdots + a_{nj} A_{nj} \]
行列式的性质
- 方阵 \(\boldsymbol{A}\) 的行列式 \(|\boldsymbol{A}| = |\boldsymbol{A}^T|\)
- 交换一个方阵的某两行(列),其行列式的值变号
- 如果一个方阵的两行(列)相等,则其行列式的值为 0
- 方阵 \(\boldsymbol{A}\)
的某一行(列)乘以 \(k\),即 \(\boldsymbol{A} \xrightarrow{kr_i}
\boldsymbol{B}\),则 \(|\boldsymbol{B}|
= k |\boldsymbol{A}|\)
- 若行列式中某一行(列)有公因子,则该公因子可提到行列式符号外面
- 若行列式中某两行(列)成比例,则该行列式的值为 0
- 若行列式中某一行(列)全为 0,则该行列式的值为 0
- 行列式中某行(列)的所有元素都是两个元素的和,则该行列式可表示为两个行列式之和,即 \[ \left| \begin{array}{c c c c} a_{11} & a_{12} & \ldots & a_{1 n} \\ \vdots & & & \vdots \\ b_{i 1} + c_{i 1} & b_{i 2} + c_{i 2} & \ldots & b_{i n} + c_{i n} \\ \vdots & & & \vdots \\ a_{n 1} & a_{n 2} & \ldots & a_{n n} \end{array} \right| = \left| \begin{array}{c c c c} a_{11} & a_{12} & \ldots & a_{1 n} \\ \vdots & & & \vdots \\ b_{i 1} & b_{i 2} & \ldots & b_{i n} \\ \vdots & & & \vdots \\ a_{n 1} & a_{n 2} & \ldots & a_{n n} \end{array} \right| + \left| \begin{array}{c c c c} a_{11} & a_{12} & \ldots & a_{1 n} \\ \vdots & & & \vdots \\ c_{i 1} & c_{i 2} & \ldots & c_{i n} \\ \vdots & & & \vdots \\ a_{n 1} & a_{n 2} & \ldots & a_{n n} \end{array} \right| \]
- 方阵 \(\boldsymbol{A}\) 的某行(列)加上另一行(列)的若干倍得到方阵 \(\boldsymbol{B}\),即 \(\boldsymbol{A} \xrightarrow{r_j + k r_i} \boldsymbol{B}\),则 \(|\boldsymbol{B}| = |\boldsymbol{A}|\)
- 设方阵 \(\boldsymbol{A}
=(a_{ij})_n\),则 \(|\boldsymbol{A}|\) 等于 \(\boldsymbol{A}\)
的任一行(列)元素与其对应代数余子式乘积之和,即 \[
|\boldsymbol{A}| = \sum_{k=1}^n (-1)^{i+k} a_{ik} M_{ik} = \sum_{k=1}^n
a_{ik} A_{ik}
\]
- 设方阵 \(\boldsymbol{A} =(a_{ij})_n\),则 \(\boldsymbol{A}\) 的第 \(i\) 行(列)元素与第 \(j(\neq i)\) 行(列)对应代数余子式乘积之和为 0,即 \(\sum_{k=1}^n a_{ik} A_{jk} = 0~(i \neq j)\),\(\sum_{k=1}^n a_{ki} A_{kj} = 0~(i \neq j)\)
- 设 \(\boldsymbol{A}\),\(\boldsymbol{B}\) 均为 \(n\) 阶方阵,则有 \(|\boldsymbol{A}\boldsymbol{B}| = |\boldsymbol{A}| \cdot |\boldsymbol{B}|\)
特殊行列式
对角矩阵的行列式 \[ D=\left|\begin{array}{cccc} a_{11} & & & \\ & a_{22} & & \\ & & \ddots & \\ & & & a_{nn} \end{array}\right|=a_{11} a_{22} \cdots a_{nn}=\prod_{i=1}^{n} a_{ii} \]
三角矩阵的行列式: \[ D=\left|\begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1n} \\ & a_{22} & \cdots & a_{2n} \\ & & \ddots & \vdots \\ & & & a_{nn} \end{array}\right|=a_{11} a_{22} \cdots a_{nn}=\prod_{i=1}^{n} a_{ii} \]
Vandermonde 行列式: \[ \begin{aligned} D_{n}&=\left|\begin{array}{cccc} 1 & 1 & \ldots & 1 \\ a_{1} & a_{2} & \ldots & a_{n} \\ a_{1}^{2} & a_{2}^{2} & \ldots & a_{n}^{2} \\ \vdots & \vdots & & \vdots \\ a_{1}^{n - 1} & a_{2}^{n - 1} & \ldots & a_{n}^{n - 1} \end{array}\right| \\ &=\left|\begin{array}{cccc} 1 & 1 & \ldots & 1 \\ 0 & a_{2} - a_{1} & \ldots & a_{n} - a_{1} \\ 0 & a_{2}(a_{2} - a_{1}) & \ldots & a_{n}(a_{n} - a_{1}) \\ \vdots & \vdots & & \vdots \\ 0 & a_{2}^{n - 2}(a_{2} - a_{1}) & \ldots & a_{n}^{n - 2}(a_{n} - a_{1}) \end{array}\right| \\ &=\prod_{i=2}^{n}(a_{i} - a_{1})\left|\begin{array}{cccc} 1 & 1 & \ldots & 1 \\ a_{2} & a_{3} & \ldots & a_{n} \\ a_{2}^{2} & a_{3}^{2} & \ldots & a_{n}^{2} \\ \vdots & \vdots & & \vdots \\ a_{2}^{n - 2} & a_{3}^{n - 2} & \ldots & a_{n}^{n - 2} \end{array}\right| = \prod_{i=2}^{n}(a_{i} - a_{1}) D_{n-1} \\ &=\prod_ {1 \leq j < i \leq n} (a_{i} - a_{j}) \end{aligned} \]
爪形行列式: \[ \begin{aligned} D&=\left|\begin{array}{ccccc} a_{0} & a_{1} & a_{2} & \cdots & a_{n} \\ b_{1} & d_{1} & 0 & \cdots & 0 \\ b_{2} & 0 & d_{2} & \cdots & 0 \\ \vdots & \vdots & \vdots & & \vdots \\ b_{n} & 0 & 0 & \cdots & d_{n} \end{array}\right| \\ &=\left|\begin{array}{ccccc} a_0-\sum_{k=1}^{n} \frac{a_{k}b_{k}}{d_{k}} & a_{1} & a_{2} & \cdots & a_{n} \\ 0 & d_{1} & 0 & \cdots & 0 \\ 0 & 0 & d_{2} & \cdots & 0 \\ \vdots & \vdots & \vdots & & \vdots \\ 0 & 0 & 0 & \cdots & d_{n} \end{array}\right| \\ &=\left(a_{0}-\sum_{k=1}^{n} \frac{a_{k}b_{k}}{d_{k}}\right) d_{1} d_{2} \cdots d_{n} \end{aligned} \]
三对角行列式: \[ D_{n}=\left|\begin{array}{cccccc} a_{1} & b_{1} & & & & \\ c_{2} & a_{2} & b_{2} & & & \\ & c_{3} & a_{3} & b_{3} & & \\ & & \ddots & \ddots & \ddots & \\ & & & c_{n-1} & a_{n-1} & b_{n-1} \\ & & & & c_{n} & a_{n} \end{array}\right| \]
则有递推关系:\(D_{n} = a_{n} D_{n-1} - b_{n-1} c_{n} D_{n-2}\),其中 \(D_{1} = a_{1}\),\(D_{2} = a_{1} a_{2} - b_{1} c_{2}\)
除对角线外元素全相等的行列式: \[ \begin{aligned} D&=\left|\begin{array}{cccc} a_{1} & b & \cdots & b \\ b & a_{2} & \cdots & b \\ \vdots & \vdots & & \vdots \\ b & b & \cdots & a_{n} \end{array}\right| \\ &=\left|\begin{array}{ccccc} 1 & b & b & \cdots & b \\ 0 & a_{1} & b & \cdots & b \\ 0 & b & a_{2} & \cdots & b \\ \vdots & \vdots & \vdots & & \vdots \\ 0 & b & b & \cdots & a_{n} \end{array}\right| \\ &=\left|\begin{array}{ccccc} 1 & b & b & \cdots & b \\ -1 & a_{1} - b & 0 & \cdots & 0 \\ -1 & 0 & a_{2} - b & \cdots & 0 \\ \vdots & \vdots & \vdots & & \vdots \\ -1 & 0 & 0 & \cdots & a_{n} - b \end{array}\right| (爪形)\\ &=\left[1 + b \sum_{i=1}^{n} \frac{1}{a_{i} - b}\right] \left(a_{1} - b\right)\left(a_{2} - b\right) \cdots \left(a_{n} - b\right) \end{aligned} \]
2.3 可逆矩阵
逆矩阵的定义与性质
- 逆矩阵:
- 对 \(n\) 阶方阵 \(\boldsymbol{A}\),若存在 \(n\) 阶方阵 \(\boldsymbol{B}\) 使得 \(\boldsymbol{A B} = \boldsymbol{B A} = \boldsymbol{E}\),则称矩阵 \(\boldsymbol{A}\) 可逆,\(\boldsymbol{B}\) 为 \(\boldsymbol{A}\) 的逆矩阵,记作 \(\boldsymbol{B} = \boldsymbol{A}^{-1}\).
- 反之,若不存在这样的矩阵 \(\boldsymbol{B}\),则称 \(\boldsymbol{A}\) 不可逆或奇异矩阵.
- 伴随矩阵:设 \(n\)
阶方阵 \(\boldsymbol{A}
=(a_{ij})_n\),\(A_{ij}\) 是元素
\(a_{ij}\) 的代数余子式,则称矩阵 \(\boldsymbol{A}^* =(A_{ji})_n\) 为矩阵 \(\boldsymbol{A}\) 的伴随矩阵. \[
\boldsymbol{A}^* = \left( \begin{array}{cccc}
A_{11} & A_{21} & \cdots & A_{n1} \\
A_{12} & A_{22} & \cdots & A_{n2} \\
\vdots & \vdots & & \vdots \\
A_{1n} & A_{2n} & \cdots & A_{nn}
\end{array} \right)
\]
- 即:代数余子式转置排列
- 对于 \(n\) 阶方阵 \(\boldsymbol{A}\),有 \(\boldsymbol{A} \boldsymbol{A}^* = \boldsymbol{A}^* \boldsymbol{A} = |\boldsymbol{A}| \boldsymbol{E}\),\(|\boldsymbol{A}^*| = |\boldsymbol{A}|^{n-1}\),\(\left(\boldsymbol{A}^T\right)^* = \left(\boldsymbol{A}^*\right)^T\)
- 方阵可逆的条件:
- 如果 \(n\) 阶方阵 \(\boldsymbol{A}\) 可逆,则其逆矩阵唯一
- \(n\) 阶方阵 \(\boldsymbol{A}\) 可逆的充分必要条件是 \(|\boldsymbol{A}| \neq 0\),且此时 \(\boldsymbol{A}^{-1} = \frac{1}{|\boldsymbol{A}|} \boldsymbol{A}^*\)
- 对 \(n\) 阶方阵 \(\boldsymbol{A}\),若存在 \(n\) 阶方阵 \(\boldsymbol{B}\) 使得 \(\boldsymbol{A B} = \boldsymbol{E}\)(或 \(\boldsymbol{B A} = \boldsymbol{E}\)),则 \(\boldsymbol{B} = \boldsymbol{A}^{-1}\)
克拉默法则
- 克拉默(Cramer)法则:
- 设 \(n \times n\) 方程组 \(\boldsymbol{A}_n \boldsymbol{X} = \boldsymbol{b}\),其中 \(\boldsymbol{A} = (a_{ij})_n\) 是系数矩阵,\(\boldsymbol{X} = (x_1,x_2,\cdots,x_n)^T\) 是未知数列向量,\(\boldsymbol{b} = (b_1,b_2,\cdots,b_n)^T\) 是常数列向量.
- 若方程组的系数行列式 \(D = |\boldsymbol{A}| \neq 0\),则方程组有唯一解: \[ x_j = \frac{D_j}{D}, j = 1,2,3,\cdots,n \]
- 其中 \(D_j\) 是将行列式 \(D\) 中的第 \(j\) 列替换成 \(\boldsymbol{b}\) 后得到的行列式,即 \[ D_j = \left| \begin{array}{ccccccc} a_{11} & \cdots & a_{1,j-1} & b_1 & a_{1,j+1} & \cdots & a_{1n} \\ a_{21} & \cdots & a_{2,j-1} & b_2 & a_{2,j+1} & \cdots & a_{2n} \\ \vdots & & \vdots & \vdots & \vdots & & \vdots \\ a_{n1} & \cdots & a_{n,j-1} & b_n & a_{n,j+1} & \cdots & a_{nn} \end{array} \right| \]
- 若 \(n \times n\) 的线性方程组
\(\boldsymbol{A}_{n} \boldsymbol{X} =
\boldsymbol{b}\)有唯一解,则方程组的系数行列式 \(D = |\boldsymbol{A}| \neq 0\)。
- \(|\boldsymbol{A}| \neq 0 \Rightarrow \boldsymbol{AX} = \boldsymbol{0}\) 只有零解
- \(|\boldsymbol{A}| = 0 \Rightarrow \boldsymbol{AX} = \boldsymbol{0}\) 有非零解
可逆矩阵的运算性质
设 \(\boldsymbol{A},\boldsymbol{B},\boldsymbol{A}_i\) 均为 \(n\) 阶可逆矩阵,\(k \in F\) 为非零常数,则:
- \((\boldsymbol{A}^{-1})^{-1} = \boldsymbol{A}\)
- \(k\boldsymbol{A}\) 可逆,且 \((k\boldsymbol{A})^{-1} = \frac{1}{k}\boldsymbol{A}^{-1}\)
- \(\boldsymbol{A}\boldsymbol{B}\) 可逆,且 \((\boldsymbol{A}\boldsymbol{B})^{-1} = \boldsymbol{B}^{-1} \boldsymbol{A}^{-1}\),\((\boldsymbol{A}_1 \boldsymbol{A}_2 \cdots \boldsymbol{A}_m)^{-1} = \boldsymbol{A}_m^{-1} \cdots \boldsymbol{A}_2^{-1} \boldsymbol{A}_1^{-1}\)
- \(\boldsymbol{A}^m\) 可逆,且 \((\boldsymbol{A}^m)^{-1} = (\boldsymbol{A}^{-1})^m\)
- \(\boldsymbol{A}^T\) 可逆,且 \((\boldsymbol{A}^T)^{-1} = (\boldsymbol{A}^{-1})^T\)
- \(|\boldsymbol{A}^{-1}| = \frac{1}{|\boldsymbol{A}|}\)
2.4 分块矩阵
分块矩阵的定义
- 分块矩阵:把矩阵 \(\boldsymbol{A}_{m\times n}\) 用若干条横线和竖线,分成若干小矩阵,每个小矩阵称为 \(\boldsymbol{A}\) 的一个子块,以这些子块为元素的形式上的矩阵称为 \(\boldsymbol{A}\) 的分块矩阵。
分块矩阵的运算
分块矩阵的加法和数乘:设 \(\boldsymbol{A},\boldsymbol{B}\) 均为 \(m \times n\) 的矩阵,\(k \in F\) 为一个数,\(\boldsymbol{A},\boldsymbol{B}\) 采用完全相同的分块法,记它们的分块矩阵为 \(\boldsymbol{A}=(\boldsymbol{A}_{ij})_{s \times t}\),\(\boldsymbol{B}=(\boldsymbol{B}_{ij})_{s \times t}\),\(\boldsymbol{A}_{ij}\) 与 \(\boldsymbol{B}_{ij}\) 同型,则 \[ \begin{aligned} & \boldsymbol{A} + \boldsymbol{B} = (\boldsymbol{A}_{ij} + \boldsymbol{B}_{ij})_{s \times t} \\ & k\boldsymbol{A} = k(\boldsymbol{A}_{ij})_{s \times t} = (k\boldsymbol{A}_{ij})_{s \times t} \end{aligned} \]
分块矩阵的乘法:设 \(\boldsymbol{A}_{m \times n},\boldsymbol{B}_{n \times p}\),且 \(\boldsymbol{A}\) 的列的分块法与 \(\boldsymbol{B}\) 的行的分块法完全一致,记它们的分块矩阵为 \(\boldsymbol{A}=(\boldsymbol{A}_{ij})_{r \times s}\),\(\boldsymbol{B}=(\boldsymbol{B}_{ij})_{s \times t}\),则 \[ \begin{aligned} \boldsymbol{AB} &= \begin{pmatrix} \boldsymbol{A}_{11} & \boldsymbol{A}_{12} & \cdots & \boldsymbol{A}_{1s}\\ \boldsymbol{A}_{21} & \boldsymbol{A}_{22} & \cdots & \boldsymbol{A}_{2s}\\ \vdots & \vdots & & \vdots\\ \boldsymbol{A}_{r1} & \boldsymbol{A}_{r2} & \cdots & \boldsymbol{A}_{rs} \end{pmatrix}\begin{pmatrix} \boldsymbol{B}_{11} & \boldsymbol{B}_{12} & \cdots & \boldsymbol{B}_{1t}\\ \boldsymbol{B}_{21} & \boldsymbol{B}_{22} & \cdots & \boldsymbol{B}_{2t}\\ \vdots & \vdots & & \vdots\\ \boldsymbol{B}_{s1} & \boldsymbol{B}_{s2} & \cdots & \boldsymbol{B}_{st} \end{pmatrix} \\ &= \boldsymbol{C} = (\boldsymbol{C}_{ij})_{r \times t} \end{aligned} \]
其中 \(\boldsymbol{C}_{ij}=\sum_{k=1}^s\boldsymbol{A}_{ik}\boldsymbol{B}_{kj}\)
分块矩阵的转置:分块矩阵 \(\boldsymbol{A}=(\boldsymbol{A}_{ij})_{s \times t}\) 的转置为 \(\boldsymbol{A}^T = (\boldsymbol{A}_{ji}^T)_{t \times s}\),即:分块矩阵转置后,子块位置互换,子块内元素转置 \[ \boldsymbol{A} = \begin{pmatrix} \boldsymbol{A}_{11} & \boldsymbol{A}_{12} & \cdots & \boldsymbol{A}_{1s}\\ \boldsymbol{A}_{21} & \boldsymbol{A}_{22} & \cdots & \boldsymbol{A}_{2s}\\ \vdots & \vdots & & \vdots\\ \boldsymbol{A}_{r1} & \boldsymbol{A}_{r2} & \cdots & \boldsymbol{A}_{rs} \end{pmatrix} \Rightarrow \boldsymbol{A}^T = \begin{pmatrix} \boldsymbol{A}_{11}^T & \boldsymbol{A}_{21}^T & \cdots & \boldsymbol{A}_{r1}^T\\ \boldsymbol{A}_{12}^T & \boldsymbol{A}_{22}^T & \cdots & \boldsymbol{A}_{r2}^T\\ \vdots & \vdots & & \vdots\\ \boldsymbol{A}_{1s}^T & \boldsymbol{A}_{2s}^T & \cdots & \boldsymbol{A}_{rs}^T \end{pmatrix} \]
分块(反)对角阵:
- 设 \(\boldsymbol{A}=(\boldsymbol{A}_{ij})_{s \times
t}\) 是一个分块矩阵,若 \(\boldsymbol{A}_{ij}=\boldsymbol{0}\) 对于
\(i \neq j\) 恒成立,则称 \(\boldsymbol{A}\) 是一个分块对角阵
记作 \[ \boldsymbol{A} = \begin{pmatrix} \boldsymbol{A}_{1} & & & \\ & \boldsymbol{A}_{2} & & \\ & & \dots & \\ & & & \boldsymbol{A}_{s} \end{pmatrix} = \operatorname{diag}(\boldsymbol{A}_{1},\boldsymbol{A}_{2},\cdots,\boldsymbol{A}_{s}) \]
其中 \(\boldsymbol{A}_{i} = \boldsymbol{A}_{ii}\) 是 \(\boldsymbol{A}\) 的第 \(i\) 个对角块,为 \(n_i\) 阶方阵,且 \(\sum_{i=1}^s n_i = n\).
若 \(\boldsymbol{A}_{i}\) 可逆,则 \(|\boldsymbol{A}| = \prod_{i=1}^s |\boldsymbol{A}_{i}| \neq 0\),可知 \(\boldsymbol{A}\) 可逆,且 \(\boldsymbol{A}^{-1} = \operatorname{diag}(\boldsymbol{A}_{1}^{-1},\boldsymbol{A}_{2}^{-1},\cdots,\boldsymbol{A}_{s}^{-1})\)
- 若 \(\boldsymbol{A}_{ij}=\boldsymbol{0}\) 对于
\(i + j \neq s + 1\) 恒成立,则称 \(\boldsymbol{A}\) 是一个分块反对角阵
- 记作 \[ \boldsymbol{A} = \begin{pmatrix} & & & \boldsymbol{A}_{1} \\ & & \boldsymbol{A}_{2} & \\ & \cdots & & \\ \boldsymbol{A}_{s} & & & \end{pmatrix} = \operatorname{antidiag}(\boldsymbol{A}_{1},\boldsymbol{A}_{2},\cdots,\boldsymbol{A}_{s}) \]
- 若 \(\boldsymbol{A}_{i}\) 可逆,则 \(\boldsymbol{A}^{-1} = \operatorname{antidiag}(\boldsymbol{A}_{1}^{-1},\boldsymbol{A}_{2}^{-1},\cdots,\boldsymbol{A}_{s}^{-1})\)
- 设 \(\boldsymbol{A}=(\boldsymbol{A}_{ij})_{s \times
t}\) 是一个分块矩阵,若 \(\boldsymbol{A}_{ij}=\boldsymbol{0}\) 对于
\(i \neq j\) 恒成立,则称 \(\boldsymbol{A}\) 是一个分块对角阵
2.5 初等矩阵与矩阵的秩
初等变换
- 初等变换
- 初等行变换:见上文
- 初等列变换:矩阵 \(\boldsymbol{A}^T\) 的初等行变换即为 \(\boldsymbol{A}\) 的初等列变换,记作 \(c\),即:
- 交换矩阵的两列:\(c_{i} \leftrightarrow c_{j}\)
- 某一列乘以非零常数:\(k c_{i}\)
- 某一列加上另一列的若干倍:\(c_{j} + k c_{i}\)
- 矩阵相抵:矩阵 \(\boldsymbol{A}\) 经有限次初等变换变到矩阵
\(\boldsymbol{B}\),称矩阵 \(\boldsymbol{A}\) 与矩阵 \(\boldsymbol{B}\) 相抵,记为 \(\boldsymbol{A} \cong
\boldsymbol{B}\).(等价关系)
- 反身性:\(\boldsymbol{A} \cong \boldsymbol{A}\)
- 对称性:\(\boldsymbol{A} \cong \boldsymbol{B} \Rightarrow \boldsymbol{B} \cong \boldsymbol{A}\)
- 传递性:\(\boldsymbol{A} \cong \boldsymbol{B} \land \boldsymbol{B} \cong \boldsymbol{C} \Rightarrow \boldsymbol{A} \cong \boldsymbol{C}\)
初等矩阵
- 初等矩阵:单位矩阵 \(\boldsymbol{E}\) 做一次初等变换所得的矩阵为初等矩阵。
- 三类初等矩阵:
- \(\boldsymbol{E}(i,j)\):交换单位矩阵 \(\boldsymbol{E}\) 的第 \(i\) 行和第 \(j\) 行得到的初等矩阵(也可以是交换第 \(i\) 列和第 \(j\) 列得到的初等矩阵) \[
\boldsymbol{E} \xrightarrow[c_i \leftrightarrow c_j]{r_i \leftrightarrow
r_j} \boldsymbol{E}(i,j)
\]
- \(|\boldsymbol{E}(i,j)| = -1\)
- \(\boldsymbol{E}(i,j)^{-1} = \boldsymbol{E}(i,j)\)
- \(\boldsymbol{E}(i(k))\):将单位矩阵 \(\boldsymbol{E}\) 的第 \(i\) 行乘以非零常数 \(k\) 得到的初等矩阵 \[
\boldsymbol{E} \xrightarrow[k c_i]{k r_i} \boldsymbol{E}(i(k))
\]
- \(|\boldsymbol{E}(i(k))| = k\)
- \(\boldsymbol{E}(i(k))^{-1} = \boldsymbol{E}(i(\frac{1}{k}))\)
- \(\boldsymbol{E}(j,i(k))\):将单位矩阵 \(\boldsymbol{E}\) 的第 \(j\) 行加上第 \(i\) 行的 \(k\) 倍得到的初等矩阵 \[
\boldsymbol{E} \xrightarrow[c_j + k c_i]{r_j + k r_i}
\boldsymbol{E}(j,i(k))
\]
- \(|\boldsymbol{E}(j,i(k))| = 1\)
- \(\boldsymbol{E}(j,i(k))^{-1} = \boldsymbol{E}(j,i(-k))\)
- \(\boldsymbol{E}(i,j)\):交换单位矩阵 \(\boldsymbol{E}\) 的第 \(i\) 行和第 \(j\) 行得到的初等矩阵(也可以是交换第 \(i\) 列和第 \(j\) 列得到的初等矩阵) \[
\boldsymbol{E} \xrightarrow[c_i \leftrightarrow c_j]{r_i \leftrightarrow
r_j} \boldsymbol{E}(i,j)
\]
- 定理:
设 \(\boldsymbol{A}\) 是一个 \(m \times n\) 的矩阵,对 \(\boldsymbol{A}\) 进行一次初等行变换相当于 \(\boldsymbol{A}\) 左乘一个对应的初等矩阵;对 \(\boldsymbol{A}\) 进行一次初等列变换相当于 \(\boldsymbol{A}\) 右乘一个对应的初等矩阵
- 初等矩阵都是可逆矩阵
对任意 \(m \times n\) 矩阵 \(\boldsymbol{A}\),存在一系列初等矩阵使得相乘得到标准形 \[ \boldsymbol{P}_{s} \cdots \boldsymbol{P}_{2} \boldsymbol{P}_{1} \boldsymbol{A} \boldsymbol{Q}_{1} \boldsymbol{Q}_{2} \cdots \boldsymbol{Q}_{s} = \begin{pmatrix} \boldsymbol{E}_{r} & \boldsymbol{0} \\ \boldsymbol{0} & \boldsymbol{0} \end{pmatrix} \]
其中 \(r\) 是矩阵 \(\boldsymbol{A}\) 的秩
矩阵的秩
- 子式:矩阵 \(\boldsymbol{A}_{m \times n}\) 的一个 \(k\) 阶子式是在 \(\boldsymbol{A}\) 中任取 \(k\) 行 \(k\) 列(\(k \leq \min\{m,n\}\))交叉处的元素按原来的相对位置构成的 \(k\) 阶行列式,称为矩阵 \(\boldsymbol{A}\) 的一个 \(k\) 阶子式.
- 秩:设矩阵 \(\boldsymbol{A}_{ m \times n}\),在 \(\boldsymbol{A}\) 中若存在一个 \(r\) 阶子式不等于零,而所有 \(r+1\) 阶(若存在)子式全为零,称 \(r\) 为矩阵 \(\boldsymbol{A}\) 的秩,记为 \(r(\boldsymbol{A})\)。规定零矩阵的秩为 \(0\).
- 秩的性质:
- 矩阵 \(\boldsymbol{A}\) 的秩是唯一的
- \(0 \leq r(\boldsymbol{A}) \leq \min\{m, n\}\)
- 设 \(\boldsymbol{A}_1\) 是 \(\boldsymbol{A}\) 的一个部分矩阵,则 \(r(\boldsymbol{A}_1) \leq r(\boldsymbol{A})\)
- 若 \(\boldsymbol{A}\) 中存在 \(r\) 阶子式不为零,则 \(r(\boldsymbol{A}) \geq r\);若 \(\boldsymbol{A}\) 中所有 \(r\) 阶子式全为零,则 \(r(\boldsymbol{A}) < r\)
- \(r(\boldsymbol{A}^T) = r(\boldsymbol{A})\)
- \(r(k\boldsymbol{A}) = \begin{cases} r(\boldsymbol{A}), & k \neq 0 \\ 0, & k = 0 \end{cases}\)
- 梯形矩阵的秩等于它的非零行的个数
- 可逆矩阵的秩等于它的阶数,即 \(r(\boldsymbol{A}) = n\)
- 初等变换不改变矩阵的秩
秩相关定理
对任意 \(m \times n\) 矩阵 \(\boldsymbol{A}\),存在一系列初等 \(m\) 阶矩阵 \(\boldsymbol{P}_1, \boldsymbol{P}_2, \cdots, \boldsymbol{P}_s\) 和初等 \(n\) 阶矩阵 \(\boldsymbol{Q}_1, \boldsymbol{Q}_2, \cdots, \boldsymbol{Q}_s\),使得 \(\boldsymbol{P}_{s} \cdots \boldsymbol{P}_{2} \boldsymbol{P}_{1} \boldsymbol{A}\) 为简化阶梯形矩阵,且 \[ \boldsymbol{P}_{s} \cdots \boldsymbol{P}_{2} \boldsymbol{P}_{1} \boldsymbol{A} \boldsymbol{Q}_{1} \boldsymbol{Q}_{2} \cdots \boldsymbol{Q}_{s} = \begin{pmatrix} \boldsymbol{E}_{r} & \boldsymbol{0} \\ \boldsymbol{0} & \boldsymbol{0} \end{pmatrix}_{m \times n} \]
为标准形,其中 \(r=r(\boldsymbol{A})\),且标准形唯一
- 任意矩阵 \(\boldsymbol{A}_{m \times n}\),存在 \(m\) 阶可逆矩阵 \(\boldsymbol{P}\) 和 \(n\) 阶可逆矩阵 \(\boldsymbol{Q}\) 使得 \[ \boldsymbol{P} \boldsymbol{A} \boldsymbol{Q} = \begin{pmatrix} \boldsymbol{E}_{r} & \boldsymbol{0} \\ \boldsymbol{0} & \boldsymbol{0} \end{pmatrix}_{m \times n}, r=r(\boldsymbol{A}) \]
- \(\boldsymbol{A}_n\) 可逆的充分必要条件是 \(\boldsymbol{A}\) 的标准形为 \(n\) 阶单位矩阵,即 \(r(\boldsymbol{A}) = n\)
- \(\boldsymbol{A}_n\) 可逆的充分必要条件是 \(\boldsymbol{A} = \boldsymbol{P}_1 \boldsymbol{P}_2 \cdots \boldsymbol{P}_s\),其中 \(\boldsymbol{P}_i\) 是 \(n\) 阶初等矩阵
- \(\boldsymbol{A}_n\) 若可逆,则 \(\boldsymbol{A}\) 可只经过初等行(列)变换变为单位矩阵 \(\boldsymbol{E}\),即 \(\boldsymbol{A} \cong \boldsymbol{E}\)
- 矩阵 \(\boldsymbol{A}_{m \times n}\) 与可逆矩阵 \(\boldsymbol{P}_m,\boldsymbol{Q}_n\) 分别左乘和右乘后,其秩不变,即 \(r(\boldsymbol{P} \boldsymbol{A}) = r(\boldsymbol{A}) = r(\boldsymbol{A} \boldsymbol{Q}) = r(\boldsymbol{P} \boldsymbol{A} \boldsymbol{Q})\)
- 矩阵 \(\boldsymbol{A}_{m \times n}\) 与 \(\boldsymbol{B}_{m \times n}\) 相抵的充分必要条件是存在可逆矩阵 \(\boldsymbol{P}_m,\boldsymbol{Q}_n\) 使得 \(\boldsymbol{PAQ} = \boldsymbol{B}\)
设 \(\boldsymbol{A}_{m \times n}\) 的矩阵,线性方程组 \(\boldsymbol{A x} = \boldsymbol{b}\) 经初等行变换得到的新方程组 \(\boldsymbol{A_1 x} = \boldsymbol{b}_1\) 与原方程组的同解
任意 \(m\times n\) 的线性方程组 \(\boldsymbol{A x} = \boldsymbol{b}\),其增广矩阵为 \(\tilde{\boldsymbol{A}} = (\boldsymbol{A}\ \boldsymbol{b})\),则线性方程组有解的充分必要条件为:系数矩阵的秩等于其增广矩阵的秩,即 \(r(\boldsymbol{A}) = r(\tilde{\boldsymbol{A}})\),且
- \(r(\boldsymbol{A}) = r(\tilde{\boldsymbol{A}}) = n\):有唯一解
- \(r(\boldsymbol{A}) = r(\tilde{\boldsymbol{A}}) < n\):有无穷多解
- \(r(\boldsymbol{A}) < r(\tilde{\boldsymbol{A}})\):无解
对于 \(m \times n\) 的齐次线性方程组 \(\boldsymbol{A x} = \boldsymbol{0}\),则
- \(r(\boldsymbol{A}) = n\):有唯一零解
- \(r(\boldsymbol{A}) < n\):有非零解(无穷多解)
则有
- \(m < n \Rightarrow r(\boldsymbol{A}) < n \Rightarrow\) 有非零解
- \(m = n\) 时:
- \(|\boldsymbol{A}| \neq 0 \Leftrightarrow r(\boldsymbol{A}) = n \Leftrightarrow\) 有唯一零解
- \(|\boldsymbol{A}| = 0 \Leftrightarrow r(\boldsymbol{A}) < n \Leftrightarrow\) 有非零解
求矩阵逆的初等变换法
- 矩阵的初等变换:设矩阵 \(\boldsymbol{A}_n\) 可逆,由上述推论 \(\boldsymbol{A} = \boldsymbol{P}_1 \boldsymbol{P}_2
\cdots \boldsymbol{P}_k\),\(\boldsymbol{P}_i\) 为初等矩阵
初等行变换:等式两边左乘 \((\boldsymbol{P}_1 \cdots \boldsymbol{P}_k)^{-1}\),有 \[ \begin{aligned} & \boldsymbol{P}_1^{-1}\cdots \boldsymbol{P}_k^{-1}\boldsymbol{A}=\boldsymbol{E} \\ \Rightarrow& \boldsymbol{A}^{-1}=\boldsymbol{P}_k^{-1}\cdots \boldsymbol{P}_1^{-1}=\boldsymbol{P}_k^{-1}\cdots \boldsymbol{P}_1^{-1}\boldsymbol{E} \end{aligned} \]
从而由这两个等式就产生了求逆矩阵的初等行变换法: \[ \begin{pmatrix} \boldsymbol{A} & \boldsymbol{E} \end{pmatrix}_{n\times 2n} \xrightarrow{初等行变换} \begin{pmatrix} \boldsymbol{E} & \boldsymbol{A}^{-1} \end{pmatrix} \]
初等列变换:等式两边右乘 \((\boldsymbol{P}_1 \cdots \boldsymbol{P}_k)^{-1}\),有 \[ \begin{aligned} & \boldsymbol{A}(\boldsymbol{P}_1 \cdots \boldsymbol{P}_k)^{-1}=\boldsymbol{E} \\ \Rightarrow& \boldsymbol{A}^{-1}=(\boldsymbol{P}_1 \cdots \boldsymbol{P}_k)^{-1}=\boldsymbol{E}(\boldsymbol{P}_1 \cdots \boldsymbol{P}_k)^{-1} \end{aligned} \]
从而由这两个等式就产生了求逆矩阵的初等列变换法: \[ \begin{pmatrix} \boldsymbol{A} \\ \boldsymbol{E} \end{pmatrix}_{2n\times n} \xrightarrow{初等列变换} \begin{pmatrix} \boldsymbol{E} \\ \boldsymbol{A}^{-1} \end{pmatrix} \]
- 初等变换法求逆矩阵
设矩阵方程为 \(\boldsymbol{AX} = \boldsymbol{B}\),其中 \(\boldsymbol{A}\) 为 \(n\) 阶可逆方阵,\(\boldsymbol{B}\) 为 \(n \times m\) 矩阵,\(\boldsymbol{X}\) 为 \(n \times m\) 未知矩阵,则未知矩阵 \(\boldsymbol{X} = \boldsymbol{A}^{-1}\boldsymbol{B}\)。构造 \(n \times (n + m)\) 矩阵 \(\begin{pmatrix} \boldsymbol{A} & \boldsymbol{B} \end{pmatrix}\),对它进行初等行变换 \[ \begin{pmatrix} \boldsymbol{A} & \boldsymbol{B} \end{pmatrix} \xrightarrow{初等行变换} \begin{pmatrix} \boldsymbol{E} & \boldsymbol{A}^{-1}\boldsymbol{B} \end{pmatrix} \]
从而得到 \(\boldsymbol{X} = \boldsymbol{A}^{-1}\boldsymbol{B}\) 的解
若矩阵方程为 \(\boldsymbol{XA} = \boldsymbol{B}\),其中 \(\boldsymbol{A}\) 为 \(n\) 阶可逆方阵,\(\boldsymbol{B}\) 为 \(m \times n\) 矩阵,\(\boldsymbol{X}\) 为 \(m \times n\) 未知矩阵,则未知矩阵 \(\boldsymbol{X} = \boldsymbol{B}\boldsymbol{A}^{-1}\)。构造 \((m + n) \times n\) 矩阵 \(\begin{pmatrix} \boldsymbol{B} \\ \boldsymbol{A} \end{pmatrix}\),对它进行初等列变换 \[ \begin{pmatrix} \boldsymbol{B} \\ \boldsymbol{A} \end{pmatrix} \xrightarrow{初等列变换} \begin{pmatrix} \boldsymbol{B}\boldsymbol{A}^{-1} \\ \boldsymbol{E} \end{pmatrix} \]
从而得到 \(\boldsymbol{X} = \boldsymbol{B}\boldsymbol{A}^{-1}\) 的解
2.6 分块矩阵的初等变换
分块矩阵的初等变换
分块矩阵的初等变换:设 \(\boldsymbol{A}\) 为数域 \(K\) 上的一个 \(s \times t\) 的分块矩阵: \[ \boldsymbol{A} = \begin{pmatrix} \boldsymbol{A}_{11} & \boldsymbol{A}_{12} & \cdots & \boldsymbol{A}_{1t}\\ \boldsymbol{A}_{21} & \boldsymbol{A}_{22} & \cdots & \boldsymbol{A}_{2t}\\ \vdots & \vdots & & \vdots\\ \boldsymbol{A}_{s1} & \boldsymbol{A}_{s2} & \cdots & \boldsymbol{A}_{st} \end{pmatrix} \]
则分块矩阵 \(\boldsymbol{A}\) 的初等变换是指:
- 交换分块矩阵 \(\boldsymbol{A}\) 的两行(或两列):\(r_{i} \leftrightarrow r_{j}\)(或 \(c_{i} \leftrightarrow c_{j}\))
- 用某个适当阶数的可逆矩阵 \(\boldsymbol{P}\) 左乘(或右乘)分块矩阵 \(\boldsymbol{A}\) 的某一行(或某一列):\(\boldsymbol{P} r_{i}\)(或 \(c_{i} \boldsymbol{P}\))
- 用某个适当阶数的可逆矩阵 \(\boldsymbol{P}\) 左乘(或右乘)分块矩阵 \(\boldsymbol{A}\) 的某一行(或某一列)加到另一行(或另一列):\(r_{j} + \boldsymbol{P} r_{i}\)(或 \(c_{j} + c_{i} \boldsymbol{P}\))
分块初等矩阵
分块初等矩阵:单位矩阵 \(\boldsymbol{E}_n\) 做一次分块矩阵的初等变换所得的矩阵为分块初等矩阵,其中 \(\boldsymbol{E}_n\) 如下表示: \[ \boldsymbol{E}_n = \begin{pmatrix} \boldsymbol{E}_{n_1} & & & \\ & \boldsymbol{E}_{n_2} & & \\ & & \dots & \\ & & & \boldsymbol{E}_{n_s} \end{pmatrix} \]
其中 \(\sum_{i=1}^s n_i = n\),\(\boldsymbol{E}_{n_i}\) 是 \(n_i\) 阶单位矩阵,\(i = 1,2,\cdots,s\).
三类分块初等矩阵:
- \(\boldsymbol{E}(i,j)\):交换单位矩阵 \(\boldsymbol{E}_n\) 的第 \(i\) 行和第 \(j\) 行得到的分块初等矩阵(也可以是交换第 \(i\) 列和第 \(j\) 列得到的分块初等矩阵)
- \(\boldsymbol{E}(i(\boldsymbol{P}))\):将单位矩阵 \(\boldsymbol{E}_n\) 的第 \(i\) 行乘以适当阶数的可逆矩阵 \(\boldsymbol{P}\) 得到的分块初等矩阵
- \(\boldsymbol{E}(j,i(\boldsymbol{P}))\):将单位矩阵 \(\boldsymbol{E}_n\) 的第 \(j\) 行加上第 \(i\) 行的适当阶数的可逆矩阵 \(\boldsymbol{P}\) 倍得到的分块初等矩阵
定理:
对分块矩阵作一次分块初等行(列)变换,相当于左乘(或右乘)一个相应的分块初等矩阵
行列式第一降阶定理:设 \(\boldsymbol{A}_m\) 可逆,\(\boldsymbol{D}_n\) 为方阵,则令 \(\boldsymbol{M}\) 为 \(m+n\) 阶分块矩阵 \[ \boldsymbol{M} = \begin{pmatrix} \boldsymbol{A} & \boldsymbol{B} \\ \boldsymbol{C} & \boldsymbol{D} \end{pmatrix} \]
则 \[ |\boldsymbol{M}| = |\boldsymbol{A}| \cdot |\boldsymbol{D} - \boldsymbol{C} \boldsymbol{A}^{-1} \boldsymbol{B}| \]
其中 \(\boldsymbol{D} - \boldsymbol{C} \boldsymbol{A}^{-1} \boldsymbol{B}\) 称为 \(\boldsymbol{M}\) 的 Schur 补
例题:设有矩阵 \(\boldsymbol{A}_{m \times n},\boldsymbol{B}_{n \times m}\),证明:\(|\boldsymbol{E}_{m} - \boldsymbol{A}\boldsymbol{B}| = |\boldsymbol{E}_{n} - \boldsymbol{B}\boldsymbol{A}|\) 证明:构造分块矩阵: \[ \boldsymbol{M} = \left( \begin{array}{c c} \boldsymbol{E}_{m} & \boldsymbol{A} \\ \boldsymbol{B} & \boldsymbol{E}_{n} \end{array} \right) \]
对其进行第三种分块矩阵的初等变换: \[ \begin{aligned} & \begin{pmatrix} \boldsymbol{E}_{m} & - \boldsymbol{A} \\ \boldsymbol{O} & \boldsymbol{E}_{n} \end{pmatrix} \boldsymbol{M} = \begin{pmatrix} \boldsymbol{E}_{m} - \boldsymbol{A}\boldsymbol{B} & \boldsymbol{O} \\ \boldsymbol{B} & \boldsymbol{E}_{n} \end{pmatrix} \\\\ & \boldsymbol{M} \begin{pmatrix} \boldsymbol{E}_{m} & - \boldsymbol{A} \\ \boldsymbol{O} & \boldsymbol{E}_{n} \end{pmatrix} = \begin{pmatrix} \boldsymbol{E}_{m} & \boldsymbol{O} \\ \boldsymbol{B} & \boldsymbol{E}_{n} -\boldsymbol{B}\boldsymbol{A} \end{pmatrix} \end{aligned} \]
两式两边取行列式: \[ \begin{aligned} &|\boldsymbol{M}| \\ =&\left| \begin{matrix} \boldsymbol{E}_{m} - \boldsymbol{A}\boldsymbol{B} & \boldsymbol{O} \\ \boldsymbol{B} & \boldsymbol{E}_{n} \end{matrix} \right| = |\boldsymbol{E}_{m} - \boldsymbol{A}\boldsymbol{B}| \\ =&\left| \begin{matrix} \boldsymbol{E}_{m} & \boldsymbol{O} \\ \boldsymbol{B} & \boldsymbol{E}_{n} -\boldsymbol{B}\boldsymbol{A} \end{matrix} \right| = |\boldsymbol{E}_{n} -\boldsymbol{B}\boldsymbol{A}| \end{aligned} \]
得证!
常用秩不等式与结论
- \(0 \leq r (\boldsymbol{A}) \leq \min\{m,n\}\)
- \(r(\boldsymbol{A}) + r (\boldsymbol{B}) - n \leq r(\boldsymbol{AB}) \leq \min\{r(\boldsymbol{A}),r(\boldsymbol{B})\}\)
- \(r \left( \boldsymbol{A} \right) = r \left( \boldsymbol{A}^{ T } \right) = r \left( \boldsymbol{A} \boldsymbol{A}^{ T } \right) = r \left( \boldsymbol{A}^{ T } \boldsymbol{A} \right)\)
- \(r(\boldsymbol{A}^{*}) = \begin{cases} n & r(\boldsymbol{A}) = n \\ 1 & r(\boldsymbol{A}) = n-1 \\ 0 & r (\boldsymbol{A}) < n - 1 \end{cases}\)
- \(0 \leq r(\boldsymbol{A} + \boldsymbol{B}) \leq r(\boldsymbol{A}) + r(\boldsymbol{B})\)
- \(\max\{r(\boldsymbol{A}),r(\boldsymbol{B}),r(\boldsymbol{A} + \boldsymbol{B})\} \leq r((\boldsymbol{A},\boldsymbol{B})) \leq r(\boldsymbol{A}) + r(\boldsymbol{B})\)
- \(r\left(\begin{pmatrix} \boldsymbol{A} & \boldsymbol{O} \\ \boldsymbol{O} & \boldsymbol{B} \end{pmatrix} \right) = r(\boldsymbol{A}) + r(\boldsymbol{B})\)
- \(r\left(\begin{pmatrix} \boldsymbol{A} & \\ \boldsymbol{C} & \boldsymbol{B} \end{pmatrix} \right) \geq r(\boldsymbol{A}) + r(\boldsymbol{B}),\quad r\left(\begin{pmatrix} \boldsymbol{A} & \boldsymbol{C} \\ \boldsymbol{B} & \end{pmatrix} \right) \geq r(\boldsymbol{A}) + r(\boldsymbol{B})\)
- \(r(\boldsymbol{ABC}) \geq r(\boldsymbol{AB}) + r(\boldsymbol{BC}) - r(\boldsymbol{B})\)
第 3 章 n 维向量与线性方程组的结构
3.1 n 维向量
向量的定义
- \(n\)
维向量:\(n\) 个数 \(a_1,a_2,\cdots,a_n\) 组成的有序数组 \((a_1,a_2,\cdots,a_n)\) 称为 \(n\) 维向量,数 \(a_i\) 称为该向量的第 \(i\) 个分量,\(n\) 称为该向量的维数。
- 实向量:\(a_i \in \mathbb{R}\);复向量:\(a_i \in \mathbb{C}\)
- 行向量:相当于 \(1 \times n\) 矩阵;列向量:相当于 \(n \times 1\) 矩阵
- 常用希腊字母如 \(\boldsymbol{\alpha}, \boldsymbol{\beta}, \boldsymbol{\gamma}\) 表示,如 \[ \boldsymbol{\alpha} = (a_1, a_2, \cdots, a_n),\quad \boldsymbol{\beta}=\begin{pmatrix} b_1 \\ b_2 \\ \vdots \\ b_n \end{pmatrix} \]
- 向量相等:若 \(n\) 维向量 \(\boldsymbol{\alpha}\) 和 \(\boldsymbol{\beta}\) 都是行(或列)向量且对应分量相等,即 \(a_i = b_i(i=1,2,\cdots,n)\),则称 \(\boldsymbol{\alpha}\) 和 \(\boldsymbol{\beta}\) 相等,记作 \(\boldsymbol{\alpha} = \boldsymbol{\beta}\)
- 零向量:分量全为零的向量称为零向量,记作 \(\boldsymbol{0}\) 。
- 负向量:若 \(\boldsymbol{\alpha}=(a_1,a_2,\cdots,a_n)\),则 \(\boldsymbol{-\alpha}=(-a_1,-a_2,\cdots,-a_n)\),称为 \(\boldsymbol{\alpha}\) 的负向量。
向量的线性运算
向量加法:设 \(\boldsymbol{\alpha}=(a_1,a_2,\cdots,a_n)\),\(\boldsymbol{\beta}=(b_1,b_2,\cdots,b_n)\) 都是 \(n\) 维向量,则称 \[ \boldsymbol{\alpha} + \boldsymbol{\beta} = (a_1+b_1,a_2+b_2,\cdots,a_n+b_n) \]
为 \(\boldsymbol{\alpha}\) 和 \(\boldsymbol{\beta}\) 的和,记作 \(\boldsymbol{\alpha} + \boldsymbol{\beta}\)
向量数乘:设 \(k \in \mathbb{R}\),\(\boldsymbol{\alpha}=(a_1,a_2,\cdots,a_n)\),则称 \[ k \boldsymbol{\alpha} = (k a_1,k a_2,\cdots,k a_n) \]
为数 \(k\) 与向量 \(\boldsymbol{\alpha}\) 的数乘,记作 \(k \boldsymbol{\alpha}\)
线性运算性质:设 \(\boldsymbol{\alpha},\boldsymbol{\beta},\boldsymbol{\gamma}\) 为任意 \(n\) 维向量,\(k,l \in \mathbb{R}\),则
- 加法交换律:\(\boldsymbol{\alpha} + \boldsymbol{\beta} = \boldsymbol{\beta} + \boldsymbol{\alpha}\)
- 加法结合律:\(\boldsymbol{\alpha} + (\boldsymbol{\beta} + \boldsymbol{\gamma}) = (\boldsymbol{\alpha} + \boldsymbol{\beta}) + \boldsymbol{\gamma}\)
- 零元存在:对任意 \(\boldsymbol{\alpha}\),都存在一个 \(\boldsymbol{0}\),使得 \(\boldsymbol{\alpha} + \boldsymbol{0} = \boldsymbol{\alpha}\)
- 负元存在:对任意 \(\boldsymbol{\alpha}\),都存在一个 \(\boldsymbol{-\alpha}\),使得 \(\boldsymbol{\alpha} + \boldsymbol{-\alpha} = \boldsymbol{0}\)
- 单位元存在:对任意 \(\boldsymbol{\alpha}\),都有 \(1 \boldsymbol{\alpha} = \boldsymbol{\alpha}\)
- 数乘结合律:\(k(l \boldsymbol{\alpha}) = (kl) \boldsymbol{\alpha}\)
- 数乘分配律:\((k+l) \boldsymbol{\alpha} = k \boldsymbol{\alpha} + l \boldsymbol{\alpha}\)
- 数乘分配律:\(k(\boldsymbol{\alpha} + \boldsymbol{\beta}) = k \boldsymbol{\alpha} + k \boldsymbol{\beta}\)
线性方程组的向量表示
设线性方程组 \[ \begin{cases} a_{11}x_{1} + a_{12}x_{2} + \cdots + a_{1n}x_{n} = b_{1} \\ a_{21}x_{1} + a_{22}x_{2} + \cdots + a_{2n}x_{n} = b_{2} \\ \qquad\vdots \\ a_{m1}x_{1} + a_{m2}x_{2} + \cdots + a_{mn}x_{n} = b_{m} \end{cases} \]
记 \[ \boldsymbol{A}_{m \times n} = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}, \quad \boldsymbol{x} = \begin{pmatrix} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \end{pmatrix}, \quad \boldsymbol{\beta} = \begin{pmatrix} b_{1} \\ b_{2} \\ \vdots \\ b_{m} \end{pmatrix} \]
则可以把线性方程组表示为 \[ \boldsymbol{A} \boldsymbol{x} = \boldsymbol{\beta} \]
由于 \(\boldsymbol{A}\) 可以用向量表示为: \[ \boldsymbol{A} = \begin{pmatrix} \boldsymbol{\gamma}_{1} \\ \boldsymbol{\gamma}_{2} \\ \vdots \\ \boldsymbol{\gamma}_{m} \end{pmatrix},\quad \boldsymbol{\gamma}_{i} = (a_{i1},a_{i2},\cdots,a_{in}) \quad 或\\ \boldsymbol{A} = (\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}),\quad \boldsymbol{\alpha}_{i} = \begin{pmatrix} a_{1i} \\ a_{2i} \\ \vdots \\ a_{mi} \end{pmatrix} \]
则可以把线性方程组表示为 \[ \begin{aligned} \boldsymbol{A} \boldsymbol{x} &= (\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}) \begin{pmatrix} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \end{pmatrix}\\ &= x_1\boldsymbol{\alpha}_{1} + x_2\boldsymbol{\alpha}_{2} + \cdots + x_n\boldsymbol{\alpha}_{n} \\ &= \boldsymbol{\beta} \end{aligned} \]
称 \(x_1\boldsymbol{\alpha}_{1} + x_2\boldsymbol{\alpha}_{2} + \cdots + x_n\boldsymbol{\alpha}_{n} = \boldsymbol{\beta}\) 为线性方程组的向量表示或称为向量方程。
3.2 向量的线性关系
向量的线性组合
线性组合(表示):对于 \(n\) 维向量 \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_m,\boldsymbol{\beta}\),如果存在数 \(k_1,k_2,\cdots,k_m\),使 \[ \boldsymbol{\beta} = k_1 \boldsymbol{\alpha}_1 + k_2 \boldsymbol{\alpha}_2 + \cdots + k_m \boldsymbol{\alpha}_m = (\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_m) \begin{pmatrix} k_1 \\ k_2 \\ \vdots \\ k_m \end{pmatrix} \]
则称向量 \(\boldsymbol{\beta}\) 是向量 \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_m\) 的一个线性组合,或称向量 \(\boldsymbol{\beta}\) 可由向量 \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_m\) 线性表示。称 \(k_1,k_2,\cdots,k_m\) 为组合系数或表示系数。
n 维单位向量/基本向量: \[ \boldsymbol{e}_{1} = \begin{pmatrix} 1 \\ 0 \\ \vdots \\ 0 \end{pmatrix}, \boldsymbol{e}_{2} = \begin{pmatrix} 0 \\ 1 \\ \vdots \\ 0 \end{pmatrix}, \vdots, \boldsymbol{e}_{n} = \begin{pmatrix} 0 \\ 0 \\ \vdots \\ 1 \end{pmatrix} \]
则任意 \(n\) 维向量 \(\boldsymbol{\alpha} = (a_1,a_2,\cdots,a_n)^T\) 均可表示为 \[ \boldsymbol{\alpha} = \sum_{i=1}^{n} a_i \boldsymbol{e}_i = a_1\boldsymbol{e}_1 + a_2\boldsymbol{e}_2 + \cdots + a_n\boldsymbol{e}_n \]
定理:\(n\) 维向量 \(\boldsymbol{\beta}\) 可由 \(n\) 维向量组 \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n\) 线性表示的充分必要条件是对应线性方程组 \(\boldsymbol{Ax} = \boldsymbol{\beta}\) 有解,其中 \(\boldsymbol{A} = (\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n})\)
- 可线性表示的充分必要条件:\(r(\boldsymbol{A}) =
r(\tilde{\boldsymbol{A}})\),其中 \(\boldsymbol{\tilde{A}} =
(A,\boldsymbol{\beta})\)
- 可线性表示且表示系数唯一的充分必要条件:\(r(\boldsymbol{A}) = r(\tilde{\boldsymbol{A}}) = m\)
- 可线性表示且表示系数不唯一的充分必要条件:\(r(\boldsymbol{A}) = r(\tilde{\boldsymbol{A}}) < m\)
- 不能线性表示的充分必要条件:\(r(\boldsymbol{A}) \neq r(\tilde{\boldsymbol{A}})\)
- 可线性表示的充分必要条件:\(r(\boldsymbol{A}) =
r(\tilde{\boldsymbol{A}})\),其中 \(\boldsymbol{\tilde{A}} =
(A,\boldsymbol{\beta})\)
向量组等价
向量组线性表示:设两个向量组 \[ (\mathrm{I})\{\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\},\quad (\mathrm{II})\{\boldsymbol{\beta}_{1},\boldsymbol{\beta}_{2},\cdots,\boldsymbol{\beta}_{t}\} \]
若向量组 \((\mathrm{I})\) 中每个向量都可由向量组 \((\mathrm{II})\) 中向量线性表示,则称 \((\mathrm{I})\) 可由 \((\mathrm{II})\) 线性表示
- 充要条件:\((\mathrm{I})\) 可由 \((\mathrm{II})\) 线性表示 \(\Rightarrow r((\boldsymbol{\beta}_{1},\boldsymbol{\beta}_{2},\cdots,\boldsymbol{\beta}_{t})) = r((\boldsymbol{\alpha}_{1},\cdots,\boldsymbol{\alpha}_{s},\boldsymbol{\beta}_{1},\cdots,\boldsymbol{\beta}_{t}))\)
- 传递性:
- 若向量组 \((\mathrm{I})\) 可由向量组 \((\mathrm{II})\) 线性表示,且 \(\boldsymbol{\gamma}\) 可由向量组 \((\mathrm{I})\) 线性表示,则 \(\boldsymbol{\gamma}\) 可由 \((\mathrm{II})\) 线性表示
- 若向量组 \((\mathrm{I})\) 可由向量组 \((\mathrm{II})\) 线性表示,且向量组 \((\mathrm{II})\) 可由向量组 \((\mathrm{III})\) 线性表示,则向量组 \((\mathrm{I})\) 可由向量组 \((\mathrm{III})\) 线性表示
向量组等价:若两个向量组 \((\mathrm{I})\) 和 \((\mathrm{II})\) 可以互相线性表示,则称 \((\mathrm{I})\) 和 \((\mathrm{II})\) 等价
- 反身性:\((\mathrm{I}) \cong (\mathrm{I})\)
- 对称性:若 \((\mathrm{I}) \cong (\mathrm{II})\),则 \((\mathrm{II}) \cong (\mathrm{I})\)
- 传递性:若 \((\mathrm{I}) \cong (\mathrm{II})\),且 \((\mathrm{II}) \cong (\mathrm{III})\),则 \((\mathrm{I}) \cong (\mathrm{III})\)
线性相关与线性无关
线性相关:设 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\) 为 \(n\) 维向量组,若存在不全为零的数 \(k_{1},k_{2},\cdots,k_{m}\),使 \[ \sum_{i=1}^{m} k_{i} \boldsymbol{\alpha}_{i} = k_1\boldsymbol{\alpha}_{1} + k_2\boldsymbol{\alpha}_{2} + \cdots + k_m\boldsymbol{\alpha}_{m}=\boldsymbol{0} \]
则称向量组 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\) 线性相关
线性无关:若只用 \(k_1=k_2=\cdots=k_m=0\) 时上式成立,则称向量组 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\) 线性无关
定理:如果 \(n\) 维向量组 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\) 线性相关(线性无关),则齐次线性方程组 \(x_{1}\boldsymbol{\alpha}_{1} + x_{2}\boldsymbol{\alpha}_{2} + \cdots + x_{m}\boldsymbol{\alpha}_{m} = 0\) 有非零解(唯一零解)。
- 令 \(\boldsymbol{\alpha}_1 =
\begin{pmatrix} a_{11} \\ a_{21} \\ \vdots \\ a_{n1}
\end{pmatrix},\boldsymbol{\alpha}_2 = \begin{pmatrix} a_{12} \\ a_{22}
\\ \vdots \\ a_{n2} \end{pmatrix},\cdots,\boldsymbol{\alpha}_m =
\begin{pmatrix} a_{1m} \\ a_{2m} \\ \vdots \\ a_{nm}
\end{pmatrix}\),令 \(\boldsymbol{A} =
(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_m)\),则:
- 向量 \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_m\) 线性相关的充分必要条件是 \(r(\boldsymbol{A}) < m\) 或 \(|\boldsymbol{A}| = 0\)
- 向量 \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_m\) 线性无关的充分必要条件是 \(r(\boldsymbol{A}) = m\) 或 \(|\boldsymbol{A}| \neq 0\)
- 对于 \(\mathbb{R}^n\) 中任意 \(m\) 个向量,当\(m > n\) 时必线性相关
- 令 \(\boldsymbol{\alpha}_1 =
\begin{pmatrix} a_{11} \\ a_{21} \\ \vdots \\ a_{n1}
\end{pmatrix},\boldsymbol{\alpha}_2 = \begin{pmatrix} a_{12} \\ a_{22}
\\ \vdots \\ a_{n2} \end{pmatrix},\cdots,\boldsymbol{\alpha}_m =
\begin{pmatrix} a_{1m} \\ a_{2m} \\ \vdots \\ a_{nm}
\end{pmatrix}\),令 \(\boldsymbol{A} =
(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_m)\),则:
线性相关/无关相关性质
若向量组 \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_m\) 中有部分向量线性相关,则该向量组必线性相关.
设 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\in\mathbb{R}^{n}\),\(\boldsymbol{\beta}_{1},\boldsymbol{\beta}_{2},\cdots,\boldsymbol{\beta}_{s}\in\mathbb{R}^{m}\) 都为列向量,令 \(n+m\) 维列向量 \[ \boldsymbol{\gamma}_{i}=\begin{pmatrix} \boldsymbol{\alpha}_{i}\\ \boldsymbol{\beta}_{i} \end{pmatrix}, i=1,2,\cdots,s \]
若 \(\boldsymbol{\gamma}_{1},\boldsymbol{\gamma}_{2},\cdots,\boldsymbol{\gamma}_{s}\) 线性相关,则 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\) 也线性相关。
- 常称 \(\boldsymbol{\alpha}_{i}\) 为 \(\boldsymbol{\gamma}_{i}\) 的截短向量,或 \(\boldsymbol{\gamma}_{i}\) 是 \(\boldsymbol{\alpha}_{i}\) 的接长向量。
- 即:若接长向量组线性相关,则其截短向量组也线性相关。
- 等价地:若截短向量组线性无关,则其接长向量组也线性无关。
设向量组 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\) 线性无关,向量组 \(\boldsymbol{\beta}_{1},\boldsymbol{\beta}_{2},\cdots,\boldsymbol{\beta}_{s}\) 可由 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\) 线性表示,即 \((\boldsymbol{\beta}_{1},\boldsymbol{\beta}_{2},\cdots,\boldsymbol{\beta}_{s})=(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m})\boldsymbol{A}_{m\times s}\),则:
- \(\boldsymbol{\beta}_{i}\) 线性相关的充分必要条件为 \(r(\boldsymbol{A}) < s\)
- \(\boldsymbol{\beta}_{i}\) 线性无关的充分必要条件为 \(r(\boldsymbol{A}) = s\)
设向量组 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\) 线性无关,\(\boldsymbol{\beta}_{j}=\sum_{i=1}^{m}a_{ij}\boldsymbol{\alpha}_{i}\),\(j=1,2,\cdots,s\),令 \(\boldsymbol{A}=(a_{ij})_{m\times s}\),则 \(r(\boldsymbol{\beta}_{1},\boldsymbol{\beta}_{2},\cdots,\boldsymbol{\beta}_{s})=r(\boldsymbol{A})\)
线性组合与线性相关的关系
- 向量 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\)(\(m\geqslant2\))线性相关的充分必要条件是其中至少有一个向量是其余向量的线性组合。
- 若向量 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\) 线性无关,而向量 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m},\boldsymbol{\beta}\) 线性相关,则向量 \(\boldsymbol{\beta}\) 可由 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\) 线性表示,且表示系数唯一。
3.3 向量组的秩
极大线性无关组
极大线性无关组:设向量组 \(\mathrm{I}:\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m},\cdots\)(向量个数可有限也可无限),若存在它的部分向量组 \(\mathrm{II}:\boldsymbol{\alpha}_{i_{1}},\boldsymbol{\alpha}_{i_{2}},\cdots,\boldsymbol{\alpha}_{i_{r}}\) 满足:
- \(\boldsymbol{\alpha}_{i_{1}},\boldsymbol{\alpha}_{i_{2}},\cdots,\boldsymbol{\alpha}_{i_{r}}\) 线性无关
- 向量组 \(\mathrm{I}\) 中的每一个向量都可由向量组 \(\mathrm{II}\) 线性表示
则称向量组 \(\mathrm{II}:\boldsymbol{\alpha}_{i_{1}},\boldsymbol{\alpha}_{i_{2}},\cdots,\boldsymbol{\alpha}_{i_{r}}\) 是向量组 \(\mathrm{I}\) 的一个极大线性无关组,简称极大无关组。
性质:
- 一个向量组若有极大线性无关组,则这个向量组与其极大线性无关组等价。
- 若向量组的极大线性无关组不唯一,则其任意两个极大线性无关组都等价。
定理:给定两个向量组 \[ \mathrm{I}:\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s},\quad\mathrm{II}:\boldsymbol{\beta}_{1},\boldsymbol{\beta}_{2},\cdots,\boldsymbol{\beta}_{t} \]
若向量组 \(\mathrm{I}\) 能被向量组 \(\mathrm{II}\) 线性表示,且 \(s>t\),则向量组 \(\mathrm{I}\) 中的向量线性相关。
- 若向量组 \(\mathrm{I}\) 线性无关,且它们可由向量组 \(\mathrm{II}\) 线性表示,则 \(s\leqslant t\)
- 两个线性无关的等价向量组必含相同个数的向量。
- 一个向量组若有两个极大线性无关组,则它们所含向量的个数相等。
向量组的秩
- 向量组的秩:向量组 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\) 的极大线性无关组所含向量的个数称为向量组的秩,记作 \(r(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m})\)。
- 性质:
- 向量组 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\) 线性无关的充分必要条件是 \(r(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m})=m\)
- 向量组 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\) 线性相关的充分必要条件是 \(r(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m})<m\)
- 任意两个等价的向量组的极大无关组也等价,所以等价的向量组必有相同的秩。
- 如果一个向量组的秩为 \(r\)(\(r>0\)),则向量组中任意 \(r\) 个线性无关的向量都是它的一个极大无关组。
- 设向量组 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\) 可由向量组 \(\boldsymbol{\beta}_{1},\boldsymbol{\beta}_{2},\cdots,\boldsymbol{\beta}_{t}\) 线性表示,则 \[ r(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s})\leqslant r(\boldsymbol{\beta}_{1},\boldsymbol{\beta}_{2},\cdots,\boldsymbol{\beta}_{t}). \]
- 向量组的秩与矩阵的秩的关系:设 \(\boldsymbol{A}\) 是 \(m\times n\) 矩阵,则 \(\boldsymbol{A}\)**** 的列向量组 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 的秩等于矩阵 \(\boldsymbol{A}\) 的秩;\(\boldsymbol{A}\) 的行向量组的秩也等于 \(\boldsymbol{A}\) 的秩。
3.4 线性方程组解的结构
齐次线性方程组解的结构
设有齐次线性方程组 \[ \begin{cases} a_{11}x_{1}+a_{12}x_{2}+\cdots+a_{1n}x_{n}=0\\ a_{21}x_{1}+a_{22}x_{2}+\cdots+a_{2n}x_{n}=0\\ \qquad\vdots\\ a_{m1}x_{1}+a_{m2}x_{2}+\cdots+a_{mn}x_{n}=0 \end{cases} \]
其矩阵形式为 \[ \boldsymbol{A}\boldsymbol{x}=\boldsymbol{0}\quad (\boldsymbol{A}=(a_{ij})_{m\times n}) \]
有解的充分必要条件:\(r(\boldsymbol{A})=r<n\)
基础解系:设 \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{p}\) 是齐次线性方程组 \(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{0}\) 的一组解向量,如果:
- \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{p}\) 线性无关;
- 齐次线性方程组 \(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{0}\) 的任意一个解向量都可由 \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{p}\) 线性表示,
则称 \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{p}\) 是齐次线性方程组 \(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{0}\) 的一个基础解系。
解的性质:设有齐次线性方程组 \[ \boldsymbol{A}_{m\times n}\boldsymbol{x}=\boldsymbol{0} \]
若 \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{s}\) 是其 \(s\) 个解向量,则它们的线性组合 \(\sum_{i=1}^{s}k_{i}\boldsymbol{\eta}_{i}\) 仍是其解向量,其中 \(k_{1},k_{2},\cdots,k_{s}\) 为任意常数。
通解形式:设有齐次线性方程组 \[ \boldsymbol{A}_{m\times n}\boldsymbol{x}=\boldsymbol{0} \]
若 \(r(\boldsymbol{A})=r<n\),则齐次线性方程组 \(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{0}\) 存在一个由 \(n-r\) 个线性无关的解向量 \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{n-r}\) 构成的基础解系,它们的线性组合 \[ \bar{\boldsymbol{\eta}}=k_{1}\boldsymbol{\eta}_{1}+k_{2}\boldsymbol{\eta}_{2}+\cdots+k_{n-r}\boldsymbol{\eta}_{n-r} \]
给出了齐次线性方程组 \(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{0}\) 的所有解,称为该齐次线性方程组通解(也称一般解),其中 \(k_{1},k_{2},\cdots,k_{n-r}\) 为任意常数。
基础解系求法:系数矩阵 \(\boldsymbol{A}\) 经初等行变换化到简化阶梯形,用分块形式表达如下: \[ \boldsymbol{A}_{m\times n}\xrightarrow{\text{初等行变换}}\boldsymbol{R}=\begin{pmatrix}\boldsymbol{E}_{r}&\boldsymbol{A}_{0}\\ \boldsymbol{0}&\boldsymbol{0}\end{pmatrix}_{m\times n} \]
则 \(\begin{pmatrix}-\boldsymbol{A}_{0}\\ \boldsymbol{E}_{n-r}\end{pmatrix}_{n\times (n-r)}\) 所在的 \(n-r\) 个列向量即为一个基础解系。
解的结构的特点:系数矩阵的秩 + 基础解系含解向量的个数 = 未知量的个数。
非齐次线性方程组解的结构
设有非齐次线性方程组 \[ \begin{cases} a_{11}x_{1}+a_{12}x_{2}+\cdots+a_{1n}x_{n}=b_{1}\\ a_{21}x_{1}+a_{22}x_{2}+\cdots+a_{2n}x_{n}=b_{2}\\ \qquad\vdots\\ a_{m1}x_{1}+a_{m2}x_{2}+\cdots+a_{mn}x_{n}=b_{m} \end{cases} \]
其矩阵形式和向量形式分别为 \[ \boldsymbol{A}\boldsymbol{x}=\boldsymbol{\beta},\quad x_{1}\boldsymbol{\alpha}_{1}+x_{2}\boldsymbol{\alpha}_{2}+\cdots+x_{n}\boldsymbol{\alpha}_{n}=\boldsymbol{\beta} \]
其中 \[ \boldsymbol{A}=(a_{ij})_{m\times n}=(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}) \\ \\ \boldsymbol{\alpha}_{j}=\begin{pmatrix}a_{1j}\\ a_{2j}\\ \vdots\\ a_{mj}\end{pmatrix},j=1,2,\cdots,n, \quad \boldsymbol{x}=\begin{pmatrix}x_{1}\\ x_{2}\\ \vdots\\ x_{n}\end{pmatrix}, \quad \boldsymbol{\beta}=\begin{pmatrix}b_{1}\\ b_{2}\\ \vdots\\ b_{m}\end{pmatrix} \]
有解的充分必要条件(下面几个条件等价)
- 向量 \(\boldsymbol{\beta}\) 可由 \(\boldsymbol{A}\) 的列向量 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 线性表示
- \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 与 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n},\boldsymbol{\beta}\) 是等价向量组
- \(r(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n})=r(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n},\boldsymbol{\beta})\)
- \(r(\boldsymbol{A})=r(\boldsymbol{A},\boldsymbol{\beta})\)。
导出组:对于任一非齐次线性方程组,令其常数项为零得到一个齐次线性方程组,称这个齐次线性方程组为非齐次线性方程组的导出组。 \[ \begin{cases} a_{11}x_{1}+a_{12}x_{2}+\cdots+a_{1n}x_{n}=b_{1}\\ a_{21}x_{1}+a_{22}x_{2}+\cdots+a_{2n}x_{n}=b_{2}\\ \qquad\vdots\\ a_{m1}x_{1}+a_{m2}x_{2}+\cdots+a_{mn}x_{n}=b_{m} \end{cases} \xrightarrow{b_{i}=0} \begin{cases} a_{11}x_{1}+a_{12}x_{2}+\cdots+a_{1n}x_{n}=0\\ a_{21}x_{1}+a_{22}x_{2}+\cdots+a_{2n}x_{n}=0\\ \qquad\vdots\\ a_{m1}x_{1}+a_{m2}x_{2}+\cdots+a_{mn}x_{n}=0 \end{cases} \]
解的性质:
若 \(\boldsymbol{\gamma}_{1},\boldsymbol{\gamma}_{2}\) 是 \(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{\beta}\) 的任意两个解向量,则 \(\boldsymbol{\gamma}_{1}-\boldsymbol{\gamma}_{2}\) 是对应的齐次线性方程组 \(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{0}\) 的解向量。
设 \(\boldsymbol{\gamma}_{0}\) 是 \(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{\beta}\) 的一个解向量,\(\boldsymbol{\eta}\) 是对应的齐次线性方程组 \(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{0}\) 的任一解向量,则 \(\boldsymbol{\gamma}_{0}+\boldsymbol{\eta}\) 仍是 \(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{\beta}\) 的一个解向量。
\(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{\beta}\) 的任一解向量 \(\boldsymbol{\gamma}\) 都可表示成 \[ \boldsymbol{\gamma}=\boldsymbol{\gamma}_{0}+\boldsymbol{\eta}, \]
其中 \(\boldsymbol{\gamma}_{0}\) 是 \(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{\beta}\) 的某个解向量,\(\boldsymbol{\eta}\) 是对应的齐次线性方程组的某个解向量。
通解形式:设有非齐次线性方程组 \[ \boldsymbol{A}_{m\times n}\boldsymbol{x}=\boldsymbol{\beta} \]
若 \(r(\boldsymbol{A})=r(\boldsymbol{A},\boldsymbol{\beta})=r\),\(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{n-r}\) 是对应的齐次线性方程组 \(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{0}\) 的基础解系,\(\boldsymbol{\gamma}_{0}\) 是 \(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{\beta}\) 的某个解(称之为该非齐次线性方程组的一个特解),则 \[ \boldsymbol{x}=\boldsymbol{\gamma}_{0}+k_{1}\boldsymbol{\eta}_{1}+k_{2}\boldsymbol{\eta}_{2}+\cdots+k_{n-r}\boldsymbol{\eta}_{n-r} \]
给出了 \(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{\beta}\) 的所有解,称为该非齐次线性方程组的通解,其中 \(k_{1},k_{2},\cdots,k_{n-r}\) 是任意常数。
解的结构:非齐次线性方程组的通解 = 非齐次线性方程组的特解 + 对应的齐次线性方程组的通解。
特解求法:可以从增广矩阵的简化阶梯形得到,当 \[ (\boldsymbol{A},\boldsymbol{\beta})\xrightarrow{\text{初等行变换}}\begin{pmatrix}\boldsymbol{E}_{r}&\boldsymbol{A}_{0}&\boldsymbol{\beta}_{0}\\ \boldsymbol{0}&\boldsymbol{0}&\boldsymbol{0}\end{pmatrix}_{m\times (n+1)} \]
则 \(\begin{pmatrix}\boldsymbol{\beta}_{0}\\ \boldsymbol{0}_{(n-r)\times 1}\end{pmatrix}_{n\times 1}\) 可作为 \(\boldsymbol{A}\boldsymbol{x}=\boldsymbol{\beta}\) 的一个特解。
第 4 章 线性空间与线性变换
4.1 线性空间的概念
线性空间
- 线性空间的定义:设 \(V\) 是一个非空集合,\(F\)
是数域。定义加法和纯量乘法运算并满足以下几个定律,则称集合
\(V\) 关于向量加法与纯量乘法组成数域
\(F\)
上的一个线性空间,或称 \(V\) 为 \(F\) 上的一个线性空间。
- 特别地,当 \(F\) 为实数域时,称 \(V\) 为实线性空间。
- 加法:在 \(V\)
的元素之间定义加法运算,记作 \(+\),即对任意两个元素 \(\boldsymbol{\alpha},\boldsymbol{\beta}\in
V\),有唯一的一个元素 \(\boldsymbol{\delta}\in V\) 与之对应,称
\(\boldsymbol{\delta}\) 为 \(\boldsymbol{\alpha}\) 和 \(\boldsymbol{\beta}\) 的和,记作 \(\boldsymbol{\delta}=\boldsymbol{\alpha}+\boldsymbol{\beta}\)。满足:
- 交换律:\(\boldsymbol{\alpha}+\boldsymbol{\beta}=\boldsymbol{\beta}+\boldsymbol{\alpha}\)
- 结合律:\((\boldsymbol{\alpha}+\boldsymbol{\beta})+\boldsymbol{\gamma}=\boldsymbol{\alpha}+(\boldsymbol{\beta}+\boldsymbol{\gamma})\)
- 零元存在性:\(V\) 中存在一个零元 \(\boldsymbol{0}\),对 \(\forall\boldsymbol{\alpha}\in V\),有 \(\boldsymbol{\alpha}+\boldsymbol{0}=\boldsymbol{\alpha}\)
- 负元存在性:对任意 \(\boldsymbol{\alpha}\in V\),都存在 \(\boldsymbol{\beta}\in V\),称 \(\boldsymbol{\beta}\) 为 \(\boldsymbol{\alpha}\) 的负元,使得 \(\boldsymbol{\alpha}+\boldsymbol{\beta}=\boldsymbol{0}\)
- 纯量乘法:在数域 \(F\) 和集合 \(V\) 之间还定义纯量乘法,即对 \(\forall\boldsymbol{\alpha}\in V,k\in
F\),有唯一的元素 \(\boldsymbol{\eta}\in V\) 与之对应,称为
\(k\) 与 \(\boldsymbol{\alpha}\) 的乘积,记为 \(\boldsymbol{\eta}=k\boldsymbol{\alpha}\),使对
\(\forall k,l\in
F,\boldsymbol{\alpha},\boldsymbol{\beta}\in V\),都有:
- \(1\boldsymbol{\alpha}=\boldsymbol{\alpha}\)
- \(k(l\boldsymbol{\alpha})=l(k\boldsymbol{\alpha})=(kl)\boldsymbol{\alpha}\)
- \((k+l)\boldsymbol{\alpha}=k\boldsymbol{\alpha}+l\boldsymbol{\alpha}\)
- \(k(\boldsymbol{\alpha}+\boldsymbol{\beta})=k\boldsymbol{\alpha}+k\boldsymbol{\beta}\)
- 常用线性空间:
- 数域 \(F\) 上的全体 \(n\) 维向量的集合依照向量的加法和向量与数的纯量乘法构成数域 \(F\) 上的线性空间,记作 \(F^n\)。
- 数域 \(F\) 上的全体 \(m \times n\) 阶矩阵的集合,关于矩阵的加法和矩阵的纯量乘法构成数域 \(F\) 上的线性空间,记为 \(F^{m \times n}\)。
- 数域 \(F\) 上的全体一元多项式,依照多项式的加法和数与多项式的乘法构成数域 \(F\) 上的线性空间,记为 \(F[x]\)。特别地,所有的实系数一元多项式,依照多项式的加法和多项式与数的乘法构成实线性空间,记为 \({\mathbb R}[x]\)。
- 线性空间的性质:设 \(V\) 是数域 \(F\) 上的线性空间,则
- 零元唯一,记作 \(\boldsymbol{0}\)
- \(V\) 中元素 \(\boldsymbol{\alpha}\) 的负元唯一,记为 \(-\boldsymbol{\alpha}\)
- \(\forall\boldsymbol{\alpha}\in V\),有 \(0\boldsymbol{\alpha}=\boldsymbol{0}\),\((-1)\boldsymbol{\alpha}=-\boldsymbol{\alpha}\)
- \(\forall k\in F\),有 \(k\boldsymbol{0}=\boldsymbol{0}\)
- 若 \(k\boldsymbol{\alpha}=\boldsymbol{0}\),则有 \(k=0\) 或 \(\boldsymbol{\alpha}=\boldsymbol{0}\)
线性子空间
线性子空间:设 \(V\) 是数域 \(F\) 上的线性空间,\(W\) 是 \(V\) 的非空子集合,若对于 \(V\) 上的加法和乘法运算,\(W\) 也是 \(F\) 上的线性空间,则称 \(W\) 为 \(V\) 的一个线性子空间,简称为子空间。
性质:设 \(V\) 是数域 \(F\) 上的线性空间,则 \(V\) 的非空子集合 \(W\) 为 \(V\) 的一个子空间的充分必要条件为 \(W\) 对于 \(V\) 的加法和纯量乘法运算封闭。
平凡子空间
- 零子空间:线性空间 \(V\) 的仅含零向量的子集合是 \(V\) 的一个子空间,常称为零子空间。
- 全子空间:\(V\) 本身也是 \(V\) 的一个子空间,常称为全子空间。
生成子空间:设 \(V\) 是数域 \(F\) 上的线性空间,\(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\in V\),集合 \[ L=\{\boldsymbol{\beta}\mid\boldsymbol{\beta}=k_{1}\boldsymbol{\alpha}_{1}+k_{2}\boldsymbol{\alpha}_{2}+\cdots+k_{m}\boldsymbol{\alpha}_{m},k_{1},k_{2},\cdots,k_{m}\in F\} \]
构成线性空间 \(V\) 的子空间,称该子空间为 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\) 生成的子空间,记为 \[ L(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}) \]
4.2 线性空间的基、维数与坐标
基、维数与坐标
基底:设 \(V\) 是数域 \(F\) 上的线性空间,若 \(V\) 中存在一组向量 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 满足:
- \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 线性无关
- \(V\) 中任一向量 \(\boldsymbol{\alpha}\) 均可由 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 线性表示
则称 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 是线性空间 \(V\) 的一组基底或基。
- \(n\) 维线性空间中任意 \(n\) 个线性无关的向量都可以作为一组基,因此,线性空间的基并不唯一。
维数:称基 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 所含向量的个数 \(n\) 为线性空间 \(V\) 的维数,记为 \(\dim V=n\),此时也称线性空间 \(V\) 是 \(n\) 维线性空间,有时记作 \(V_{n}\)。
- 因为零向量构成的线性空间 \(\{\boldsymbol{0}\}\) 没有基,不妨规定 \(\dim\{\boldsymbol{0}\}=0\)。
- \(n\) 维线性空间与 \(0\) 维线性空间统称为有限维线性空间,或有限生成的线性空间。
- 如果 \(V\) 不是有限生成的,或者说,如果 \(V\) 中含有无限多个线性无关的向量,称 \(V\) 为无限维线性空间。
坐标:设 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 是 \(n\) 维线性空间 \(V\) 的一组基,\(\boldsymbol{\gamma}\in V\),且 \[ \boldsymbol{\gamma}=x_{1}\boldsymbol{\alpha}_{1}+x_{2}\boldsymbol{\alpha}_{2}+\cdots+x_{n}\boldsymbol{\alpha}_{n}=(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n})\boldsymbol{x} \]
其中 \[ \boldsymbol{x}=\begin{pmatrix}x_{1}\\ x_{2}\\ \vdots\\ x_{n}\end{pmatrix} \]
称向量 \(\boldsymbol{x}\) 为 \(\boldsymbol{\gamma}\) 在基 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 下的坐标。
- 由于 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 线性无关,因此 \(\boldsymbol{\gamma}\) 在此基下的坐标是唯一的。
同构映射:设 \(V\) 和 \(V'\) 是数域 \(F\) 上的两个线性空间,如果存在 \(V\) 到 \(V'\) 上的一个满足下述条件的一一对应 \(\sigma\):
- \(\sigma(\boldsymbol{\alpha}+\boldsymbol{\beta})=\sigma(\boldsymbol{\alpha})+\sigma(\boldsymbol{\beta})\),\(\forall\boldsymbol{\alpha},\boldsymbol{\beta}\in V\)
- \(\sigma(k\boldsymbol{\alpha})=k\sigma(\boldsymbol{\alpha})\),\(\forall\boldsymbol{\alpha}\in V\),\(\forall k\in F\)
则称 \(\sigma\) 为线性空间 \(V\) 到 \(V'\) 的一个同构映射,也称线性空间 \(V\) 与 \(V'\) 同构。
性质:数域 \(F\) 上任意一个 \(n\) 维线性空间 \(V\) 均与 \(F^{n}\) 同构。 证明:设 \(\sigma\) 是从 \(V\) 到 \(F^{n}\) 的一个映射,且 \(\sigma(\boldsymbol{\gamma})=\boldsymbol{x}\),设 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 是 \(V\) 的一组基,\(\forall\boldsymbol{\gamma},\boldsymbol{\delta}\in V\),它们在 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 下的坐标分别为 \[ \boldsymbol{x}=\begin{pmatrix}x_{1}\\ x_{2}\\ \vdots\\ x_{n}\end{pmatrix},\quad \boldsymbol{x}'=\begin{pmatrix}x_{1}'\\ x_{2}'\\ \vdots\\ x_{n}'\end{pmatrix} \]
即 \[ \boldsymbol{\gamma}=(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n})\boldsymbol{x},\quad \sigma(\boldsymbol{\gamma})=\boldsymbol{x} \\ \boldsymbol{\delta}=(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n})\boldsymbol{x}',\quad \sigma(\boldsymbol{\delta})=\boldsymbol{x}' \]
对 \(\forall k,l \in F\),令 \(k\boldsymbol{\gamma}+l\boldsymbol{\delta}=(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n})(k\boldsymbol{x}+l\boldsymbol{x}')\),那么 \(k\boldsymbol{\gamma}+l\boldsymbol{\delta}\) 在 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 下的坐标为
\[ k\boldsymbol{x}+l\boldsymbol{x}'=k\begin{pmatrix}x_{1}\\ x_{2}\\ \vdots\\ x_{n}\end{pmatrix}+l\begin{pmatrix}x_{1}'\\ x_{2}'\\ \vdots\\ x_{n}'\end{pmatrix}, \]
反之,\(V\) 中坐标为 \(k\boldsymbol{x}+l\boldsymbol{x}'\) 的向量必是 \(k\boldsymbol{\gamma}+l\boldsymbol{\delta}\),即有 \[ \sigma(k\boldsymbol{\gamma}+l\boldsymbol{\delta})=k\boldsymbol{x}+l\boldsymbol{x}'=k\sigma(\boldsymbol{\gamma})+l\sigma(\boldsymbol{\delta}). \]
这说明当 \(n\) 维线性空间 \(V_{n}\) 取定了基之后,向量与它的坐标不仅一一对应,而且向量的加法与纯量乘法都可以转化为坐标之间的加法与纯量乘法运算。
基变换与坐标变换
设 \(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 和 \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{n}\) 是 \(n\) 维线性空间 \(V\) 中的两组基,且 \[ \begin{cases} \boldsymbol{\eta}_{1}=c_{11}\boldsymbol{\varepsilon}_{1}+c_{21}\boldsymbol{\varepsilon}_{2}+\cdots+c_{n1}\boldsymbol{\varepsilon}_{n}\\ \boldsymbol{\eta}_{2}=c_{12}\boldsymbol{\varepsilon}_{1}+c_{22}\boldsymbol{\varepsilon}_{2}+\cdots+c_{n2}\boldsymbol{\varepsilon}_{n}\\ \qquad\vdots\\ \boldsymbol{\eta}_{n}=c_{1n}\boldsymbol{\varepsilon}_{1}+c_{2n}\boldsymbol{\varepsilon}_{2}+\cdots+c_{nn}\boldsymbol{\varepsilon}_{n} \end{cases} \]
过渡矩阵:由基 \(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 到基 \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{n}\) 的过渡矩阵为 \[ \boldsymbol{C}=(c_{ij})_{n\times n}=\begin{pmatrix}c_{11}&c_{12}&\cdots&c_{1n}\\ c_{21}&c_{22}&\cdots&c_{2n}\\ \vdots&\vdots&&\vdots\\ c_{n1}&c_{n2}&\cdots&c_{nn}\end{pmatrix} \]
- \(\boldsymbol{C}\) 是可逆的
- \(\boldsymbol{C}\) 的第 \(j\) 列恰为 \(\boldsymbol{\eta}_{j}\) 在基 \(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 下的坐标
基变换公式:由基 \(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 到基 \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{n}\) 的基变换公式为 \[ (\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{n})=(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n})\boldsymbol{C} \]
坐标变换公式:设 \(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 和 \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{n}\) 是 \(n\) 维线性空间 \(V\) 中的两组基,由基 \(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 到基 \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{n}\) 的过渡矩阵记为 \(\boldsymbol{C}=(c_{ij})_{n\times n}\),若向量 \(\boldsymbol{\xi}\) 在两组基下的坐标分别为 \[ \boldsymbol{x}=\begin{pmatrix}x_{1}\\ x_{2}\\ \vdots\\ x_{n}\end{pmatrix},\quad \boldsymbol{x}'=\begin{pmatrix}x_{1}'\\ x_{2}'\\ \vdots\\ x_{n}'\end{pmatrix} \]
则有坐标变换公式 \[ \boldsymbol{x}=\boldsymbol{C}\boldsymbol{x}',\quad \boldsymbol{x}'=\boldsymbol{C}^{-1}\boldsymbol{x} \]
4.3 欧氏空间
欧氏空间的定义与基本性质
- 欧氏空间:设 \(V\)
为实数域 \(\mathbb{R}\)
上的一个线性空间。对 \(V\)
中的任意一对元素 \(\boldsymbol{\alpha}\) 与 \(\boldsymbol{\beta}\),都有 \(\mathbb{R}\) 中唯一的一个实数(记作 \((\boldsymbol{\alpha},\boldsymbol{\beta})\))与之对应,若此对应关系满足以下条件:
- 对称性:\((\boldsymbol{\alpha},\boldsymbol{\beta})=(\boldsymbol{\beta},\boldsymbol{\alpha})\),\(\forall\boldsymbol{\alpha},\boldsymbol{\beta}\in V\)
- 线性性:\((k\boldsymbol{\alpha}+l\boldsymbol{\beta},\boldsymbol{\gamma})=k(\boldsymbol{\alpha},\boldsymbol{\gamma})+l(\boldsymbol{\beta},\boldsymbol{\gamma})\),\(\forall k,l\in\mathbb{R}\),\(\boldsymbol{\alpha},\boldsymbol{\beta},\boldsymbol{\gamma}\in V\)
- 正定性:\((\boldsymbol{\alpha},\boldsymbol{\alpha})\geqslant 0\),且 \((\boldsymbol{\alpha},\boldsymbol{\alpha})=0\) 的充分必要条件是 \(\boldsymbol{\alpha}=\boldsymbol{0}\)
- 向量内积:设 \(V\)
为欧氏空间,对 \(V\) 中任意向量 \(\boldsymbol{\alpha},\boldsymbol{\beta}\),则定义向量
\(\boldsymbol{\alpha}\) 与 \(\boldsymbol{\beta}\) 的内积 \((\boldsymbol{\alpha},\boldsymbol{\beta})\)
为 \[
(\boldsymbol{\alpha},\boldsymbol{\beta})=\sum_{i=1}^{n}\alpha_{i}\beta_{i}
\]
- 性质:零向量与任意向量的内积都是零,即 \[ (\boldsymbol{\alpha},\boldsymbol{0})=(\boldsymbol{0},\boldsymbol{\alpha})=0,\forall \boldsymbol{\alpha}\in V \]
- 向量长度:设 \(V\)
为欧氏空间,对 \(V\) 中任意向量 \(\boldsymbol{\alpha}\),则定义向量 \(\boldsymbol{\alpha}\) 的长度 \(|\boldsymbol{\alpha}|\) 为 \[
|\boldsymbol{\alpha}|=\sqrt{(\boldsymbol{\alpha},\boldsymbol{\alpha})}
\]
- 单位向量:若 \(|\boldsymbol{\alpha}|=1\),则称 \(\boldsymbol{\alpha}\) 为单位向量
- 向量单位化:若 \(\boldsymbol{\beta}\) 是 \(V\) 中的任一非零向量,则进行向量单位化后可得单位向量 \(\boldsymbol{\beta}^{0}\),即 \[ \boldsymbol{\beta}^{0}=\frac{1}{|\boldsymbol{\beta}|}\boldsymbol{\beta} \]
- 定理:设 \(V\)
为欧氏空间,\(\boldsymbol{\alpha},\boldsymbol{\beta}\in
V\),\(k\in\mathbb{R}\),则
- \(|\boldsymbol{\alpha}|\geqslant 0\),且 \(|\boldsymbol{\alpha}|=0\) 的充分必要条件是 \(\boldsymbol{\alpha}=\boldsymbol{0}\)
- \(|k\boldsymbol{\alpha}|=|k|\cdot|\boldsymbol{\alpha}|\),\(\forall k\in\mathbb{R}\),\(\boldsymbol{\alpha}\in V\)
- 柯西-施瓦茨(Cauchy-Schwarz)不等式:\(|(\boldsymbol{\alpha},\boldsymbol{\beta})|\leqslant|\boldsymbol{\alpha}|\cdot|\boldsymbol{\beta}|\),\(\forall\boldsymbol{\alpha},\boldsymbol{\beta}\in
V\),当且仅当 \(\boldsymbol{\alpha}\) 与 \(\boldsymbol{\beta}\) 线性相关时,\(|(\boldsymbol{\alpha},\boldsymbol{\beta})|=|\boldsymbol{\alpha}|\cdot|\boldsymbol{\beta}|\)。
- \((a_{1}b_{1}+a_{2}b_{2}+\cdots+a_{n}b_{n})^{2}\leqslant(a_{1}^{2}+a_{2}^{2}+\cdots+a_{n}^{2})\cdot(b_{1}^{2}+b_{2}^{2}+\cdots+b_{n}^{2})\)
- \(\left(\int_{a}^{b}f(x)g(x)\,\mathrm{d}x\right)^{2}\leqslant\int_{a}^{b}f^{2}(x)\,\mathrm{d}x\cdot\int_{a}^{b}g^{2}(x)\,\mathrm{d}x\)
- 单位向量:若 \(|\boldsymbol{\alpha}|=1\),则称 \(\boldsymbol{\alpha}\) 为单位向量
- 向量夹角:设 \(V\)
为欧氏空间,\(\boldsymbol{\alpha},\boldsymbol{\beta}\) 为
\(V\) 中的非零向量。则定义向量 \(\boldsymbol{\alpha}\) 与 \(\boldsymbol{\beta}\) 的夹角 \(\langle\boldsymbol{\alpha},\boldsymbol{\beta}\rangle\)
为 \[
\langle\boldsymbol{\alpha},\boldsymbol{\beta}\rangle=\arccos\frac{(\boldsymbol{\alpha},\boldsymbol{\beta})}{|\boldsymbol{\alpha}|\cdot|\boldsymbol{\beta}|}
\]
- 向量正交:当 \((\boldsymbol{\alpha},\boldsymbol{\beta})=0\)
时称 \(\boldsymbol{\alpha}\) 与 \(\boldsymbol{\beta}\) 正交,记作 \(\boldsymbol{\alpha}\perp\boldsymbol{\beta}\)。
- 零向量 \(\boldsymbol{0}\) 可看作与 \(V\) 中任意向量都正交。
- 正交向量组:设 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\)
为欧氏空间 \(V\)
中一组非零向量。若对任意 \(1\leqslant
i,j\leqslant s\),当 \(i\neq j\)
时都有 \(\boldsymbol{\alpha}_{i}\perp\boldsymbol{\alpha}_{j}\),则称向量组
\(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\)
为一个正交向量组。
- 性质:设 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\) 为欧氏空间 \(V\) 中的一个正交向量组,则 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\) 线性无关。
- 向量正交:当 \((\boldsymbol{\alpha},\boldsymbol{\beta})=0\)
时称 \(\boldsymbol{\alpha}\) 与 \(\boldsymbol{\beta}\) 正交,记作 \(\boldsymbol{\alpha}\perp\boldsymbol{\beta}\)。
- 向量距离:设 \(V\) 为欧氏空间,对 \(\boldsymbol{\alpha},\boldsymbol{\beta}\in V\),定义向量 \(\boldsymbol{\alpha}\) 与 \(\boldsymbol{\beta}\) 的距离 \(d(\boldsymbol{\alpha},\boldsymbol{\beta})\) 为向量 \(\boldsymbol{\alpha}-\boldsymbol{\beta}\) 的长度,即 \[ d(\boldsymbol{\alpha},\boldsymbol{\beta})=|\boldsymbol{\alpha}-\boldsymbol{\beta}| \]
标准正交基
设 \(V\) 为 \(n\) 维欧氏空间,\(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 是 \(V\) 的一组基。设 \(\boldsymbol{\alpha},\boldsymbol{\beta}\in V\),其中 \[ \begin{aligned} &\boldsymbol{\alpha}=a_{1}\boldsymbol{\varepsilon}_{1}+a_{2}\boldsymbol{\varepsilon}_{2}+\cdots+a_{n}\boldsymbol{\varepsilon}_{n}=(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n})\begin{pmatrix}a_{1}\\ a_{2}\\ \vdots\\ a_{n}\end{pmatrix} \\ &\boldsymbol{\beta}=b_{1}\boldsymbol{\varepsilon}_{1}+b_{2}\boldsymbol{\varepsilon}_{2}+\cdots+b_{n}\boldsymbol{\varepsilon}_{n}=(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n})\begin{pmatrix}b_{1}\\ b_{2}\\ \vdots\\ b_{n}\end{pmatrix} \end{aligned} \]
则 \(\boldsymbol{\alpha}\) 与 \(\boldsymbol{\beta}\) 的内积 \((\boldsymbol{\alpha},\boldsymbol{\beta})\) 为 \[ \begin{aligned} (\boldsymbol{\alpha},\boldsymbol{\beta}) &=(a_{1}\boldsymbol{\varepsilon}_{1}+a_{2}\boldsymbol{\varepsilon}_{2}+\cdots+a_{n}\boldsymbol{\varepsilon}_{n},b_{1}\boldsymbol{\varepsilon}_{1}+b_{2}\boldsymbol{\varepsilon}_{2}+\cdots+b_{n}\boldsymbol{\varepsilon}_{n})\\ &=\sum_{i=1}^{n}\sum_{j=1}^{n}a_{i}b_{j}(\boldsymbol{\varepsilon}_{i},\boldsymbol{\varepsilon}_{j})\\ &=(a_{1},a_{2},\cdots,a_{n})\boldsymbol{A}\begin{pmatrix}b_{1}\\ b_{2}\\ \vdots\\ b_{n}\end{pmatrix} \end{aligned} \]
- 基的度量矩阵:上式中矩阵 \(\boldsymbol{A}\) 叫作基 \(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 的度量矩阵,即 \[ \boldsymbol{A}=\begin{pmatrix}(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{1})&(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2})&\cdots&(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{n})\\ (\boldsymbol{\varepsilon}_{2},\boldsymbol{\varepsilon}_{1})&(\boldsymbol{\varepsilon}_{2},\boldsymbol{\varepsilon}_{2})&\cdots&(\boldsymbol{\varepsilon}_{2},\boldsymbol{\varepsilon}_{n})\\ \vdots&\vdots&&\vdots\\ (\boldsymbol{\varepsilon}_{n},\boldsymbol{\varepsilon}_{1})&(\boldsymbol{\varepsilon}_{n},\boldsymbol{\varepsilon}_{2})&\cdots&(\boldsymbol{\varepsilon}_{n},\boldsymbol{\varepsilon}_{n})\end{pmatrix} \]
- 正交基:设 \(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\)
为 \(n\) 维欧氏空间 \(V\) 的一个正交向量组。因此是 \(V\) 的一组基,称为 \(V\) 的一组正交基。
- 性质:正交基的度量矩阵 \(\boldsymbol{A}\) 为对角矩阵。
- 标准正交基:若正交基中每一个向量都是单位向量,则称此正交基为标准正交基。
- 性质:标准正交基的度量矩阵 \(\boldsymbol{A}\) 为单位矩阵。
施密特正交化方法
- 施密特正交化方法:设 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\)
是线性无关的向量组(\(s\geqslant 2\))
正交化:令 \[ \begin{aligned} \boldsymbol{\beta}_{1}&=\boldsymbol{\alpha}_{1}\\ \boldsymbol{\beta}_{2}&=\boldsymbol{\alpha}_{2}-\frac{(\boldsymbol{\alpha}_{2},\boldsymbol{\beta}_{1})}{(\boldsymbol{\beta}_{1},\boldsymbol{\beta}_{1})}\boldsymbol{\beta}_{1}\\ \boldsymbol{\beta}_{3}&=\boldsymbol{\alpha}_{3}-\frac{(\boldsymbol{\alpha}_{3},\boldsymbol{\beta}_{1})}{(\boldsymbol{\beta}_{1},\boldsymbol{\beta}_{1})}\boldsymbol{\beta}_{1}-\frac{(\boldsymbol{\alpha}_{3},\boldsymbol{\beta}_{2})}{(\boldsymbol{\beta}_{2},\boldsymbol{\beta}_{2})}\boldsymbol{\beta}_{2}\\ &\quad\vdots\\ \boldsymbol{\beta}_{s}&=\boldsymbol{\alpha}_{s}-\frac{(\boldsymbol{\alpha}_{s},\boldsymbol{\beta}_{1})}{(\boldsymbol{\beta}_{1},\boldsymbol{\beta}_{1})}\boldsymbol{\beta}_{1}-\cdots-\frac{(\boldsymbol{\alpha}_{s},\boldsymbol{\beta}_{s-1})}{(\boldsymbol{\beta}_{s-1},\boldsymbol{\beta}_{s-1})}\boldsymbol{\beta}_{s-1} \end{aligned} \]
则 \(\boldsymbol{\beta}_{1},\boldsymbol{\beta}_{2},\cdots,\boldsymbol{\beta}_{s}\) 是正交向量组。
单位化:令 \[ \boldsymbol{\eta}_{i}=\frac{1}{|\boldsymbol{\beta}_{i}|}\boldsymbol{\beta}_{i}\quad(i=1,2,\cdots,s) \]
则 \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{s}\) 为标准正交向量组。
- 等价性:由向量组等价的传递性可得线性无关的向量组 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\) 与标准正交向量组 \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{s}\) 等价。如果 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 是 \(n\) 维欧氏空间的一组基,则按照上面的施密特正交化方法就得到了一组标准正交基 \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{n}\),由于这两个向量组等价,因此由它们生成的空间是相同的,即 \[ L(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n})=L(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{n}) \]
正交矩阵
正交矩阵:若 \(n\) 阶实矩阵 \(\boldsymbol{A}\) 的列向量组是标准正交向量组,即若记 \[ \boldsymbol{A}=(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}), \]
\(\boldsymbol{A}\) 的列向量组 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{n}\) 满足 \[ (\boldsymbol{\alpha}_{i},\boldsymbol{\alpha}_{j})=\begin{cases}0,&i\neq j\\ 1,&i=j\end{cases}\quad(i,j=1,2,\cdots,n), \]
则称 \(\boldsymbol{A}\) 为正交矩阵。
性质:
- 若 \(\boldsymbol{A}\) 为正交矩阵,则 \(|\boldsymbol{A}|=\pm 1\)
- 实矩阵 \(\boldsymbol{A}\) 为正交矩阵的充要条件为 \(\boldsymbol{A}^{\mathrm{T}}\boldsymbol{A}=\boldsymbol{E}\)
- 实矩阵 \(\boldsymbol{A}\) 为正交矩阵的充要条件为 \(\boldsymbol{A}^{-1}=\boldsymbol{A}^{\mathrm{T}}\)
- 若矩阵 \(\boldsymbol{A}\) 为正交矩阵,则 \(\boldsymbol{A}^{-1}\) 和 \(\boldsymbol{A}^{*}\) 也是正交矩阵
- 若 \(n\) 阶矩阵 \(\boldsymbol{A}\) 和 \(\boldsymbol{B}\) 都是正交矩阵,则乘积 \(\boldsymbol{A}\boldsymbol{B}\) 也是正交矩阵
4.4 线性变换
线性变换的概念
- 变换:设 \(V\) 是数域 \(F\) 上的线性空间,若 \(\mathscr{A}\) 是线性空间 \(V\) 到自身的一个映射,即对 \(\forall\boldsymbol{\alpha}\in V\),有唯一的向量 \(\boldsymbol{\beta}\in V\) 与 \(\boldsymbol{\alpha}\) 对应,则称 \(\mathscr{A}\) 为 \(V\) 的一个变换。
- 线性变换:若变换 \(\mathscr{A}\) 满足:
- \(\mathscr{A}(\boldsymbol{\alpha}+\boldsymbol{\beta})=\mathscr{A}(\boldsymbol{\alpha})+\mathscr{A}(\boldsymbol{\beta})\)
- \(\mathscr{A}(k\boldsymbol{\alpha})=k\mathscr{A}(\boldsymbol{\alpha})\),\(\forall k\in F\)
- 像:线性变换 \(\mathscr{A}\) 的像 \(\boldsymbol{\beta}\) 为: \[ \boldsymbol{\beta} = \mathscr{A}(\boldsymbol{\alpha}) \]
- 值域:线性变换 \(\mathscr{A}\) 的值域 \(\mathrm{Im}(\mathscr{A})\) 为: \[ \mathrm{Im}(\mathscr{A})=\{\mathscr{A}(\boldsymbol{\xi})\mid\boldsymbol{\xi}\in V\} \]
- 核:线性变换 \(\mathscr{A}\) 的核 \(\mathrm{Ker}(\mathscr{A})\) 为: \[ \mathrm{Ker}(\mathscr{A})=\{\boldsymbol{\xi}\in V\mid\mathscr{A}(\boldsymbol{\xi})=\boldsymbol{0}\} \]
- 秩:线性变换 \(\mathscr{A}\) 的秩 \(r(\mathscr{A})\) 为: \[ r(\mathscr{A})=\dim(\mathrm{Im}(\mathscr{A})) \]
- 零度:线性变换 \(\mathscr{A}\) 的零度 \(r(\mathrm{Ker}(\mathscr{A}))\) 为: \[ r(\mathrm{Ker}(\mathscr{A}))=\dim(\mathrm{Ker}(\mathscr{A})), \]
常见线性变换
- 数乘变换: \[ \mathscr{A}(\boldsymbol{\alpha})=k\boldsymbol{\alpha},\quad \forall\boldsymbol{\alpha}\in V \]
- 恒等变换:即 \(k=1\) 的数乘变换 \[ \mathscr{A}(\boldsymbol{\alpha})=\boldsymbol{\alpha},\quad \forall\boldsymbol{\alpha}\in V \]
- 零变换:即 \(k=0\) 的数乘变换 \[ \mathscr{A}(\boldsymbol{\alpha})=\boldsymbol{0},\quad \forall\boldsymbol{\alpha}\in V \]
- n 阶方阵相似变换:详见下文 \[ \sigma:\,V\to V,\quad \sigma(\boldsymbol{A})=\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}. \]
- n 阶对称方阵的合同变换:详见下文 \[ \sigma:\,V\to V,\quad \sigma(\boldsymbol{A})=\boldsymbol{P}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{P}. \]
线性变换的运算
- 设 \(V\) 为数域 \(F\) 上的线性空间,\(k\in F\),\(\mathscr{A}\) 与 \(\mathscr{B}\) 为 \(V\) 的两个线性变换,则
- 和: \[ (\mathscr{A}+\mathscr{B})(\boldsymbol{\alpha})=\mathscr{A}(\boldsymbol{\alpha})+\mathscr{B}(\boldsymbol{\alpha}),\quad \forall\boldsymbol{\alpha}\in V, \]
- 数乘(纯量乘积): \[ (k\mathscr{A})(\boldsymbol{\alpha})=k(\mathscr{A}(\boldsymbol{\alpha})),\quad \forall k\in F,\forall\boldsymbol{\alpha}\in V, \]
- 积: \[ (\mathscr{A}\mathscr{B})(\boldsymbol{\alpha})=\mathscr{A}(\mathscr{B}(\boldsymbol{\alpha})),\quad \forall\boldsymbol{\alpha}\in V, \]
- 定理:若 \(V\) 为数域 \(F\) 上的线性空间,\(k\in F\),\(\mathscr{A}\) 与 \(\mathscr{B}\) 为 \(V\) 中的两个线性变换,则 \(\mathscr{A}+\mathscr{B}\),\(k\mathscr{A}\) 与 \(\mathscr{A}\mathscr{B}\) 都是 \(V\) 的线性变换。
线性变换的性质
若 \(\mathscr{A}\) 是数域 \(F\) 上的线性空间 \(V\) 的线性变换,则
\(\mathscr{A}(\boldsymbol{0})=\boldsymbol{0}\)
\(\mathscr{A}(-\boldsymbol{\alpha})=-\mathscr{A}(\boldsymbol{\alpha})\)
线性变换保持线性关系式不变,即对 \(\forall\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\in V\),\(k_{1},k_{2},\cdots,k_{m}\in F\) 有 \[ \mathscr{A}(k_{1}\boldsymbol{\alpha}_{1}+k_{2}\boldsymbol{\alpha}_{2}+\cdots+k_{m}\boldsymbol{\alpha}_{m})=k_{1}\mathscr{A}(\boldsymbol{\alpha}_{1})+k_{2}\mathscr{A}(\boldsymbol{\alpha}_{2})+\cdots+k_{m}\mathscr{A}(\boldsymbol{\alpha}_{m}) \]
即 \[ \mathscr{A}[(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m})\boldsymbol{k}]=(\mathscr{A}\boldsymbol{\alpha}_{1},\mathscr{A}\boldsymbol{\alpha}_{2},\cdots,\mathscr{A}\boldsymbol{\alpha}_{m})\boldsymbol{k} \]
其中 \(\boldsymbol{k}=(k_{1},k_{2},\cdots,k_{m})^{\mathrm{T}}\)。
- 线性变换 \(\mathscr{A}\) 将 \(V\) 中线性相关的向量组 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{m}\) 变换到线性相关的向量组。
4.5 线性变换的矩阵
线性变换在给定基下的矩阵:设 \(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 是 \(n\) 维线性空间 \(V\) 的一组基,\(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 在线性变换 \(\mathscr{A}\) 下的像分别为 \[ \begin{cases} \mathscr{A}(\boldsymbol{\varepsilon}_{1})=a_{11}\boldsymbol{\varepsilon}_{1}+a_{21}\boldsymbol{\varepsilon}_{2}+\cdots+a_{n1}\boldsymbol{\varepsilon}_{n}\\ \mathscr{A}(\boldsymbol{\varepsilon}_{2})=a_{12}\boldsymbol{\varepsilon}_{1}+a_{22}\boldsymbol{\varepsilon}_{2}+\cdots+a_{n2}\boldsymbol{\varepsilon}_{n}\\ \qquad\vdots\\ \mathscr{A}(\boldsymbol{\varepsilon}_{n})=a_{1n}\boldsymbol{\varepsilon}_{1}+a_{2n}\boldsymbol{\varepsilon}_{2}+\cdots+a_{nn}\boldsymbol{\varepsilon}_{n} \end{cases} \]
利用分块矩阵乘法,可表示为如下形式: \[ \mathscr{A}(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n})=(\mathscr{A}(\boldsymbol{\varepsilon}_{1}),\mathscr{A}(\boldsymbol{\varepsilon}_{2}),\cdots,\mathscr{A}(\boldsymbol{\varepsilon}_{n}))=(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n})\boldsymbol{A} \]
则称矩阵 \(\boldsymbol{A}\) 为线性变换 \(\mathscr{A}\) 在基 \(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 下的矩阵,即 \[ \boldsymbol{A}=(a_{ij})_{n\times n}=\begin{pmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn}\end{pmatrix} \]
线性变换与给定基下矩阵的关系:
- 设 \(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 是数域 \(F\) 上的 \(n\) 维线性空间 \(V\) 的一组基,\(\boldsymbol{A}=(a_{ij})_{n\times n}\) 是一个 \(n\) 阶方阵,那么必存在唯一的线性变换 \(\mathscr{A}\),它在基 \(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 下的矩阵为 \(\boldsymbol{A}\)。
- 设 \(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 是 \(n\) 维线性空间 \(V\) 的一组基,那么 \(V\) 中所有的线性变换 \(\mathscr{A}\) 与所有的 \(n\) 阶方阵 \(\boldsymbol{A}\) 之间存在一一对应的关系,这种关系由下式确定: \[ (\mathscr{A}(\boldsymbol{\varepsilon}_{1}),\mathscr{A}(\boldsymbol{\varepsilon}_{2}),\cdots,\mathscr{A}(\boldsymbol{\varepsilon}_{n}))=(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n})\boldsymbol{A} \]
线性变换在不同基下矩阵间的关系:设 \(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 和 \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{n}\) 是 \(n\) 维线性空间 \(V\) 的两组基,\(V\) 的线性变换 \(\mathscr{A}\) 在这两组基下的矩阵分别为 \(\boldsymbol{A}\) 和 \(\boldsymbol{B}\),且从 \(\boldsymbol{\varepsilon}_{1},\boldsymbol{\varepsilon}_{2},\cdots,\boldsymbol{\varepsilon}_{n}\) 到 \(\boldsymbol{\eta}_{1},\boldsymbol{\eta}_{2},\cdots,\boldsymbol{\eta}_{n}\) 的过渡矩阵为 \(\boldsymbol{C}\),那么 \[ \boldsymbol{B}=\boldsymbol{C}^{-1}\boldsymbol{A}\boldsymbol{C}. \]
第 5 章 矩阵的相似对角化
5.1 矩阵的特征值与特征向量
特征值与特征向量的概念
特征值与特征向量:设 \(\boldsymbol{A}\) 为数域 \(F\) 上的一个 \(n\) 阶方阵,\(\lambda\in F\),\(\boldsymbol{\alpha}\) 为 \(F\) 上的 \(n\) 维非零列向量。若 \[ \boldsymbol{A}\boldsymbol{\alpha}=\lambda\boldsymbol{\alpha} \]
则称 \(\lambda\) 为方阵 \(\boldsymbol{A}\) 的一个特征值,\(\boldsymbol{\alpha}\) 为 \(\boldsymbol{A}\) 的对应于特征值 \(\lambda\) 的特征向量。
- 性质:移项有 \[
(\lambda\boldsymbol{E} - \boldsymbol{A})\boldsymbol{\alpha} =
\boldsymbol{0}
\]
- 因此,若 \(\lambda\) 是矩阵 \(\boldsymbol{A}\) 的特征值,\(\boldsymbol{\alpha}\) 为对应于 \(\lambda\) 的特征向量,则 \(\boldsymbol{\alpha}\) 为齐次线性方程组 \((\lambda\boldsymbol{E} - \boldsymbol{A})\boldsymbol{X} = 0\) 的非零解向量
- 反之,若存在某个数 \(\lambda\) 使得齐次线性方程组 \((\lambda\boldsymbol{E} - \boldsymbol{A})\boldsymbol{X} = 0\) 有非零解,则 \(\lambda\) 为矩阵 \(\boldsymbol{A}\) 的特征值,方程组的任意一个非零解向量均为 \(\lambda\) 对应的特征向量
- 推论:
- \(\lambda\) 是矩阵 \(\boldsymbol{A}\) 的特征值的充分必要条件为 \(|\lambda\boldsymbol{E} - \boldsymbol{A}| = 0\)
- 若 \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_s\) 是对应于某个特征值 \(\lambda_0\) 的任意 \(s\) 个特征向量,则它们的任一非零线性组合 \(\sum_{i=1}^{s} k_i \boldsymbol{\alpha}_i\) 也是矩阵 \(\boldsymbol{A}\) 的对应于 \(\lambda_0\) 的特征向量
- 性质:移项有 \[
(\lambda\boldsymbol{E} - \boldsymbol{A})\boldsymbol{\alpha} =
\boldsymbol{0}
\]
特征子空间:矩阵 \(\boldsymbol{A}\) 对应于某个特征值 \(\lambda_0\) 的全体特征向量连同零向量一起组成 \(n\) 维向量空间 \(F^n\) 的一个子空间,它是齐次线性方程组 \((\lambda_0\boldsymbol{E} - \boldsymbol{A})\boldsymbol{\alpha} = \boldsymbol{0}\) 的解空间,称之为矩阵 \(\boldsymbol{A}\) 的对应于特征值 \(\lambda_0\) 的特征子空间,记为 \(V_{\lambda_0}\)
- 几何重数:特征子空间 \(V_{\lambda_{0}}\) 的维数称为特征值 \(\lambda_{0}\) 的几何重数。
特征多项式与特征方程:设数域 \(F\) 上的 \(n\) 阶方阵 \(\boldsymbol{A}=(a_{ij})_{n\times n}\),称 \[ f(\lambda)=|\lambda\boldsymbol{E}-\boldsymbol{A}|=\begin{vmatrix}\lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\cdots&-a_{2n}\\ \vdots&\vdots&&\vdots\\ -a_{n1}&-a_{n2}&\cdots&\lambda-a_{nn} \end{vmatrix} \]
为矩阵 \(\boldsymbol{A}\) 的特征多项式,\(|\lambda\boldsymbol{E}-\boldsymbol{A}|=0\) 叫作 \(\boldsymbol{A}\) 的特征方程。
特征根:由 \(n\) 阶行列式的定义可知,特征多项式的展开式 \(f(\lambda)\) 为 \(\lambda\) 的 \(n\) 次多项式,在复数域内恰有 \(n\) 个根(重根按重数计算),所以 \(n\) 阶方阵在复数域内必有 \(n\) 个特征值(重根按重数计算)。 \[ \begin{aligned} f(\lambda)&=\lambda^{n}-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}+\cdots+(-1)^{n}|\boldsymbol{A}| \\ &=(\lambda-\lambda_{1})^{n_{1}}(\lambda-\lambda_{2})^{n_{2}}\cdots(\lambda-\lambda_{s})^{n_{s}} \end{aligned} \]
其中 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\in\mathbb{C}\) 两两不同,\(n_{1}+n_{2}+\cdots+n_{s}=n\)。
- 代数重数:称特征值 \(\lambda_{i}\) 为此特征多项式的 \(n_{i}\) 重根,\(n_{i}\) 叫作 \(\lambda_{i}\) 的代数重数。
- 特别地,代数重数为 1 的特征值也称为单特征值或特征多项式的单根。
特征值与特征向量的求法
- 特征值与特征向量的求法:给定一个 \(n\) 阶方阵 \(\boldsymbol{A}\),可按如下步骤求它的特征值与特征向量:
计算 \(\boldsymbol{A}\) 的特征多项式 \(f(\lambda)=|\lambda\boldsymbol{E}-\boldsymbol{A}|\),并求特征方程 \(f(\lambda)=0\) 的所有根,即为 \(\boldsymbol{A}\) 的所有特征值。设解得 \(\boldsymbol{A}\) 有 \(s\) 个不同特征值 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\)
对每一个特征值 \(\lambda_{i}\)(\(i=1,2,\cdots,s\)),求出齐次线性方程组 \[ (\lambda_{i}\boldsymbol{E}-\boldsymbol{A})\boldsymbol{X}=\boldsymbol{0} \]
的一个基础解系 \(\boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{ir_{i}}\),此基础解系的所有非零线性组合 \(\sum_{j=1}^{r_{i}}k_{ij}\boldsymbol{\alpha}_{ij}\)(\(k_{ij}\) 不全为零)即为方阵 \(\boldsymbol{A}\) 的对应于 \(\lambda_{i}\) 的全部特征向量。
- 说明:
- 对角矩阵的特征值就是对角线上的所有元素,同阶的单位矩阵的列向量可分别看作是它们所对应的一个特征向量
- 行和相等的方阵,这个行和一定是它的一个特征值,而分量均为 1 的列向量必为这个特征值所对应的一个特征向量
特征值与特征向量的性质
- 设 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{n}\) 为 \(n\) 阶方阵 \(\boldsymbol{A}=(a_{ij})_{n\times n}\) 的 \(n\) 个特征值,则 \[ \sum_{j=1}^{n}\lambda_{j}=\sum_{i=1}^{n}a_{ii}=\mathrm{tr}(\boldsymbol{A}) \\ \prod_{j=1}^{n}\lambda_{j}=|\boldsymbol{A}| \]
- 方阵 \(\boldsymbol{A}\) 与 \(\boldsymbol{A}^{\mathrm{T}}\) 有相同的特征多项式及相同的特征值。 \[ |\lambda\boldsymbol{E}-\boldsymbol{A}^{\mathrm{T}}|=|(\lambda\boldsymbol{E}-\boldsymbol{A})^{\mathrm{T}}|=|\lambda\boldsymbol{E}-\boldsymbol{A}| \]
- 设 \(\lambda\) 为方阵 \(\boldsymbol{A}\) 的特征值,\(\boldsymbol{\alpha}\) 为 \(\boldsymbol{A}\) 的对应于 \(\lambda\) 的特征向量,则
- \(k\lambda\) 是 \(k\boldsymbol{A}\) 的特征值,\(\boldsymbol{\alpha}\) 也为 \(k\boldsymbol{A}\) 的对应于特征值 \(k\lambda\) 的特征向量,其中 \(k\) 为任意常数
- \(\lambda^{m}\) 是 \(\boldsymbol{A}^{m}\) 的特征值,\(\boldsymbol{\alpha}\) 也为 \(\boldsymbol{A}^{m}\) 的对应于特征值 \(\lambda^{m}\) 的特征向量,其中 \(m\) 为任意正整数
- \(g(\lambda)\) 是 \(g(\boldsymbol{A})\) 的特征值,\(\boldsymbol{\alpha}\) 也为 \(g(\boldsymbol{A})\) 的对应于特征值 \(g(\lambda)\) 的特征向量,其中 \(g(x)\) 为数域 \(F\) 上的多项式,\(m\) 为正整数 \[ g(x)=a_{m}x^{m}+a_{m-1}x^{m-1}+\cdots+a_{1}x+a_{0} \]
- \(n\) 阶方阵 \(\boldsymbol{A}\) 可逆的充分必要条件为 \(\boldsymbol{A}\) 的 \(n\) 个特征值全不为零。
- 设 \(\lambda\) 为可逆矩阵 \(\boldsymbol{A}\) 的特征值,\(\boldsymbol{\alpha}\) 为 \(\boldsymbol{A}\) 的对应于 \(\lambda\) 的特征向量,则
- \(\frac{1}{\lambda}\) 为其逆矩阵 \(\boldsymbol{A}^{-1}\) 的特征值,且 \(\boldsymbol{\alpha}\) 是 \(\boldsymbol{A}^{-1}\) 的对应于特征值 \(\frac{1}{\lambda}\) 的特征向量
- \(\frac{1}{\lambda}\cdot|\boldsymbol{A}|\) 为其伴随矩阵 \(\boldsymbol{A}^{*}\) 的特征值,\(\boldsymbol{\alpha}\) 也是 \(\boldsymbol{A}^{*}\) 的对应于特征值 \(\frac{1}{\lambda}\cdot|\boldsymbol{A}|\) 的特征向量。
- 设 \(\lambda_{0}\) 是方阵 \(\boldsymbol{A}\)
的一个特征值,它的几何重数(维数)和代数重数(特征根的重数)分别为 \(r\) 和 \(k\)。则 \(r\leqslant k\)。
- 设 \(\lambda_{0}\) 为方阵 \(\boldsymbol{A}\) 的一个单特征值,则 \(\boldsymbol{A}\) 的对应于 \(\lambda_{0}\) 的线性无关的特征向量有且仅有一个。
- 设 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\)
为 \(n\) 阶方阵 \(\boldsymbol{A}\) 的 \(s\) 个不同特征值,\(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\)
分别是对应它们的特征向量,则 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\)
线性无关。
设 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\) 为 \(n\) 阶方阵 \(\boldsymbol{A}\) 的 \(s\) 个不同特征值,\(\boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{ir_{i}}\) 为对应于特征值 \(\lambda_{i}\) 的 \(r_{i}\) 个线性无关的特征向量,\(1\leqslant i\leqslant s\)。则向量组 \[ \boldsymbol{\alpha}_{11},\boldsymbol{\alpha}_{12},\cdots,\boldsymbol{\alpha}_{1r_{1}};\boldsymbol{\alpha}_{21},\boldsymbol{\alpha}_{22},\cdots,\boldsymbol{\alpha}_{2r_{2}};\cdots;\boldsymbol{\alpha}_{s1},\boldsymbol{\alpha}_{s2},\cdots,\boldsymbol{\alpha}_{sr_{s}} \]
线性无关。
5.2 相似矩阵和矩阵的对角化
相似矩阵
相似矩阵:设 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 都是数域 \(F\) 上的 \(n\) 阶方阵,若存在 \(F\) 上的 \(n\) 阶可逆矩阵 \(\boldsymbol{P}\) 使得 \[ \boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{B} \]
则称方阵 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 相似,记作 \(\boldsymbol{A}\sim\boldsymbol{B}\)。
相似矩阵的性质:
方阵的相似关系是一种等价关系:
- 反身性:设 \(\boldsymbol{A}\in F^{n\times n}\),则 \(\boldsymbol{A}\sim\boldsymbol{A}\)
- 对称性:设 \(\boldsymbol{A},\boldsymbol{B}\in F^{n\times n}\),若 \(\boldsymbol{A}\sim\boldsymbol{B}\),则 \(\boldsymbol{B}\sim\boldsymbol{A}\)
- 传递性:设 \(\boldsymbol{A},\boldsymbol{B},\boldsymbol{C}\in F^{n\times n}\),若 \(\boldsymbol{A}\sim\boldsymbol{B}\) 且 \(\boldsymbol{B}\sim\boldsymbol{C}\),则 \(\boldsymbol{A}\sim\boldsymbol{C}\)
相似矩阵有相同的特征多项式,从而有相同的特征值、相同的行列式和相同的迹。
设 \(\boldsymbol{A}\sim\boldsymbol{B}\),且 \(\boldsymbol{A}\) 可逆,则 \(\boldsymbol{B}\) 可逆,且 \(\boldsymbol{A}^{-1}\sim\boldsymbol{B}^{-1}\)。
设 \(\boldsymbol{A}\sim\boldsymbol{B}\),则
- \(k\boldsymbol{A}\sim k\boldsymbol{B}\),\(k\in F\)
- \(\boldsymbol{A}^{m}\sim\boldsymbol{B}^{m}\),其中 \(m\) 是任意正整数
- \(g(\boldsymbol{A})\sim g(\boldsymbol{B})\),其中 \(g(x)\) 为数域 \(F\) 上的 \(m\) 次多项式,\(m\) 为非负整数。 \[ g(x)=a_{m}x^{m}+a_{m-1}x^{m-1}+\cdots+a_{1}x+a_{0} \]
设 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 为数域 \(F\) 上的分块对角阵,其中 \(\boldsymbol{A}_{i}\) 与 \(\boldsymbol{B}_{i}\) 都是 \(n_{i}\) 阶方阵 \[ \boldsymbol{A}=\begin{pmatrix}\boldsymbol{A}_{1}&&&\\ &\boldsymbol{A}_{2}&&\\ &&\ddots&\\ &&&\boldsymbol{A}_{t}\end{pmatrix},\quad \boldsymbol{B}=\begin{pmatrix}\boldsymbol{B}_{1}&&&\\ &\boldsymbol{B}_{2}&&\\ &&\ddots&\\ &&&\boldsymbol{B}_{t}\end{pmatrix} \]
若对所有的 \(i\),\(1\leqslant i\leqslant t\),\(\boldsymbol{A}_{i}\sim\boldsymbol{B}_{i}\),则 \(\boldsymbol{A}\sim\boldsymbol{B}\)。
设 \(\boldsymbol{A}=(a_{ij})_{n\times n}\) 为复数域 \(\mathbb{C}\) 上的 \(n\) 阶方阵,则存在复数域 \(\mathbb{C}\) 上的上三角矩阵 \(\boldsymbol{B}\) 与矩阵 \(\boldsymbol{A}\) 相似。
矩阵相似对角阵
可对角化:设 \(\boldsymbol{A}\) 为 \(n\) 阶方阵,若 \(\boldsymbol{A}\) 相似于对角阵,即若存在 \(n\) 阶可逆矩阵 \(\boldsymbol{P}\) 使得 \[ \boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{\Lambda} \]
其中 \(\boldsymbol{\Lambda}\) 为 \(n\) 阶对角阵,则称 \(\boldsymbol{A}\) 可对角化。
可对角化条件:设 \(\boldsymbol{A}\) 为复数域 \(\mathbb{C}\) 上的 \(n\) 阶方阵,则 \(\boldsymbol{A}\) 相似于对角阵的充分必要条件是 \(\boldsymbol{A}\) 有 \(n\) 个线性无关的特征向量。
- 若 \(n\) 阶方阵 \(\boldsymbol{A}\) 有 \(n\) 个不同的特征值,则 \(\boldsymbol{A}\) 必可对角化。(充分条件)
- 设 \(n\) 阶方阵 \(\boldsymbol{A}\) 有 \(s\) 个不同的特征值 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\)。对 \(1\leqslant i\leqslant s\),\(\lambda_{i}\) 的代数重数与几何重数分别为 \(n_{i}\) 与 \(m_{i}\),则方阵 \(\boldsymbol{A}\) 相似于对角阵的充分必要条件为 \[ m_{i}=n_{i},\quad i=1,2,\cdots,s. \]
判断及求解方法:判断一个方阵 \(\boldsymbol{A}_{n}\) 是否相似于对角阵,及求使得 \(\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}\) 为对角阵的可逆矩阵 \(\boldsymbol{P}\) 的一般步骤为:
求出方阵 \(\boldsymbol{A}\) 的所有特征值 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\),它们的代数重数分别为 \(n_{1},n_{2},\cdots,n_{s}\),\(\sum\limits_{i=1}^{s}n_{i}=n\)
对每个特征值 \(\lambda_{i}\),计算 \(r(\lambda_{i}\boldsymbol{E}-\boldsymbol{A})\),若下式成立,则 \(\boldsymbol{A}\) 可对角化,否则不能对角化 \[ r(\lambda_{i}\boldsymbol{E}-\boldsymbol{A})=n-n_{i},\quad i=1,2,\cdots,s \]
在可对角化的情况下,对每个特征值 \(\lambda_{i}\),求出齐次线性方程组 \((\lambda_{i}\boldsymbol{E}-\boldsymbol{A})\boldsymbol{x}=\boldsymbol{0}\) 的基础解系 \[ \boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{in_{i}},\quad i=1,2,\cdots,s \]
令 \[ \boldsymbol{P}=(\boldsymbol{\alpha}_{11},\boldsymbol{\alpha}_{12},\cdots,\boldsymbol{\alpha}_{1n_{1}},\cdots,\boldsymbol{\alpha}_{s1},\boldsymbol{\alpha}_{s2},\cdots,\boldsymbol{\alpha}_{sn_{s}}) \]
则 \(\boldsymbol{P}\) 可逆,且有 \[ \boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{\Lambda}=\mathrm{diag}(\underbrace{\lambda_{1},\cdots,\lambda_{1}}_{n_{1}\text{个}},\underbrace{\lambda_{2},\cdots,\lambda_{2}}_{n_{2}\text{个}},\cdots,\underbrace{\lambda_{s},\cdots,\lambda_{s}}_{n_{s}\text{个}}) \]
5.3 实对称矩阵的相似对角化
实对称矩阵的特征值与特征向量
- 一般性质:见上文
- 特殊性质:
- 实对称矩阵的特征值全是实数。
- 实对称矩阵的属于不同特征值的实特征向量正交。
实对称矩阵正交相似对角阵
定理:设 \(\boldsymbol{A}\) 为 \(n\) 阶实对称矩阵,则存在 \(n\) 阶正交矩阵 \(\boldsymbol{Q}\),使得 \[ \boldsymbol{Q}^{-1}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{Q}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{\Lambda}, \]
其中 \[ \boldsymbol{\Lambda}=\begin{pmatrix}\lambda_{1}&&&\\ &\lambda_{2}&&\\ &&\ddots&\\ &&&\lambda_{n}\end{pmatrix},\quad \lambda_{1},\lambda_{2},\cdots,\lambda_{n}\text{ 为 }\boldsymbol{A}\text{ 的特征值}。 \]
- \(n\) 阶实对称矩阵必有 \(n\) 个线性无关的特征向量。
- \(n\) 阶实对称矩阵的每个特征值的几何重数必等于它的代数重数。
求实对称矩阵正交相似对角阵的方法:对任意实对称矩阵 \(\boldsymbol{A}\),找出正交矩阵 \(\boldsymbol{Q}\) 使得 \(\boldsymbol{Q}^{-1}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{Q}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{\Lambda}\)(对角阵)的方法如下:
求出实对称矩阵 \(\boldsymbol{A}\) 的全部特征值 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\),它们的代数重数分别为 \(n_{1},n_{2},\cdots,n_{s}\),\(\sum_{i=1}^{s}n_{i}=n\)
对每个特征值 \(\lambda_{i}\),求出齐次线性方程组 \((\lambda_{i}\boldsymbol{E}-\boldsymbol{A})\boldsymbol{x}=\boldsymbol{0}\) 的基础解系 \[ \boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{in_{i}},\quad i=1,2,\cdots,s \]
对 \(\boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{in_{i}}\) 正交化、单位化得 \(\boldsymbol{\varepsilon}_{i1},\boldsymbol{\varepsilon}_{i2},\cdots,\boldsymbol{\varepsilon}_{in_{i}}\),即得到两两正交的单位特征向量 \[ \boldsymbol{\varepsilon}_{11},\boldsymbol{\varepsilon}_{12},\cdots,\boldsymbol{\varepsilon}_{1n_{1}},\cdots,\boldsymbol{\varepsilon}_{s1},\boldsymbol{\varepsilon}_{s2},\cdots,\boldsymbol{\varepsilon}_{sn_{s}} \]
令 \[ \boldsymbol{Q}=(\boldsymbol{\varepsilon}_{11},\boldsymbol{\varepsilon}_{12},\cdots,\boldsymbol{\varepsilon}_{1n_{1}},\cdots,\boldsymbol{\varepsilon}_{s1},\boldsymbol{\varepsilon}_{s2},\cdots,\boldsymbol{\varepsilon}_{sn_{s}}) \]
则 \(\boldsymbol{Q}\) 为正交矩阵,且有 \[ \boldsymbol{Q}^{-1}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{Q}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{\Lambda}=\mathrm{diag}(\underbrace{\lambda_{1},\cdots,\lambda_{1}}_{n_{1}\text{个}},\underbrace{\lambda_{2},\cdots,\lambda_{2}}_{n_{2}\text{个}},\cdots,\underbrace{\lambda_{s},\cdots,\lambda_{s}}_{n_{s}\text{个}}) \]
第 6 章 实二次型
6.1 二次型的基本概念及化二次型为标准形
二次型及其矩阵表示
二次型:称含 \(n\) 个变量 \(x_{1},x_{2},\cdots,x_{n}\) 的二次齐次函数 \[ \begin{aligned} f(x_{1},x_{2},\cdots,x_{n})=&a_{11}x_{1}^{2}+2a_{12}x_{1}x_{2}+\cdots+2a_{1n}x_{1}x_{n}+\\ &a_{22}x_{2}^{2}+2a_{23}x_{2}x_{3}+\cdots+2a_{2n}x_{2}x_{n}+\cdots+a_{nn}x_{n}^{2} \end{aligned} \]
为一个 \(n\) 元二次型,简称二次型。
- 实二次型:系数 \(a_{ij}\in\mathbb{R}\)
- 复二次型:系数 \(a_{ij}\in\mathbb{C}\)
- 标准二次型:只含平方项的二次型 \[ f(x_{1},x_{2},\cdots,x_{n})=a_{11}x_{1}^{2}+a_{22}x_{2}^{2}+\cdots+a_{nn}x_{n}^{2} \]
- 规范二次型:各项的系数为 \(1\),\(-1\) 或 \(0\) 的标准二次型
矩阵表示:设 \(a_{ij}=a_{ji}\)(\(i,j=1,2,\cdots,n\)),则二次型可表示为 \[ \begin{aligned} f=&a_{11}x_{1}^{2}+a_{12}x_{1}x_{2}+\cdots+a_{1n}x_{1}x_{n}+\\ &a_{21}x_{2}x_{1}+a_{22}x_{2}^{2}+\cdots+a_{2n}x_{2}x_{n}+\\ &\cdots+\\ &a_{n1}x_{n}x_{1}+a_{n2}x_{n}x_{2}+\cdots+a_{nn}x_{n}^{2}\\ =&\sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}x_{i}x_{j} \end{aligned} \]
又设矩阵 \[ \boldsymbol{A}=\begin{pmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn}\end{pmatrix},\quad \boldsymbol{x}=\begin{pmatrix}x_{1}\\ x_{2}\\ \vdots\\ x_{n}\end{pmatrix} \]
则 \(\boldsymbol{A}\) 为实对称矩阵,且 \[ f=\sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}x_{i}x_{j}=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x} \]
称上式为二次型 \(f\) 的矩阵表示式,则二次型 \(f\) 与实对称矩阵 \(\boldsymbol{A}\) 一一对应。
- 称实对称阵 \(\boldsymbol{A}\) 为二次型 \(f\) 的矩阵,\(\boldsymbol{A}\) 的秩 \(r(\boldsymbol{A})\) 为 \(f\) 的秩,记作 \(r(f)\),即 \[ r(f)=r(\boldsymbol{A}). \]
- 标准二次型的矩阵 \[ \boldsymbol{A}_{1}=\begin{pmatrix}a_{11}&&&\\ &a_{22}&&\\ &&\ddots&\\ &&&a_{nn}\end{pmatrix} \]
- 规范二次型的矩阵:其中 \(r=r(\boldsymbol{A}_{2})=r(f)\)。 \[ \boldsymbol{A}_{2}=\begin{pmatrix}\boldsymbol{E}_{p}&&&\\ &-\boldsymbol{E}_{r-p}&&\\ &&&\boldsymbol{0}\end{pmatrix} \]
二次型的非奇异线性替换
非奇异的线性替换:设 \(\boldsymbol{x},\boldsymbol{y}\) 为 \(n\) 维向量,\(n\) 阶方阵 \(\boldsymbol{P}\) 为可逆矩阵,称 \[ \boldsymbol{x}=\boldsymbol{P}\boldsymbol{y} \]
为非奇异(非退化)的线性替换。
合同矩阵
合同矩阵:设 \(\boldsymbol{A}\) 和 \(\boldsymbol{B}\) 为 \(n\) 阶方阵,若存在 \(F\) 上的 \(n\) 阶可逆矩阵 \(\boldsymbol{P}\) 使得 \[ \boldsymbol{P}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{B} \]
则称矩阵 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 合同。
合同矩阵的性质:
- 方阵的合同关系是一种等价关系:
- 反身性:\(\boldsymbol{A}\) 合同于 \(\boldsymbol{A}\)
- 对称性:若 \(\boldsymbol{A}\) 合同于 \(\boldsymbol{B}\),则 \(\boldsymbol{B}\) 也合同于 \(\boldsymbol{A}\)
- 传递性:若 \(\boldsymbol{A}\) 合同于 \(\boldsymbol{B}\),\(\boldsymbol{B}\) 又合同于 \(\boldsymbol{C}\),则 \(\boldsymbol{A}\) 也合同于 \(\boldsymbol{C}\)
- 若 \(\boldsymbol{A}\) 合同于 \(\boldsymbol{B}\),则 \(r(\boldsymbol{A})=r(\boldsymbol{B})\)
- 若 \(\boldsymbol{A}\) 合同于 \(\boldsymbol{B}\) 且 \(\boldsymbol{A}\) 为对称阵,则 \(\boldsymbol{B}\) 也是对称阵。
- 一个二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\) 经非奇异线性替换 \(\boldsymbol{x}=\boldsymbol{P}\boldsymbol{y}\) 仍变为一个二次型 \(f=\boldsymbol{y}^{\mathrm{T}}(\boldsymbol{P}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{P})\boldsymbol{y}=\boldsymbol{y}^{\mathrm{T}}\boldsymbol{B}\boldsymbol{y}\),且它们的矩阵合同,即 \[ \boldsymbol{P}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{B} \]
- 方阵的合同关系是一种等价关系:
化二次型为标准二次型的方法
二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\) 化为标准二型的问题等同于实对称矩阵 \(\boldsymbol{A}\) 合同到对角矩阵的问题。
定理:任何一个二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\) 必存在正交线性替换 \(\boldsymbol{x}=\boldsymbol{Q}\boldsymbol{y}\)(\(\boldsymbol{Q}\) 为正交矩阵),使得新变量的二次型 \(\boldsymbol{y}^{\mathrm{T}}(\boldsymbol{Q}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{Q})\boldsymbol{y}=\boldsymbol{y}^{\mathrm{T}}\boldsymbol{\Lambda}\boldsymbol{y}\) 为标准二次型。即 \[ \begin{aligned} f&=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\\ &\xlongequal{\boldsymbol{x}=\boldsymbol{Q}\boldsymbol{y}} \boldsymbol{y}^{\mathrm{T}}(\boldsymbol{Q}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{Q})\boldsymbol{y}\\ &\xlongequal{\boldsymbol{\Lambda}=\boldsymbol{Q}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{Q}} \boldsymbol{y}^{\mathrm{T}}\boldsymbol{\Lambda}\boldsymbol{y}\\ &=\lambda_{1}y_{1}^{2}+\lambda_{2}y_{2}^{2}+\cdots+\lambda_{n}y_{n}^{2} \end{aligned} \]
其中 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{n}\) 是实对称矩阵 \(\boldsymbol{A}\) 的特征值。
正交替换法:对任何二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\),首先求实对称矩阵 \(\boldsymbol{A}\) 的正交相似对角阵 \(\boldsymbol{Q}\) ,然后用 \(\boldsymbol{x}=\boldsymbol{Q}\boldsymbol{y}\) 表示新变量,即可化为标准二次型,步骤如下:
- 求出实对称矩阵 \(\boldsymbol{A}\) 的全部特征值 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\),它们的代数重数分别为 \(n_{1},n_{2},\cdots,n_{s}\),\(\sum_{i=1}^{s}n_{i}=n\)
- 对每个特征值 \(\lambda_{i}\),求出齐次线性方程组 \((\lambda_{i}\boldsymbol{E}-\boldsymbol{A})\boldsymbol{x}=\boldsymbol{0}\) 的基础解系 \[ \boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{in_{i}},\quad i=1,2,\cdots,s \]
- 对 \(\boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{in_{i}}\) 正交化、单位化得 \(\boldsymbol{\varepsilon}_{i1},\boldsymbol{\varepsilon}_{i2},\cdots,\boldsymbol{\varepsilon}_{in_{i}}\),即得到两两正交的单位特征向量 \[ \boldsymbol{\varepsilon}_{11},\boldsymbol{\varepsilon}_{12},\cdots,\boldsymbol{\varepsilon}_{1n_{1}},\cdots,\boldsymbol{\varepsilon}_{s1},\boldsymbol{\varepsilon}_{s2},\cdots,\boldsymbol{\varepsilon}_{sn_{s}} \]
- 则 \(\boldsymbol{Q}\) 为正交矩阵 \[ \boldsymbol{Q}=(\boldsymbol{\varepsilon}_{11},\boldsymbol{\varepsilon}_{12},\cdots,\boldsymbol{\varepsilon}_{1n_{1}},\cdots,\boldsymbol{\varepsilon}_{s1},\boldsymbol{\varepsilon}_{s2},\cdots,\boldsymbol{\varepsilon}_{sn_{s}}) \]
- 进行正交替换 \[ \boldsymbol{x}=\boldsymbol{Q}\boldsymbol{y} \]
- 则新变量的二次型为标准二次型 \[ f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}=\boldsymbol{y}^{\mathrm{T}}\boldsymbol{\Lambda}\boldsymbol{y}=\lambda_{1}y_{1}^{2}+\lambda_{2}y_{2}^{2}+\cdots+\lambda_{n}y_{n}^{2} \]
定理 设二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\),则存在非奇异线性替换 \(\boldsymbol{x}=\boldsymbol{P}\boldsymbol{y}\) 化 \(f\) 为标准二次型。
- 二次型经配方法化为标准形时,标准形各项的系数可以是不唯一的,它们不必是二次型矩阵的特征值,与所作的非退化线性替换有关。
- 几何意义:二次曲线方程经非奇异线性替换化为标准形方程时,曲线的度量(大小和形状)可能会改变。
配方法:对任何二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\)
- 若 \(f\) 中平方项的系数不全为零时,不妨设 \(x_{i}^2\) 系数不为零,则可通过配方使余下的二次型为不含 \(x_{i}\) 的 \(n-1\) 元二次型,进而可继续用配方使余下的二次型为不含 \(x_{i-1}\) 的 \(n-2\) 元二次型,依此类推,最后可化为标准形。
- 若 \(f\) 中所有平方项的系数都为零,而 \(x_{i}x_{j}\) 的项的系数不为零,则可先用一次非奇异性替换使得 \(f\) 中出现系数不为零的平方项,然后使用同样方法配方,最后可化为标准形。
6.2 惯性定理与正定二次型
惯性定理
- 惯性定理:任何实二次型必存在非奇异线性替换化二次型为规范标准形,且规范标准形是唯一的。
- 几何意义:二次曲线(二次曲面)方程经非奇异线性替换化为标准方程时,标准方程的系数与所作的线性替换有关,但曲线(曲面)的类型(如椭圆型,双曲型等)是不会因所作的线性替换不同而改变。
- 惯性指数:设二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\),\(r(f)=r\),经非奇异线性替换化 \(f\) 为标准形,则:
- 正惯性指数:\(f\) 的标准形中正项的个数,记为 \(p\)
- 负惯性指数:\(q=r-p\)
- 符号差:\(s=p-q\)
- 性质:二次型的正惯性指数、负惯性指数和符号差与所作的非奇异线性替换无关
- 任何实对称矩阵 \(\boldsymbol{A}_{n}\) 都合同于对角矩阵 \[ \mathrm{diag}(\underbrace{1,\cdots,1}_{p\text{个}},\underbrace{-1,\cdots,-1}_{r-p\text{个}},\underbrace{0,\cdots,0}_{n-r\text{个}})=\begin{pmatrix}\boldsymbol{E}_{p}&&\\ &-\boldsymbol{E}_{r-p}&\\ &&\boldsymbol{0}\end{pmatrix}_{n} \]
- 两个 \(n\) 元二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\) 与 \(g=\boldsymbol{y}^{\mathrm{T}}\boldsymbol{B}\boldsymbol{y}\) 有相同的秩及正惯性指数的充分必要条件为存在非奇异线性替换 \(\boldsymbol{x}=\boldsymbol{P}\boldsymbol{y}\),使 \[ f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\xlongequal{\boldsymbol{x}=\boldsymbol{P}\boldsymbol{y}}\boldsymbol{y}^{\mathrm{T}}\boldsymbol{B}\boldsymbol{y}=g \]
- \(n\) 阶实对称矩阵 \(\boldsymbol{A}\) 合同于 \(\boldsymbol{B}\) 的充分必要条件为 \(r(\boldsymbol{A})=r(\boldsymbol{B})\),且 \(\boldsymbol{A}\) 和 \(\boldsymbol{B}\) 的正惯性指数相等。
正定二次型
正定二次型与正定矩阵:设 \(n\) 元二次型 \[ f(x_{1},x_{2},\cdots,x_{n})=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x} \]
若对任意非零向量 \(\boldsymbol{x}_{0}=(c_{1},c_{2},\cdots,c_{n})^{\mathrm{T}}\),都有 \[ f(c_{1},c_{2},\cdots,c_{n})=\boldsymbol{x}_{0}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}_{0}>0 \]
则称二次型 \(f\) 为正定二次型,并称其矩阵 \(\boldsymbol{A}\) 为正定矩阵。
- 性质:实二次型 \(f(x_{1},x_{2},\cdots,x_{n})=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\) 经非奇异线性替换后其正定性不改变。
顺序主子式:设矩阵 \(\boldsymbol{A}=(a_{ij})_{n\times n}\),则称由 \(\boldsymbol{A}\) 的前 \(k\) 行前 \(k\) 列构成的 \(k\) 阶行列式(\(1\leqslant k\leqslant n\)) \[ \begin{vmatrix}a_{11}&a_{12}&\cdots&a_{1k}\\ a_{21}&a_{22}&\cdots&a_{2k}\\ \vdots&\vdots&&\vdots\\ a_{k1}&a_{k2}&\cdots&a_{kk}\end{vmatrix} \]
为矩阵 \(\boldsymbol{A}\) 的 \(k\) 阶顺序主子式。
正定矩阵判定定理:设 \(\boldsymbol{A}\) 为 \(n\) 阶实对称矩阵,则下述命题等价:
- \(\boldsymbol{A}\) 为正定矩阵
- \(\boldsymbol{A}\) 的特征值全大于零
- \(\boldsymbol{A}\) 合同于单位矩阵 \(\boldsymbol{E}\)
- 存在非奇异矩阵 \(\boldsymbol{M}\),使得 \(\boldsymbol{A}=\boldsymbol{M}^{\mathrm{T}}\boldsymbol{M}\)
- 推论:若 \(n\) 阶实对称矩阵 \(\boldsymbol{A}\) 正定,则 \(|\boldsymbol{A}|>0\)。
正定二次型判定定理:对应实对称矩阵为正定矩阵,正惯性指数 \(p=r=n\)。
标准二次型 \(f(x_{1},x_{2},\cdots,x_{n})=k_{1}x_{1}^{2}+k_{2}x_{2}^{2}+\cdots+k_{n}x_{n}^{2}\) 正定的充分必要条件为 \(k_{i}>0\),\(i=1,2,\cdots,n\)。
一般 \(n\) 元二次型 \[ f(x_{1},x_{2},\cdots,x_{n})=\sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}x_{i}x_{j} \]
正定的充分必要条件为其矩阵 \(\boldsymbol{A}=(a_{ij})_{n\times n}\) 的各阶顺序主子式全大于零。即 \[ |a_{11}|>0,\quad \begin{vmatrix}a_{11}&a_{12}\\ a_{21}&a_{22}\end{vmatrix}>0,\quad \begin{vmatrix}a_{11}&a_{12}&a_{13}\\ a_{21}&a_{22}&a_{23}\\ a_{31}&a_{32}&a_{33}\end{vmatrix}>0,\quad\cdots,\quad \begin{vmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn}\end{vmatrix}>0 \]
其他二次型
半正定二次型与半正定矩阵:对任意非零列向量 \(\boldsymbol{x}_{0}=(c_{1},c_{2},\cdots,c_{n})^{\mathrm{T}}\),都有 \[ f(c_{1},c_{2},\cdots,c_{n})=\boldsymbol{x}_{0}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}_{0}\geq0 \]
负定二次型与负定矩阵:对任意非零列向量 \(\boldsymbol{x}_{0}=(c_{1},c_{2},\cdots,c_{n})^{\mathrm{T}}\),都有 \[ f(c_{1},c_{2},\cdots,c_{n})=\boldsymbol{x}_{0}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}_{0}<0 \]
半负定二次型与半负定矩阵:对任意非零列向量 \(\boldsymbol{x}_{0}=(c_{1},c_{2},\cdots,c_{n})^{\mathrm{T}}\),都有 \[ f(c_{1},c_{2},\cdots,c_{n})=\boldsymbol{x}_{0}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}_{0}\leq0 \]
不定二次型与不定矩阵:存在非零向量 \(\boldsymbol{x}_{1}=(c_{1},c_{2},\cdots,c_{n})^{\mathrm{T}}\neq\boldsymbol{0}\) 及 \(\boldsymbol{x}_{2}=(d_{1},d_{2},\cdots,d_{n})^{\mathrm{T}}\neq\boldsymbol{0}\),使得 \[ f(c_{1},c_{2},\cdots,c_{n})=\boldsymbol{x}_{1}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}_{1}>0, \]
且 \[ f(d_{1},d_{2},\cdots,d_{n})=\boldsymbol{x}_{2}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}_{2}<0, \]
说明:
- \(f\) 是(半)负定二次型的充要条件是 \(-f\) 为(半)正定二次型。
- \(f\) 为不定二次型的充要条件为其正惯性指数 \(p\) 满足 \(0<p<r(f)\)。