第五章 矩阵的相似对角化¶
5.1 矩阵的特征值与特征向量¶
特征值与特征向量的概念¶
-
特征值与特征向量:设 \(\boldsymbol{A}\) 为数域 \(F\) 上的一个 \(n\) 阶方阵,\(\lambda\in F\),\(\boldsymbol{\alpha}\) 为 \(F\) 上的 \(n\) 维非零列向量。若
\[ \boldsymbol{A}\boldsymbol{\alpha}=\lambda\boldsymbol{\alpha} \]则称 \(\lambda\) 为方阵 \(\boldsymbol{A}\) 的一个 特征值,\(\boldsymbol{\alpha}\) 为 \(\boldsymbol{A}\) 的对应于特征值 \(\lambda\) 的 特征向量。
-
性质:移项有
\[ (\lambda\boldsymbol{E} - \boldsymbol{A})\boldsymbol{\alpha} = \boldsymbol{0} \]- 因此,若 \(\lambda\) 是矩阵 \(\boldsymbol{A}\) 的特征值,\(\boldsymbol{\alpha}\) 为对应于 \(\lambda\) 的特征向量,则 \(\boldsymbol{\alpha}\) 为齐次线性方程组 \((\lambda\boldsymbol{E} - \boldsymbol{A})\boldsymbol{X} = 0\) 的非零解向量
- 反之,若存在某个数 \(\lambda\) 使得齐次线性方程组 \((\lambda\boldsymbol{E} - \boldsymbol{A})\boldsymbol{X} = 0\) 有非零解,则 \(\lambda\) 为矩阵 \(\boldsymbol{A}\) 的特征值,方程组的任意一个非零解向量均为 \(\lambda\) 对应的特征向量
- 推论:
- \(\lambda\) 是矩阵 \(\boldsymbol{A}\) 的特征值的充分必要条件为 \(|\lambda\boldsymbol{E} - \boldsymbol{A}| = 0\)
- 若 \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_s\) 是对应于某个特征值 \(\lambda_0\) 的任意 \(s\) 个特征向量,则它们的任一非零线性组合 \(\sum_{i=1}^{s} k_i \boldsymbol{\alpha}_i\) 也是矩阵 \(\boldsymbol{A}\) 的对应于 \(\lambda_0\) 的特征向量
- 特征子空间:矩阵 \(\boldsymbol{A}\) 对应于某个特征值 \(\lambda_0\) 的全体特征向量连同零向量一起组成 \(n\) 维向量空间 \(F^n\) 的一个子空间,它是齐次线性方程组 \((\lambda_0\boldsymbol{E} - \boldsymbol{A})\boldsymbol{\alpha} = \boldsymbol{0}\) 的解空间,称之为矩阵 \(\boldsymbol{A}\) 的对应于特征值 \(\lambda_0\) 的 特征子空间,记为 \(V_{\lambda_0}\)
- 几何重数:特征子空间 \(V_{\lambda_{0}}\) 的维数称为特征值 \(\lambda_{0}\) 的几何重数。
- 特征多项式与特征方程:设数域 \(F\) 上的 \(n\) 阶方阵 \(\boldsymbol{A}=(a_{ij})_{n\times n}\),称
\[ f(\lambda)=|\lambda\boldsymbol{E}-\boldsymbol{A}|=\begin{vmatrix}\lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\cdots&-a_{2n}\\ \vdots&\vdots&&\vdots\\ -a_{n1}&-a_{n2}&\cdots&\lambda-a_{nn} \end{vmatrix} \]为矩阵 \(\boldsymbol{A}\) 的 特征多项式,\(|\lambda\boldsymbol{E}-\boldsymbol{A}|=0\) 叫作 \(\boldsymbol{A}\) 的 特征方程。
-
-
特征根:由 \(n\) 阶行列式的定义可知,特征多项式的展开式 \(f(\lambda)\) 为 \(\lambda\) 的 \(n\) 次多项式,在复数域内恰有 \(n\) 个根(重根按重数计算),所以 \(n\) 阶方阵在复数域内必有 \(n\) 个特征值(重根按重数计算)。
\[ \begin{aligned} f(\lambda)&=\lambda^{n}-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}+\cdots+(-1)^{n}|\boldsymbol{A}| \\ &=(\lambda-\lambda_{1})^{n_{1}}(\lambda-\lambda_{2})^{n_{2}}\cdots(\lambda-\lambda_{s})^{n_{s}} \end{aligned} \]其中 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\in\mathbb{C}\) 两两不同,\(n_{1}+n_{2}+\cdots+n_{s}=n\)。
- 代数重数:称特征值 \(\lambda_{i}\) 为此特征多项式的 \(n_{i}\) 重根,\(n_{i}\) 叫作 \(\lambda_{i}\) 的 代数重数。
- 特别地,代数重数为 1 的特征值也称为单特征值或特征多项式的 单根。
特征值与特征向量的求法¶
-
特征值与特征向量的求法:给定一个 \(n\) 阶方阵 \(\boldsymbol{A}\),可按如下步骤求它的特征值与特征向量:
- 计算 \(\boldsymbol{A}\) 的特征多项式 \(f(\lambda)=|\lambda\boldsymbol{E}-\boldsymbol{A}|\),并求特征方程 \(f(\lambda)=0\) 的所有根,即为 \(\boldsymbol{A}\) 的所有特征值。设解得 \(\boldsymbol{A}\) 有 \(s\) 个不同特征值 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\)
-
对每一个特征值 \(\lambda_{i}\)(\(i=1,2,\cdots,s\)),求出齐次线性方程组
\[ (\lambda_{i}\boldsymbol{E}-\boldsymbol{A})\boldsymbol{X}=\boldsymbol{0} \]的一个基础解系 \(\boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{ir_{i}}\),此基础解系的所有非零线性组合 \(\sum_{j=1}^{r_{i}}k_{ij}\boldsymbol{\alpha}_{ij}\)(\(k_{ij}\) 不全为零)即为方阵 \(\boldsymbol{A}\) 的对应于 \(\lambda_{i}\) 的全部特征向量。
-
说明:
- 对角矩阵 的特征值就是对角线上的所有元素,同阶的单位矩阵的列向量可分别看作是它们所对应的一个特征向量
- 行和相等的方阵,这个行和一定是它的一个特征值,而分量均为 1 的列向量必为这个特征值所对应的一个特征向量
特征值与特征向量的性质¶
-
设 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{n}\) 为 \(n\) 阶方阵 \(\boldsymbol{A}=(a_{ij})_{n\times n}\) 的 \(n\) 个特征值,则
\[ \sum_{j=1}^{n}\lambda_{j}=\sum_{i=1}^{n}a_{ii}=\mathrm{tr}(\boldsymbol{A}) \\ \prod_{j=1}^{n}\lambda_{j}=|\boldsymbol{A}| \] -
方阵 \(\boldsymbol{A}\) 与 \(\boldsymbol{A}^{\mathrm{T}}\) 有相同的特征多项式及相同的特征值。
\[ |\lambda\boldsymbol{E}-\boldsymbol{A}^{\mathrm{T}}|=|(\lambda\boldsymbol{E}-\boldsymbol{A})^{\mathrm{T}}|=|\lambda\boldsymbol{E}-\boldsymbol{A}| \] -
设 \(\lambda\) 为方阵 \(\boldsymbol{A}\) 的特征值,\(\boldsymbol{\alpha}\) 为 \(\boldsymbol{A}\) 的对应于 \(\lambda\) 的特征向量,则
- \(k\lambda\) 是 \(k\boldsymbol{A}\) 的特征值,\(\boldsymbol{\alpha}\) 也为 \(k\boldsymbol{A}\) 的对应于特征值 \(k\lambda\) 的特征向量,其中 \(k\) 为任意常数
- \(\lambda^{m}\) 是 \(\boldsymbol{A}^{m}\) 的特征值,\(\boldsymbol{\alpha}\) 也为 \(\boldsymbol{A}^{m}\) 的对应于特征值 \(\lambda^{m}\) 的特征向量,其中 \(m\) 为任意正整数
-
\(g(\lambda)\) 是 \(g(\boldsymbol{A})\) 的特征值,\(\boldsymbol{\alpha}\) 也为 \(g(\boldsymbol{A})\) 的对应于特征值 \(g(\lambda)\) 的特征向量,其中 \(g(x)\) 为数域 \(F\) 上的多项式,\(m\) 为正整数
\[ g(x)=a_{m}x^{m}+a_{m-1}x^{m-1}+\cdots+a_{1}x+a_{0} \]
-
\(n\) 阶方阵 \(\boldsymbol{A}\) 可逆的充分必要条件为 \(\boldsymbol{A}\) 的 \(n\) 个特征值全不为零。
- 设 \(\lambda\) 为可逆矩阵 \(\boldsymbol{A}\) 的特征值,\(\boldsymbol{\alpha}\) 为 \(\boldsymbol{A}\) 的对应于 \(\lambda\) 的特征向量,则
- \(\frac{1}{\lambda}\) 为其逆矩阵 \(\boldsymbol{A}^{-1}\) 的特征值,且 \(\boldsymbol{\alpha}\) 是 \(\boldsymbol{A}^{-1}\) 的对应于特征值 \(\frac{1}{\lambda}\) 的特征向量
- \(\frac{1}{\lambda}\cdot|\boldsymbol{A}|\) 为其伴随矩阵 \(\boldsymbol{A}^{*}\) 的特征值,\(\boldsymbol{\alpha}\) 也是 \(\boldsymbol{A}^{*}\) 的对应于特征值 \(\frac{1}{\lambda}\cdot|\boldsymbol{A}|\) 的特征向量。
- 设 \(\lambda_{0}\) 是方阵 \(\boldsymbol{A}\) 的一个特征值,它的几何重数(维数)和代数重数(特征根的重数)分别为 \(r\) 和 \(k\)。则 \(r\leqslant k\)。
- 设 \(\lambda_{0}\) 为方阵 \(\boldsymbol{A}\) 的一个单特征值,则 \(\boldsymbol{A}\) 的对应于 \(\lambda_{0}\) 的线性无关的特征向量有且仅有一个。
- 设 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\) 为 \(n\) 阶方阵 \(\boldsymbol{A}\) 的 \(s\) 个不同特征值,\(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\) 分别是对应它们的特征向量,则 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\) 线性无关。
-
设 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\) 为 \(n\) 阶方阵 \(\boldsymbol{A}\) 的 \(s\) 个不同特征值,\(\boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{ir_{i}}\) 为对应于特征值 \(\lambda_{i}\) 的 \(r_{i}\) 个线性无关的特征向量,\(1\leqslant i\leqslant s\)。则向量组
\[ \boldsymbol{\alpha}_{11},\boldsymbol{\alpha}_{12},\cdots,\boldsymbol{\alpha}_{1r_{1}};\boldsymbol{\alpha}_{21},\boldsymbol{\alpha}_{22},\cdots,\boldsymbol{\alpha}_{2r_{2}};\cdots;\boldsymbol{\alpha}_{s1},\boldsymbol{\alpha}_{s2},\cdots,\boldsymbol{\alpha}_{sr_{s}} \]线性无关。
-
5.2 相似矩阵和矩阵的对角化¶
相似矩阵¶
-
相似矩阵:设 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 都是数域 \(F\) 上的 \(n\) 阶方阵,若存在 \(F\) 上的 \(n\) 阶可逆矩阵 \(\boldsymbol{P}\) 使得
\[ \boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{B} \]则称方阵 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 相似,记作 \(\boldsymbol{A}\sim\boldsymbol{B}\)。
-
相似矩阵的性质:
- 方阵的相似关系是一种 等价关系:
- 反身性:设 \(\boldsymbol{A}\in F^{n\times n}\),则 \(\boldsymbol{A}\sim\boldsymbol{A}\)
- 对称性:设 \(\boldsymbol{A},\boldsymbol{B}\in F^{n\times n}\),若 \(\boldsymbol{A}\sim\boldsymbol{B}\),则 \(\boldsymbol{B}\sim\boldsymbol{A}\)
- 传递性:设 \(\boldsymbol{A},\boldsymbol{B},\boldsymbol{C}\in F^{n\times n}\),若 \(\boldsymbol{A}\sim\boldsymbol{B}\) 且 \(\boldsymbol{B}\sim\boldsymbol{C}\),则 \(\boldsymbol{A}\sim\boldsymbol{C}\)
- 相似矩阵有相同的特征多项式,从而有相同的特征值、相同的行列式和相同的迹。
- 设 \(\boldsymbol{A}\sim\boldsymbol{B}\),且 \(\boldsymbol{A}\) 可逆,则 \(\boldsymbol{B}\) 可逆,且 \(\boldsymbol{A}^{-1}\sim\boldsymbol{B}^{-1}\)。
-
设 \(\boldsymbol{A}\sim\boldsymbol{B}\),则
- \(k\boldsymbol{A}\sim k\boldsymbol{B}\),\(k\in F\)
- \(\boldsymbol{A}^{m}\sim\boldsymbol{B}^{m}\),其中 \(m\) 是任意正整数
-
\(g(\boldsymbol{A})\sim g(\boldsymbol{B})\),其中 \(g(x)\) 为数域 \(F\) 上的 \(m\) 次多项式,\(m\) 为非负整数。
\[ g(x)=a_{m}x^{m}+a_{m-1}x^{m-1}+\cdots+a_{1}x+a_{0} \]
-
设 \(\boldsymbol{A}\) 与 \(\boldsymbol{B}\) 为数域 \(F\) 上的分块对角阵,其中 \(\boldsymbol{A}_{i}\) 与 \(\boldsymbol{B}_{i}\) 都是 \(n_{i}\) 阶方阵
\[ \boldsymbol{A}=\begin{pmatrix}\boldsymbol{A}_{1}&&&\\ &\boldsymbol{A}_{2}&&\\ &&\ddots&\\ &&&\boldsymbol{A}_{t}\end{pmatrix},\quad \boldsymbol{B}=\begin{pmatrix}\boldsymbol{B}_{1}&&&\\ &\boldsymbol{B}_{2}&&\\ &&\ddots&\\ &&&\boldsymbol{B}_{t}\end{pmatrix} \]若对所有的 \(i\),\(1\leqslant i\leqslant t\),\(\boldsymbol{A}_{i}\sim\boldsymbol{B}_{i}\),则 \(\boldsymbol{A}\sim\boldsymbol{B}\)。
-
设 \(\boldsymbol{A}=(a_{ij})_{n\times n}\) 为复数域 \(\mathbb{C}\) 上的 \(n\) 阶方阵,则存在复数域 \(\mathbb{C}\) 上的上三角矩阵 \(\boldsymbol{B}\) 与矩阵 \(\boldsymbol{A}\) 相似。
- 方阵的相似关系是一种 等价关系:
矩阵相似对角阵¶
-
可对角化:设 \(\boldsymbol{A}\) 为 \(n\) 阶方阵,若 \(\boldsymbol{A}\) 相似于对角阵,即若存在 \(n\) 阶可逆矩阵 \(\boldsymbol{P}\) 使得
\[ \boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{\Lambda} \]其中 \(\boldsymbol{\Lambda}\) 为 \(n\) 阶对角阵,则称 \(\boldsymbol{A}\) 可对角化。
-
可对角化条件:设 \(\boldsymbol{A}\) 为复数域 \(\mathbb{C}\) 上的 \(n\) 阶方阵,则 \(\boldsymbol{A}\) 相似于对角阵的充分必要条件是 \(\boldsymbol{A}\) 有 \(n\) 个线性无关的特征向量。
- 若 \(n\) 阶方阵 \(\boldsymbol{A}\) 有 \(n\) 个不同的特征值,则 \(\boldsymbol{A}\) 必可对角化。(充分条件)
-
设 \(n\) 阶方阵 \(\boldsymbol{A}\) 有 \(s\) 个不同的特征值 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\)。对 \(1\leqslant i\leqslant s\),\(\lambda_{i}\) 的代数重数与几何重数分别为 \(n_{i}\) 与 \(m_{i}\),则方阵 \(\boldsymbol{A}\) 相似于对角阵的充分必要条件为
\[ m_{i}=n_{i},\quad i=1,2,\cdots,s. \]
-
判断及求解方法:判断一个方阵 \(\boldsymbol{A}_{n}\) 是否相似于对角阵,及求使得 \(\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}\) 为对角阵的可逆矩阵 \(\boldsymbol{P}\) 的一般步骤为:
- 求出方阵 \(\boldsymbol{A}\) 的所有特征值 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\),它们的代数重数分别为 \(n_{1},n_{2},\cdots,n_{s}\),\(\sum\limits_{i=1}^{s}n_{i}=n\)
-
对每个特征值 \(\lambda_{i}\),计算 \(r(\lambda_{i}\boldsymbol{E}-\boldsymbol{A})\),若下式成立,则 \(\boldsymbol{A}\) 可对角化,否则不能对角化
\[ r(\lambda_{i}\boldsymbol{E}-\boldsymbol{A})=n-n_{i},\quad i=1,2,\cdots,s \] -
在可对角化的情况下,对每个特征值 \(\lambda_{i}\),求出齐次线性方程组 \((\lambda_{i}\boldsymbol{E}-\boldsymbol{A})\boldsymbol{x}=\boldsymbol{0}\) 的基础解系
\[ \boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{in_{i}},\quad i=1,2,\cdots,s \] -
令
\[ \boldsymbol{P}=(\boldsymbol{\alpha}_{11},\boldsymbol{\alpha}_{12},\cdots,\boldsymbol{\alpha}_{1n_{1}},\cdots,\boldsymbol{\alpha}_{s1},\boldsymbol{\alpha}_{s2},\cdots,\boldsymbol{\alpha}_{sn_{s}}) \]则 \(\boldsymbol{P}\) 可逆,且有
\[ \boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{\Lambda}=\mathrm{diag}(\underbrace{\lambda_{1},\cdots,\lambda_{1}}_{n_{1}\text{个}},\underbrace{\lambda_{2},\cdots,\lambda_{2}}_{n_{2}\text{个}},\cdots,\underbrace{\lambda_{s},\cdots,\lambda_{s}}_{n_{s}\text{个}}) \]
5.3 实对称矩阵的相似对角化¶
实对称矩阵的特征值与特征向量¶
- 一般性质:见上文
- 特殊性质:
- 实对称矩阵的特征值全是实数。
- 实对称矩阵的属于不同特征值的实特征向量正交。
实对称矩阵正交相似对角阵¶
-
定理:设 \(\boldsymbol{A}\) 为 \(n\) 阶实对称矩阵,则存在 \(n\) 阶正交矩阵 \(\boldsymbol{Q}\),使得
\[ \boldsymbol{Q}^{-1}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{Q}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{\Lambda}, \]其中
\[ \boldsymbol{\Lambda}=\begin{pmatrix}\lambda_{1}&&&\\ &\lambda_{2}&&\\ &&\ddots&\\ &&&\lambda_{n}\end{pmatrix},\quad \lambda_{1},\lambda_{2},\cdots,\lambda_{n}\text{ 为 }\boldsymbol{A}\text{ 的特征值}. \]- \(n\) 阶实对称矩阵必有 \(n\) 个线性无关的特征向量。
- \(n\) 阶实对称矩阵的每个特征值的几何重数必等于它的代数重数。
- 求实对称矩阵正交相似对角阵的方法:对任意实对称矩阵 \(\boldsymbol{A}\),找出正交矩阵 \(\boldsymbol{Q}\) 使得 \(\boldsymbol{Q}^{-1}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{Q}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{\Lambda}\)(对角阵)的方法如下:
- 求出实对称矩阵 \(\boldsymbol{A}\) 的全部特征值 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\),它们的代数重数分别为 \(n_{1},n_{2},\cdots,n_{s}\),\(\sum_{i=1}^{s}n_{i}=n\)
-
对每个特征值 \(\lambda_{i}\),求出齐次线性方程组 \((\lambda_{i}\boldsymbol{E}-\boldsymbol{A})\boldsymbol{x}=\boldsymbol{0}\) 的基础解系
\[ \boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{in_{i}},\quad i=1,2,\cdots,s \] -
对 \(\boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{in_{i}}\) 正交化、单位化得 \(\boldsymbol{\varepsilon}_{i1},\boldsymbol{\varepsilon}_{i2},\cdots,\boldsymbol{\varepsilon}_{in_{i}}\),即得到两两正交的单位特征向量
\[ \boldsymbol{\varepsilon}_{11},\boldsymbol{\varepsilon}_{12},\cdots,\boldsymbol{\varepsilon}_{1n_{1}},\cdots,\boldsymbol{\varepsilon}_{s1},\boldsymbol{\varepsilon}_{s2},\cdots,\boldsymbol{\varepsilon}_{sn_{s}} \] -
令
\[ \boldsymbol{Q}=(\boldsymbol{\varepsilon}_{11},\boldsymbol{\varepsilon}_{12},\cdots,\boldsymbol{\varepsilon}_{1n_{1}},\cdots,\boldsymbol{\varepsilon}_{s1},\boldsymbol{\varepsilon}_{s2},\cdots,\boldsymbol{\varepsilon}_{sn_{s}}) \]则 \(\boldsymbol{Q}\) 为正交矩阵,且有
\[ \boldsymbol{Q}^{-1}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{Q}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{\Lambda}=\mathrm{diag}(\underbrace{\lambda_{1},\cdots,\lambda_{1}}_{n_{1}\text{个}},\underbrace{\lambda_{2},\cdots,\lambda_{2}}_{n_{2}\text{个}},\cdots,\underbrace{\lambda_{s},\cdots,\lambda_{s}}_{n_{s}\text{个}}) \]