跳转至

第五章 矩阵的相似对角化

5.1 矩阵的特征值与特征向量

特征值与特征向量的概念

  • 特征值与特征向量:设 \(\boldsymbol{A}\) 为数域 \(F\) 上的一个 \(n\) 阶方阵,\(\lambda\in F\)\(\boldsymbol{\alpha}\)\(F\) 上的 \(n\) 维非零列向量。若

    \[ \boldsymbol{A}\boldsymbol{\alpha}=\lambda\boldsymbol{\alpha} \]

    则称 \(\lambda\) 为方阵 \(\boldsymbol{A}\) 的一个 特征值\(\boldsymbol{\alpha}\)\(\boldsymbol{A}\) 的对应于特征值 \(\lambda\)特征向量

    • 性质:移项有

      \[ (\lambda\boldsymbol{E} - \boldsymbol{A})\boldsymbol{\alpha} = \boldsymbol{0} \]
      • 因此,若 \(\lambda\) 是矩阵 \(\boldsymbol{A}\) 的特征值,\(\boldsymbol{\alpha}\) 为对应于 \(\lambda\) 的特征向量,则 \(\boldsymbol{\alpha}\) 为齐次线性方程组 \((\lambda\boldsymbol{E} - \boldsymbol{A})\boldsymbol{X} = 0\) 的非零解向量
      • 反之,若存在某个数 \(\lambda\) 使得齐次线性方程组 \((\lambda\boldsymbol{E} - \boldsymbol{A})\boldsymbol{X} = 0\) 有非零解,则 \(\lambda\) 为矩阵 \(\boldsymbol{A}\) 的特征值,方程组的任意一个非零解向量均为 \(\lambda\) 对应的特征向量
        • 推论
      • \(\lambda\) 是矩阵 \(\boldsymbol{A}\) 的特征值的充分必要条件为 \(|\lambda\boldsymbol{E} - \boldsymbol{A}| = 0\)
      • \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_s\) 是对应于某个特征值 \(\lambda_0\) 的任意 \(s\) 个特征向量,则它们的任一非零线性组合 \(\sum_{i=1}^{s} k_i \boldsymbol{\alpha}_i\) 也是矩阵 \(\boldsymbol{A}\) 的对应于 \(\lambda_0\) 的特征向量
      • 特征子空间:矩阵 \(\boldsymbol{A}\) 对应于某个特征值 \(\lambda_0\) 的全体特征向量连同零向量一起组成 \(n\) 维向量空间 \(F^n\) 的一个子空间,它是齐次线性方程组 \((\lambda_0\boldsymbol{E} - \boldsymbol{A})\boldsymbol{\alpha} = \boldsymbol{0}\) 的解空间,称之为矩阵 \(\boldsymbol{A}\) 的对应于特征值 \(\lambda_0\)特征子空间,记为 \(V_{\lambda_0}\)
        • 几何重数:特征子空间 \(V_{\lambda_{0}}\) 的维数称为特征值 \(\lambda_{0}\) 的几何重数。
      • 特征多项式与特征方程:设数域 \(F\) 上的 \(n\) 阶方阵 \(\boldsymbol{A}=(a_{ij})_{n\times n}\),称
    \[ f(\lambda)=|\lambda\boldsymbol{E}-\boldsymbol{A}|=\begin{vmatrix}\lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\cdots&-a_{2n}\\ \vdots&\vdots&&\vdots\\ -a_{n1}&-a_{n2}&\cdots&\lambda-a_{nn} \end{vmatrix} \]

    为矩阵 \(\boldsymbol{A}\)特征多项式\(|\lambda\boldsymbol{E}-\boldsymbol{A}|=0\) 叫作 \(\boldsymbol{A}\)特征方程

  • 特征根:由 \(n\) 阶行列式的定义可知,特征多项式的展开式 \(f(\lambda)\)\(\lambda\)\(n\) 次多项式,在复数域内恰有 \(n\) 个根(重根按重数计算),所以 \(n\) 阶方阵在复数域内必有 \(n\) 个特征值(重根按重数计算)。

    \[ \begin{aligned} f(\lambda)&=\lambda^{n}-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}+\cdots+(-1)^{n}|\boldsymbol{A}| \\ &=(\lambda-\lambda_{1})^{n_{1}}(\lambda-\lambda_{2})^{n_{2}}\cdots(\lambda-\lambda_{s})^{n_{s}} \end{aligned} \]

    其中 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\in\mathbb{C}\) 两两不同,\(n_{1}+n_{2}+\cdots+n_{s}=n\)

    • 代数重数:称特征值 \(\lambda_{i}\) 为此特征多项式的 \(n_{i}\) 重根\(n_{i}\) 叫作 \(\lambda_{i}\)代数重数
    • 特别地,代数重数为 1 的特征值也称为单特征值或特征多项式的 单根

特征值与特征向量的求法

  • 特征值与特征向量的求法:给定一个 \(n\) 阶方阵 \(\boldsymbol{A}\),可按如下步骤求它的特征值与特征向量:

    1. 计算 \(\boldsymbol{A}\) 的特征多项式 \(f(\lambda)=|\lambda\boldsymbol{E}-\boldsymbol{A}|\),并求特征方程 \(f(\lambda)=0\) 的所有根,即为 \(\boldsymbol{A}\) 的所有特征值。设解得 \(\boldsymbol{A}\)\(s\) 个不同特征值 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\)
    2. 对每一个特征值 \(\lambda_{i}\)\(i=1,2,\cdots,s\)),求出齐次线性方程组

      \[ (\lambda_{i}\boldsymbol{E}-\boldsymbol{A})\boldsymbol{X}=\boldsymbol{0} \]

      的一个基础解系 \(\boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{ir_{i}}\),此基础解系的所有非零线性组合 \(\sum_{j=1}^{r_{i}}k_{ij}\boldsymbol{\alpha}_{ij}\)\(k_{ij}\) 不全为零)即为方阵 \(\boldsymbol{A}\) 的对应于 \(\lambda_{i}\) 的全部特征向量。

  • 说明

    1. 对角矩阵 的特征值就是对角线上的所有元素,同阶的单位矩阵的列向量可分别看作是它们所对应的一个特征向量
    2. 行和相等的方阵,这个行和一定是它的一个特征值,而分量均为 1 的列向量必为这个特征值所对应的一个特征向量

特征值与特征向量的性质

  1. \(\lambda_{1},\lambda_{2},\cdots,\lambda_{n}\)\(n\) 阶方阵 \(\boldsymbol{A}=(a_{ij})_{n\times n}\)\(n\) 个特征值,则

    \[ \sum_{j=1}^{n}\lambda_{j}=\sum_{i=1}^{n}a_{ii}=\mathrm{tr}(\boldsymbol{A}) \\ \prod_{j=1}^{n}\lambda_{j}=|\boldsymbol{A}| \]
  2. 方阵 \(\boldsymbol{A}\)\(\boldsymbol{A}^{\mathrm{T}}\) 有相同的特征多项式及相同的特征值。

    \[ |\lambda\boldsymbol{E}-\boldsymbol{A}^{\mathrm{T}}|=|(\lambda\boldsymbol{E}-\boldsymbol{A})^{\mathrm{T}}|=|\lambda\boldsymbol{E}-\boldsymbol{A}| \]
  3. \(\lambda\) 为方阵 \(\boldsymbol{A}\) 的特征值,\(\boldsymbol{\alpha}\)\(\boldsymbol{A}\) 的对应于 \(\lambda\) 的特征向量,则

    1. \(k\lambda\)\(k\boldsymbol{A}\) 的特征值,\(\boldsymbol{\alpha}\) 也为 \(k\boldsymbol{A}\) 的对应于特征值 \(k\lambda\) 的特征向量,其中 \(k\) 为任意常数
    2. \(\lambda^{m}\)\(\boldsymbol{A}^{m}\) 的特征值,\(\boldsymbol{\alpha}\) 也为 \(\boldsymbol{A}^{m}\) 的对应于特征值 \(\lambda^{m}\) 的特征向量,其中 \(m\) 为任意正整数
    3. \(g(\lambda)\)\(g(\boldsymbol{A})\) 的特征值,\(\boldsymbol{\alpha}\) 也为 \(g(\boldsymbol{A})\) 的对应于特征值 \(g(\lambda)\) 的特征向量,其中 \(g(x)\) 为数域 \(F\) 上的多项式,\(m\) 为正整数

      \[ g(x)=a_{m}x^{m}+a_{m-1}x^{m-1}+\cdots+a_{1}x+a_{0} \]
  4. \(n\) 阶方阵 \(\boldsymbol{A}\) 可逆的充分必要条件为 \(\boldsymbol{A}\)\(n\) 个特征值全不为零。

  5. \(\lambda\) 为可逆矩阵 \(\boldsymbol{A}\) 的特征值,\(\boldsymbol{\alpha}\)\(\boldsymbol{A}\) 的对应于 \(\lambda\) 的特征向量,则
    1. \(\frac{1}{\lambda}\) 为其逆矩阵 \(\boldsymbol{A}^{-1}\) 的特征值,且 \(\boldsymbol{\alpha}\)\(\boldsymbol{A}^{-1}\) 的对应于特征值 \(\frac{1}{\lambda}\) 的特征向量
    2. \(\frac{1}{\lambda}\cdot|\boldsymbol{A}|\) 为其伴随矩阵 \(\boldsymbol{A}^{*}\) 的特征值,\(\boldsymbol{\alpha}\) 也是 \(\boldsymbol{A}^{*}\) 的对应于特征值 \(\frac{1}{\lambda}\cdot|\boldsymbol{A}|\) 的特征向量。
  6. \(\lambda_{0}\) 是方阵 \(\boldsymbol{A}\) 的一个特征值,它的几何重数(维数)和代数重数(特征根的重数)分别为 \(r\)\(k\)。则 \(r\leqslant k\)
    • \(\lambda_{0}\) 为方阵 \(\boldsymbol{A}\) 的一个单特征值,则 \(\boldsymbol{A}\) 的对应于 \(\lambda_{0}\) 的线性无关的特征向量有且仅有一个。
  7. \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\)\(n\) 阶方阵 \(\boldsymbol{A}\)\(s\) 个不同特征值,\(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\) 分别是对应它们的特征向量,则 \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\cdots,\boldsymbol{\alpha}_{s}\) 线性无关。
    • \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\)\(n\) 阶方阵 \(\boldsymbol{A}\)\(s\) 个不同特征值,\(\boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{ir_{i}}\) 为对应于特征值 \(\lambda_{i}\)\(r_{i}\) 个线性无关的特征向量,\(1\leqslant i\leqslant s\)。则向量组

      \[ \boldsymbol{\alpha}_{11},\boldsymbol{\alpha}_{12},\cdots,\boldsymbol{\alpha}_{1r_{1}};\boldsymbol{\alpha}_{21},\boldsymbol{\alpha}_{22},\cdots,\boldsymbol{\alpha}_{2r_{2}};\cdots;\boldsymbol{\alpha}_{s1},\boldsymbol{\alpha}_{s2},\cdots,\boldsymbol{\alpha}_{sr_{s}} \]

      线性无关。

5.2 相似矩阵和矩阵的对角化

相似矩阵

  • 相似矩阵:设 \(\boldsymbol{A}\)\(\boldsymbol{B}\) 都是数域 \(F\) 上的 \(n\) 阶方阵,若存在 \(F\) 上的 \(n\) 阶可逆矩阵 \(\boldsymbol{P}\) 使得

    \[ \boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{B} \]

    则称方阵 \(\boldsymbol{A}\)\(\boldsymbol{B}\) 相似,记作 \(\boldsymbol{A}\sim\boldsymbol{B}\)

  • 相似矩阵的性质:

    1. 方阵的相似关系是一种 等价关系
      1. 反身性:设 \(\boldsymbol{A}\in F^{n\times n}\),则 \(\boldsymbol{A}\sim\boldsymbol{A}\)
      2. 对称性:设 \(\boldsymbol{A},\boldsymbol{B}\in F^{n\times n}\),若 \(\boldsymbol{A}\sim\boldsymbol{B}\),则 \(\boldsymbol{B}\sim\boldsymbol{A}\)
      3. 传递性:设 \(\boldsymbol{A},\boldsymbol{B},\boldsymbol{C}\in F^{n\times n}\),若 \(\boldsymbol{A}\sim\boldsymbol{B}\)\(\boldsymbol{B}\sim\boldsymbol{C}\),则 \(\boldsymbol{A}\sim\boldsymbol{C}\)
    2. 相似矩阵有相同的特征多项式,从而有相同的特征值、相同的行列式和相同的迹。
    3. \(\boldsymbol{A}\sim\boldsymbol{B}\),且 \(\boldsymbol{A}\) 可逆,则 \(\boldsymbol{B}\) 可逆,且 \(\boldsymbol{A}^{-1}\sim\boldsymbol{B}^{-1}\)
    4. \(\boldsymbol{A}\sim\boldsymbol{B}\),则

      1. \(k\boldsymbol{A}\sim k\boldsymbol{B}\)\(k\in F\)
      2. \(\boldsymbol{A}^{m}\sim\boldsymbol{B}^{m}\),其中 \(m\) 是任意正整数
      3. \(g(\boldsymbol{A})\sim g(\boldsymbol{B})\),其中 \(g(x)\) 为数域 \(F\) 上的 \(m\) 次多项式,\(m\) 为非负整数。

        \[ g(x)=a_{m}x^{m}+a_{m-1}x^{m-1}+\cdots+a_{1}x+a_{0} \]
    5. \(\boldsymbol{A}\)\(\boldsymbol{B}\) 为数域 \(F\) 上的分块对角阵,其中 \(\boldsymbol{A}_{i}\)\(\boldsymbol{B}_{i}\) 都是 \(n_{i}\) 阶方阵

      \[ \boldsymbol{A}=\begin{pmatrix}\boldsymbol{A}_{1}&&&\\ &\boldsymbol{A}_{2}&&\\ &&\ddots&\\ &&&\boldsymbol{A}_{t}\end{pmatrix},\quad \boldsymbol{B}=\begin{pmatrix}\boldsymbol{B}_{1}&&&\\ &\boldsymbol{B}_{2}&&\\ &&\ddots&\\ &&&\boldsymbol{B}_{t}\end{pmatrix} \]

      若对所有的 \(i\)\(1\leqslant i\leqslant t\)\(\boldsymbol{A}_{i}\sim\boldsymbol{B}_{i}\),则 \(\boldsymbol{A}\sim\boldsymbol{B}\)

    6. \(\boldsymbol{A}=(a_{ij})_{n\times n}\) 为复数域 \(\mathbb{C}\) 上的 \(n\) 阶方阵,则存在复数域 \(\mathbb{C}\) 上的上三角矩阵 \(\boldsymbol{B}\) 与矩阵 \(\boldsymbol{A}\) 相似。

矩阵相似对角阵

  • 可对角化:设 \(\boldsymbol{A}\)\(n\) 阶方阵,若 \(\boldsymbol{A}\) 相似于对角阵,即若存在 \(n\) 阶可逆矩阵 \(\boldsymbol{P}\) 使得

    \[ \boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{\Lambda} \]

    其中 \(\boldsymbol{\Lambda}\)\(n\) 阶对角阵,则称 \(\boldsymbol{A}\) 可对角化。

  • 可对角化条件:设 \(\boldsymbol{A}\) 为复数域 \(\mathbb{C}\) 上的 \(n\) 阶方阵,则 \(\boldsymbol{A}\) 相似于对角阵的充分必要条件是 \(\boldsymbol{A}\)\(n\) 个线性无关的特征向量。

    • \(n\) 阶方阵 \(\boldsymbol{A}\)\(n\) 个不同的特征值,则 \(\boldsymbol{A}\) 必可对角化。(充分条件)
    • \(n\) 阶方阵 \(\boldsymbol{A}\)\(s\) 个不同的特征值 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\)。对 \(1\leqslant i\leqslant s\)\(\lambda_{i}\) 的代数重数与几何重数分别为 \(n_{i}\)\(m_{i}\),则方阵 \(\boldsymbol{A}\) 相似于对角阵的充分必要条件为

      \[ m_{i}=n_{i},\quad i=1,2,\cdots,s. \]
  • 判断及求解方法:判断一个方阵 \(\boldsymbol{A}_{n}\) 是否相似于对角阵,及求使得 \(\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}\) 为对角阵的可逆矩阵 \(\boldsymbol{P}\) 的一般步骤为:

    1. 求出方阵 \(\boldsymbol{A}\) 的所有特征值 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\),它们的代数重数分别为 \(n_{1},n_{2},\cdots,n_{s}\)\(\sum\limits_{i=1}^{s}n_{i}=n\)
    2. 对每个特征值 \(\lambda_{i}\),计算 \(r(\lambda_{i}\boldsymbol{E}-\boldsymbol{A})\),若下式成立,则 \(\boldsymbol{A}\) 可对角化,否则不能对角化

      \[ r(\lambda_{i}\boldsymbol{E}-\boldsymbol{A})=n-n_{i},\quad i=1,2,\cdots,s \]
    3. 在可对角化的情况下,对每个特征值 \(\lambda_{i}\),求出齐次线性方程组 \((\lambda_{i}\boldsymbol{E}-\boldsymbol{A})\boldsymbol{x}=\boldsymbol{0}\) 的基础解系

      \[ \boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{in_{i}},\quad i=1,2,\cdots,s \]
    4. \[ \boldsymbol{P}=(\boldsymbol{\alpha}_{11},\boldsymbol{\alpha}_{12},\cdots,\boldsymbol{\alpha}_{1n_{1}},\cdots,\boldsymbol{\alpha}_{s1},\boldsymbol{\alpha}_{s2},\cdots,\boldsymbol{\alpha}_{sn_{s}}) \]

      \(\boldsymbol{P}\) 可逆,且有

      \[ \boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{\Lambda}=\mathrm{diag}(\underbrace{\lambda_{1},\cdots,\lambda_{1}}_{n_{1}\text{个}},\underbrace{\lambda_{2},\cdots,\lambda_{2}}_{n_{2}\text{个}},\cdots,\underbrace{\lambda_{s},\cdots,\lambda_{s}}_{n_{s}\text{个}}) \]

5.3 实对称矩阵的相似对角化

实对称矩阵的特征值与特征向量

  • 一般性质:见上文
  • 特殊性质
    1. 实对称矩阵的特征值全是实数。
    2. 实对称矩阵的属于不同特征值的实特征向量正交。

实对称矩阵正交相似对角阵

  • 定理:设 \(\boldsymbol{A}\)\(n\) 阶实对称矩阵,则存在 \(n\) 阶正交矩阵 \(\boldsymbol{Q}\),使得

    \[ \boldsymbol{Q}^{-1}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{Q}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{\Lambda}, \]

    其中

    \[ \boldsymbol{\Lambda}=\begin{pmatrix}\lambda_{1}&&&\\ &\lambda_{2}&&\\ &&\ddots&\\ &&&\lambda_{n}\end{pmatrix},\quad \lambda_{1},\lambda_{2},\cdots,\lambda_{n}\text{ 为 }\boldsymbol{A}\text{ 的特征值}. \]
    • \(n\) 阶实对称矩阵必有 \(n\) 个线性无关的特征向量。
    • \(n\) 阶实对称矩阵的每个特征值的几何重数必等于它的代数重数。
    • 求实对称矩阵正交相似对角阵的方法:对任意实对称矩阵 \(\boldsymbol{A}\),找出正交矩阵 \(\boldsymbol{Q}\) 使得 \(\boldsymbol{Q}^{-1}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{Q}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{\Lambda}\)(对角阵)的方法如下:
    • 求出实对称矩阵 \(\boldsymbol{A}\) 的全部特征值 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\),它们的代数重数分别为 \(n_{1},n_{2},\cdots,n_{s}\)\(\sum_{i=1}^{s}n_{i}=n\)
    • 对每个特征值 \(\lambda_{i}\),求出齐次线性方程组 \((\lambda_{i}\boldsymbol{E}-\boldsymbol{A})\boldsymbol{x}=\boldsymbol{0}\) 的基础解系

      \[ \boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{in_{i}},\quad i=1,2,\cdots,s \]
    • \(\boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{in_{i}}\) 正交化、单位化得 \(\boldsymbol{\varepsilon}_{i1},\boldsymbol{\varepsilon}_{i2},\cdots,\boldsymbol{\varepsilon}_{in_{i}}\),即得到两两正交的单位特征向量

      \[ \boldsymbol{\varepsilon}_{11},\boldsymbol{\varepsilon}_{12},\cdots,\boldsymbol{\varepsilon}_{1n_{1}},\cdots,\boldsymbol{\varepsilon}_{s1},\boldsymbol{\varepsilon}_{s2},\cdots,\boldsymbol{\varepsilon}_{sn_{s}} \]
    • \[ \boldsymbol{Q}=(\boldsymbol{\varepsilon}_{11},\boldsymbol{\varepsilon}_{12},\cdots,\boldsymbol{\varepsilon}_{1n_{1}},\cdots,\boldsymbol{\varepsilon}_{s1},\boldsymbol{\varepsilon}_{s2},\cdots,\boldsymbol{\varepsilon}_{sn_{s}}) \]

      \(\boldsymbol{Q}\) 为正交矩阵,且有

      \[ \boldsymbol{Q}^{-1}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{Q}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{\Lambda}=\mathrm{diag}(\underbrace{\lambda_{1},\cdots,\lambda_{1}}_{n_{1}\text{个}},\underbrace{\lambda_{2},\cdots,\lambda_{2}}_{n_{2}\text{个}},\cdots,\underbrace{\lambda_{s},\cdots,\lambda_{s}}_{n_{s}\text{个}}) \]