跳转至

第六章 实二次型

6.1 二次型的基本概念及化二次型为标准形

二次型及其矩阵表示

  • 二次型:称含 \(n\) 个变量 \(x_{1},x_{2},\cdots,x_{n}\) 的二次齐次函数

    \[ \begin{aligned} f(x_{1},x_{2},\cdots,x_{n})=&a_{11}x_{1}^{2}+2a_{12}x_{1}x_{2}+\cdots+2a_{1n}x_{1}x_{n}+\\ &a_{22}x_{2}^{2}+2a_{23}x_{2}x_{3}+\cdots+2a_{2n}x_{2}x_{n}+\cdots+a_{nn}x_{n}^{2} \end{aligned} \]

    为一个 \(n\) 元二次型,简称二次型。

    • 实二次型:系数 \(a_{ij}\in\mathbb{R}\)
    • 复二次型:系数 \(a_{ij}\in\mathbb{C}\)
    • 标准二次型:只含平方项的二次型

      \[ f(x_{1},x_{2},\cdots,x_{n})=a_{11}x_{1}^{2}+a_{22}x_{2}^{2}+\cdots+a_{nn}x_{n}^{2} \]
    • 规范二次型:各项的系数为 \(1\)\(-1\)\(0\) 的标准二次型

    • 矩阵表示:设 \(a_{ij}=a_{ji}\)\(i,j=1,2,\cdots,n\)),则二次型可表示为
    \[ \begin{aligned} f=&a_{11}x_{1}^{2}+a_{12}x_{1}x_{2}+\cdots+a_{1n}x_{1}x_{n}+\\ &a_{21}x_{2}x_{1}+a_{22}x_{2}^{2}+\cdots+a_{2n}x_{2}x_{n}+\\ &\cdots+\\ &a_{n1}x_{n}x_{1}+a_{n2}x_{n}x_{2}+\cdots+a_{nn}x_{n}^{2}\\ =&\sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}x_{i}x_{j} \end{aligned} \]

    又设矩阵

    \[ \boldsymbol{A}=\begin{pmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn}\end{pmatrix},\quad \boldsymbol{x}=\begin{pmatrix}x_{1}\\ x_{2}\\ \vdots\\ x_{n}\end{pmatrix} \]

    \(\boldsymbol{A}\) 为实对称矩阵,且

    \[ f=\sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}x_{i}x_{j}=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x} \]

    称上式为二次型 \(f\)矩阵表示式,则二次型 \(f\) 与实对称矩阵 \(\boldsymbol{A}\) 一一对应。

    • 称实对称阵 \(\boldsymbol{A}\) 为二次型 \(f\) 的矩阵,\(\boldsymbol{A}\) 的秩 \(r(\boldsymbol{A})\)\(f\) 的秩,记作 \(r(f)\),即

      \[ r(f)=r(\boldsymbol{A}). \]
    • 标准二次型的矩阵

      \[ \boldsymbol{A}_{1}=\begin{pmatrix}a_{11}&&&\\ &a_{22}&&\\ &&\ddots&\\ &&&a_{nn}\end{pmatrix} \]
    • 规范二次型的矩阵:其中 \(r=r(\boldsymbol{A}_{2})=r(f)\)

      \[ \boldsymbol{A}_{2}=\begin{pmatrix}\boldsymbol{E}_{p}&&&\\ &-\boldsymbol{E}_{r-p}&&\\ &&&\boldsymbol{0}\end{pmatrix} \]

二次型的非奇异线性替换

  • 非奇异的线性替换:设 \(\boldsymbol{x},\boldsymbol{y}\)\(n\) 维向量,\(n\) 阶方阵 \(\boldsymbol{P}\) 为可逆矩阵,称

    \[ \boldsymbol{x}=\boldsymbol{P}\boldsymbol{y} \]

    非奇异(非退化)的线性替换

合同矩阵

  • 合同矩阵:设 \(\boldsymbol{A}\)\(\boldsymbol{B}\)\(n\) 阶方阵,若存在 \(F\) 上的 \(n\) 阶可逆矩阵 \(\boldsymbol{P}\) 使得

    \[ \boldsymbol{P}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{B} \]

    则称矩阵 \(\boldsymbol{A}\)\(\boldsymbol{B}\) 合同。

  • 合同矩阵的性质

    1. 方阵的合同关系是一种 等价关系
      1. 反身性\(\boldsymbol{A}\) 合同于 \(\boldsymbol{A}\)
      2. 对称性:若 \(\boldsymbol{A}\) 合同于 \(\boldsymbol{B}\),则 \(\boldsymbol{B}\) 也合同于 \(\boldsymbol{A}\)
      3. 传递性:若 \(\boldsymbol{A}\) 合同于 \(\boldsymbol{B}\)\(\boldsymbol{B}\) 又合同于 \(\boldsymbol{C}\),则 \(\boldsymbol{A}\) 也合同于 \(\boldsymbol{C}\)
    2. \(\boldsymbol{A}\) 合同于 \(\boldsymbol{B}\),则 \(r(\boldsymbol{A})=r(\boldsymbol{B})\)
    3. \(\boldsymbol{A}\) 合同于 \(\boldsymbol{B}\)\(\boldsymbol{A}\) 为对称阵,则 \(\boldsymbol{B}\) 也是对称阵。
    4. 一个二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\) 经非奇异线性替换 \(\boldsymbol{x}=\boldsymbol{P}\boldsymbol{y}\) 仍变为一个二次型 \(f=\boldsymbol{y}^{\mathrm{T}}(\boldsymbol{P}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{P})\boldsymbol{y}=\boldsymbol{y}^{\mathrm{T}}\boldsymbol{B}\boldsymbol{y}\),且它们的矩阵合同,即

      \[ \boldsymbol{P}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{B} \]

化二次型为标准二次型的方法

  • 二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\) 化为标准二型的问题等同于实对称矩阵 \(\boldsymbol{A}\) 合同到对角矩阵的问题。
  • 定理:任何一个二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\) 必存在 正交线性替换 \(\boldsymbol{x}=\boldsymbol{Q}\boldsymbol{y}\)\(\boldsymbol{Q}\) 为正交矩阵),使得新变量的二次型 \(\boldsymbol{y}^{\mathrm{T}}(\boldsymbol{Q}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{Q})\boldsymbol{y}=\boldsymbol{y}^{\mathrm{T}}\boldsymbol{\Lambda}\boldsymbol{y}\) 为标准二次型。即

    \[ \begin{aligned} f&=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\\ &\xlongequal{\boldsymbol{x}=\boldsymbol{Q}\boldsymbol{y}} \boldsymbol{y}^{\mathrm{T}}(\boldsymbol{Q}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{Q})\boldsymbol{y}\\ &\xlongequal{\boldsymbol{\Lambda}=\boldsymbol{Q}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{Q}} \boldsymbol{y}^{\mathrm{T}}\boldsymbol{\Lambda}\boldsymbol{y}\\ &=\lambda_{1}y_{1}^{2}+\lambda_{2}y_{2}^{2}+\cdots+\lambda_{n}y_{n}^{2} \end{aligned} \]

    其中 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{n}\) 是实对称矩阵 \(\boldsymbol{A}\) 的特征值。

  • 正交替换法:对任何二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\),首先求实对称矩阵 \(\boldsymbol{A}\) 的正交相似对角阵 \(\boldsymbol{Q}\) ,然后用 \(\boldsymbol{x}=\boldsymbol{Q}\boldsymbol{y}\) 表示新变量,即可化为标准二次型,步骤如下:

    1. 求出实对称矩阵 \(\boldsymbol{A}\) 的全部特征值 \(\lambda_{1},\lambda_{2},\cdots,\lambda_{s}\),它们的代数重数分别为 \(n_{1},n_{2},\cdots,n_{s}\)\(\sum_{i=1}^{s}n_{i}=n\)
    2. 对每个特征值 \(\lambda_{i}\),求出齐次线性方程组 \((\lambda_{i}\boldsymbol{E}-\boldsymbol{A})\boldsymbol{x}=\boldsymbol{0}\) 的基础解系

      \[ \boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{in_{i}},\quad i=1,2,\cdots,s \]
    3. \(\boldsymbol{\alpha}_{i1},\boldsymbol{\alpha}_{i2},\cdots,\boldsymbol{\alpha}_{in_{i}}\) 正交化、单位化得 \(\boldsymbol{\varepsilon}_{i1},\boldsymbol{\varepsilon}_{i2},\cdots,\boldsymbol{\varepsilon}_{in_{i}}\),即得到两两正交的单位特征向量

      \[ \boldsymbol{\varepsilon}_{11},\boldsymbol{\varepsilon}_{12},\cdots,\boldsymbol{\varepsilon}_{1n_{1}},\cdots,\boldsymbol{\varepsilon}_{s1},\boldsymbol{\varepsilon}_{s2},\cdots,\boldsymbol{\varepsilon}_{sn_{s}} \]
    4. \(\boldsymbol{Q}\) 为正交矩阵

      \[ \boldsymbol{Q}=(\boldsymbol{\varepsilon}_{11},\boldsymbol{\varepsilon}_{12},\cdots,\boldsymbol{\varepsilon}_{1n_{1}},\cdots,\boldsymbol{\varepsilon}_{s1},\boldsymbol{\varepsilon}_{s2},\cdots,\boldsymbol{\varepsilon}_{sn_{s}}) \]
    5. 进行正交替换

      \[ \boldsymbol{x}=\boldsymbol{Q}\boldsymbol{y} \]
    6. 则新变量的二次型为标准二次型

      \[ f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}=\boldsymbol{y}^{\mathrm{T}}\boldsymbol{\Lambda}\boldsymbol{y}=\lambda_{1}y_{1}^{2}+\lambda_{2}y_{2}^{2}+\cdots+\lambda_{n}y_{n}^{2} \]
  • 定理 设二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\),则存在非奇异线性替换 \(\boldsymbol{x}=\boldsymbol{P}\boldsymbol{y}\)\(f\) 为标准二次型。

    • 二次型经配方法化为标准形时,标准形各项的系数可以是不唯一的,它们不必是二次型矩阵的特征值,与所作的非退化线性替换有关。
    • 几何意义:二次曲线方程经非奇异线性替换化为标准形方程时,曲线的度量(大小和形状)可能会改变。
  • 配方法:对任何二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\)
    • \(f\) 中平方项的系数不全为零时,不妨设 \(x_{i}^2\) 系数不为零,则可通过配方使余下的二次型为不含 \(x_{i}\)\(n-1\) 元二次型,进而可继续用配方使余下的二次型为不含 \(x_{i-1}\)\(n-2\) 元二次型,依此类推,最后可化为标准形。
    • \(f\) 中所有平方项的系数都为零,而 \(x_{i}x_{j}\) 的项的系数不为零,则可先用一次 非奇异性替换 使得 \(f\) 中出现系数不为零的平方项,然后使用同样方法配方,最后可化为标准形。

6.2 惯性定理与正定二次型

惯性定理

  • 惯性定理:任何实二次型必存在非奇异线性替换化二次型为规范标准形,且规范标准形是唯一的。
    • 几何意义:二次曲线(二次曲面)方程经非奇异线性替换化为标准方程时,标准方程的系数与所作的线性替换有关,但曲线(曲面)的类型(如椭圆型,双曲型等)是不会因所作的线性替换不同而改变。
  • 惯性指数:设二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\)\(r(f)=r\),经非奇异线性替换化 \(f\) 为标准形,则:
    • 正惯性指数\(f\) 的标准形中正项的个数,记为 \(p\)
    • 负惯性指数\(q=r-p\)
    • 符号差\(s=p-q\)
  • 性质:二次型的正惯性指数、负惯性指数和符号差与所作的非奇异线性替换无关

    • 任何实对称矩阵 \(\boldsymbol{A}_{n}\) 都合同于对角矩阵

      \[ \mathrm{diag}(\underbrace{1,\cdots,1}_{p\text{个}},\underbrace{-1,\cdots,-1}_{r-p\text{个}},\underbrace{0,\cdots,0}_{n-r\text{个}})=\begin{pmatrix}\boldsymbol{E}_{p}&&\\ &-\boldsymbol{E}_{r-p}&\\ &&\boldsymbol{0}\end{pmatrix}_{n} \]
    • 两个 \(n\) 元二次型 \(f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\)\(g=\boldsymbol{y}^{\mathrm{T}}\boldsymbol{B}\boldsymbol{y}\) 有相同的秩及正惯性指数的 充分必要条件 为存在非奇异线性替换 \(\boldsymbol{x}=\boldsymbol{P}\boldsymbol{y}\),使

      \[ f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\xlongequal{\boldsymbol{x}=\boldsymbol{P}\boldsymbol{y}}\boldsymbol{y}^{\mathrm{T}}\boldsymbol{B}\boldsymbol{y}=g \]
    • \(n\) 阶实对称矩阵 \(\boldsymbol{A}\) 合同于 \(\boldsymbol{B}\) 的充分必要条件为 \(r(\boldsymbol{A})=r(\boldsymbol{B})\),且 \(\boldsymbol{A}\)\(\boldsymbol{B}\) 的正惯性指数相等。

正定二次型

  • 正定二次型与正定矩阵:设 \(n\) 元二次型

    \[ f(x_{1},x_{2},\cdots,x_{n})=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x} \]

    若对任意非零向量 \(\boldsymbol{x}_{0}=(c_{1},c_{2},\cdots,c_{n})^{\mathrm{T}}\),都有

    \[ f(c_{1},c_{2},\cdots,c_{n})=\boldsymbol{x}_{0}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}_{0}>0 \]

    则称二次型 \(f\)正定二次型,并称其矩阵 \(\boldsymbol{A}\)正定矩阵

    • 性质:实二次型 \(f(x_{1},x_{2},\cdots,x_{n})=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}\) 经非奇异线性替换后其正定性不改变。
    • 顺序主子式:设矩阵 \(\boldsymbol{A}=(a_{ij})_{n\times n}\),则称由 \(\boldsymbol{A}\) 的前 \(k\) 行前 \(k\) 列构成的 \(k\) 阶行列式(\(1\leqslant k\leqslant n\)
    \[ \begin{vmatrix}a_{11}&a_{12}&\cdots&a_{1k}\\ a_{21}&a_{22}&\cdots&a_{2k}\\ \vdots&\vdots&&\vdots\\ a_{k1}&a_{k2}&\cdots&a_{kk}\end{vmatrix} \]

    为矩阵 \(\boldsymbol{A}\)\(k\) 阶顺序主子式

  • 正定矩阵判定定理:设 \(\boldsymbol{A}\)\(n\) 阶实对称矩阵,则下述命题等价:

    1. \(\boldsymbol{A}\) 为正定矩阵
    2. \(\boldsymbol{A}\) 的特征值全大于零
    3. \(\boldsymbol{A}\) 合同于单位矩阵 \(\boldsymbol{E}\)
    4. 存在非奇异矩阵 \(\boldsymbol{M}\),使得 \(\boldsymbol{A}=\boldsymbol{M}^{\mathrm{T}}\boldsymbol{M}\)
    5. 推论:若 \(n\) 阶实对称矩阵 \(\boldsymbol{A}\) 正定,则 \(|\boldsymbol{A}|>0\)
  • 正定二次型判定定理:对应实对称矩阵为正定矩阵,正惯性指数 \(p=r=n\)
    • 标准二次型 \(f(x_{1},x_{2},\cdots,x_{n})=k_{1}x_{1}^{2}+k_{2}x_{2}^{2}+\cdots+k_{n}x_{n}^{2}\) 正定的充分必要条件为 \(k_{i}>0\)\(i=1,2,\cdots,n\)
    • 一般 \(n\) 元二次型

      \[ f(x_{1},x_{2},\cdots,x_{n})=\sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}x_{i}x_{j} \]

      正定的充分必要条件为其矩阵 \(\boldsymbol{A}=(a_{ij})_{n\times n}\) 的各阶顺序主子式全大于零。即

      \[ |a_{11}|>0,\quad \begin{vmatrix}a_{11}&a_{12}\\ a_{21}&a_{22}\end{vmatrix}>0,\quad \begin{vmatrix}a_{11}&a_{12}&a_{13}\\ a_{21}&a_{22}&a_{23}\\ a_{31}&a_{32}&a_{33}\end{vmatrix}>0,\quad\cdots,\quad \begin{vmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn}\end{vmatrix}>0 \]

其他二次型

  • 半正定二次型与半正定矩阵:对任意非零列向量 \(\boldsymbol{x}_{0}=(c_{1},c_{2},\cdots,c_{n})^{\mathrm{T}}\),都有

    \[ f(c_{1},c_{2},\cdots,c_{n})=\boldsymbol{x}_{0}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}_{0}\geq0 \]
  • 负定二次型与负定矩阵:对任意非零列向量 \(\boldsymbol{x}_{0}=(c_{1},c_{2},\cdots,c_{n})^{\mathrm{T}}\),都有

    \[ f(c_{1},c_{2},\cdots,c_{n})=\boldsymbol{x}_{0}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}_{0}<0 \]
  • 半负定二次型与半负定矩阵:对任意非零列向量 \(\boldsymbol{x}_{0}=(c_{1},c_{2},\cdots,c_{n})^{\mathrm{T}}\),都有

    \[ f(c_{1},c_{2},\cdots,c_{n})=\boldsymbol{x}_{0}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}_{0}\leq0 \]
  • 不定二次型与不定矩阵:存在非零向量 \(\boldsymbol{x}_{1}=(c_{1},c_{2},\cdots,c_{n})^{\mathrm{T}}\neq\boldsymbol{0}\)\(\boldsymbol{x}_{2}=(d_{1},d_{2},\cdots,d_{n})^{\mathrm{T}}\neq\boldsymbol{0}\),使得

    \[ f(c_{1},c_{2},\cdots,c_{n})=\boldsymbol{x}_{1}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}_{1}>0, \]

    \[ f(d_{1},d_{2},\cdots,d_{n})=\boldsymbol{x}_{2}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}_{2}<0, \]
  • 说明

    • \(f\) 是(半)负定二次型的充要条件是 \(-f\) 为(半)正定二次型。
    • \(f\) 为不定二次型的充要条件为其正惯性指数 \(p\) 满足 \(0<p<r(f)\)