跳转至

第五章 矩阵的特征值理论与相似对角化

知识点

特征值和特征向量

  • 矩阵的特征值和特征向量

    • 特征值和特征向量的定义

      \(\boldsymbol A\)\(n\) 阶矩阵,若存在数 \(\lambda\)\(n\)非零 列向量 \(\boldsymbol x\) 使 \(\boldsymbol A\boldsymbol x=\lambda \boldsymbol x\) 成立,即 \((\lambda \boldsymbol E-\boldsymbol A)\boldsymbol x=\boldsymbol 0\) 有非零解,则称 \(\lambda\)\(\boldsymbol A\) 的一个特征值,此时,非零解 \(\boldsymbol x\) 称为 \(\boldsymbol A\) 的对应于特征值 \(\lambda\) 的特征向量。

      【① 不方的矩阵没有特征值;② \(\lambda\) 可以是复数】

      注:由定义,\(\lambda\)\(n\) 阶方阵 \(\boldsymbol A\) 的特征值 \(\Leftrightarrow\) \(|\lambda\boldsymbol E-\boldsymbol A|=0\),这时,齐次方程组 \((\lambda \boldsymbol E-\boldsymbol A)\boldsymbol x=\boldsymbol 0\) 的非零解都是矩阵 \(\boldsymbol A\) 属于特征值 \(\lambda\) 的特征向量。

      \(\boldsymbol A\)\(0\) 特征值的特征向量 = 齐次方程组 \(\boldsymbol A\boldsymbol x=\boldsymbol 0\) 的非零解。

    • 特征多项式和特征方程

      关于 \(\lambda\)\(n\) 次多项式 \(f(\lambda)=|\lambda \boldsymbol E-\boldsymbol A|=\begin{vmatrix}\lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\-a_{21}&\lambda-a_{22}&\cdots&-a_{2n}\\\vdots&\vdots&\ddots&\vdots\\-a_{n1}&-a_{n2}&\cdots&\lambda-a_{nn}\end{vmatrix}\) 称为 \(A\)特征多项式\(|\lambda \boldsymbol E-\boldsymbol A|=0\) 称为 \(\boldsymbol A\)特征方程,它的根称为 \(\boldsymbol A\)特征根特征值)。

      \(f(\lambda)\) 是关于 \(\lambda\)\(n\) 次多项式,\(f(\lambda)=0\) 在复数范围内有 \(n\) 个根,即 \(\boldsymbol A\) 在复数域有 \(n\) 个特征值)

    • 求具体矩阵的特征值和特征向量

      ① 解特征方程 \(|\lambda \boldsymbol E-\boldsymbol A|=0\),求 \(\boldsymbol A\) 的特征值。(技巧:1. 上(下)三角的特征值为主对角线元素;2. 求行列式时,可以试试两行(列)消出 \(0\),提公因子)

      ② 对于每个特征值,解 \((\lambda \boldsymbol E-\boldsymbol A)\boldsymbol x=\boldsymbol 0\) 的非零解得对应特征向量(通解去掉零解)。

  • 特征值和特征向量的性质

    • 特征值和特征向量的有关性质

      • \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_s\) 都是矩阵 \(\boldsymbol A\) 属于特征值 \(\lambda\) 的特征向量,则非零向量 \(k_1\boldsymbol{\alpha}_1+k_2\boldsymbol{\alpha}_2+\cdots+k_s\boldsymbol{\alpha}_s\) 也是矩阵 \(\boldsymbol A\) 属于特征值 \(\lambda\) 的特征向量。

      • 矩阵 \(\boldsymbol A\) 属于不同特征值的特征向量线性无关。

        推论 1:\(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_s\)\(\boldsymbol A\) 的属于 \(s\) 个不同特征值的特征向量,则 \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_s\) 线性无关。

        推论 2:\(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2\) 分别是 \(\boldsymbol A\) 的属于不同特征值 \(\lambda_1,\lambda_2\) 的特征向量,则 \(k_1\boldsymbol{\alpha}_1+k_2\boldsymbol{\alpha}_2\) 不是 \(\boldsymbol A\) 的特征向量。

      • \(k\) 重特征值至多有 \(k\) 个(至少有 \(1\) 个)线性无关的特征向量。

      • \(n\) 阶方阵 \(\boldsymbol A\)\(n\) 个特征值为 \(\lambda_1,\lambda_2,\cdots,\lambda_n\),则有 \(\text{tr}(\boldsymbol A)=\sum_{i=1}^n \lambda_i\)\(|A|=\prod_{i=1}^n \lambda_i\)

        推论:\(\boldsymbol A\) 可逆当且仅当 \(\lambda_i\neq 0\,(i=1,2,\cdots,n)\)

      • \(\lambda\)\(\boldsymbol A\) 的任一特征值,\(\boldsymbol \alpha\) 是对应特征向量。

        \(f(\boldsymbol A)=a_m\boldsymbol A^m+a_{m-1}\boldsymbol A^{m-1}+\cdots+a_0\boldsymbol E\)\(f(\lambda)=a_m\lambda^m+a_{m-1}\lambda^{m-1}+\cdots+a_0\),则 \(f(\lambda)\)\(f(\boldsymbol A)\) 的特征值,对应特征向量 \(\boldsymbol \alpha\)

        • a) 由此可知,若 \(f(\boldsymbol A)=\boldsymbol O\),则 \(\boldsymbol A\) 的任一特征值 \(\lambda\) 都满足 \(f(\lambda)=0\)(即特征值只能取 \(f(\lambda)=0\) 的解),但 \(f(\lambda)=0\) 的解不一定都是 \(\boldsymbol A\) 的特征值。

          b) 有以下常用结论成立(设 \(\boldsymbol A\) 的全部特征值为 \(\lambda_1,\lambda_2,\cdots,\lambda_n\)):\(a\boldsymbol E+b\boldsymbol A\) 的全部特征值为 \(a+b\lambda_1,a+b\lambda_2,\cdots,a+b\lambda_n\)\(\boldsymbol A^m\) 的全部特征值为 \(\lambda_1^m,\lambda_2^m,\cdots,\lambda_n^m\)

        ② 若 \(\boldsymbol A\) 可逆,则 \(\lambda\neq 0\),且 \(\dfrac 1 {\lambda}\) 是矩阵 \(\boldsymbol A^{-1}\) 的特征值,对应特征向量 \(\boldsymbol \alpha\)

        ③ 若 \(\lambda\neq 0\)\(\boldsymbol A\) 可逆,则 \(\dfrac{|\boldsymbol A|}{\lambda}\) 是矩阵 \(\boldsymbol A^*\) 的特征值,对应特征向量 \(\boldsymbol \alpha\)

        补充:设 \(\lambda\) 是可逆 \(\boldsymbol A\) 的一个特征值,对应特征向量为 \(\boldsymbol \alpha\)\(\lambda\neq 0\)),则 \(f(\lambda)+k\cdot \dfrac{|\boldsymbol A|}{\lambda}+l\cdot \dfrac 1 {\lambda}\)\(f(\boldsymbol A)+k\boldsymbol A^*+l\boldsymbol A^{-1}\)(不能混入 \(\boldsymbol B,\boldsymbol A^T\))的特征值,对应特征向量 \(\boldsymbol \alpha\)

        ④ 若 \(\boldsymbol P^{-1}\boldsymbol A\boldsymbol P=\boldsymbol B\),则 \(\lambda\)\(\boldsymbol B\) 的特征值,对应特征向量 \(\boldsymbol P^{-1}\boldsymbol \alpha\)

      • \(n\) 阶矩阵 \(\boldsymbol A\)\(\boldsymbol A^T\) 有相同的特征值,但对应的特征向量不一定相同。

相似对角化

  • 相似矩阵及其性质

    • 相似矩阵的定义

      \(\boldsymbol A,\boldsymbol B\) 是两个 \(n\) 阶矩阵,若存在可逆矩阵 \(\boldsymbol P\),满足 \(\boldsymbol P^{-1}\boldsymbol A\boldsymbol P=\boldsymbol B\),则矩阵 \(\boldsymbol A\) 与矩阵 \(\boldsymbol B\) 相似,记作 \(\boldsymbol A\sim \boldsymbol B\)

    • 矩阵相似的性质

      \(\boldsymbol A\sim \boldsymbol B\),则

      \(f(\boldsymbol A)\sim f(\boldsymbol B)\)\(f(x)\) 为多项式),\(\boldsymbol A^{-1}\sim \boldsymbol B^{-1}\)(若可逆),\(\boldsymbol A^T\sim \boldsymbol B^T\)\(\boldsymbol A^*\sim \boldsymbol B^*\);若 \(\boldsymbol A\) 可逆,则 \(\boldsymbol {AB}=\sim \boldsymbol {BA}\)

      补充:\(\boldsymbol P^{-1}\boldsymbol A\boldsymbol P=\boldsymbol B\Rightarrow \boldsymbol P^{-1}(f(\boldsymbol A)+k\boldsymbol A^*+l\boldsymbol A^{-1})\boldsymbol P=f(\boldsymbol B)+k\boldsymbol B^*+l\boldsymbol B^{-1}\)(不能混入 \(\boldsymbol C,\boldsymbol A^T\))。

      \(|\boldsymbol A|=|\boldsymbol B|\)\(|\lambda \boldsymbol E-\boldsymbol A|=|\lambda \boldsymbol E-\boldsymbol B|\)\(\boldsymbol A,\boldsymbol B\) 特征值相同),\(r(\boldsymbol A)=r(\boldsymbol B)\)\(\text{tr}(\boldsymbol A)=\text{tr}(\boldsymbol B)\)

      \(\boldsymbol A\sim \boldsymbol B\)\(\boldsymbol C\sim \boldsymbol D\),则 \(\begin{bmatrix}\boldsymbol A&\boldsymbol O\\\boldsymbol O&\boldsymbol C\end{bmatrix}\sim \begin{bmatrix}\boldsymbol B&\boldsymbol O\\\boldsymbol O&\boldsymbol D\end{bmatrix}\)

  • 矩阵的相似对角化

    • 相似对角化的定义

      若矩阵 \(\boldsymbol A\) 与对角矩阵 \(\boldsymbol \Lambda\) 相似,即存在可逆矩阵 \(\boldsymbol P\),使 \(\boldsymbol P^{-1}\boldsymbol A\boldsymbol P=\boldsymbol \Lambda\),则称 \(\boldsymbol A\) 可以相似对角化,记为 \(\boldsymbol A\sim \boldsymbol \Lambda\),称 \(\boldsymbol \Lambda\)\(\boldsymbol A\) 的相似标准形。

      注:① \(\boldsymbol A\sim\boldsymbol \Lambda\) 时,\(\boldsymbol \Lambda\) 主对角线上的元素即为 \(\boldsymbol A\) 的全部特征值;② \(\boldsymbol P\) 的各列向量为 \(\boldsymbol A\)\(n\) 个线性无关的特征向量,且顺序与 \(\lambda_i\) 对应。

      结论:若 \(\boldsymbol A\) 可对角化,则 \(r(\boldsymbol A)=\boldsymbol A\) 非零特征值个数。

    • 矩阵可相似对角化的充要条件

      \(\boldsymbol A\sim \boldsymbol \Lambda\)

      \(\Leftrightarrow\) \(\boldsymbol A\) 恰有 \(n\) 个线性无关的特征向量

      \(\Leftrightarrow\) 对于 \(\boldsymbol A\) 的每个 \(k_i\) 重特征值 \(\lambda_i\),都有 \(k_i\) 个无关特征向量

      \(\Leftrightarrow\) 对于 \(\boldsymbol A\) 的每个 \(k_i\) 重特征值 \(\lambda_i\)\(n-r(\lambda_i\boldsymbol E-\boldsymbol A)=k_i\)

    • 矩阵可相似对角化的充分条件

      \(n\) 阶矩阵 \(\boldsymbol A\)\(n\) 个不同的特征值 \(\Rightarrow\) \(\boldsymbol A\sim \boldsymbol \Lambda\)

      \(n\) 阶矩阵 \(\boldsymbol A\) 是实对称矩阵 \(\Rightarrow\) \(\boldsymbol A\sim \boldsymbol \Lambda\)

实对称矩阵

  • 实对称矩阵及其性质

    • 实对称矩阵的定义

      对于实矩阵 \(\boldsymbol A\),若 \(\boldsymbol A^T=\boldsymbol A\),则 \(\boldsymbol A\) 为实对称矩阵。

    • 正交矩阵

      • 定义:若 \(n\) 阶方阵 \(\boldsymbol A\) 满足 \(\boldsymbol A\boldsymbol A^T=\boldsymbol A^T\boldsymbol A=\boldsymbol E\),称 \(\boldsymbol A\) 是正交矩阵。
      • 性质:

        \(\boldsymbol A\) 为正交矩阵,则 \(\boldsymbol A^{-1}=\boldsymbol A^T\)

        ② 正交矩阵的行列式等于 \(1\)\(-1\)

        ③ 正交矩阵的行(列)向量长度均为 \(1\),且行(列)向量两两正交。

    • 实对称矩阵的特性

      • 特征值全是实数,特征向量均为实向量。
      • 必能相似对角化,且存在正交矩阵 \(\boldsymbol Q\),使 \(\boldsymbol Q^T\boldsymbol A\boldsymbol Q=\boldsymbol Q^{-1}\boldsymbol A\boldsymbol Q=\boldsymbol \Lambda\)

        注:能通过正交矩阵 \(\boldsymbol Q\) 相似对角化的矩阵一定是对称矩阵,非对称矩阵一定不能通过正交矩阵 \(\boldsymbol Q\) 相似对角化。

        (由 \(\boldsymbol Q^T\boldsymbol A\boldsymbol Q=\boldsymbol Q^{-1}\boldsymbol A\boldsymbol Q=\Lambda\Leftrightarrow \boldsymbol A^T=(\boldsymbol Q\boldsymbol \Lambda\boldsymbol Q^T)^T=\boldsymbol Q\boldsymbol \Lambda\boldsymbol Q^T=\boldsymbol A\)

      • 不同特征值的特征向量必定正交。

      • \(k\) 重特征值必定有 \(k\) 个线性无关的特征向量。
      • 非零特征值的个数(重根按重数计)等于矩阵的秩。
  • 实对称矩阵的正交相似对角化

    求正交阵 \(\boldsymbol Q\) 和对角阵 \(\boldsymbol \Lambda\),使 \(\boldsymbol Q^T\boldsymbol A\boldsymbol Q=\boldsymbol Q^{-1}\boldsymbol A\boldsymbol Q=\boldsymbol \Lambda\)

    ① 求 \(\boldsymbol A\) 所有的特征值和对应特征向量;

    ② 将属于同一特征值的特征向量正交化,再将所有特征向量单位化;

    ③ 写成 \(\boldsymbol Q\)\(\boldsymbol \Lambda\)

    • 施密特(Schmidt)正交化方法

      若向量组 \(\boldsymbol \alpha_1,\boldsymbol \alpha_2,\boldsymbol \alpha_3\) 无关,令 \(\boldsymbol \beta_1=\boldsymbol \alpha_1\)\(\boldsymbol \beta_2=\boldsymbol \alpha_2-\dfrac{(\boldsymbol \alpha_2,\boldsymbol \beta_1)}{(\boldsymbol \beta_1,\boldsymbol \beta_1)}\boldsymbol \beta_1\)\(\boldsymbol \beta_3=\boldsymbol \alpha_3-\dfrac{(\boldsymbol \alpha_3,\boldsymbol \beta_1)}{(\boldsymbol \beta_1,\boldsymbol \beta_1)}\boldsymbol \beta_1-\dfrac{(\boldsymbol \alpha_3,\boldsymbol \beta_2)}{(\boldsymbol \beta_2,\boldsymbol \beta_2)}\boldsymbol \beta_2\),则向量组 \(\boldsymbol \beta_1,\boldsymbol \beta_2,\boldsymbol \beta_3\) 两两正交,且与向量组 \(\boldsymbol \alpha_1,\boldsymbol \alpha_2,\boldsymbol \alpha_3\) 等价,这一过程称为 Schmidt 正交化。

      注:线性无关向量组正交规范化后得到的结果不唯一。

\boldsymbol

\(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_s\)

\(k_1\boldsymbol{\alpha}_1+k_2\boldsymbol{\alpha}_2+\cdots+k_s\boldsymbol{\alpha}_s\)