第五章矩阵的特征值理论与相似对角化

2025-11-272025-11-27

知识点¶

特征值和特征向量¶

矩阵的特征值和特征向量
- 特征值和特征向量的定义
  
  设 \(\boldsymbol A\) 是 \(n\) 阶矩阵，若存在数 \(\lambda\) 和 \(n\) 维非零列向量 \(\boldsymbol x\) 使 \(\boldsymbol A\boldsymbol x=\lambda \boldsymbol x\) 成立，即 \((\lambda \boldsymbol E-\boldsymbol A)\boldsymbol x=\boldsymbol 0\) 有非零解，则称 \(\lambda\) 为 \(\boldsymbol A\) 的一个特征值，此时，非零解 \(\boldsymbol x\) 称为 \(\boldsymbol A\) 的对应于特征值 \(\lambda\) 的特征向量。
  
  【① 不方的矩阵没有特征值；② \(\lambda\) 可以是复数】
  
  注：由定义，\(\lambda\) 是 \(n\) 阶方阵 \(\boldsymbol A\) 的特征值 \(\Leftrightarrow\) \(|\lambda\boldsymbol E-\boldsymbol A|=0\)，这时，齐次方程组 \((\lambda \boldsymbol E-\boldsymbol A)\boldsymbol x=\boldsymbol 0\) 的非零解都是矩阵 \(\boldsymbol A\) 属于特征值 \(\lambda\) 的特征向量。
  
  \(\boldsymbol A\) 的 \(0\) 特征值的特征向量 = 齐次方程组 \(\boldsymbol A\boldsymbol x=\boldsymbol 0\) 的非零解。
- 特征多项式和特征方程
  
  关于 \(\lambda\) 的 \(n\) 次多项式 \(f(\lambda)=|\lambda \boldsymbol E-\boldsymbol A|=\begin{vmatrix}\lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\-a_{21}&\lambda-a_{22}&\cdots&-a_{2n}\\\vdots&\vdots&\ddots&\vdots\\-a_{n1}&-a_{n2}&\cdots&\lambda-a_{nn}\end{vmatrix}\) 称为 \(A\) 的 特征多项式，\(|\lambda \boldsymbol E-\boldsymbol A|=0\) 称为 \(\boldsymbol A\) 的 特征方程，它的根称为 \(\boldsymbol A\) 的 特征根（特征值）。
  
  （\(f(\lambda)\) 是关于 \(\lambda\) 的 \(n\) 次多项式，\(f(\lambda)=0\) 在复数范围内有 \(n\) 个根，即 \(\boldsymbol A\) 在复数域有 \(n\) 个特征值）
- 求具体矩阵的特征值和特征向量
  
  ① 解特征方程 \(|\lambda \boldsymbol E-\boldsymbol A|=0\)，求 \(\boldsymbol A\) 的特征值。（技巧：1. 上（下）三角的特征值为主对角线元素；2. 求行列式时，可以试试两行（列）消出 \(0\)，提公因子）
  
  ② 对于每个特征值，解 \((\lambda \boldsymbol E-\boldsymbol A)\boldsymbol x=\boldsymbol 0\) 的非零解得对应特征向量（通解去掉零解）。
特征值和特征向量的性质
- 特征值和特征向量的有关性质
  - 设 \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_s\) 都是矩阵 \(\boldsymbol A\) 属于特征值 \(\lambda\) 的特征向量，则非零向量 \(k_1\boldsymbol{\alpha}_1+k_2\boldsymbol{\alpha}_2+\cdots+k_s\boldsymbol{\alpha}_s\) 也是矩阵 \(\boldsymbol A\) 属于特征值 \(\lambda\) 的特征向量。
  - 矩阵 \(\boldsymbol A\) 属于不同特征值的特征向量线性无关。
    
    推论 1：\(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_s\) 是 \(\boldsymbol A\) 的属于 \(s\) 个不同特征值的特征向量，则 \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_s\) 线性无关。
    
    推论 2：\(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2\) 分别是 \(\boldsymbol A\) 的属于不同特征值 \(\lambda_1,\lambda_2\) 的特征向量，则 \(k_1\boldsymbol{\alpha}_1+k_2\boldsymbol{\alpha}_2\) 不是 \(\boldsymbol A\) 的特征向量。
  - \(k\) 重特征值至多有 \(k\) 个（至少有 \(1\) 个）线性无关的特征向量。
  - 设 \(n\) 阶方阵 \(\boldsymbol A\) 的 \(n\) 个特征值为 \(\lambda_1,\lambda_2,\cdots,\lambda_n\)，则有 \(\text{tr}(\boldsymbol A)=\sum_{i=1}^n \lambda_i\)，\(|A|=\prod_{i=1}^n \lambda_i\)。
    
    推论：\(\boldsymbol A\) 可逆当且仅当 \(\lambda_i\neq 0\,(i=1,2,\cdots,n)\)。
  - 设 \(\lambda\) 为 \(\boldsymbol A\) 的任一特征值，\(\boldsymbol \alpha\) 是对应特征向量。
    
    ① \(f(\boldsymbol A)=a_m\boldsymbol A^m+a_{m-1}\boldsymbol A^{m-1}+\cdots+a_0\boldsymbol E\)，\(f(\lambda)=a_m\lambda^m+a_{m-1}\lambda^{m-1}+\cdots+a_0\)，则 \(f(\lambda)\) 为 \(f(\boldsymbol A)\) 的特征值，对应特征向量 \(\boldsymbol \alpha\)。
    - a) 由此可知，若 \(f(\boldsymbol A)=\boldsymbol O\)，则 \(\boldsymbol A\) 的任一特征值 \(\lambda\) 都满足 \(f(\lambda)=0\)（即特征值只能取 \(f(\lambda)=0\) 的解），但 \(f(\lambda)=0\) 的解不一定都是 \(\boldsymbol A\) 的特征值。
      
      b) 有以下常用结论成立（设 \(\boldsymbol A\) 的全部特征值为 \(\lambda_1,\lambda_2,\cdots,\lambda_n\)）：\(a\boldsymbol E+b\boldsymbol A\) 的全部特征值为 \(a+b\lambda_1,a+b\lambda_2,\cdots,a+b\lambda_n\)；\(\boldsymbol A^m\) 的全部特征值为 \(\lambda_1^m,\lambda_2^m,\cdots,\lambda_n^m\)。
    ② 若 \(\boldsymbol A\) 可逆，则 \(\lambda\neq 0\)，且 \(\dfrac 1 {\lambda}\) 是矩阵 \(\boldsymbol A^{-1}\) 的特征值，对应特征向量 \(\boldsymbol \alpha\)。
    
    ③ 若 \(\lambda\neq 0\)，\(\boldsymbol A\) 可逆，则 \(\dfrac{|\boldsymbol A|}{\lambda}\) 是矩阵 \(\boldsymbol A^*\) 的特征值，对应特征向量 \(\boldsymbol \alpha\)。
    
    补充：设 \(\lambda\) 是可逆 \(\boldsymbol A\) 的一个特征值，对应特征向量为 \(\boldsymbol \alpha\)（\(\lambda\neq 0\)），则 \(f(\lambda)+k\cdot \dfrac{|\boldsymbol A|}{\lambda}+l\cdot \dfrac 1 {\lambda}\) 是 \(f(\boldsymbol A)+k\boldsymbol A^*+l\boldsymbol A^{-1}\)（不能混入 \(\boldsymbol B,\boldsymbol A^T\)）的特征值，对应特征向量 \(\boldsymbol \alpha\)。
    
    ④ 若 \(\boldsymbol P^{-1}\boldsymbol A\boldsymbol P=\boldsymbol B\)，则 \(\lambda\) 为 \(\boldsymbol B\) 的特征值，对应特征向量 \(\boldsymbol P^{-1}\boldsymbol \alpha\)。
  - \(n\) 阶矩阵 \(\boldsymbol A\) 和 \(\boldsymbol A^T\) 有相同的特征值，但对应的特征向量不一定相同。

相似对角化¶

相似矩阵及其性质
- 相似矩阵的定义
  
  设 \(\boldsymbol A,\boldsymbol B\) 是两个 \(n\) 阶矩阵，若存在可逆矩阵 \(\boldsymbol P\)，满足 \(\boldsymbol P^{-1}\boldsymbol A\boldsymbol P=\boldsymbol B\)，则矩阵 \(\boldsymbol A\) 与矩阵 \(\boldsymbol B\) 相似，记作 \(\boldsymbol A\sim \boldsymbol B\)。
- 矩阵相似的性质
  
  若 \(\boldsymbol A\sim \boldsymbol B\)，则
  
  ① \(f(\boldsymbol A)\sim f(\boldsymbol B)\)（\(f(x)\) 为多项式），\(\boldsymbol A^{-1}\sim \boldsymbol B^{-1}\)（若可逆），\(\boldsymbol A^T\sim \boldsymbol B^T\)，\(\boldsymbol A^*\sim \boldsymbol B^*\)；若 \(\boldsymbol A\) 可逆，则 \(\boldsymbol {AB}=\sim \boldsymbol {BA}\)。
  
  补充：\(\boldsymbol P^{-1}\boldsymbol A\boldsymbol P=\boldsymbol B\Rightarrow \boldsymbol P^{-1}(f(\boldsymbol A)+k\boldsymbol A^*+l\boldsymbol A^{-1})\boldsymbol P=f(\boldsymbol B)+k\boldsymbol B^*+l\boldsymbol B^{-1}\)（不能混入 \(\boldsymbol C,\boldsymbol A^T\)）。
  
  ② \(|\boldsymbol A|=|\boldsymbol B|\)，\(|\lambda \boldsymbol E-\boldsymbol A|=|\lambda \boldsymbol E-\boldsymbol B|\)（\(\boldsymbol A,\boldsymbol B\) 特征值相同），\(r(\boldsymbol A)=r(\boldsymbol B)\)，\(\text{tr}(\boldsymbol A)=\text{tr}(\boldsymbol B)\)
  
  若 \(\boldsymbol A\sim \boldsymbol B\)，\(\boldsymbol C\sim \boldsymbol D\)，则 \(\begin{bmatrix}\boldsymbol A&\boldsymbol O\\\boldsymbol O&\boldsymbol C\end{bmatrix}\sim \begin{bmatrix}\boldsymbol B&\boldsymbol O\\\boldsymbol O&\boldsymbol D\end{bmatrix}\)。
矩阵的相似对角化
- 相似对角化的定义
  
  若矩阵 \(\boldsymbol A\) 与对角矩阵 \(\boldsymbol \Lambda\) 相似，即存在可逆矩阵 \(\boldsymbol P\)，使 \(\boldsymbol P^{-1}\boldsymbol A\boldsymbol P=\boldsymbol \Lambda\)，则称 \(\boldsymbol A\) 可以相似对角化，记为 \(\boldsymbol A\sim \boldsymbol \Lambda\)，称 \(\boldsymbol \Lambda\) 是 \(\boldsymbol A\) 的相似标准形。
  
  注：① \(\boldsymbol A\sim\boldsymbol \Lambda\) 时，\(\boldsymbol \Lambda\) 主对角线上的元素即为 \(\boldsymbol A\) 的全部特征值；② \(\boldsymbol P\) 的各列向量为 \(\boldsymbol A\) 的 \(n\) 个线性无关的特征向量，且顺序与 \(\lambda_i\) 对应。
  
  结论：若 \(\boldsymbol A\) 可对角化，则 \(r(\boldsymbol A)=\boldsymbol A\) 非零特征值个数。
- 矩阵可相似对角化的充要条件
  
  \(\boldsymbol A\sim \boldsymbol \Lambda\)
  
  \(\Leftrightarrow\) \(\boldsymbol A\) 恰有 \(n\) 个线性无关的特征向量
  
  \(\Leftrightarrow\) 对于 \(\boldsymbol A\) 的每个 \(k_i\) 重特征值 \(\lambda_i\)，都有 \(k_i\) 个无关特征向量
  
  \(\Leftrightarrow\) 对于 \(\boldsymbol A\) 的每个 \(k_i\) 重特征值 \(\lambda_i\)，\(n-r(\lambda_i\boldsymbol E-\boldsymbol A)=k_i\)
- 矩阵可相似对角化的充分条件
  
  ① \(n\) 阶矩阵 \(\boldsymbol A\) 有 \(n\) 个不同的特征值 \(\Rightarrow\) \(\boldsymbol A\sim \boldsymbol \Lambda\)
  
  ② \(n\) 阶矩阵 \(\boldsymbol A\) 是实对称矩阵 \(\Rightarrow\) \(\boldsymbol A\sim \boldsymbol \Lambda\)

实对称矩阵¶

实对称矩阵及其性质
- 实对称矩阵的定义
  
  对于实矩阵 \(\boldsymbol A\)，若 \(\boldsymbol A^T=\boldsymbol A\)，则 \(\boldsymbol A\) 为实对称矩阵。
- 正交矩阵
  - 定义：若 \(n\) 阶方阵 \(\boldsymbol A\) 满足 \(\boldsymbol A\boldsymbol A^T=\boldsymbol A^T\boldsymbol A=\boldsymbol E\)，称 \(\boldsymbol A\) 是正交矩阵。
  - 性质：
    
    ① \(\boldsymbol A\) 为正交矩阵，则 \(\boldsymbol A^{-1}=\boldsymbol A^T\)；
    
    ② 正交矩阵的行列式等于 \(1\) 或 \(-1\)；
    
    ③ 正交矩阵的行（列）向量长度均为 \(1\)，且行（列）向量两两正交。
- 实对称矩阵的特性
  - 特征值全是实数，特征向量均为实向量。
  - 必能相似对角化，且存在正交矩阵 \(\boldsymbol Q\)，使 \(\boldsymbol Q^T\boldsymbol A\boldsymbol Q=\boldsymbol Q^{-1}\boldsymbol A\boldsymbol Q=\boldsymbol \Lambda\)。
    
    注：能通过正交矩阵 \(\boldsymbol Q\) 相似对角化的矩阵一定是对称矩阵，非对称矩阵一定不能通过正交矩阵 \(\boldsymbol Q\) 相似对角化。
    
    （由 \(\boldsymbol Q^T\boldsymbol A\boldsymbol Q=\boldsymbol Q^{-1}\boldsymbol A\boldsymbol Q=\Lambda\Leftrightarrow \boldsymbol A^T=(\boldsymbol Q\boldsymbol \Lambda\boldsymbol Q^T)^T=\boldsymbol Q\boldsymbol \Lambda\boldsymbol Q^T=\boldsymbol A\)）
  - 不同特征值的特征向量必定正交。
  - \(k\) 重特征值必定有 \(k\) 个线性无关的特征向量。
  - 非零特征值的个数（重根按重数计）等于矩阵的秩。
实对称矩阵的正交相似对角化

求正交阵 \(\boldsymbol Q\) 和对角阵 \(\boldsymbol \Lambda\)，使 \(\boldsymbol Q^T\boldsymbol A\boldsymbol Q=\boldsymbol Q^{-1}\boldsymbol A\boldsymbol Q=\boldsymbol \Lambda\)

① 求 \(\boldsymbol A\) 所有的特征值和对应特征向量；

② 将属于同一特征值的特征向量正交化，再将所有特征向量单位化；

③ 写成 \(\boldsymbol Q\) 和 \(\boldsymbol \Lambda\)。
- 施密特（Schmidt）正交化方法
  
  若向量组 \(\boldsymbol \alpha_1,\boldsymbol \alpha_2,\boldsymbol \alpha_3\) 无关，令 \(\boldsymbol \beta_1=\boldsymbol \alpha_1\)，\(\boldsymbol \beta_2=\boldsymbol \alpha_2-\dfrac{(\boldsymbol \alpha_2,\boldsymbol \beta_1)}{(\boldsymbol \beta_1,\boldsymbol \beta_1)}\boldsymbol \beta_1\)，\(\boldsymbol \beta_3=\boldsymbol \alpha_3-\dfrac{(\boldsymbol \alpha_3,\boldsymbol \beta_1)}{(\boldsymbol \beta_1,\boldsymbol \beta_1)}\boldsymbol \beta_1-\dfrac{(\boldsymbol \alpha_3,\boldsymbol \beta_2)}{(\boldsymbol \beta_2,\boldsymbol \beta_2)}\boldsymbol \beta_2\)，则向量组 \(\boldsymbol \beta_1,\boldsymbol \beta_2,\boldsymbol \beta_3\) 两两正交，且与向量组 \(\boldsymbol \alpha_1,\boldsymbol \alpha_2,\boldsymbol \alpha_3\) 等价，这一过程称为 Schmidt 正交化。
  
  注：线性无关向量组正交规范化后得到的结果不唯一。

\boldsymbol

\(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_s\)

\(k_1\boldsymbol{\alpha}_1+k_2\boldsymbol{\alpha}_2+\cdots+k_s\boldsymbol{\alpha}_s\)

第五章 矩阵的特征值理论与相似对角化

知识点¶

特征值和特征向量¶

相似对角化¶

实对称矩阵¶

第五章矩阵的特征值理论与相似对角化