第五章 矩阵的特征值理论与相似对角化
知识点¶
特征值和特征向量¶
-
矩阵的特征值和特征向量
-
特征值和特征向量的定义
设 \(\boldsymbol A\) 是 \(n\) 阶矩阵,若存在数 \(\lambda\) 和 \(n\) 维 非零 列向量 \(\boldsymbol x\) 使 \(\boldsymbol A\boldsymbol x=\lambda \boldsymbol x\) 成立,即 \((\lambda \boldsymbol E-\boldsymbol A)\boldsymbol x=\boldsymbol 0\) 有非零解,则称 \(\lambda\) 为 \(\boldsymbol A\) 的一个特征值,此时,非零解 \(\boldsymbol x\) 称为 \(\boldsymbol A\) 的对应于特征值 \(\lambda\) 的特征向量。
【① 不方的矩阵没有特征值;② \(\lambda\) 可以是复数】
注:由定义,\(\lambda\) 是 \(n\) 阶方阵 \(\boldsymbol A\) 的特征值 \(\Leftrightarrow\) \(|\lambda\boldsymbol E-\boldsymbol A|=0\),这时,齐次方程组 \((\lambda \boldsymbol E-\boldsymbol A)\boldsymbol x=\boldsymbol 0\) 的非零解都是矩阵 \(\boldsymbol A\) 属于特征值 \(\lambda\) 的特征向量。
\(\boldsymbol A\) 的 \(0\) 特征值的特征向量 = 齐次方程组 \(\boldsymbol A\boldsymbol x=\boldsymbol 0\) 的非零解。
-
特征多项式和特征方程
关于 \(\lambda\) 的 \(n\) 次多项式 \(f(\lambda)=|\lambda \boldsymbol E-\boldsymbol A|=\begin{vmatrix}\lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\-a_{21}&\lambda-a_{22}&\cdots&-a_{2n}\\\vdots&\vdots&\ddots&\vdots\\-a_{n1}&-a_{n2}&\cdots&\lambda-a_{nn}\end{vmatrix}\) 称为 \(A\) 的 特征多项式,\(|\lambda \boldsymbol E-\boldsymbol A|=0\) 称为 \(\boldsymbol A\) 的 特征方程,它的根称为 \(\boldsymbol A\) 的 特征根(特征值)。
(\(f(\lambda)\) 是关于 \(\lambda\) 的 \(n\) 次多项式,\(f(\lambda)=0\) 在复数范围内有 \(n\) 个根,即 \(\boldsymbol A\) 在复数域有 \(n\) 个特征值)
-
求具体矩阵的特征值和特征向量
① 解特征方程 \(|\lambda \boldsymbol E-\boldsymbol A|=0\),求 \(\boldsymbol A\) 的特征值。(技巧:1. 上(下)三角的特征值为主对角线元素;2. 求行列式时,可以试试两行(列)消出 \(0\),提公因子)
② 对于每个特征值,解 \((\lambda \boldsymbol E-\boldsymbol A)\boldsymbol x=\boldsymbol 0\) 的非零解得对应特征向量(通解去掉零解)。
-
-
特征值和特征向量的性质
-
特征值和特征向量的有关性质
-
设 \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_s\) 都是矩阵 \(\boldsymbol A\) 属于特征值 \(\lambda\) 的特征向量,则非零向量 \(k_1\boldsymbol{\alpha}_1+k_2\boldsymbol{\alpha}_2+\cdots+k_s\boldsymbol{\alpha}_s\) 也是矩阵 \(\boldsymbol A\) 属于特征值 \(\lambda\) 的特征向量。
-
矩阵 \(\boldsymbol A\) 属于不同特征值的特征向量线性无关。
推论 1:\(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_s\) 是 \(\boldsymbol A\) 的属于 \(s\) 个不同特征值的特征向量,则 \(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_s\) 线性无关。
推论 2:\(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2\) 分别是 \(\boldsymbol A\) 的属于不同特征值 \(\lambda_1,\lambda_2\) 的特征向量,则 \(k_1\boldsymbol{\alpha}_1+k_2\boldsymbol{\alpha}_2\) 不是 \(\boldsymbol A\) 的特征向量。
-
\(k\) 重特征值至多有 \(k\) 个(至少有 \(1\) 个)线性无关的特征向量。
-
设 \(n\) 阶方阵 \(\boldsymbol A\) 的 \(n\) 个特征值为 \(\lambda_1,\lambda_2,\cdots,\lambda_n\),则有 \(\text{tr}(\boldsymbol A)=\sum_{i=1}^n \lambda_i\),\(|A|=\prod_{i=1}^n \lambda_i\)。
推论:\(\boldsymbol A\) 可逆当且仅当 \(\lambda_i\neq 0\,(i=1,2,\cdots,n)\)。
-
设 \(\lambda\) 为 \(\boldsymbol A\) 的任一特征值,\(\boldsymbol \alpha\) 是对应特征向量。
① \(f(\boldsymbol A)=a_m\boldsymbol A^m+a_{m-1}\boldsymbol A^{m-1}+\cdots+a_0\boldsymbol E\),\(f(\lambda)=a_m\lambda^m+a_{m-1}\lambda^{m-1}+\cdots+a_0\),则 \(f(\lambda)\) 为 \(f(\boldsymbol A)\) 的特征值,对应特征向量 \(\boldsymbol \alpha\)。
-
a) 由此可知,若 \(f(\boldsymbol A)=\boldsymbol O\),则 \(\boldsymbol A\) 的任一特征值 \(\lambda\) 都满足 \(f(\lambda)=0\)(即特征值只能取 \(f(\lambda)=0\) 的解),但 \(f(\lambda)=0\) 的解不一定都是 \(\boldsymbol A\) 的特征值。
b) 有以下常用结论成立(设 \(\boldsymbol A\) 的全部特征值为 \(\lambda_1,\lambda_2,\cdots,\lambda_n\)):\(a\boldsymbol E+b\boldsymbol A\) 的全部特征值为 \(a+b\lambda_1,a+b\lambda_2,\cdots,a+b\lambda_n\);\(\boldsymbol A^m\) 的全部特征值为 \(\lambda_1^m,\lambda_2^m,\cdots,\lambda_n^m\)。
② 若 \(\boldsymbol A\) 可逆,则 \(\lambda\neq 0\),且 \(\dfrac 1 {\lambda}\) 是矩阵 \(\boldsymbol A^{-1}\) 的特征值,对应特征向量 \(\boldsymbol \alpha\)。
③ 若 \(\lambda\neq 0\),\(\boldsymbol A\) 可逆,则 \(\dfrac{|\boldsymbol A|}{\lambda}\) 是矩阵 \(\boldsymbol A^*\) 的特征值,对应特征向量 \(\boldsymbol \alpha\)。
补充:设 \(\lambda\) 是可逆 \(\boldsymbol A\) 的一个特征值,对应特征向量为 \(\boldsymbol \alpha\)(\(\lambda\neq 0\)),则 \(f(\lambda)+k\cdot \dfrac{|\boldsymbol A|}{\lambda}+l\cdot \dfrac 1 {\lambda}\) 是 \(f(\boldsymbol A)+k\boldsymbol A^*+l\boldsymbol A^{-1}\)(不能混入 \(\boldsymbol B,\boldsymbol A^T\))的特征值,对应特征向量 \(\boldsymbol \alpha\)。
④ 若 \(\boldsymbol P^{-1}\boldsymbol A\boldsymbol P=\boldsymbol B\),则 \(\lambda\) 为 \(\boldsymbol B\) 的特征值,对应特征向量 \(\boldsymbol P^{-1}\boldsymbol \alpha\)。
-
-
\(n\) 阶矩阵 \(\boldsymbol A\) 和 \(\boldsymbol A^T\) 有相同的特征值,但对应的特征向量不一定相同。
-
-
相似对角化¶
-
相似矩阵及其性质
-
相似矩阵的定义
设 \(\boldsymbol A,\boldsymbol B\) 是两个 \(n\) 阶矩阵,若存在可逆矩阵 \(\boldsymbol P\),满足 \(\boldsymbol P^{-1}\boldsymbol A\boldsymbol P=\boldsymbol B\),则矩阵 \(\boldsymbol A\) 与矩阵 \(\boldsymbol B\) 相似,记作 \(\boldsymbol A\sim \boldsymbol B\)。
-
矩阵相似的性质
若 \(\boldsymbol A\sim \boldsymbol B\),则
① \(f(\boldsymbol A)\sim f(\boldsymbol B)\)(\(f(x)\) 为多项式),\(\boldsymbol A^{-1}\sim \boldsymbol B^{-1}\)(若可逆),\(\boldsymbol A^T\sim \boldsymbol B^T\),\(\boldsymbol A^*\sim \boldsymbol B^*\);若 \(\boldsymbol A\) 可逆,则 \(\boldsymbol {AB}=\sim \boldsymbol {BA}\)。
补充:\(\boldsymbol P^{-1}\boldsymbol A\boldsymbol P=\boldsymbol B\Rightarrow \boldsymbol P^{-1}(f(\boldsymbol A)+k\boldsymbol A^*+l\boldsymbol A^{-1})\boldsymbol P=f(\boldsymbol B)+k\boldsymbol B^*+l\boldsymbol B^{-1}\)(不能混入 \(\boldsymbol C,\boldsymbol A^T\))。
② \(|\boldsymbol A|=|\boldsymbol B|\),\(|\lambda \boldsymbol E-\boldsymbol A|=|\lambda \boldsymbol E-\boldsymbol B|\)(\(\boldsymbol A,\boldsymbol B\) 特征值相同),\(r(\boldsymbol A)=r(\boldsymbol B)\),\(\text{tr}(\boldsymbol A)=\text{tr}(\boldsymbol B)\)
若 \(\boldsymbol A\sim \boldsymbol B\),\(\boldsymbol C\sim \boldsymbol D\),则 \(\begin{bmatrix}\boldsymbol A&\boldsymbol O\\\boldsymbol O&\boldsymbol C\end{bmatrix}\sim \begin{bmatrix}\boldsymbol B&\boldsymbol O\\\boldsymbol O&\boldsymbol D\end{bmatrix}\)。
-
-
矩阵的相似对角化
-
相似对角化的定义
若矩阵 \(\boldsymbol A\) 与对角矩阵 \(\boldsymbol \Lambda\) 相似,即存在可逆矩阵 \(\boldsymbol P\),使 \(\boldsymbol P^{-1}\boldsymbol A\boldsymbol P=\boldsymbol \Lambda\),则称 \(\boldsymbol A\) 可以相似对角化,记为 \(\boldsymbol A\sim \boldsymbol \Lambda\),称 \(\boldsymbol \Lambda\) 是 \(\boldsymbol A\) 的相似标准形。
注:① \(\boldsymbol A\sim\boldsymbol \Lambda\) 时,\(\boldsymbol \Lambda\) 主对角线上的元素即为 \(\boldsymbol A\) 的全部特征值;② \(\boldsymbol P\) 的各列向量为 \(\boldsymbol A\) 的 \(n\) 个线性无关的特征向量,且顺序与 \(\lambda_i\) 对应。
结论:若 \(\boldsymbol A\) 可对角化,则 \(r(\boldsymbol A)=\boldsymbol A\) 非零特征值个数。
-
矩阵可相似对角化的充要条件
\(\boldsymbol A\sim \boldsymbol \Lambda\)
\(\Leftrightarrow\) \(\boldsymbol A\) 恰有 \(n\) 个线性无关的特征向量
\(\Leftrightarrow\) 对于 \(\boldsymbol A\) 的每个 \(k_i\) 重特征值 \(\lambda_i\),都有 \(k_i\) 个无关特征向量
\(\Leftrightarrow\) 对于 \(\boldsymbol A\) 的每个 \(k_i\) 重特征值 \(\lambda_i\),\(n-r(\lambda_i\boldsymbol E-\boldsymbol A)=k_i\)
-
矩阵可相似对角化的充分条件
① \(n\) 阶矩阵 \(\boldsymbol A\) 有 \(n\) 个不同的特征值 \(\Rightarrow\) \(\boldsymbol A\sim \boldsymbol \Lambda\)
② \(n\) 阶矩阵 \(\boldsymbol A\) 是实对称矩阵 \(\Rightarrow\) \(\boldsymbol A\sim \boldsymbol \Lambda\)
-
实对称矩阵¶
-
实对称矩阵及其性质
-
实对称矩阵的定义
对于实矩阵 \(\boldsymbol A\),若 \(\boldsymbol A^T=\boldsymbol A\),则 \(\boldsymbol A\) 为实对称矩阵。
-
正交矩阵
- 定义:若 \(n\) 阶方阵 \(\boldsymbol A\) 满足 \(\boldsymbol A\boldsymbol A^T=\boldsymbol A^T\boldsymbol A=\boldsymbol E\),称 \(\boldsymbol A\) 是正交矩阵。
-
性质:
① \(\boldsymbol A\) 为正交矩阵,则 \(\boldsymbol A^{-1}=\boldsymbol A^T\);
② 正交矩阵的行列式等于 \(1\) 或 \(-1\);
③ 正交矩阵的行(列)向量长度均为 \(1\),且行(列)向量两两正交。
-
实对称矩阵的特性
- 特征值全是实数,特征向量均为实向量。
-
必能相似对角化,且存在正交矩阵 \(\boldsymbol Q\),使 \(\boldsymbol Q^T\boldsymbol A\boldsymbol Q=\boldsymbol Q^{-1}\boldsymbol A\boldsymbol Q=\boldsymbol \Lambda\)。
注:能通过正交矩阵 \(\boldsymbol Q\) 相似对角化的矩阵一定是对称矩阵,非对称矩阵一定不能通过正交矩阵 \(\boldsymbol Q\) 相似对角化。
(由 \(\boldsymbol Q^T\boldsymbol A\boldsymbol Q=\boldsymbol Q^{-1}\boldsymbol A\boldsymbol Q=\Lambda\Leftrightarrow \boldsymbol A^T=(\boldsymbol Q\boldsymbol \Lambda\boldsymbol Q^T)^T=\boldsymbol Q\boldsymbol \Lambda\boldsymbol Q^T=\boldsymbol A\))
-
不同特征值的特征向量必定正交。
- \(k\) 重特征值必定有 \(k\) 个线性无关的特征向量。
- 非零特征值的个数(重根按重数计)等于矩阵的秩。
-
-
实对称矩阵的正交相似对角化
求正交阵 \(\boldsymbol Q\) 和对角阵 \(\boldsymbol \Lambda\),使 \(\boldsymbol Q^T\boldsymbol A\boldsymbol Q=\boldsymbol Q^{-1}\boldsymbol A\boldsymbol Q=\boldsymbol \Lambda\)
① 求 \(\boldsymbol A\) 所有的特征值和对应特征向量;
② 将属于同一特征值的特征向量正交化,再将所有特征向量单位化;
③ 写成 \(\boldsymbol Q\) 和 \(\boldsymbol \Lambda\)。
-
施密特(Schmidt)正交化方法
若向量组 \(\boldsymbol \alpha_1,\boldsymbol \alpha_2,\boldsymbol \alpha_3\) 无关,令 \(\boldsymbol \beta_1=\boldsymbol \alpha_1\),\(\boldsymbol \beta_2=\boldsymbol \alpha_2-\dfrac{(\boldsymbol \alpha_2,\boldsymbol \beta_1)}{(\boldsymbol \beta_1,\boldsymbol \beta_1)}\boldsymbol \beta_1\),\(\boldsymbol \beta_3=\boldsymbol \alpha_3-\dfrac{(\boldsymbol \alpha_3,\boldsymbol \beta_1)}{(\boldsymbol \beta_1,\boldsymbol \beta_1)}\boldsymbol \beta_1-\dfrac{(\boldsymbol \alpha_3,\boldsymbol \beta_2)}{(\boldsymbol \beta_2,\boldsymbol \beta_2)}\boldsymbol \beta_2\),则向量组 \(\boldsymbol \beta_1,\boldsymbol \beta_2,\boldsymbol \beta_3\) 两两正交,且与向量组 \(\boldsymbol \alpha_1,\boldsymbol \alpha_2,\boldsymbol \alpha_3\) 等价,这一过程称为 Schmidt 正交化。
注:线性无关向量组正交规范化后得到的结果不唯一。
-
\boldsymbol
\(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_s\)
\(k_1\boldsymbol{\alpha}_1+k_2\boldsymbol{\alpha}_2+\cdots+k_s\boldsymbol{\alpha}_s\)