Jordan 标准型
摘 要 本文主要阐述 Jordan 标准型的简单理论. 本文首先通过特征值与特征向量介绍矩阵对角化的方法, 并引出矩阵不可对角化的问题. 然后介绍多项式矩阵的基本理论, 通过例子阐述矩阵的 Jordan 标准型及其过渡矩阵的求法. 最后指出了用 Jordan 标准型表述的几个结论.
1 可对角化的情况
1.1 特征值与特征向量
特征值与特征向量 对于 n 阶方阵 A, 如果有数 λ 和向量 u=0 使得
Au=λu⟺(λI−A)u=0
即线性变换 A 作用于向量 u 等价于将 u 伸缩至 λ 倍, 则称 λ 是 A 的一个特征值, u 是 λ 对应的一个特征向量.
特征多项式 n 次多项式 ∣λI−A∣ 称为矩阵 A 的特征多项式. A 的特征值等价于其特征多项式的根, 故 n 阶矩阵有且仅有 n 个特征值 (重根按重数计).
代数重数 特征值 λ 的代数重数 α 定义为 λ 作为特征多项式根的重数. ∑α=n.
特征矩阵与特征空间 对于矩阵 A, 给定特征值 λ 对应的所有特征向量 u 构成一个线性空间, 它是特征矩阵 λI−A 的核 Ker(λI−A), 称其为特征值 λ 对应的特征空间.
几何重数 特征值 λi 的几何重数 γi 定义为其对应特征空间的维数 nullity(λiI−A).
代数重数与几何重数的关系 几何重数不超过代数重数, 即 γi≤αi. 即 α-重特征值对应特征空间的维数小于等于 α.
1.2 矩阵的对角化
特征向量系 矩阵 A 所有特征值对应的特征空间的一组基称为矩阵 A 的一个特征向量系. 因为 γi≤αi, 所以 ∑γi≤n, 即特征向量系中的向量个数不超过 n.
完备特征向量系 称 A 的特征向量系是完备的, 若矩阵 A 特征向量系中有 n 个向量, 即矩阵 A 有 n 个线性无关的特征向量.
单纯矩阵和亏损矩阵 称 A 为单纯矩阵, 若 A 有完备的特征向量系. 否则称 A 为亏损矩阵.
可对角化的矩阵 称 A 可对角化, 如果它相似于一个对角矩阵. 即存在可逆阵 P 和对角阵 Λ 使得
P−1AP=Λ
可对角化的条件 矩阵 A 可相似对角化, 当且仅当它是一个单纯矩阵.
对角化的方法 取 Λ=diag(λ1,λ2,⋯,λn), U=(u1,u2,⋯,un), 此时有
U−1AU=Λ
2 多项式矩阵
多项式矩阵及其秩和行列式 称矩阵 A(λ) 是一个多项式矩阵, 如果它的元素均是 λ 的多项式. 多项式矩阵秩的定义与一般矩阵相同(非零子式的最大阶数), 行列式的定义与一般矩阵相同.
多项式矩阵的初等变换 多项式矩阵有三种初等变换:
- 交换: 对调第 i 行(列)与第 j 行(列);
- 倍乘: 将第 i 行(列)乘以 k 倍, 其中 k 不为零且不含 λ;
- 倍加: 将第 i 行(列)的 k(λ) 倍加到第 j 行(列), 其中 k(λ) 是 λ 的多项式.
Smith 标准型 多项式矩阵总能通过有限次初等变换化为 Smith 标准型:
S(λ)=s1(λ)⋱sr(λ)0⋱0
其中 r 是多项式矩阵的秩, si(λ) 是 si+1(λ) 的因子, 且最高次项系数为 1.
例 多项式矩阵
−λ+1λλ2+12λ−1λ2λ2+λ−1λ−λ−λ2
可以通过初等变换化为 Smith 标准型
1λλ(λ2+1)
这里 1 是 λ 的因子, λ 是 λ(λ2+1) 的因子. 原矩阵的秩为 3.
不变因子 Smith 矩阵的对角元 s1(λ),⋯,sr(λ) 称为多项式矩阵的不变因子.
初等因子 多项式矩阵的初等因子是指其每一不变因子因式分解后的项. 初等因子可有重复, 但不能遗漏.
例 若一个多项式矩阵的不变因子是
1,λ(λ−1),λ(λ−1)2,λ2(λ−1)2
则它的初等因子是
λ,(λ−1),λ,(λ−1)2,λ2,(λ−1)2
3 不可对角化的情况
3.1 Jordan 标准型
虽然矩阵不可对角化, 但是我们可以退而求其次, 探讨矩阵是否相似与一类形式上接近对角矩阵的矩阵.
Jordan 块 称以下形式的 m 阶方阵为一个 m 阶 Jordan 块:
Jm(λ)=λ1λ⋱⋱1λ
Jordan 标准型 Jordan 块构成的分块对角矩阵称为一个 Jordan 标准型:
J=Jm1(λ1)Jm2(λ2)⋱Jms(λs)
A 的每一个 初等因子 (λ−λi)βi 对应一个 Jordan 块 Jβi(λ). 矩阵必相似于其 Jordan 标准型, 即存在可逆阵 P 使得
P−1AP=J
例 特征矩阵初等因 子为
(λ−1),(λ−1),(λ−3)2
的矩阵对应的 Jordan 标准形为
J=31311
例 矩阵
A=2−300020000200112
写出特征矩阵, 通过略复杂的初等变换可知其 Smith 标准型为
11(λ−2)2(λ−2)2
它的初等因子是
(λ−2)2,(λ−2)2
所以对应的 Jordan 标准型为
J=212212
3.2 过渡矩阵的求法
以三阶矩阵为例. 三阶矩阵有两种包含 2 阶或以上 Jordan 块的 Jordan 标准型:
J=λ1λ21λ2,J=λ11λ11λ1
对于第一种情况, 令 U=(u1,u2,u3), 考虑
U−1AU=J⟺AU=UJ
即
A(u1,u2,u3)=(u1,u2,u3)λ1λ21λ2
这等价于
(Au1,Au2,Au3)=(λ1u1,λ2u2,u2+λ2u3)
即解方程组
⎩⎨⎧(λ1I−A)u1=0(λ2I−A)u2=0(λ2I−A)u3=−u2
观察方程组可知 u1,u2 分别是 λ1,λ2 对应的特征向量, u3 是最后一个非齐次线性 方程组的解.
对于第二种情况, 同理可得方程组
⎩⎨⎧(λ1I−A)u1=0(λ1I−A)u2=−u1(λ1I−A)u3=−u2
观察方程组可知 u1 是 λ1 对应的特征向量, u2,u3 是最后两个非齐次线性方程组的解.
扩展到 n 维的情况, 每一个 Jordan 块的第一行对应方程
(λI−A)ui=0
其余行对应方程
(λI−A)ui=−ui−1
广义特征向量 称 Jordan 块第一行对应的方程的解向量为矩阵的特征向量, 其余行方程的解向量为矩阵的广义特征向量.
例 矩阵
A=−1−41130002
可以求出其 Jordan 标准型为
J=2111
特征值 2 和 1 对应的特征向量分别为
u1=(0,0,1)T,u2(1,2,−1)T
最后一个非线性齐次方程组及其解为
(I−A)u3=−u2,u3=(0,1,−1)T
所以取 U=(u1,u2,u3) 时有 U−1AU=J.
4 利用 Jordan 标准型表示一些结论
零特征值与秩 矩阵丢失的秩等于矩阵零特征值的几何重数, 即
rankA=n−γ0
矩阵秩等于零特征值个数, 当且仅当零特征值的几何重数等于其代数重数. 即
\mathop{\rm rank}A=\## \lambda_{\neq 0} \quad\iff\quad \alpha_0=\gamma_0
用 Jordan 标准型的语言重述, 矩阵丢失的秩等于零特征值 Jordan 块的个数, 即
rankA=n−#J(0)
矩阵秩等于零特征值个数, 当且仅当矩阵的零特征值 2 阶或以上 Jordan 块, 即
\mathop{\rm rank}A=\## \lambda_{\neq 0} \quad\iff\quad \lnot\exists J_m(0),\quad m\geq 2
究其根本, 这是因为非零特征值 Jordan 块 Jm(λ) 的秩必为 m, 而零特征值 Jordan 块 Jm(0) 的秩仅为 m−1.
例 矩阵的 Jordan 标准型为
J=201001010
它的零特征值有 2 个 Jordan 块, 所以矩阵的秩为 6−2=4. 这一结论可以直观地阐述为“非零特征值”“右侧有 1 的零特征值”都会贡献 1 个秩. 如上矩阵中框起的 2 和 3 个 0 贡献了秩, 所以秩为 4.
矩阵相似的等价条件 两矩阵相似, 当且仅当它们有相同的 Jordan 标准型, 即它们的特征矩阵有相同的初等因子. 所以相似矩阵必有相同的特征值, 代数重数和几何重数. 反之不然, 因为它们不一定有相同的 Jordan 块.
参考资料
[1] 方保镕, 周继东, 李医民. 矩阵论[M]. 第二版. 北京: 清华大学出版社, 2013.
[2] https://www.bilibili.com/video/BV1WV411J7HH