跳到主要内容

Jordan 标准型

摘 要 本文主要阐述 Jordan 标准型的简单理论. 本文首先通过特征值与特征向量介绍矩阵对角化的方法, 并引出矩阵不可对角化的问题. 然后介绍多项式矩阵的基本理论, 通过例子阐述矩阵的 Jordan 标准型及其过渡矩阵的求法. 最后指出了用 Jordan 标准型表述的几个结论.

1 可对角化的情况

1.1 特征值与特征向量

特征值与特征向量 对于 nn 阶方阵 AA, 如果有数 λ\lambda 和向量 u0\boldsymbol u\neq\boldsymbol 0 使得

Au=λu    (λIA)u=0A\boldsymbol u=\lambda\boldsymbol u\iff (\lambda I-A)\boldsymbol u=\boldsymbol 0

即线性变换 AA 作用于向量 u\boldsymbol u 等价于将 u\boldsymbol u 伸缩至 λ\lambda 倍, 则称 λ\lambdaAA 的一个特征值, u\boldsymbol uλ\lambda 对应的一个特征向量.

特征多项式nn 次多项式 λIA\left|\lambda I-A\right| 称为矩阵 AA 的特征多项式. AA 的特征值等价于其特征多项式的根, 故 nn 阶矩阵有且仅有 nn 个特征值 (重根按重数计).

代数重数 特征值 λ\lambda 的代数重数 α\alpha 定义为 λ\lambda 作为特征多项式根的重数. α=n\sum \alpha=n.

特征矩阵与特征空间 对于矩阵 AA, 给定特征值 λ\lambda 对应的所有特征向量 u\boldsymbol u 构成一个线性空间, 它是特征矩阵 λIA\lambda I-A 的核 Ker(λIA)\mathop{\rm Ker}(\lambda I-A), 称其为特征值 λ\lambda 对应的特征空间.

几何重数 特征值 λi\lambda_i 的几何重数 γi\gamma_i 定义为其对应特征空间的维数 nullity(λiIA)\mathop{\rm nullity}(\lambda_i I-A).

代数重数与几何重数的关系 几何重数不超过代数重数, 即 γiαi\gamma_i\leq\alpha_i. 即 α\alpha-重特征值对应特征空间的维数小于等于 α\alpha.

1.2 矩阵的对角化

特征向量系 矩阵 AA 所有特征值对应的特征空间的一组基称为矩阵 AA 的一个特征向量系. 因为 γiαi\gamma_i\leq\alpha_i, 所以 γin\sum \gamma_i\leq n, 即特征向量系中的向量个数不超过 nn.

完备特征向量系 称 AA 的特征向量系是完备的, 若矩阵 AA 特征向量系中有 nn 个向量, 即矩阵 AAnn 个线性无关的特征向量.

单纯矩阵和亏损矩阵 称 AA 为单纯矩阵, 若 AA 有完备的特征向量系. 否则称 AA 为亏损矩阵.

可对角化的矩阵 称 AA 可对角化, 如果它相似于一个对角矩阵. 即存在可逆阵 PP 和对角阵 Λ\Lambda 使得

P1AP=ΛP^{-1}AP=\Lambda

可对角化的条件 矩阵 AA 可相似对角化, 当且仅当它是一个单纯矩阵.

对角化的方法 取 Λ=diag(λ1,λ2,,λn)\Lambda=\mathop{\rm diag}(\lambda_1,\lambda_2,\cdots,\lambda_n), U=(u1,u2,,un)U=(\boldsymbol u_1,\boldsymbol u_2,\cdots,\boldsymbol u_n), 此时有

U1AU=ΛU^{-1}AU=\Lambda

2 多项式矩阵

多项式矩阵及其秩和行列式 称矩阵 A(λ)A(\lambda) 是一个多项式矩阵, 如果它的元素均是 λ\lambda 的多项式. 多项式矩阵秩的定义与一般矩阵相同(非零子式的最大阶数), 行列式的定义与一般矩阵相同.

多项式矩阵的初等变换 多项式矩阵有三种初等变换:

  • 交换: 对调第 ii 行(列)与第 jj 行(列);
  • 倍乘: 将第 ii 行(列)乘以 kk 倍, 其中 kk 不为零且不含 λ\lambda;
  • 倍加: 将第 ii 行(列)的 k(λ)k(\lambda) 倍加到第 jj 行(列), 其中 k(λ)k(\lambda)λ\lambda 的多项式.

Smith 标准型 多项式矩阵总能通过有限次初等变换化为 Smith 标准型:

S(λ)=(s1(λ)sr(λ)00)S(\lambda)=\begin{pmatrix}s_1(\lambda)\\ & \ddots\\ & & s_r(\lambda)\\ & & & 0\\ & & & & \ddots\\ & & & & & 0\end{pmatrix}

其中 rr 是多项式矩阵的秩, si(λ)s_i(\lambda)si+1(λ)s_{i+1}(\lambda) 的因子, 且最高次项系数为 11.

 多项式矩阵

(λ+12λ1λλλ2λλ2+1λ2+λ1λ2)\begin{pmatrix}-\lambda+1 & 2\lambda-1 & \lambda\\\lambda & \lambda^2 & -\lambda\\\lambda^2+1 & \lambda^2+\lambda-1 & -\lambda^2\end{pmatrix}

可以通过初等变换化为 Smith 标准型

(1λλ(λ2+1))\begin{pmatrix}1\\ & \lambda\\ & & \lambda(\lambda^2+1)\end{pmatrix}

这里 11λ\lambda 的因子, λ\lambdaλ(λ2+1)\lambda(\lambda^2+1) 的因子. 原矩阵的秩为 33.

不变因子 Smith 矩阵的对角元 s1(λ),,sr(λ)s_1(\lambda),\cdots,s_r(\lambda) 称为多项式矩阵的不变因子.

初等因子 多项式矩阵的初等因子是指其每一不变因子因式分解后的项. 初等因子可有重复, 但不能遗漏.

 若一个多项式矩阵的不变因子是

1,λ(λ1),λ(λ1)2,λ2(λ1)21,\quad \lambda(\lambda-1),\quad \lambda(\lambda-1)^2,\quad \lambda^2(\lambda-1)^2

则它的初等因子是

λ,(λ1),λ,(λ1)2,λ2,(λ1)2\lambda,\quad (\lambda-1),\quad \lambda,\quad (\lambda-1)^2,\quad\lambda^2,\quad (\lambda-1)^2

3 不可对角化的情况

3.1 Jordan 标准型

  虽然矩阵不可对角化, 但是我们可以退而求其次, 探讨矩阵是否相似与一类形式上接近对角矩阵的矩阵.

Jordan 块 称以下形式的 mm 阶方阵为一个 mm 阶 Jordan 块:

Jm(λ)=(λ1λ1λ)J_m(\lambda)=\begin{pmatrix}\lambda & 1\\ & \lambda & \ddots\\ & & \ddots & 1\\ & & & \lambda\\\end{pmatrix}

Jordan 标准型 Jordan 块构成的分块对角矩阵称为一个 Jordan 标准型:

J=(Jm1(λ1)Jm2(λ2)Jms(λs))J=\begin{pmatrix}J_{m_1}(\lambda_1)\\ & J_{m_2}(\lambda_2)\\ & & \ddots\\ & & & J_{m_s}(\lambda_s)\end{pmatrix}

AA 的每一个初等因子 (λλi)βi(\lambda-\lambda_i)^{\beta_i} 对应一个 Jordan 块 Jβi(λ)J_{\beta_i}(\lambda). 矩阵必相似于其 Jordan 标准型, 即存在可逆阵 PP 使得

P1AP=JP^{-1}AP=J

 特征矩阵初等因子为

(λ1),(λ1),(λ3)2(\lambda-1),\quad(\lambda-1),\quad(\lambda-3)^2

的矩阵对应的 Jordan 标准形为

J=(31311)J=\begin{pmatrix}3 & 1\\ & 3\\ & & 1\\ & & & 1\end{pmatrix}

 矩阵

A=(2000320100210002)A=\begin{pmatrix}2 & 0 & 0 & 0\\ -3 & 2 & 0 & 1\\ 0 & 0 & 2 & 1\\ 0 & 0 & 0 & 2\end{pmatrix}

写出特征矩阵, 通过略复杂的初等变换可知其 Smith 标准型为

(11(λ2)2(λ2)2)\begin{pmatrix}1\\ & 1\\ & & (\lambda-2)^2\\ & & & (\lambda-2)^2\end{pmatrix}

它的初等因子是

(λ2)2,(λ2)2(\lambda-2)^2,\quad (\lambda-2)^2

所以对应的 Jordan 标准型为

J=(212212)J=\begin{pmatrix}2 & 1\\ & 2\\ & & 2 & 1\\ & & & 2\end{pmatrix}

3.2 过渡矩阵的求法

  以三阶矩阵为例. 三阶矩阵有两种包含 22 阶或以上 Jordan 块的 Jordan 标准型:

J=(λ1λ21λ2),J=(λ11λ11λ1)J=\begin{pmatrix}\lambda_1\\ & \lambda_2 & 1\\ & & \lambda_2\end{pmatrix},\qquad J=\begin{pmatrix}\lambda_1 & 1\\ & \lambda_1 & 1\\ & & \lambda_1\end{pmatrix}

  对于第一种情况, 令 U=(u1,u2,u3)U=(\boldsymbol u_1,\boldsymbol u_2,\boldsymbol u_3), 考虑

U1AU=J    AU=UJU^{-1}AU=J\iff AU=UJ

A(u1,u2,u3)=(u1,u2,u3)(λ1λ21λ2)A(\boldsymbol u_1,\boldsymbol u_2,\boldsymbol u_3)=(\boldsymbol u_1,\boldsymbol u_2,\boldsymbol u_3)\begin{pmatrix}\lambda_1\\ & \lambda_2 & 1\\ & & \lambda_2\end{pmatrix}

这等价于

(Au1,Au2,Au3)=(λ1u1,λ2u2,u2+λ2u3)(A\boldsymbol u_1,A\boldsymbol u_2,A\boldsymbol u_3)=(\lambda_1\boldsymbol u_1,\lambda_2\boldsymbol u_2,\boldsymbol u_2+\lambda_2\boldsymbol u_3)

即解方程组

{(λ1IA)u1=0(λ2IA)u2=0(λ2IA)u3=u2\begin{cases}(\lambda_1I-A)\boldsymbol u_1=\boldsymbol 0\\ (\lambda_2I-A)\boldsymbol u_2=\boldsymbol 0\\ (\lambda_2I-A)\boldsymbol u_3=-\boldsymbol u_2\end{cases}

观察方程组可知 u1,u2\boldsymbol u_1,\boldsymbol u_2 分别是 λ1,λ2\lambda_1,\lambda_2 对应的特征向量, u3\boldsymbol u_3 是最后一个非齐次线性方程组的解.

  对于第二种情况, 同理可得方程组

{(λ1IA)u1=0(λ1IA)u2=u1(λ1IA)u3=u2\begin{cases}(\lambda_1I-A)\boldsymbol u_1=\boldsymbol 0\\ (\lambda_1I-A)\boldsymbol u_2=\boldsymbol -\boldsymbol u_1\\ (\lambda_1I-A)\boldsymbol u_3=-\boldsymbol u_2\end{cases}

观察方程组可知 u1\boldsymbol u_1λ1\lambda_1 对应的特征向量, u2,u3\boldsymbol u_2,\boldsymbol u_3 是最后两个非齐次线性方程组的解.

  扩展到 nn 维的情况, 每一个 Jordan 块的第一行对应方程

(λIA)ui=0(\lambda I-A)\boldsymbol u_i=\boldsymbol 0

其余行对应方程

(λIA)ui=ui1(\lambda I-A)\boldsymbol u_i=-\boldsymbol u_{i-1}

广义特征向量 称 Jordan 块第一行对应的方程的解向量为矩阵的特征向量, 其余行方程的解向量为矩阵的广义特征向量.

 矩阵

A=(110430102)A=\begin{pmatrix}-1 & 1 & 0\\ -4 & 3 & 0\\ 1 & 0 & 2\end{pmatrix}

可以求出其 Jordan 标准型为

J=(2111)J=\begin{pmatrix}2\\ & 1 & 1\\ & & 1\end{pmatrix}

特征值 2211 对应的特征向量分别为

u1=(0,0,1)T,u2(1,2,1)T\boldsymbol u_1=(0,0,1)^T,\qquad \boldsymbol u_2(1,2,-1)^T

最后一个非线性齐次方程组及其解为

(IA)u3=u2,u3=(0,1,1)T(I-A)\boldsymbol u_3=-\boldsymbol u_2,\qquad \boldsymbol u_3=(0,1,-1)^T

所以取 U=(u1,u2,u3)U=(\boldsymbol u_1,\boldsymbol u_2,\boldsymbol u_3) 时有 U1AU=JU^{-1}AU=J.

4 利用 Jordan 标准型表示一些结论

零特征值与秩 矩阵丢失的秩等于矩阵零特征值的几何重数, 即

rankA=nγ0\mathop{\rm rank}A=n-\gamma_0

矩阵秩等于零特征值个数, 当且仅当零特征值的几何重数等于其代数重数. 即

\mathop{\rm rank}A=\## \lambda_{\neq 0} \quad\iff\quad \alpha_0=\gamma_0

用 Jordan 标准型的语言重述, 矩阵丢失的秩等于零特征值 Jordan 块的个数, 即

rankA=n#J(0)\mathop{\rm rank}A=n-\#J(0)

矩阵秩等于零特征值个数, 当且仅当矩阵的零特征值 22 阶或以上 Jordan 块, 即

\mathop{\rm rank}A=\## \lambda_{\neq 0} \quad\iff\quad \lnot\exists J_m(0),\quad m\geq 2

究其根本, 这是因为非零特征值 Jordan 块 Jm(λ)J_m(\lambda) 的秩必为 mm, 而零特征值 Jordan 块 Jm(0)J_m(0) 的秩仅为 m1m-1.

 矩阵的 Jordan 标准型为

J=(201001010)J=\begin{pmatrix}\boxed 2\\ & \boxed 0 & 1\\ & & 0\\ & & & \boxed 0 & 1\\ & & & & \boxed 0 & 1\\ & & & & & 0\end{pmatrix}

它的零特征值有 22 个 Jordan 块, 所以矩阵的秩为 62=46-2=4. 这一结论可以直观地阐述为“非零特征值”“右侧有 11 的零特征值”都会贡献 11 个秩. 如上矩阵中框起的 223300 贡献了秩, 所以秩为 44.

矩阵相似的等价条件 两矩阵相似, 当且仅当它们有相同的 Jordan 标准型, 即它们的特征矩阵有相同的初等因子. 所以相似矩阵必有相同的特征值, 代数重数和几何重数. 反之不然, 因为它们不一定有相同的 Jordan 块.

参考资料

[1] 方保镕, 周继东, 李医民. 矩阵论[M]. 第二版. 北京: 清华大学出版社, 2013.

[2] https://www.bilibili.com/video/BV1WV411J7HH