【代数学】Jordan 标准型
摘 要 本文主要阐述 Jordan 标准型的简单理论. 本文首先通过特征值与特征向量介绍矩阵对角化的方法, 并引出矩阵不可对角化的问题. 然后介绍多项式矩阵的基本理论, 通过例子阐述矩阵的 Jordan 标准型及其过渡矩阵的求法. 最后指出了用 Jordan 标准型表述的几个结论.
1 可对角化的情况
1.1 特征值与特征向量
特征值与特征向量 对于 $n$ 阶方阵 $A$, 如果有数 $\lambda$ 和向量 $\boldsymbol u\neq\boldsymbol 0$ 使得
$$A\boldsymbol u=\lambda\boldsymbol u\iff (\lambda I-A)\boldsymbol u=\boldsymbol 0$$
即线性变换 $A$ 作用于向量 $\boldsymbol u$ 等价于将 $\boldsymbol u$ 伸缩至 $\lambda$ 倍, 则称 $\lambda$ 是 $A$ 的一个特征值, $\boldsymbol u$ 是 $\lambda$ 对应的一个特征向量.
特征多项式 $n$ 次多项式 $\left|\lambda I-A\right|$ 称为矩阵 $A$ 的特征多项式. $A$ 的特征值等价于其特征多项式的根, 故 $n$ 阶矩阵有且仅有 $n$ 个特征值 (重根按重数计).
代数重数 特征值 $\lambda$ 的代数重数 $\alpha$ 定义为 $\lambda$ 作为特征多项式根的重数. $\sum \alpha=n$.
特征矩阵与特征空间 对于矩阵 $A$, 给定特征值 $\lambda$ 对应的所有特征向量 $\boldsymbol u$ 构成一个线性空间, 它是特征矩阵 $\lambda I-A$ 的核 $\mathop{\rm Ker}(\lambda I-A)$, 称其为特征值 $\lambda$ 对应的特征空间.
几何重数 特征值 $\lambda_i$ 的几何重数 $\gamma_i$ 定义为其对应特征空间的维数 $\mathop{\rm nullity}(\lambda_i I-A)$.
代数重数与几何重数的关系 几何重数不超过代数重数, 即 $\gamma_i\leq\alpha_i$. 即 $\alpha$-重特征值对应特征空间的维数小于等于 $\alpha$.
1.2 矩阵的对角化
特征向量系 矩阵 $A$ 所有特征值对应的特征空间的一组基称为矩阵 $A$ 的一个特征向量系. 因为 $\gamma_i\leq\alpha_i$, 所以 $\sum \gamma_i\leq n$, 即特征向量系中的向量个数不超过 $n$.
完备特征向量系 称 $A$ 的特征向量系是完备的, 若矩阵 $A$ 特征向量系中有 $n$ 个向量, 即矩阵 $A$ 有 $n$ 个线性无关的特征向量.
单纯矩阵和亏损矩阵 称 $A$ 为单纯矩阵, 若 $A$ 有完备的特征向量系. 否则称 $A$ 为亏损矩阵.
可对角化的矩阵 称 $A$ 可对角化, 如果它相似于一个对角矩阵. 即存在可逆阵 $P$ 和对角阵 $\Lambda$ 使得
$$P^{-1}AP=\Lambda$$
可对角化的条件 矩阵 $A$ 可相似对角化, 当且仅当它是一个单纯矩阵.
对角化的方法 取 $\Lambda=\mathop{\rm diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)$, $U=(\boldsymbol u_1,\boldsymbol u_2,\cdots,\boldsymbol u_n)$, 此时有
$$U^{-1}AU=\Lambda$$
2 多项式矩阵
多项式矩阵及其秩和行列式 称矩阵 $A(\lambda)$ 是一个多项式矩阵, 如果它的元素均是 $\lambda$ 的多项式. 多项式矩阵秩的定义与一般矩阵相同(非零子式的最大阶数), 行列式的定义与一般矩阵相同.
多项式矩阵的初等变换 多项式矩阵有三种初等变换:
- 交换: 对调第 $i$ 行(列)与第 $j$ 行(列);
- 倍乘: 将第 $i$ 行(列)乘以 $k$ 倍, 其中 $k$ 不为零且不含 $\lambda$;
- 倍加: 将第 $i$ 行(列)的 $k(\lambda)$ 倍加到第 $j$ 行(列), 其中 $k(\lambda)$ 是 $\lambda$ 的多项式.
Smith 标准型 多项式矩阵总能通过有限次初等变换化为 Smith 标准型:
$$S(\lambda)=\begin{pmatrix}s_1(\lambda)\\ & \ddots\\ & & s_r(\lambda)\\ & & & 0\\ & & & & \ddots\\ & & & & & 0\end{pmatrix}$$
其中 $r$ 是多项式矩阵的秩, $s_i(\lambda)$ 是 $s_{i+1}(\lambda)$ 的因子, 且最高次项系数为 $1$.
例 多项式矩阵
$$\begin{pmatrix}-\lambda+1 & 2\lambda-1 & \lambda\\\lambda & \lambda^2 & -\lambda\\\lambda^2+1 & \lambda^2+\lambda-1 & -\lambda^2\end{pmatrix}$$
可以通过初等变换化为 Smith 标准型
$$\begin{pmatrix}1\\ & \lambda\\ & & \lambda(\lambda^2+1)\end{pmatrix}$$
这里 $1$ 是 $\lambda$ 的因子, $\lambda$ 是 $\lambda(\lambda^2+1)$ 的因子. 原矩阵的秩为 $3$.
不变因子 Smith 矩阵的对角元 $s_1(\lambda),\cdots,s_r(\lambda)$ 称为多项式矩阵的不变因子.
初等因子 多项式矩阵的初等因子是指其每一不变因子因式分解后的项. 初等因子可有重复, 但不能遗漏.
例 若一个多项式矩阵的不变因子是
$$1,\quad \lambda(\lambda-1),\quad \lambda(\lambda-1)^2,\quad \lambda^2(\lambda-1)^2$$
则它的初等因子是
$$\lambda,\quad \lambda,\quad\lambda^2,\quad (\lambda-1),\quad (\lambda-1)^2,\quad (\lambda-1)^2$$
3 不可对角化的情况
3.1 Jordan 标准型
虽然矩阵不可对角化, 但是我们可以退而求其次, 探讨矩阵是否相似与一类形式上接近对角矩阵的矩阵.
Jordan 块 称以下形式的 $m$ 阶方阵为一个 $m$ 阶 Jordan 块:
$$J_m(\lambda)=\begin{pmatrix}\lambda & 1\\ & \lambda & \ddots\\ & & \ddots & 1\\ & & & \lambda\\\end{pmatrix}$$
Jordan 标准型 Jordan 块构成的分块对角矩阵称为一个 Jordan 标准型:
$$J=\begin{pmatrix}J_{m_1}(\lambda_1)\\ & J_{m_2}(\lambda_2)\\ & & \ddots\\ & & & J_{m_s}(\lambda_s)\end{pmatrix}$$
$A$ 的每一个初等因子 $(\lambda-\lambda_i)^{\beta_i}$ 对应一个 Jordan 块 $J_{\beta_i}(\lambda)$. 矩阵必相似于其 Jordan 标准型, 即存在可逆阵 $P$ 使得
$$P^{-1}AP=J$$
例 特征矩阵初等因子为
$$(\lambda-1),\quad(\lambda-1),\quad(\lambda-3)^2$$
的矩阵对应的 Jordan 标准形为
$$J=\begin{pmatrix}3 & 1\\ & 3\\ & & 1\\ & & & 1\end{pmatrix}$$例 矩阵
$$A=\begin{pmatrix}2 & 0 & 0 & 0\\ -3 & 2 & 0 & 1\\ 0 & 0 & 2 & 1\\ 0 & 0 & 0 & 2\end{pmatrix}$$
写出特征矩阵, 通过略复杂的初等变换可知其 Smith 标准型为
$$\begin{pmatrix}1\\ & 1\\ & & (\lambda-2)^2\\ & & & (\lambda-2)^2\end{pmatrix}$$
它的初等因子是
$$(\lambda-2)^2,\quad (\lambda-2)^2$$
所以对应的 Jordan 标准型为
$$J=\begin{pmatrix}2 & 1\\ & 2\\ & & 2 & 1\\ & & & 2\end{pmatrix}$$
3.2 过渡矩阵的求法
以三阶矩阵为例. 三阶矩阵有两种包含 $2$ 阶或以上 Jordan 块的 Jordan 标准型:
$$J=\begin{pmatrix}\lambda_1\\ & \lambda_2 & 1\\ & & \lambda_2\end{pmatrix},\qquad J=\begin{pmatrix}\lambda_1 & 1\\ & \lambda_1 & 1\\ & & \lambda_1\end{pmatrix}$$
对于第一种情况, 令 $U=(\boldsymbol u_1,\boldsymbol u_2,\boldsymbol u_3)$, 考虑
$$U^{-1}AU=J\iff AU=UJ$$
即
$$A(\boldsymbol u_1,\boldsymbol u_2,\boldsymbol u_3)=(\boldsymbol u_1,\boldsymbol u_2,\boldsymbol u_3)\begin{pmatrix}\lambda_1\\ & \lambda_2 & 1\\ & & \lambda_2\end{pmatrix}$$
这等价于
$$(A\boldsymbol u_1,A\boldsymbol u_2,A\boldsymbol u_3)=(\lambda_1\boldsymbol u_1,\lambda_2\boldsymbol u_2,\boldsymbol u_2+\lambda_2\boldsymbol u_3)$$
即解方程组
$$\begin{cases}(\lambda_1I-A)\boldsymbol u_1=\boldsymbol 0\\ (\lambda_2I-A)\boldsymbol u_2=\boldsymbol 0\\ (\lambda_2I-A)\boldsymbol u_3=-\boldsymbol u_2\end{cases}$$
观察方程组可知 $\boldsymbol u_1,\boldsymbol u_2$ 分别是 $\lambda_1,\lambda_2$ 对应的特征向量, $\boldsymbol u_3$ 是最后一个非齐次线性方程组的解.
对于第二种情况, 同理可得方程组
$$\begin{cases}(\lambda_1I-A)\boldsymbol u_1=\boldsymbol 0\\ (\lambda_1I-A)\boldsymbol u_2=\boldsymbol -\boldsymbol u_1\\ (\lambda_1I-A)\boldsymbol u_3=-\boldsymbol u_2\end{cases}$$
观察方程组可知 $\boldsymbol u_1$ 是 $\lambda_1$ 对应的特征向量, $\boldsymbol u_2,\boldsymbol u_3$ 是最后两个非齐次线性方程组的解.
扩展到 $n$ 维的情况, 每一个 Jordan 块的第一行对应方程
$$(\lambda I-A)\boldsymbol u_i=\boldsymbol 0$$
其余行对应方程
$$(\lambda I-A)\boldsymbol u_i=-\boldsymbol u_{i-1}$$
广义特征向量 称 Jordan 块第一行对应的方程的解向量为矩阵的特征向量, 其余行方程的解向量为矩阵的广义特征向量.
例 矩阵
$$A=\begin{pmatrix}-1 & 1 & 0\\ -4 & 3 & 0\\ 1 & 0 & 2\end{pmatrix}$$
可以求出其 Jordan 标准型为
$$J=\begin{pmatrix}2\\ & 1 & 1\\ & & 1\end{pmatrix}$$
特征值 $2$ 和 $1$ 对应的特征向量分别为
$$\boldsymbol u_1=(0,0,1)^T,\qquad \boldsymbol u_2(1,2,-1)^T$$
最后一个非线性齐次方程组及其解为
$$(I-A)\boldsymbol u_3=-\boldsymbol u_2,\qquad \boldsymbol u_3=(0,1,-1)^T$$
所以取 $U=(\boldsymbol u_1,\boldsymbol u_2,\boldsymbol u_3)$ 时有 $U^{-1}AU=J$.
4 利用 Jordan 标准型表示一些结论
零特征值与秩 矩阵丢失的秩等于矩阵零特征值的几何重数, 即
$$\mathop{\rm rank}A=n-\gamma_0$$
矩阵秩等于零特征值个数, 当且仅当零特征值的几何重数等于其代数重数. 即
$$\mathop{\rm rank}A=\# \lambda_{\neq 0} \quad\iff\quad \alpha_0=\gamma_0$$
用 Jordan 标准型的语言重述, 矩阵丢失的秩等于零特征值 Jordan 块的个数, 即
$$\mathop{\rm rank}A=n-\#J(0)$$
矩阵秩等于零特征值个数, 当且仅当矩阵的零特征值 $2$ 阶或以上 Jordan 块, 即
$$\mathop{\rm rank}A=\# \lambda_{\neq 0} \quad\iff\quad \lnot\exists J_m(0),\quad m\geq 2$$
究其根本, 这是因为非零特征值 Jordan 块 $J_m(\lambda)$ 的秩必为 $m$, 而零特征值 Jordan 块 $J_m(0)$ 的秩仅为 $m-1$.
例 矩阵的 Jordan 标准型为
$$J=\begin{pmatrix}\boxed 2\\ & \boxed 0 & 1\\ & & 0\\ & & & \boxed 0 & 1\\ & & & & \boxed 0 & 1\\ & & & & & 0\end{pmatrix}$$
它的零特征值有 $2$ 个 Jordan 块, 所以矩阵的秩为 $6-2=4$. 这一结论可以直观地阐述为“非零特征值”“右侧有 $1$ 的零特征值”都会贡献 $1$ 个秩. 如上矩阵中框起的 $2$ 和 $3$ 个 $0$ 贡献了秩, 所以秩为 $4$.
矩阵相似的等价条件 两矩阵相似, 当且仅当它们有相同的 Jordan 标准型, 即它们的特征矩阵有相同的初等因子. 所以相似矩阵必有相同的特征值, 代数重数和几何重数. 反之不然, 因为它们不一定有相同的 Jordan 块.
参考资料
[1] 方保镕, 周继东, 李医民. 矩阵论[M]. 第二版. 北京:清华大学出版社, 2013.