介绍三种 Cayley-Hamilton 的证明方法。在正式开始之前,先指出一类错误的证明思路。

考虑到 $f(\lambda)=\det (\lambda I-A)$ 的形式,将 $\lambda$ 替换成 $A$,就得到所谓

$$f(A)=\det (AI-A)=\det O=0$$

这混淆了标量和矩阵的关系,上述代换应该表示为 Kronecker 乘积的形式,与本定理并无关系。

伴随矩阵方法(代数方法)

对于 $f(\lambda)=\det (\lambda I-A)$,设 $\lambda I-A=B$,则根据行列式的计算,有

$$f(\lambda )I=\det B\cdot I=BB^*$$

而伴随 $B^*$ 的定义要求它至多是 $n-1$ 次的 $\lambda$ 的多项式,所以 $B^*$ 可以表示为

$$B^*=\sum^{n-1}_{k=0}C_k\lambda^k$$

所以代入

$$\sum^{n}_{k=0}a_k\lambda^k I=f(\lambda)I=\sum^{n-1}_{k=0}(\lambda I-A)C_k\lambda^k$$

从而比较系数

$$\begin{matrix}a_0& =& -AC_0&\\ a_1& =& C_0&-AC_1\\ a_2& =&& C_1&-AC_2\\ \vdots& &&&\ddots&\\ a_{n-1}& =&&& C_{n-2}&-AC_{n-1}\\ a_n& =&&&& C_{n-1}\end{matrix}$$

累加即可。

对角矩阵方法(分析方法)

这个方法只适用于 $\mathbb F=\mathbb R,\mathbb C$ 上的矩阵。

先考虑 $A$ 可对角化的情形,则此时存在可逆矩阵 $P$ 使得,对于任意多项式 $f$,都有

$$Pf(A)P^{-1}=\mathrm{diag}(f(\lambda_1),f(\lambda_2),\cdots,f(\lambda_n))$$

所以特别地,$A$ 适合于多项式

$$f(\lambda)=\prod^n_{i=1}(\lambda -\lambda_i)=\det (\lambda I-A)$$

对于一般的不可对角化的 $A$,考虑扰动 $B(\varepsilon)$,其中

$$B(\varepsilon)=\mathrm {diag}(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n),\quad \|B(\varepsilon)\|_\infty<\varepsilon$$

$$f_\varepsilon(\lambda):=\det (\lambda I-(A+ B))=\det (\lambda I-A)+o(\varepsilon)=:f(\lambda)+o(\varepsilon)$$

可对角化矩阵在 $(M_n(\mathbb F),\|\cdot\|_\infty)$ 中稠密,所以

$$O=f_\varepsilon(A+B)=f(A+ B)+o(\varepsilon)= f(A)+o(\varepsilon)\to f(A)$$

上述极限是关于 $\varepsilon$,显然是连续的,所以极限成立。关于稠密性,考虑复矩阵的 Schur 引理,进行上三角化。

上三角化(几何方法)

Schur 引理或 Jordan 标准型和根子空间。略。同样只适用于 $\mathbb F=\mathbb R,\mathbb C$ 上的矩阵。