介绍三种 Cayley-Hamilton 的证明方法。在正式开始之前,先指出一类错误的证明思路。
考虑到 $f(\lambda)=\det (\lambda I-A)$ 的形式,将 $\lambda$ 替换成 $A$,就得到所谓
$$f(A)=\det (AI-A)=\det O=0$$
这混淆了标量和矩阵的关系,上述代换应该表示为 Kronecker 乘积的形式,与本定理并无关系。
伴随矩阵方法(代数方法)
对于 $f(\lambda)=\det (\lambda I-A)$,设 $\lambda I-A=B$,则根据行列式的计算,有
$$f(\lambda )I=\det B\cdot I=BB^*$$而伴随 $B^*$ 的定义要求它至多是 $n-1$ 次的 $\lambda$ 的多项式,所以 $B^*$ 可以表示为
$$B^*=\sum^{n-1}_{k=0}C_k\lambda^k$$所以代入
$$\sum^{n}_{k=0}a_k\lambda^k I=f(\lambda)I=\sum^{n-1}_{k=0}(\lambda I-A)C_k\lambda^k$$从而比较系数
$$\begin{matrix}a_0& =& -AC_0&\\ a_1& =& C_0&-AC_1\\ a_2& =&& C_1&-AC_2\\ \vdots& &&&\ddots&\\ a_{n-1}& =&&& C_{n-2}&-AC_{n-1}\\ a_n& =&&&& C_{n-1}\end{matrix}$$累加即可。
对角矩阵方法(分析方法)
这个方法只适用于 $\mathbb F=\mathbb R,\mathbb C$ 上的矩阵。
先考虑 $A$ 可对角化的情形,则此时存在可逆矩阵 $P$ 使得,对于任意多项式 $f$,都有
$$Pf(A)P^{-1}=\mathrm{diag}(f(\lambda_1),f(\lambda_2),\cdots,f(\lambda_n))$$所以特别地,$A$ 适合于多项式
$$f(\lambda)=\prod^n_{i=1}(\lambda -\lambda_i)=\det (\lambda I-A)$$对于一般的不可对角化的 $A$,考虑扰动 $B(\varepsilon)$,其中
$$B(\varepsilon)=\mathrm {diag}(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n),\quad \|B(\varepsilon)\|_\infty<\varepsilon$$则
$$f_\varepsilon(\lambda):=\det (\lambda I-(A+ B))=\det (\lambda I-A)+o(\varepsilon)=:f(\lambda)+o(\varepsilon)$$可对角化矩阵在 $(M_n(\mathbb F),\|\cdot\|_\infty)$ 中稠密,所以
$$O=f_\varepsilon(A+B)=f(A+ B)+o(\varepsilon)= f(A)+o(\varepsilon)\to f(A)$$上述极限是关于 $\varepsilon$,显然是连续的,所以极限成立。关于稠密性,考虑复矩阵的 Schur 引理,进行上三角化。
上三角化(几何方法)
Schur 引理或 Jordan 标准型和根子空间。略。同样只适用于 $\mathbb F=\mathbb R,\mathbb C$ 上的矩阵。