O Teorema de Cayley-Hamilton
Toda matriz satisfaz sua própria equação característica — uma das afirmações mais elegantes de toda a álgebra linear.
Motivação
Dada uma matriz $A \in M_{n\times n}(\mathbb{F})$, define-se seu polinômio característico como
$$p(\lambda) = \det(\lambda I - A).$$
As raízes de $p$ são os autovalores de $A$. Uma pergunta natural surge: o que acontece quando substituímos $\lambda$ pela própria matriz $A$?
Teorema
Teorema (Cayley-Hamilton). Seja $A \in M_{n\times n}(\mathbb{F})$ e $p(\lambda) = \det(\lambda I - A)$ seu polinômio característico. Então
$$p(A) = 0.$$
Isto é, toda matriz anula seu próprio polinômio característico. O resultado vale sobre qualquer corpo $\mathbb{F}$.
Um aviso importante
A "demonstração" ingênua consiste em substituir $\lambda = A$ diretamente em $\det(\lambda I - A)$, obtendo $\det(AI - A) = \det(0) = 0$. Esse argumento está errado: $\det(\lambda I - A)$ é um polinômio escalar em $\lambda$, e a substituição $\lambda \mapsto A$ não faz sentido dentro do determinante.
Demonstração
Usamos a matriz adjunta (adjugada). Para qualquer $\lambda$, existe uma matriz polinomial $B(\lambda)$ com entradas polinomiais em $\lambda$ tal que
$$(\lambda I - A)\, B(\lambda) = p(\lambda)\, I.$$
Isso é a identidade $M \cdot \text{adj}(M) = \det(M)\,I$ aplicada a $M = \lambda I - A$. Como $B(\lambda)$ tem grau no máximo $n-1$, escrevemos
$$B(\lambda) = B_{n-1}\lambda^{n-1} + B_{n-2}\lambda^{n-2} + \cdots + B_0,$$
com $B_k \in M_{n\times n}(\mathbb{F})$. Igualando coeficientes de cada potência de $\lambda$ com os de $p(\lambda) = \lambda^n + c_{n-1}\lambda^{n-1} + \cdots + c_0$, obtemos:
$$B_{n-1} = I,$$ $$B_{k-1} - A B_k = c_k\, I \quad (k = n{-}1, \ldots, 1),$$ $$-A B_0 = c_0\, I.$$
Multiplicamos a $k$-ésima equação por $A^k$ e somamos tudo. O lado esquerdo colapsa a zero por cancelamento telescópico, portanto
$$p(A) = A^n + c_{n-1}A^{n-1} + \cdots + c_1 A + c_0 I = 0. \quad \square$$
Exemplo numérico
Seja $A = \begin{pmatrix} 1 & 2 \\ 0 & 3 \end{pmatrix}$. O polinômio característico é
$$p(\lambda) = (\lambda-1)(\lambda-3) = \lambda^2 - 4\lambda + 3.$$
Calculemos $p(A) = A^2 - 4A + 3I$:
$$A^2 = \begin{pmatrix}1&8\\0&9\end{pmatrix}, \qquad 4A = \begin{pmatrix}4&8\\0&12\end{pmatrix}, \qquad 3I = \begin{pmatrix}3&0\\0&3\end{pmatrix}.$$
$$p(A) = \begin{pmatrix}1&8\\0&9\end{pmatrix} - \begin{pmatrix}4&8\\0&12\end{pmatrix} + \begin{pmatrix}3&0\\0&3\end{pmatrix} = \begin{pmatrix}0&0\\0&0\end{pmatrix}. \checkmark$$
Corolários e aplicações
Toda potência $A^k$ com $k \geq n$ pode ser escrita como combinação linear de $I, A, \ldots, A^{n-1}$. Em particular, o polinômio mínimo de $A$ divide $p(\lambda)$.
Se $A$ é invertível ($c_0 \neq 0$), podemos expressar $A^{-1}$ diretamente:
$$A^{-1} = -\frac{1}{c_0}\bigl(A^{n-1} + c_{n-1}A^{n-2} + \cdots + c_1 I\bigr).$$