Laat #n# een natuurlijk getal zijn en #A# een #(n\times n)#-matrix. Als #p# een veelterm is met #p(A)=0# (de nulmatrix), dan zeggen we wel dat #A# een nulpunt van #p# is. De karakteristieke veelterm #p_A# van een #(n\times n)#-matrix voldoet aan #p_A(A) = 0# en heeft graad #n#. Maar soms zijn er veeltermen van lagere graad waarvan #A# een nulpunt is (dat wil zeggen: die de nulmatrix leveren als je #A# invult). We brengen in herinnering dat een veelterm monisch heet als de leidende coëfficiënt gelijk is aan #1#.
Laat #n# een natuurlijk getal zijn en #A# een #(n\times n)#-matrix.
- Er is een unieke monische veelterm #m_A(x)# van minimale graad, zodat #m_A(A) = 0#. Deze veelterm heet de minimumveelterm van #A#.
- De minimumveelterm van een matrix #A# is gelijk aan de minimumveelterm voor elke geconjugeerde van #A#. In het bijzonder kunnen we spreken van de minimumveelterm van een lineaire afbeelding #L:V\to V#, waarbij #V# een #n#-dimensionale vectorruimte is, waarmee we dan de minimumveelterm van de #(n\times n)#-matrix #L_\alpha# ten opzichte van een willekeurig gekozen basis #\alpha# voor #V# bedoelen. We schrijven dan ook #m_L# in plaats van #m_A#.
- Elke veelterm #f(x)# die voldoet aan #f(A) = 0# is een veelvoud van #m_A(x)#. In het bijzonder is #m_A# een deler van #p_A#.
- Elke wortel van de karakteristieke veelterm van #A# is een wortel van de minimumveelterm van #A#.
1. Er bestaat een veelterm #p(x)# met de eigenschap #p(A) = 0#, namelijk de karakteristieke veelterm, zoals de stelling van Cayley-Hamilton beweert. Dan is er ook zo'n veelterm met minimale graad. Het delen van deze veelterm door de leidende coëfficiënt geeft een monische veelterm #m# van minimale graad die voldoet aan #m(A) = 0#.
Stel nu dat #m_1(x)# en #m_2(x)# beide monisch en van minimale graad zijn zodat #m_1(A) = m_2(A) = 0#. Dan is #m_1-m_2# een veelterm van lagere graad die ook aan #(m_1-m_2)(A) = 0# voldoet (want #(m_1-m_2)(A) =m_1(A)-m_2(A)#). Als dit verschil niet gelijk aan #0# is, dan delen we door de leidende coëfficiënt, zeg #c#, en krijgen we een veelterm die vanwege de aanname van minimale graad gelijk aan #0# moet zijn. Dus\[\frac{1}{c}(m_1(x)-m_2(x)) = 0\] We concluderen dat #m_1(x) = m_2(x)#. Dit stelt de uniciteit van #m# vast.
2. Laat #T# een inverteerbare #(n\times n)#-matrix zijn en #f(x)# een veelterm. Dan geldt #f(A) = 0# dan en slechts dan als #f(T\,A\, T^{-1}) = 0#. Immers, voor een zekere graad #n# heeft #f(x)# de vorm \[f(x)=c_nx^n+c_{n-1}x^{n-1}+\cdots+c_1x+c_0\] dus \[\begin{array}{rcl}f(T\,A\, T^{-1})&=&c_n(T\,A\, T^{-1})^n+c_{n-1}(T\,A\, T^{-1})^{n-1}+\cdots+c_1T\,A\, T^{-1}+c_0\\&=&c_n\underbrace{T\,A\, T^{-1}T\,A\, T^{-1}\cdots T\,A\, T^{-1}}_{n\text{ keer }T\,A\,T^{-1}}+{}\\&&{}+c_{n-1}\underbrace{T\,A\, T^{-1}T\,A\, T^{-1}\cdots T\,A\, T^{-1}}_{n-1\text{ keer }T\,A\,T^{-1}}+\cdots+c_1T\,A\, T^{-1}+c_0\\&=&c_nT\underbrace{A\,A\,\cdots A}_{n\text{ keer }A}T^{-1}+c_{n-1}T\underbrace{A\,A\,\cdots A}_{n-1\text{ keer }A}T^{-1}+\cdots+c_1T\,A\, T^{-1}+c_0\\&=&c_nTA^nT^{-1}+c_{n-1}TA^{n-1}T^{-1}+\cdots+c_1T\,A\, T^{-1}+c_0\\&=&T\left(c_nA^n+c_{n-1}A^{n-1}+\cdots+c_1A+c_0\right)T^{-1}\\&=&Tf(A)T^{-1}\end{array}\]Hieruit volgt direct dat de minimumveelterm van #A# gelijk is aan de minimumveelterm van #T\,A\, T^{-1}#.
3. Laat #f# nu een willekeurige veelterm zijn met #f(A)=0#. Deling met rest door #m# geeft veeltermen #q# en #r# met \[ f(x) =q(x)\cdot m(x) + r(x)\]waarbij de graad van #r# kleiner is dan de graad van #m#. Vullen we #A# in voor #x# en herschikken we de termen, dan krijgen we
\[r(A) = f(A) - q(A)\cdot m(A) = 0- q(A)\cdot 0 = 0\]
Omdat de graad van #r# kleiner is dan de graad van #m# en #m# een veelterm van minimale graad is met de eigenschap dat #m(A) =0#, volgt dat #r(x) = 0#, zodat #f(x) = q(x)\cdot m(x)#. Dit laat zien dat #m# een deler van #f# is.
4. Laat #\lambda# een wortel zijn van de karakteristieke veelterm van #A#, zodat #\det\left(A-\lambda\, I_n\right)=0#. Volgens Inverteerbaarheid en rang volgt uit #\det\left(A-\lambda\, I_n\right)=0# dat de kern van #A-\lambda\, I_n# minstens één vector bevat, zeg #\vec{v}#, die ongelijk is aan de nulvector. Deze vector voldoet aan #\left(A-\lambda\, I_n\right)\vec{v}=\vec{0}#, oftewel aan \(A\vec{v}=\lambda\vec{v}\). Hieruit volgt \[\vec{0} = m_A(A)\vec{v} = m_A(\lambda)\vec{v} \] Omdat #\vec{v}\ne\vec{0}# vinden we dat \( m_A(\lambda)=0\); dat wil zeggen: #\lambda# is een wortel van de minimumveelterm van #A#.
De enige matrix met minimumveelterm #m(x)=x# is de nulmatrix.
Als #n\gt1#, dan komen alle natuurlijke getallen kleiner dan of gelijk aan #n# voor als de graad van een minimumveelterm van een #(n\times n)#-matrix. Als
\[A =\matrix{0&1&0&0&\cdots&0\\ 0&0&1&0&\cdots&0\\ 0&0&\ddots&\ddots&\cdots&0 \\0&0&0&\ddots&1&0\\ 0&0&0&\ddots&0&1\\ 0&0&0&\cdots&0&0 }\] dan voldoet #A# aan #A^n=0#, maar niet aan #A^{n-1} = 0#. De graad kan dus #n# zijn.
Eerder hebben we gezien dat de conjugatieklasse van een vierkante matrix #A# niet uniek bepaald is door de karakteristieke veelterm. De vraag rijst nu of de karakteristieke veelterm en de minimumveelterm samen de conjugatieklasse van #A# uniek bepalen. Het eerder gegeven voorbeeld van de niet-geconjugeerde #(2\times2)#-matrix #N=\matrix{0&1\\ 0&0}# en de nulmatrix gaat niet meer op. De minimumveelterm van #N# en de nulmatrix zijn namelijk #x^2#, respectievelijk #x#, zodat de minimumveelterm verschillend is op de conjugatieklassen van de twee matrices. Maar, voor dezelfde #(2\times2)#-matrix #N# als boven, hebben de #(4\times4)#-matrices \[A=\matrix{N&0\\ 0&0}\phantom{xx}\text{ en } \phantom{xxx} B=\matrix{N&0\\ 0&N}\]beide karakteristieke veelterm #x^4# en minimumveelterm #x^2#, terwijl ze niet geconjugeerd zijn. Hiermee is het antwoord gegeven: de karakteristieke veelterm en de minimumveelterm samen bepalen de conjugatieklasse van een vierkante matrix in het algemeen niet uniek.
Een direct gevolg van de laatste uitspraak is dat de minimumveelterm graad #n# heeft als alle wortels van de karakteristieke veelterm verschillen.
Later zullen we zien dat een matrix van een lineaire afbeelding #L:V\to V# dan en slechts dan geconjugeerd is met een diagonaalmatrix (alleen over de complexe getallen als er niet-reële wortels zijn) als de minimumveelterm van #L# geen dubbele wortels heeft.
De minimumveelterm van een vierkante matrix #A# is op minstens twee manieren te bepalen:
- Bereken de karakteristieke veelterm #p_A#. Vind de grootste monische deler #n_A# van #p_A# zonder dubbele complexe wortels. Zoek onder de monische delers van #p_A# die een veelvoud van #n_A# zijn, het exemplaar met de kleinste graad zodat #A# er een nulpunt van is.
- Zoek een lineaire relatie van de vorm #c_0\cdot I+c_1\cdot A+c_2\cdot A^2+\cdots +c_{k-1}\cdot A^{k-1}+A^k=0# voor de kleinst mogelijke #k#. Dan geldt #m_A (x)= c+c_1\cdot x+c_2\cdot x^2+\cdots+c_{k-1}\cdot x^{k-1}+x^k#.
De eerste methode is te doen als #p_A# veel verschillende wortels heeft. De tweede methode is erg direct. We geven hieronder enkele voorbeelden.
Bereken de minimumveelterm #m_A(x)# van de matrix \[ A = \matrix{-4 & -2 & -1 \\ 0 & -1 & 1 \\ 1 & 1 & 1 \\ } \]
#m_A(x) =# #x^3+4 x^2-x-5#
We zoeken de monische veelterm in #x# van laagste graad die de nulmatrix oplevert als we #x=A# invullen.
Daartoe berekenen we eerst de relevante machten van #A#:
\[\begin{array}{rcl}
A^2 &=& \matrix{15 & 9 & 1 \\ 1 & 2 & 0 \\ -3 & -2 & 1 \\ }\\ A^3 &=& \matrix{-59 & -38 & -5 \\ -4 & -4 & 1 \\ 13 & 9 & 2 \\ }
\end{array}\] We bekijken vervolgens de veelterm #a+b\cdot x+c\cdot x^2+d\cdot x^3# met nader te bepalen coëfficiënten #a#, #b#, #c#, #d# zodanig dat de nulmatrix ontstaat als we #x=A# invullen. Dit geeft
\[\matrix{-59 d+15 c-4 b+a & -38 d+9 c-2 b & -5 d+c-b \\ c-4 d & -4 d+2 c-b+a & d+b \\ 13 d-3 c+b & 9 d-2 c+b & 2 d+c+b+a \\ } = \matrix{0&0&0\\ 0&0&0\\ 0&0&0} \]Hier staat een stelsel van #9# lineaire vergelijkingen met onbekenden #a#, #b#, #c#, #d#. De oplossing ervan, geschreven met #d# als parameter, is
\[ a=-5 d ,\phantom{xx} b=-d ,\phantom{xx} c=4 d \]Kennelijk is er alleen een oplossing als #d\ne0#. De minimumveelterm heeft dus graad #3#. Omdat de minimumveelterm #m_A(x)# monisch is, moeten we #d=1# kiezen om het antwoord te vinden. Dat geeft de oplossing \[ a=-5 ,\phantom{xx} b=-1 ,\phantom{xx} c=4 \] zodat het antwoord is #m_A(x) = x^3+4 x^2-x-5#.
De karakteristieke veelterm van #A# is gelijk aan #-1# maal de minimumveelterm.