We laten nu zien dat het vinden van een eenvoudige vorm van de matrix van een lineaire afbeelding #V\to V# ten opzichte van een basis voor een eindigdimensionale vectorruimte #V# kunnen terugbrengen tot het geval waarin de minimumveelterm de macht van een enkele lineaire veelterm is dan wel (in het geval #V# reëel is) de macht van een kwadratische veelterm met negatieve discriminant.
We brengen in herinnering dat de notatie #V = U\oplus W# betekent dat #V# de directe som van deelruimten #U# en #W# is; dat wil zeggen: #V = U+W# en #U\cap W =\{\vec{0}\}#.
Laat #V# een vectorruimte zijn van eindige dimensie #n# en laat #L:V\to V# een lineaire afbeelding zijn die een nulpunt is van de veelterm #f(x)#. Als #g(x)# en #h(x)# veeltermen zijn met \[\gcd(g(x),h(x))=1\phantom{xx}\text{ en }\phantom{xx}f(x) = g(x)\cdot h(x)\] dan geldt
\[\begin{array}{rcl} \im{g(L)} &=& \ker{h(L)}\\ \im{h(L)} &=& \ker{g(L)}\\ V &=& \ker{g(L)}\oplus \ker{h(L)}\end{array}\]
De betrokken deelruimten #\ker{h(L)}# en # \ker{g(L)}# zijn beide invariant onder #L#.
Als we dus bases #\alpha# voor #\ker{g(L)}# en #\beta# voor #\ker{h(L)}# kiezen, dan is het samenstel #\gamma# een basis voor #V# en heeft de matrix van #L# ten opzichte van #\gamma# de vorm\[L_\gamma = \matrix{L_\alpha&0\\ 0 & L_\beta}\]waarbij #L_\alpha# de matrix van #\left.L\right|_{\ker{g(L)}}# ten opzichte van #\alpha# is en #L_\beta# de matrix van #\left.L\right|_{\ker{h(L)}}# ten opzichte van #\beta#.
In het bijzonder is de karakteristieke veelterm van #L# op #V# het product van de karakteristieke veeltermen van de beperkingen van #L# tot #\ker{g(L)}# en tot #\ker{h(L)}#.
De uitspraak over invariantie is een direct gevolg van de stelling Invariantie van kern en beeld onder commuterende lineaire afbeeldingen omdat #L# commuteert met elke matrix van de vorm #p(L)#, waarbij #p# een veelterm is.
Stel dat #\vec{x}# behoort tot #\im{h(L)}#. Dan is er een vector #\vec{y}# in #V#, zodat #\vec{x}= {h(L)} (\vec{y})#. Toepassing van #{g(L)}# op deze gelijkheid geeft \[{g(L)}\vec{x}= {g(L)}\,{h(L)} (\vec{y}) = {f(L)} (\vec{y})=\vec{0}\] wat betekent dat #\vec{x}# behoort tot #\ker{g(L)}#. Dit bewijst dat #\im{h(L)}# in #\ker{g(L)}# ligt.
Voor het bewijs van het omgekeerde gebruiken we de uitgebreide stelling van Euclides, die ons twee veeltermen #p(x)# en #q(x)# geeft, zodat \[p(x)\cdot g(x)+q(x)\cdot h(x) = 1\]Invullen van #L# geeft \[p(L)\, g(L)+q(L)\, h(L) = I_V\]Als nu #\vec{x}# tot #\ker{g(L)}# behoort, dan geeft de gelijkheid \[h(L)\left( q(L)\vec{x} \right)=q(L)\, h(L)\vec{x} = \vec{x}\] Hieruit concluderen we dat #\ker{g(L)}# in #\im{h(L)}# ligt. Tezamen met de eerder bewezen inclusie levert dit de gelijkheid #\ker{g(L)}=\im{h(L)}#. Omdat de rollen van #g# en #h# verwisselbaar zijn, stellen we vast dat ook #\ker{h(L)}=\im{g(L)}# bewezen is.
Om de uitspraak over de directe som te bewijzen moeten we twee uitspraken afleiden:
- De vectorruimte #V# wordt opgespannen door #\ker{g(L)}# en #\ker{h(L)}#.
- De doorsnede van #\ker{g(L)}# en #\ker{h(L)}# is #\{\vec{0}\}#.
1. Een blik op de eerder afgeleide gelijkheid \[p(L)\, g(L)+q(L)\, h(L) = I_V\]leert ons dat elke #\vec{x}# in #V# geschreven kan worden als \(g(L)\left(p(L)(\vec{x})\right)+h(L)\left(q(L)(\vec{x})\right)\) en dus ligt in het opspansel van #\im{g(L)}# en #\im{h(L)}#. We hebben al ingezien dat deze deelruimten samenvallen met #\ker{h(L)}# respectievelijk #\ker{g(L)}#, waaruit volgt dat #V# wordt opgespannen door #\ker{g(L)}# en #\ker{h(L)}#.
2. Stel #\vec{x}# behoort tot zowel #\ker{g(L)}# als #\ker{h(L)}#. Dan volgt
\[\vec{x} = p(L)\left(g(L)(\vec{x})\right)+q(L)\left(h(L)(\vec{x})\right) =p(L)( \vec{0})+q(L)(\vec{0})= \vec{0}+\vec{0} = \vec{0}\] Dit laat zien dat #\vec{x}# de nulvector is.
Het feit dat de karakteristieke veelterm van #L# op #V# het product is van de karakteristieke veelterm van de beperkingen van #L# tot #\ker{g(L)}# en tot #\ker{h(L)}# is het gevolg van de matrixdecompositie en een formule voor de determinant van enkele speciale matrices toegepast op de matrix van #L-x\cdot I_V# ten opzichte van een basis voor #V# die uit bases voor #\ker{g(L)}# en #\ker{h(L)}# bestaat.
De belangrijkste voorbeelden van veeltermen #f(x)# met #f(L) = 0# zijn de minimumveelterm #f(x) = m_L(x)# en de karakteristieke veelterm #f(x) = p_L(x)#.
De voorwaarde #\gcd(g(x),h(x))=1# is echt nodig om de conclusie te kunnen trekken dat #V# een directe som van #\ker{g(L)}# en #\ker{h(L)}# is. Als #L:\mathbb{R}^2\to\mathbb{R}^2# de lineaire afbeelding is bepaald door de matrix \[ \matrix{0&1\\ 0&0}\] dan is de minimumveelterm van #L# gelijk aan #x^2#. De veeltermen #g(x)=x# en #h(x)=x# voldoen aan alle voorwaarden van de stelling behalve #\gcd(g(x),h(x))=1#. Omdat #g(x) =x= h(x)# geldt #\ker{g(L)}=\ker{L} = \ker{h(L)}#. De vectorruimte #\mathbb{R}^2# is dus niet de directe som van de twee kernen.
Toepassing op een volledige ontbinding van de karakteristieke veelterm van #L# geeft:
Als #V# een eindigdimensionale vectorruimte is en #L:V\to V# een lineaire afbeelding met karakteristieke veelterm gelijk aan \[(x-\lambda_1)^{k_1} \cdots (x-\lambda_r)^{k_r}\]voor zekere onderling verschillende getallen #\lambda_1,\ldots,\lambda_r# en natuurlijke getallen #k_1,\ldots,k_r#, dan geldt\[ V = \ker{(L-\lambda_1\,I_V)^{k_1}}\oplus \cdots \oplus \ker{(L-\lambda_r\,I_V)^{k_r}}\]
In het bijzonder heeft de beperking van #L# tot \(\ker{(L-\lambda_i\,I_V)^{k_i}}\) karakteristieke veelterm \((x-\lambda_i)^{k_i}\) en geldt \(\dim{\ker{(L-\lambda_i\,I_V)^{k_i}}}=k_i\) voor #i=1,\ldots,r#.
De directesomdecompositie \( V = \ker{(L-\lambda_1\,I_V)^{k_1}}\oplus \cdots \oplus \ker{(L-\lambda_r\,I_V)^{k_r}}\) volgt direct uit herhaalde toepassing van bovenstaande stelling met #f(x)=p_L(x)# en # g(x)# achtereenvolgens gelijk aan \((x-\lambda_i)^{k_i}\) voor #i=1,\ldots,r#.
De deelruimte \(\ker{(L-\lambda_i\,I_V)^{k_i}}\) is invariant onder #L#. Omdat #\lambda_i# de enige wortel van de minimumveelterm op deze deelruimte is, heeft vanwege uitspraak 4 van de stelling Minimumveelterm de beperking van #L# tot deze deelruimte karakteristieke veelterm \((x-\lambda_i)^{m_i}\) voor een zeker natuurlijk getal #m_i#. De karakteristieke veelterm van #L# is dan dankzij de stelling Determinanten van enkele speciale matrices gelijk aan het product \[p_L(x) = (x-\lambda_1)^{m_1}\cdot \cdots \cdot (x-\lambda_r)^{m_r}\]Vergelijking met de gegeven ontbinding in factoren laat zien dat #m_i = k_i# voor #i=1,\ldots,r#. Hieruit volgt dat #k_i# de dimensie is van \(\ker{(L-\lambda_i\,I_V)^{k_i}}\).
De lineaire afbeelding #L# heeft, zoals we weten, als minimumveelterm \[m_L(x)=(x-\lambda_1)^{\ell_1}\cdots (x-\lambda_r)^{\ell_r}\]voor zekere natuurlijke getallen #\ell_1,\ldots,\ell_r#, met #\ell_i\le k_i#. Later zullen we zien dat #(x-\lambda_i)^{\ell_i}# de minimumveelterm van #L# beperkt tot #\ker{(x-\lambda_i)^{k_i}}# is. Niet alleen \(\ker{(L-\lambda_i\,I_V)^{\ell_i}}\) is een lineaire deelruimte invariant onder #L#, maar ook \(\ker{(L-\lambda_i\,I_V)^{k}}\) voor elk natuurlijk getal #k#. We zullen de dimensies van deze lineaire deelruimten later gebruiken om de conjugatieklasse van #L# te karakteriseren.
Stel dat \(A\) een #(2\times2)#-matrix is en dat #\lambda# en #\mu# de wortels van de karakteristieke veelterm #p_A(x)# van #A# zijn. Als #\lambda\ne\mu#, dan is #\mathbb{R}^2# de directe som van de twee #1#-dimensionale eigenruimten #\ker{A-\lambda\cdot I_2}# en #\ker{A-\mu\cdot I_2}#. Ten opzichte van elke basis opgebouwd uit een vector uit elk van beide eigenruimten heeft #L_A# als matrix de diagonaalmatrix met #\lambda# en #\mu# op de diagonaal. Hier bevestigt de stelling dus wat we al weten: #A# is diagonaliseerbaar.
Stel nu dat #\lambda = \mu#. Nu is #A# dan en slechts dan diagonaliseerbaar als #A= \lambda\cdot I_2#. Als dit niet het geval is, dan moet #\ker{A-\lambda\cdot I_2}# dimensie #1# hebben. Kiezen we nu een basis bestaande uit een vector uit #\ker{A-\lambda\cdot I_2}# en een vector daarbuiten, dan heeft de matrix van #L_A# ten opzichte daarvan de vorm
\[\matrix{\lambda&*\\ 0&\lambda}\]waarbij #*# een getal ongelijk aan #0# weergeeft. De stelling is hier niet te gebruiken, maar later zullen we zien dat de basis zo gekozen kan worden dat #*# gelijk is aan #1#.
Stel dat #L# een lineaire afbeelding #V\to V# is op een reële lineaire vectorruimte #V# met complexe niet-reële eigenwaarde #\lambda#. Dan is ook #\overline\lambda# een eigenwaarde en bestaat er een #2#-dimensionale lineaire deelruimte #U# van #V# die invariant is onder #L# en waarop #L# eigenwaarden #\lambda# en #\overline\lambda# heeft. Deze ruimte kan verkregen worden door eerst het beeld #W# van #V# onder de reële lineaire afbeelding #L^2-2\Re{\lambda}\cdot L + \lambda\cdot\overline{\lambda} \cdot I_V# te bepalen en vervolgens een vector #\vec{w}\in W# ongelijk aan de nulvector te kiezen. Dan is #U = \linspan{\vec{w},L(\vec{w})}# een deelruimte als vereist.
Bekijk de matrix \[ A = \matrix{-10 & 6 & 14 \\ -1 & 1 & 1 \\ -7 & 4 & 10 \\ } \] De karakteristieke veelterm van deze matrix is gelijk aan # \left(1-x\right) x^2 #.
Bepaal een #(3\times3)#-matrix #T# waarvan de eerste twee kolommen een basis voor #\ker{ A^2}# vormen en de derde kolom een basis voor #\ker{ A-I_3}#.
#T=# #\matrix{-11 & 6 & -4 \\ -1 & 0 & 2 \\ -7 & 4 & -4 \\ }#
Volgens de stelling
Invariante directe som is de gevraagde basis ook een basis van #\im{A-I_3 }# aangevuld met een basis van #\im{ A^2 }#. Deze deelruimten worden opgespannen door de kolommen van de matrices \[A-I_3 = \matrix{-11 & 6 & 14 \\ -1 & 0 & 1 \\ -7 & 4 & 9 \\ }\phantom{xx}\text{ en }\phantom{xx} A^2= \matrix{-4 & 2 & 6 \\ 2 & -1 & -3 \\ -4 & 2 & 6 \\ } \] Na uitdunning vinden we dat de volgende kolommen een basis vormen:
\[\begin{array}{rcl}\basis{\cv{ -11 \\ -1 \\ -7 } , \cv{ 6 \\ 0 \\ 4 } } \phantom{xx}&\text{ voor } &\ker{ A^2 }\phantom{xxxx}\\ &\text{ en }&\\ \basis{\cv{ -4 \\ 2 \\ -4 } } \phantom{xx}&\text{ voor } &\ker{A-I_3 }\end{array}\] Dit leidt tot het antwoord
\[T = \matrix{-11 & 6 & -4 \\ -1 & 0 & 2 \\ -7 & 4 & -4 \\ }\]
De keuze van #T# is niet uniek.
De matrix van #L_A# ten opzichte van de basis bestaande uit de kolommen van #T# is
\[ T^{-1}\, A\, T = \matrix{-3 & 2 & 0 \\ -{{9}\over{2}} & 3 & 0 \\ 0 & 0 & 1 \\ }
\]