Hoofdstuk 1: Beschrijvende statistiek: Variabiliteit
Identificeren van uitschieters met de interkwartielafstand-regel
Een veelgebruikte methode voor het identificeren van uitschieters is de interkwartielafstand-regel.
Interkwartielafstand-regel
Volgens de interkwartielafstand-regel wordt een score #X# als een uitschieter beschouwd indien:
- De score meer dan #1.5\cdot IQR\,# onder het eerste kwartiel ligt: \[X < (Q_1 - 1.5\cdot IQR)\]
- De score meer dan #1.5\cdot IQR\,# boven het derde kwartiel ligt: \[X > (Q_3 + 1.5\cdot IQR)\]
Gegeven is de onderstaande steekproef van #13# scores:
\[79,\,\,\,93,\,\,\,86,\,\,\,88,\,\,\,83,\,\,\,91,\,\,\,93,\,\,\,49,\,\,\,123,\,\,\,97,\,\,\,70,\,\,\,94,\,\,\,74\]
Op basis van de interkwartielafstand regel, hoeveel uitschieters zijn er in deze steefproef?
Om de interkwartielafstand te berekenen, sorteer je eerst de waardes in oplopende volgorde:
\[49,\,\,\,70,\,\,\,74,\,\,\,79,\,\,\,83,\,\,\,86,\,\,\,88,\,\,\,91,\,\,\,93,\,\,\,93,\,\,\,94,\,\,\,97,\,\,\,123\]
Vervolgens bereken je het eerste kwartiel. Om de index #i_1# van het eerste kwartiel (#Q=1#) te vinden, gebruik je de volgende formule:
\[\begin{array}{rcl}
i_1 &=& \cfrac{Q}{4}(n-1)+1\\
&=& \cfrac{1}{4}(13 - 1) + 1=4
\end{array}\]
Omdat #i_1=4# een geheel getal is, is het eerste kwartiel de score op de #4^{e}# positie van de gesorteerde data:ordered data:
\[X_{4} = 79\]
Vervolgens bereken je het derde kwartiel. Om de index #i_3# van het derde kwartiel (#Q=3#) te vinden, gebruik je de volgende formule:
\[\begin{array}{rcl}
i_3 &=& \cfrac{Q}{4}(n-1)+1\\
&=& \cfrac{3}{4}(13 - 1) + 1=10
\end{array}\]
Omdat #i_3=10# een geheel getal is, is het derde kwartiel de score op de #10^{e}# positie van de gesorteerde data:
\[X_{10} = 93\]
Bereken je de interkwartielafstand:
\[\text{IQR}=Q_3-Q_1=93-79=14\]
Volgends de interkwartielafstand regel, is een score #X# een uitschieter als:
- De score meer dan #1.5\cdot IQR\,# onder het eerste kwartiel ligt: #X < (Q_1 - 1.5\cdot IQR)#
\[Q_1 - 1.5\cdot IQR = 79 - 1.5 \cdot 14 = 58.0\] - De score meer dan #1.5\cdot IQR\,# boven het derde kwartiel ligt: #X > (Q_3 + 1.5\cdot IQR)#
\[Q_3 + 1.5\cdot IQR = 93 + 1.5 \cdot 14 = 114.0\]
Dit betekent dat een score #X<58.0# or #X>114.0# een uitschieter is, waarvan er #2# zijn in de steekproef, namelijk: #49# and #123#.
omptest.org als je een OMPT examen moet maken.