Hoofdstuk 1: Beschrijvende statistiek: Frequentieverdelingen
Kwantielen
Naast een beschrijving van de kenmerken van een verdeling als een geheel, kan beschrijvende statistiek ook gebruikt worden om meer informatie over individuele scores te krijgen. Een bijzonder bruikbare stukje informatie is de locatie van een score opzichte van alle andere scores in de verdeling.
Als we de locatie van een score ten opzichte van de andere scores weten, kunnen we bijvoorbeeld beoordelen of we die score als hoog, laag, of gemiddeld moeten beschouwen. Ruwe scores zijn niet erg informatief in dit opzicht.
Eén van de manieren om de locatie van een score te bepalen is het bereken van de percentiel rang.
Percentiel Rang
De percentiel rang van een score is het percentage van de scores in de verdeling met een waarde kleiner dan of gelijk aan de score in kwestie.
Een student scoort #7.0# op een examen en wilt graag weten hoe goed zij het examen gemaakt heeft in vergelijking met haar klasgenoten. De cijfers van de hele klas zijn als volgt:
\[3.4\,\,\,\,4.2\,\,\,\,5.3\,\,\,\,5.6\,\,\,\,5.7\,\,\,\,6.0\,\,\,\,6.2\,\,\,\,6.4\,\,\,\,6.4\,\,\,\,6.7\,\,\,\,7.0\,\,\,\,7.0\,\,\,\,7.2\,\,\,\,7.8\,\,\,\,8.4\,\,\,\,8.9\]
Om de percentiel rang te berekenen van #X=7.0#, tellen eerst we het aantal cijfers die gelijk zijn aan of lager zijn dan #7.0#, wat in dit geval #12# is.
Vervolgens delen we dat aantal door het totaal aantal scores (#16#) en vermenigvuldigen we met #100\%#.
\[\cfrac{12}{16}\cdot 100\% = 75\%\]
Dus de percentiel rang van #X=7.0# is #75#.
#\phantom{0}#
Wanneer we een score indentificeren aan de hand van de percentiel rang, wordt de score ookwel een percentiel genoemd.
Percentielen
Definitie
Percentielen zijn de waarden die een verdeling in honderd gelijke delen verdelen.
Het #P^{de}# percentiel van een verdeling is de score wiens waarde groter is dan of gelijk is aan #P# procent van alle scores.
Formule
De index van het #P^{de}# percentiel van een verdeling is:
\[i = \cfrac{P}{100}(n-1)+1\]
waarbij #n# het totaal aantal scores is en #P# een waarde tussen #1# en #99#.
Percentielberekening
De berekening van het #P^{de}# percentiel begint met het ordenen van de scores van klein naar groot.
Vervolgens gebruiken we de volgende formule om de index van het #P^{de}# percentiel te vinden:
\[i = \cfrac{P}{100}(n-1)+1\]
waarbij #n# het totaal aantal scores is.
Let op dat we de bovenstaande formule de positie van het #P^{de}# percentiel bepaalt en niet de waarde die aan dit percentiel gekoppeld is.
Als #i# een geheel getal is, dan is het #P^{de}# percentiel de score op de #i^{de}# positie van de geordende data.
Als #i# geen geheel getal is, dan moet lineaire interpolatie gebruikt worden om het percentiel te berekenen:
- Vind de twee getallen het dichtst bij #i# liggen door de waarde van #i# op- en af te ronden. Deze indices worden respectievelijk aangeduid met #i_{boven}# en #i_{onder}#.
- Bepaal de waarden op deze posities. Deze waarden worden respectievelijk aangeduid met #X_{boven}# en #X_{onder}#.
- Bereken het #P^{de}# percentiel met de volgende formule: \[P^{de}\text{ percentiel}=X_{onder} + (i - i_{onder}) \cdot (X_{boven} - X_{onder})\]
\[17\,\,\,\,\,21\,\,\,\,\,4\,\,\,\,\,6\,\,\,\,\,2\,\,\,\,\,20\,\,\,\,\,2\,\,\,\,\,1\,\,\,\,\,1\,\,\,\,\,1\,\,\,\,\,4\,\,\,\,\,5\,\,\,\,\,1\,\,\,\,\,10\,\,\,\,\,23\,\,\,\,\,25\,\,\,\,\,3\,\,\,\,\,13\,\,\,\,\,19\,\,\,\,\,16\,\,\,\,\,18\] Bereken het #20^{e}# percentiel.
Er zijn een aantal manieren om het #20^{e}# percentiel te berekenen. Klik op een van de panelen om een specifieke oplossing te bekijken.
\[1\,\,\,\,\,1\,\,\,\,\,1\,\,\,\,\,1\,\,\,\,\,2\,\,\,\,\,2\,\,\,\,\,3\,\,\,\,\,4\,\,\,\,\,4\,\,\,\,\,5\,\,\,\,\,6\,\,\,\,\,10\,\,\,\,\,13\,\,\,\,\,16\,\,\,\,\,17\,\,\,\,\,18\,\,\,\,\,19\,\,\,\,\,20\,\,\,\,\,21\,\,\,\,\,23\,\,\,\,\,25\]
Vervolgens, om de index #i# te vinden van het #20^{e}# percentiel (#P=20#), gebruik je de volgende formule:
\[\begin{array}{rcl}
i &=& \cfrac{P}{100}(n-1)+1\\
&=& \cfrac{20}{100}(21 - 1) + 1=5
\end{array}\]
Omdat #i=5# een geheel getal is, is het #20^{e}# percentiel de score op de #5^{de}# positie van de gesorteerde data:
\[P_{20}= X_{5} = 2\]
PERCENTILE(array, k)Ervanuitgaande dat de scores in cel A1 tot A21 staan, is de Excel functie om het #20^{e}# percentiel te berekenen:
- array: De reeks of het celbereik van de numerieke waardes waarvan je de percentielwaarde wil.
- k: De percentielwaarde in het bereik #[0, 1]#, inclusief.
\[= \text{PERCENTILE(A1:A21, 0.2)}\]
Dit geeft:
\[P_{20} = 2\]
quantile(x, probs)Om het #20^{e}# percentiel te berekenen, voer je het volgende commando uit:
- x: De numerieke vector van de waardes waarvan je de percentielwaarde wil.
- probs: De numerieke vector met kansen met waardes in het bereik #[0, 1]#.
\[quantile(x = c(17,21,4,6,2,20,2,1,1,1,4,5,1,10,23,25,3,13,19,16,18), probs = 0.2)\]
Dit geeft:
\[P_{20}= 2\]
#\phantom{0}#
Percentielen breken een verdeling op in #100# gelijke stukken. Het is echter ook mogelijk om een verdeling in een ander aantal gelijke delen op te splitsen. Wanneer we een verdeling van scores in gelijke delen verdelen, dan worden de delende waarden kwantielen genoemd.
Kwantielen
Als we een dataset in #k# gelijke delen opsplitsen, dan noemen we de delende waarden #k#-kwantielen. Ongeacht de gekozen waarde van #k#, zijn er altijd #k-1# kwantielen.
#\phantom{0}#
Als we een verdeling in vier gelijke delen opsplitsen, dan worden de delende waarden kwartielen genoemd.
Kwartielen
Definitie
Kwartielen zijn de waarden die een verdeling in vier gelijke delen verdelen.
De eerste (#Q_1#), tweede (#Q_2#) en derde (#Q_3#) kwartielen zijn respectievelijk gelijk aan het 25e, 50e en 75e percentiel.
Het tweede kwartiel van een verdeling wordt ook wel de mediaan genoemd.
Formule
De index van het #Q^{de}# kwartiel van een verdeling is:
\[i=\dfrac{Q}{4}(n-1)+1\]
waarbij #n# het aantal scores is en #Q# een waarde tussen #1# en #3# is.
Kwartiel Berekening
De berekening van het #Q^{de}# kwartiel begint met het ordenen van de scores van klein naar groot.
Vervolgens gebruiken we de volgende formule om de index van het #Q^{de}# kwartiel te vinden:
\[i=\dfrac{Q}{4}(n-1)+1\]
waarbij #n# het totaal aantal scores in de dataset is.
Let op dat we de bovenstaande formule de positie van het #Q^{de}# kwartiel bepaalt en niet de waarde die aan dit kwartiel gekoppeld is.
Als #i# een geheel getal is, dan is het #Q^{de}# kwartiel de score op de #i^{de}# positie van de geordende data.
Als #i# geen geheel getal is, dan moet lineaire interpolatie gebruikt worden om het kwartiel te berekenen:
- Vind de twee getallen het dichtst bij #i# liggen door de waarde van #i# op- en af te ronden. Deze indices worden respectievelijk aangeduid met #i_{boven}# en #i_{onder}#.
- Bepaal de waarden op deze posities. Deze waarden worden respectievelijk aangeduid met #X_{boven}# en #X_{onder}#.
- Bereken het #Q^{de}# kwartiel met de volgende formule: \[Q^{de}\text{ kwartiel}=X_{onder} + (i - i_{onder}) \cdot (X_{boven} - X_{onder})\]
Er zijn een aantal manieren om het #2^{e}# kwartiel te berekenen. Klik op een van de panelen om een specifieke oplossing te bekijken.
\[3\,\,\,\,\,3\,\,\,\,\,4\,\,\,\,\,6\,\,\,\,\,8\,\,\,\,\,8\,\,\,\,\,11\,\,\,\,\,14\,\,\,\,\,17\,\,\,\,\,18\,\,\,\,\,20\,\,\,\,\,25\,\,\,\,\,25\]
Vervolgens, om de index #i# te vinden van het #2^{e}# kwartiel (#Q=2#), gebruik je de volgende formule:
\[\begin{array}{rcl}
i &=& \cfrac{Q}{4}(n-1)+1\\
&=& \cfrac{2}{4}(13 - 1) + 1=7
\end{array}\]
Omdat #i=7# een geheel getal is, is het #2^{e}# kwartiel de score op de #7^{de}# positie van de gesorteerde data:
\[Q_{2}=X_{7} = 11\]
QUARTILE(array, quart)Ervanuitgaande dat de scores in cel A1 tot en met A13 staan, is het Excel commando om het #2^{e}# kwartiel te berekenen:
- array: De reeks of het celbereik van de numerieke waardes waarvoor je het kwartiel wil.
- quart: Geeft aan welk kwartiel weer te geven.
\[= \text{QUARTILE(A1:A13, 2)}\]
Dit geeft:
\[Q_{2} = 11\]
quantile(x)Om het #2^{e}# kwartiel te berekenen, voer je het volgende commando uit:
- x: De numerieke vector van de waardes waarvan je de kwartielen wil.
\[quantile(x = c(3,20,8,3,11,25,6,8,25,17,14,18,4))\]
Als we kijken naar het resultaat wat R geeft, dan zien we onder #50\%#:
\[Q_{2}= 11\]
omptest.org als je een OMPT examen moet maken.