Hoofdstuk 1: Beschrijvende statistiek: Variabiliteit
Variantie en standaardafwijking
De som van de kwadraten dient als basis voor twee van de belangrijkste maten van variabiliteit: de variantie en de standaardafwijking.
Variantie
Definitie
De variantie is het gemiddelde van de gekwadrateerde afwijkingen.
De populatie- en de steekproefvariantie worden respectievelijk aangeduid met #\sigma^2# en #s^2#.
Let op dat de steekproefvariantie berekend wordt door te delen door #n-1#. Dit doen we om ervoor te zorgen dat de steekproefvariantie een zuivere schatter wordt van de populatievariantie.
Formules
\[\begin{array}{rcl}
\sigma^2 &=&\dfrac{SS}{N}= \dfrac{\sum{(X - \mu)^2}}{N}\\
\\
s^2&=&\dfrac{SS}{n-1}= \dfrac{\sum{(X - \bar{X})^2}}{n - 1}\\
\end{array}\]
Steekproefvariantie berekenen met Software
Om de steekproefvariantie te berekenen in Excel, gebruiken we de volgende functie:
VAR(array)
- reeks: De reeks of celbereik van numerieke waarden waarvoor je de steekproefvariantie wilt berekenen.
Om de steekproefvariantie te berekenen in R, gebruiken we de volgende functie:
var(x)
- x: De numerieke vector waarvan je de steekproefvariantie wilt berekenen.
Een nadeel van de variantie als maat voor de spreiding binnen een verdeling, is dat de variantie niet in dezelfde eenheid wordt uitgedrukt als de oorspronkelijke metingen. Dit komt doordat, wanneer we de afwijkingen van het gemiddelde kwadrateren, de eenheid van deze afwijkingen ook gekwadratreerd wordt. Bijvoorbeeld, wanneer de oorspronkelijke data in meters uitgedrukt wordt, dan wordt de variantie die we op basis van deze waarden berekenen uitgedrukt in vierkante meters.
Doordat de meeteenheid van de variantie niet overeenkomt met de meeteenheid van de oorspronkelijke data, is het moeilijk om de variantie te vergelijken met andere spreidingsmaten die wel dezelfde meeteenheid als de oorsponkelijke data hebben, zoals de spreidingsbreedte en de interkwartielafstand.
Het is om deze reden dat men over het algemeen de voorkeur geeft aan de standaardafwijking als maatstaf voor de variabiliteit binnen een verdeling.
Standaardafwijking
Definitie
De standaardafwijking wordt berekend door de vierkantswortel van de variantie te trekken, met als gevolg dat de standaardafwijking in dezelfde eenheid wordt uitgedrukt als de oorspronkelijke metingen.
De populatie en steekproefstandaardafwijking worden respectievelijk aangeduid als #\sigma# en #s#.
Een handige vuistregel is dat de meerderheid van alle scores binnen één standaardafwijking van het gemiddelde liggen.
Formules
\[\begin{array}{rcl}
\sigma &=& \sqrt{\sigma^2} = \sqrt{\dfrac{\sum{(X-\mu)^2}}{N}}
\\\\\\
s &=& \sqrt{s^2} = \sqrt{\dfrac{\sum{(X-\bar{X})^2}}{n-1}}
\end{array}\]
Steekproef standaardafwijking berekenen met software
Om de steekproef standaardafwijking te berekenen in Excel, gebruik je de volgende functie:
STDEV(array)
- array: De reeks of celbereik van numerieke waarden waarvoor je de standaardafwijking wilt berekenen.
Om de steekproef standaardafwijking te berekenen in R, gebruik je de volgende functie:
sd(x)
- x: De numerieke vector waarvan je de standaardafwijking wilt berekenen.
omptest.org als je een OMPT examen moet maken.