
Centrumgetallen
Het statistisch onderzoek houdt zich - behalve met het ordenen en grafisch voorstellen van de gegevens - ook bezig met het samenvatten van de waarnemingsgetallen tot getallen die kenmerkend zijn voor de steekproef van de onderzochte eigenschap.
Centrumgetallen of centrummaten
Dit zijn getallen waarrond de waarnemingsgetallen zich concentreren. We zullen onder andere bekijken: het gemiddelde, de mediaan en de kwartielen.
1. Het gemiddelde
1. Gemiddelde van ruwe gegevens
Het gemiddelde van een reeks ruwe gegevens is gelijk aan de som van die gegevens gedeeld door het aantal gegevens.

* Het gemiddelde van een reeks gegevens noteren we meestal met 1 decimaal meer dan de waarnemingsgetallen.
De 24 leerlingen van een klas A behaalden voor een toets volgende punten op 10:

Het gemiddelde berekenen we als volgt;

En het resultaat schrijven we als volgt x = 5,7 (met een streepje boven de x)
2. Gemiddelde van verwerkte, niet-gegroepeerde gegevens

Om het gemiddelde te berekenen van verwerken, vermenigvuldigen we de verschillende waarnemingsgetallen met de bijhorende frequenties en tellen de producten op. Deze som delen we door het aantal gegevens.

Het gemiddelde wordt dan als volgt berekend;

3. Gemiddelde van verwerkte, gegroepeerde gegevens
Nemen we het voorbeeld van het gewicht van de 40 blikjes conserven, waar de gegevens in klassen werden ingedeeld en kennen we de exacte waarden van de gegevens niet meer.

In dit geval zullen we het gemiddelde berekenen door alle gegevens te vervangen door het klassemidden van de klasse waartoe dat gegeven behoort. De formule ziet er dan als volgt uit;

Het gemiddelde wordt dan als volgt berekend;

Het gemiddelde dat we bekomen bij een gegroepeerde frequentietabel is slechts bij benadering juist omdat we werken met klassenmiddens i.p.v. met de oorspronkelijke resultaten. In het bovenstaande voorbeeld zouden we gebruikmakend van de ruwe gegevens vinden; x = 499,3. Vergeleken met het resultaat dat we bekomen zijn met de klassenmiddens (499,7), merk je dat er weinig verschil is tussen beide resultaten. Het is dus hier verantwoord om te werken met de gegroepeerde frequentietabellen.
Als we het gemiddelde als centrumgetal nemen, dan spelen alle waarnemingsgetallen een rol. Het gemiddelde wordt zeer sterk beïnvloed door zeer kleine en zeer grote waarnemingsgetallen en is in dat geval geen goede centrummaat.
2. Mediaan
1. Mediaan van ruwe gegevens
Voorbeeld 1: De resultaten van een toets wiskunde zijn: 1 6 0 6 2 1 7 8 7
Het gemiddelde is 4,2. De leraar besluit dat het gemiddelde geen eerlijk beeld geeft over de groep leerlingen. Immers, meer dan de helft van de leerlingen is geslaagd.
Hij besluit om de mediaan op het rapport te vermelden. Om de mediaan te vinden rangschikt de leraar de resultaten in stijgende volgorde; 0 1 1 2 6 6 7 7 8
Daarna zoekt hij het middelste resultaat. Dit is de mediaan (Me =6). De extreem lage resultaten van sommige leerlingen hebben minder invloed op de mediaan dan op het gemiddelde.
De mediaan van een oneven aantal gegevens die in stijgende volgorde werden gerangschikt, is gelijk aan het middelste gegeven. Bij een oneven aantal gegevens is het nummer van de mediaan gelijk aan (n+1)/2.
Voorbeeld 2: De resultaten van een toets wiskunde zijn: 5 4 7 5 7 7 8 6 4 8
Het gemiddelde is 6,1. Om de mediaan te vinden rangschikt de leraar de resultaten in stijgende volgorde;
4 4 5 5 6 7 7 7 8 8. Omdat het aantal resultaten even is, zijn er twee middelste resultaten. De mediaan is het gemiddelde van die twee middelste resultaten. Me = 6,5. Indien er minder extreme resultaten zijn die het gemiddelde sterk beïnvloeden, liggen het gemiddelde en de mediaan dichter bij elkaar.
De mediaan van een even aantal gegevens die in stijgende volgorde werden gerangschikt, is gelijk aan het gemiddelde van de twee middelste gegevens. De nummers van de twee middelste gegevens zijn dan (n+1)/2-0,5 en (n+1)/2+0,5.
2. Mediaan van van verwerkte, niet-gegroepeerde gegevens
Als de gegevens in een frequentietabel staan, dan kunnen we met behulp van de cumulatieve frequenties gemakkelijk het middelste of de twee middelste gegevens vinden.
Voorbeeld 1: We zoeken de mediaan van de scores van de 24 leerlingen uit klas A.

Er zijn 24 gegevens, dus n is even. De twee middelste gegevens zijn met nummer 12 en nummer 13 (24+1/2=12,5 --> 12 & 13)
Het 12de gegeven is gelijk aan 6. Het 13de gegeven is ook gelijk aan 6. De mediaan is het gemiddelde van deze twee gegevens en dus Me = 6.
Voorbeeld 2:

Er zijn 45 gegevens, dus een oneven aantal. Het middelste gegeven is het gegeven met nummer 23 (45+1/2=23). Het drieëntwintigste gegeven is gelijk aan 29. We noteren Me = 29.
3. Mediaan van gegroepeerde gegevens
Voor een oneven aantal waarnemingsgetallen (n) geldt:
- het klassenmidden van de klasse waartoe het middelste waarnemingsgetal behoort is de mediaan.
Voor een even aantal waarnemingsgetallen (n) geldt:
- als de twee middelste waarnemingsgetallen tot dezelfde klasse behoren, dan is het de klassenmidden de mediaan;
- als de twee middelste waarnemingsgetallen tot twee opeenvolgende klassen behoren, dan is het gemiddelde van de middens van die klassen de mediaan.
Voorbeeld 1: We zoeken de mediaan van de massa van 40 blikjes conserven.

Er zijn 40 waarnemingsgetallen, dus n is even. De twee middelste waarnemingsgetallen hebben dan nummer 20 en 21 (40+1/2 = 20,5).
Het 20ste waarnemingsgetal kennen we niet meer maar het behoort tot klasse [497,500[. Daarom nemen we voor het 20ste waarnemingsgetal 498,5. Dit is het midden van de klasse waartoe het 20ste waarnemingsgetal behoort.
Voor het 21ste waarnemingsgetal nemen we 501,5. Dit is het midden van de klasse waartoe het 21ste waarnemingsgetal behoort.
Het gemiddelde van de middens van die klassen is de mediaan.
Dus Me ≈ (498,5+501,5)/2=500. De klasse die de mediaan bevat is de mediaanklasse, hier dus [500,503[.
Voorbeeld 2:

Er zijn 34 gegevens, dus n is even. De twee middelste gegevens zijn de gegevens met nummer 17 en met nummer 18. Beide gegeevns liggen in de klasse [8,11[. Het midden van die klasse is de mediaan, dus Me = 9,5. De klasse die de mediaan bevat is de mediaanklasse, hier [8,11[.
De mediaan is een centrummaat die verbonden is met de plaats van de gegevens, nadat die gegevens in stijgende volgorde gerangschikt werden. De mediaan wordt dus niet beïnvloed door zeer kleine of zeer grote waarnemingsgetallen.
Maak nu de oefeningen in het excel document op het tweede tabblad.
3. Kwartielen
Het eerste kwartiel Q1 is de mediaan van de eerste helft van een reeks gerangschikte data van klein naar groot;
Het derde kwartiel Q3 is de mediaan van de tweede helft van een reeks gerangschikte data van klein naar groot.
Voorbeeld: We beschouwen een reeks punten behaald door de 27 leerlingen in Johans klas, gerangschikt van klein naar groot.

De mediaan 7 verdeelt de reeks in 2 helften. Als we nu de mediaan van de linkerhelft en van de rechterhelft bepalen, dan verdelen de drie medianen de reeks punten in vier gelijke delen of kwarten.

De mediaan van 5 van de linkerhelft noemen we het eerste kwartiel omdat het eerste kwart van de punten links van 5 ligt. We schrijven Q1 = 5.
De mediaan 8 van de rechterhelft noemen we het derde kwartiel omdat drie kwart van de punten links van 8 ligt. We schrijven Q3 = 8.
Maak nu de oefeningen in het excel document op het derde tabblad en upload vervolgens de file op de voorziene plaats in Smartschool.