
H2 Frequentietabellen
1. Gegevens ordenen
De sportraad van een gemeente wil een sportcomplex bouwen en voert een statistisch onderzoek uit bij 80 jongeren die aan zaalsport doen. Het aantal uren per week dat ze één of meer zaalsporten beoefenen, lezen we af in de volgende tabel. Als de gegevens nog niet geteld zijn, zoals in dit voorbeeld, dan spreekt men over ruwe gegevens.

Als we de data sorteren en rangschikken van klein naar groot, dan bekomen we de volgende tabel met geordende of verwerkte gegevens. In de tabel met de gesorteerde data tellen we het aantal. maal dat eenzelfde waarnemingsgetal voorkomt. Zo bekomen we het aantal jongeren dat respectievelijk 2, 3, 4, 5 en 7 uur per week aan zaalsport doet. Deze aantallen noemen we frequenties. Een tabel waarin we de frequenties kunnen aflezen, noemen we een frequentietabel.

2. Absolute versus relatieve frequentie
De absolute frequentie (ni) geeft telkens aan hoeveel maal eenzelfde waarneming of waarnemingsgetal (xi) voorkomt. De relatieve frequentie (fi) daarentegen is een verhouding uitgedrukt in percentage, breukvorm of decimale notatie. Deze wordt bepaald door de absolute frequentie te delen door het totaal (i.e. steekproefgrootte). De absolute frequenties opgeteld komt overeen met de steekproefgrootte. De relatieve frequenties opgeteld geeft telkens samen 100% of 1. Deze worden gebruikt om eigenschappen van verschillende populaties te vergelijken, met verschillende steekproefgrootte.
Download onderstaande excel file en vul de relatieve frequentie aan en upload deze op de voorziene plaats op Smartschool.
3. Cumulatieve frequentie
De cumulatieve absolute frequentie (cni) van een waarnemingsgetal is het aantal gegevens kleiner dan of gelijk aan het waarnemingsgetal. Om deze waarde te bekomen tel je frequenties van de voorgaande waarnemingen mee op. Deze frequentie biedt een antwoord op vragen als "Hoeveel jongeren doen minder dan 3 of 3 uur aan zaalsport gedurende een week?"
De cumulatieve relatieve frequentie (cfi)van een waarnemingsgetal is de cumulatieve absolute frequentie gedeeld door het totaal aantal gegevens, de steekproefgrootte.
Download onderstaande excel file en vul de cumulatieve absolute en relatieve frequentie aan en upload deze op de voorziene plaats op Smartschool.
4. Gegroepeerde frequentietabel
Tot nu toe ging het over niet-gegroepeerde frequentietabellen. Volgend statistisch onderzoek zal duidelijk maken waarvoor een gegroepeerde frequentietabel ook zijn nut kan hebben.
Een fabrikant verzamelde de volgende waarnemingsgetallen i.v.m. de massa van 40 blikjes conserven uitgedrukt in gram.

Na het ordenen van deze gegevens zoals gezien in paragraaf 1, bekomen we het volgende niet-gegroepeerde frequentietabel.

Merk op dat er 24 verschillende waarnemingsgetallen (x) voorkomen die bovendien onderling weinig verschillen. Daarom groeperen we de waarnemingsgetallen in een aantal opeenvolgende intervallen. Deze intervallen noemen we klassen. Enerzijds moet de indeling leiden tot een duidelijker inzicht in de gegevens. Anderzijds mag er niet te veel informatie verloren gaan door intervallen te nemen die te groot zijn.

Het tabel hierboven is een zogenaamde gegroepeerde frequentietabel. De waarnemingsgetallen zijn gegroepeerd in verschillende intervallen. Elk interval, bijvoorbeeld [485,488[, heeft een ondergrens en een bovengrens, respectievelijk 485 en 488. Dit zijn het kleinste en het grootste getal in de intervalnotatie. De haakjes duiden aan dat de ondergrens tot de klasse behoort en de bovengrens niet. De bovengrens ligt in de daaropvolgende klasse. Het verschil tussen de ondergrens en de bovengrens noemen we de klassenbreedte. In dit voorbeeld is deze dus 3 namelijk 488-485. Bij elke klasse hoort een klassenfrequentie, dat aangeeft hoeveel keer de waarnemingsgetallen binnen de klasse voorkomen.
We kunnen niet meer achterhalen in deze gegroepeerde frequentietabel wat de absolute frequentie van elk waarnemingsgetal afzonderlijk is. Enerzijds is er informatie verloren gegaan, maar anderzijds is deze tabel overzichtelijker en korter. Bij een klassenbreedte van 10 bekomen we volgende frequentietabel en merk je onmiddellijk dat bij deze indeling te veel informatie verloren is gegaan.

Elke klasse wordt vertegenwoordigd door een klassenmidden. Deze wordt bepaald door het gemiddelde te nemen van de ondergrens en de bovengrens. Als voorbeeld; het klasmidden van de eerste klasse [485,488[ is (485+488)/2 = 486,5.
Het berekenen van de relatieve klassenfrequentie, de cumulatieve absolute klassenfrequentie en de cumulatieve relatieve klassenfrequentie gebeurt op analoge wijze als bij een niet-gegroepeerde frequentietabel. Download onderstaande excel file en vul de ontbrekende gegevens aan en upload deze op de voorziene plaats op Smartschool.