Het is belangrijk dat je de verschillende soorten variabelen leert onderscheiden. Het soort variabele dat je onderzoekt bepaalt namelijk welke statistische onderzoekstechnieken je zinvol kunt inzetten. Denk bijvoorbeeld aan het bekende voorbeeld dat je geen gemiddelde hobby kunt berekenen.
Een kwalitatieve variabele beschrijft van elk element van de populatie een bepaald kenmerk dat niet noodzakelijk in een getal wordt uitgedrukt, bijvoorbeeld: het geslacht, de kleur ogen, de bloedgroep, de naam, enzovoorts.
Een kwantitatieve variabele wordt wel in een getal uitgedrukt, zoals de lengte, de hoogte van het inkomen, de omvang van het gezin, enzovoorts. Kwantitatieve variabelen kun je verdelen in discreet en continu.
Een variabele die alleen bepaalde waarden kan aannemen en niet alle tussenliggende waarden heet discreet. Een voorbeeld is het aantal kinderen in een gezin.
Als wel alle tussenliggende waarden mogelijk zijn, ofwel als een variabele alle waarden binnen een interval kan aannemen, heet de variabele continu. Voorbeelden zijn lengte en gewicht.
Dotplot
Over Dik Trom wordt gezegd: “Het is een bijzonder kind, en dat is-ie”. Maar hoe kun je zo’n uitspraak hard maken? In deze paragraaf leer je een individu vergelijken met een groep. Daarvoor gebruik je verschillende representaties, zoals het histogram en de frequentiepolygoon. Je leert welke verbanden er tussen deze representaties bestaan en welke informatie je er bij uitstek uit af kunt lezen.
Lengtes van de jongens en de meisjes van elkaar verschillen
Staafdiagram, histogram en frequentiepolygoon
Staafdiagram brengt de frequentieverdeling goed in beeld
Dataset Gegevens154Leerlingen (4)
Cijfers vergelijken
Dataset Gegevens154Leerlingen (5)
Notatie klassenindeling
Cumulatieve frequentie
In plaats van de lengte van de leerlingen weer te geven in een histogram, kun je ook kiezen voor een frequentietabel. Aan de frequentietabel is de kolom cumulatieve frequentie toegevoegd. De cumulatieve frequentie (ook wel somfrequentie genaamd) bereken je door de frequenties van een bepaalde klasse en alle voorgaande klassen op te tellen. Zo vind je de somfrequentie van een lengte, bijvoorbeeld \(174\) cm, door alle frequenties tot en met de klasse \(170-174\) op te tellen, dus \(6+14+37+26=83\).
Een lijndiagram bij deze somfrequenties noem je een somfrequentiepolygoon of cumulatieve frequentiepolygoon. De polygoon brengt de verdeling van de variabele lengte in beeld. In de somfrequentiepolygoon zie je bijvoorbeeld dat na de klasse van onze \(184\) cm lange Wouter, de grafiek nog maar langzaam stijgt. Dit betekent dat er niet veel leerlingen langer zijn dan Wouter.
Eigenschappen van een cumulatieve frequentiepolygoon
Let bij het tekenen van een cumulatieve frequentiepolygoon op het volgende:
de stippen teken je boven de rechter grens van een klasse;
de eerste stip teken je boven de linker grens van de kleinste klasse.
Cumulatieve percentages
Cumulatieve percentages uitzetten in een lijngrafiek
Ook cumulatieve percentages kun je uitzetten in een lijngrafiek.
Een lijngrafiek zoals hierboven noemen we een relatieve somfrequentiepolygoon (of relatieve cumulatieve frequentiepolygoon).
Verschillende representaties, verschillende informatie
Iedere representatie heeft eigen sterke en zwakke kanten. Zo kun je uit de dotplot van de vorige vraag eenvoudig de afzonderlijke sprinttijden aflezen. Lastiger is het om direct (dus zonder tellen) uit de dotplot af te lezen hoeveel leerlingen sneller waren dan \(9\) seconden. Daarvoor is een somfrequentiepolygoon meer geschikt.
Verschillende diagrammen geven dus verschillende informatie.
We bekijken nogmaals het voorbeeld van de sprinttijden.
Een dotplot en een steelbladdiagram tonen iedere sprinttijd afzonderlijk.
Een frequentietabel, een staafdiagram en een frequentiepolygoon tonen de sprinttijd samengevoegd met andere sprinttijden, al naar gelang de gebruikte klassenindeling. Hoe groter de klassen zijn, hoe minder je van ieder sprinttijd terugziet maar hoe meer je kunt zeggen over groepen sprinttijden (de meest gesprintte tijden, het tijdsinterval van de langzaamste sprinters, enzovoorts).
Een somfrequentiepolygoon geeft vooral informatie over groepen sprinttijden, net als een indeling in grote klassen. In een relatieve somfrequentiepolygoon kun je eenvoudig de \(20\%\) snelste sprinttijden aflezen, de \(50\%\) langzaamste sprinttijden, enzovoorts.
Het heeft dus zin om na te denken over de keuze van een diagram; afhankelijk van de vraag kies je het meest geschikte diagram.
Dit lesmateriaal is gepubliceerd onder de Creative Commons Naamsvermelding-GelijkDelen 4.0 Internationale licentie. Dit houdt in dat je onder de voorwaarde van naamsvermelding en publicatie onder dezelfde licentie vrij bent om:
het werk te delen - te kopiëren, te verspreiden en door te geven via elk medium of bestandsformaat
het werk te bewerken - te remixen, te veranderen en afgeleide werken te maken
voor alle doeleinden, inclusief commerciële doeleinden.
Van dit lesmateriaal is de volgende aanvullende informatie beschikbaar:
Toelichting
Deze les valt onder de arrangeerbare leerlijn van de Stercollectie voor wiskunde A voor havo leerjaar 4. Dit is thema ’Statistiek 2'. Het onderwerp van deze les is: data in beeld.
Leerniveau
HAVO 4;
Eindgebruiker
leerling/student
Moeilijkheidsgraad
gemiddeld
Studiebelasting
4 uur en 0 minuten
Trefwoorden
arrangeerbaar, data, dataset, havo 4, staafdiagram, statistische variabelen, stercollectie, wiskunde a
Deze les valt onder de arrangeerbare leerlijn van de Stercollectie voor wiskunde A voor havo leerjaar 4. Dit is thema ’Statistiek 2'. Het onderwerp van deze les is: data in beeld.
Leeromgevingen die gebruik maken van LTI kunnen Wikiwijs arrangementen en toetsen afspelen en resultaten
terugkoppelen. Hiervoor moet de leeromgeving wel bij Wikiwijs aangemeld zijn. Wil je gebruik maken van de LTI
koppeling? Meld je aan via info@wikiwijs.nl met het verzoek om een LTI
koppeling aan te gaan.
Maak je al gebruik van LTI? Gebruik dan de onderstaande Launch URL’s.
Arrangement
IMSCC package
Wil je de Launch URL’s niet los kopiëren, maar in één keer downloaden? Download dan de IMSCC package.
Wikiwijs lesmateriaal kan worden gebruikt in een externe leeromgeving. Er kunnen koppelingen worden gemaakt en
het lesmateriaal kan op verschillende manieren worden geëxporteerd. Meer informatie hierover kun je vinden op
onze Developers Wiki.