Hoofdstuk 4 Statistiek

Hoofdstuk 4 Statistiek

Startpagina

In deze site kun je op je eigen tempo en op je eigen niveau oefenen. Maar let op: dit vraagt wel verantwoordelijkheid! Zorg ervoor dat je genoeg oefent, dat je zeker weet dat je de stof beheerst en bovenal dat je het aangeeft wanneer je ergens tegenaan loopt.

Als je hulpt nodig hebt met de stof of met het plannen, ga dan naar je docent, kijk op internet voor tips of stel je vraag aan de persoon naast je. Stel altijd vragen!

Je kan deze site zelfstandig doorwerken. Het is belangrijk dat je de theorie goed doorleest en/of de filmpjes bekijkt en daarbij goed oefent. 


Links zie je in het menu de verschillende kopjes.

  • Leerdoelen: voordat je begint is het handig om een te weten wat je gaat leren, de leerdoelen geven ook handvattend om te controleren of je de stof goed genoeg begrijpt
  • Voorkennis: hier kun je nog eens terugkijken naar wat je al moet weten voor je met dit hoofdstuk begint.
  • Verschillende paragrafen: deze paragrafen zijn onder verdeeld in:
    • Theorie: vaak staan hier uitlegfilmpjes.
    • ​Extra theorie: hier wordt nog eens in tekst en voorbeelden de theorie uitgelegd.
    • Extra oefeningen: deze kun je na het doornemen van de theorie maken om te controleren of je de basis beheerst. LET OP! deze vervangen niet de de opgaven uit je boek!
  • Eindoefeningen: hier staan per paragraaf oefeningen om te controleren of je de stof echt beheerst.


In het boek begint iedere paragraaf met een zelftest (na het theorieblok). Hiermee kan meten hoe goed jij al in het onderwerp bent en hoeveel oefening je nog nodig hebt. Je mag natuurlijk altijd meer maken, mocht je dit nodig hebben om je zeker te voelen. Maar let op! Als je tempo laag is, dan kan het zijn dat je achter gaat lopen als je alles wilt maken.

In de les

Het is belangrijk dat je tijdens de les kunt werken aan de praktische opdracht. Zonder spullen kun je niet optimaal leren. Daarnaast moet je deze site door kunnen werken en de filmpjes kunnen bekijken.

Zorg er daarom voor dat je iedere les de volgende spullen bij de hand hebt:

  • lesboek
  • praktische opdracht
  • schrift
  • pen, potlood, gum, marker/stiften
  • geodriehoek
  • rekenmachine
  • ipad (opgeladen)
  • oortjes

Doe actief mee in de les en zorg dat je je tijd goed benut!

Leerdoelen

Print deze uit en hou bij welke leerdoelen jij gehaald denkt te hebben en waar dit uitblijkft.
Denk hierbij aan:

  • Opgaven die aansluiten bij het leerdoel foutloos gemaakt
  • Testopgaven foutloos gemaakt
  • Mondeling de vraag foutloos beantwoord
  • etc.

Open bestand Leerdoelen H4.docx

Voorkennis

Afronden

4.1 Informatie

Theorie

Onderzoek doen:

Steekproef en telling

 

Extra theorie

In deze paragraaf gaan we 2 verschillende manier bekijken van informatie verzamelen.

  1. de eerste is door middel van een telling
  2. de tweede is door middel van een steekproef

 

Een telling:
Veel verschillende informatie wordt tegenwoordig verzameld door instanties. Die instanties houden alle gegevens geordend bij.
Hierdoor is het mogelijk om daadwerkelijk te gaan tellen hoeveel 3 vmbo leerlingen er in Nederland zijn, hoeveel mensen er in de provinci Zuid-holland wonen, hoeveel mensen in 2001 geboren zijn of hoeveel mensen een rijbewijs hebben. Dit zijn een paar voorbeelden van informatie die door overheidsinstanties verzameld en bewaard wordt.
Een telling is dus het tellen van het aantal mensen. Dit ga je natuurlijk niet pen en papier doen, maar dit wordt gedaan met behulp van datasheets en programma's zoals heel simpel excel.

 

Een steekproef:
Soms is het niet mogelijk om een telling uit te voeren. Het kan zijn dat de gegevens die je wilt hebben nergens geregisteerd staan. Hierbij kun je denken aan meningen van mensen, maar ook bijvoorbeeld schoenmaten of het aantal mensen met een huisdier. Dit zijn allemaal gegevens die niet geregisteerd staan in een grote databank. Daarbij wil je ook niet aan alle mensen in Nederland gaan vragen welke schoenmaat zij hebben (dit duurt veel te lang en is niet realistisch).
Om toch informatie over deze gegeven te krijgen kun je een steekproef uitvoeren.
Bij een steekproef ga je aan een klein deel van de mensen (de populatie) de benodigde informatie vragen, bijv. heb jij een huisdier?.
De informatie die je krijgt uit dat kleine deel geldt vervolgens voor de hele bevolking.

Zoals je misschien zelf al door hebt kan het zijn dat je steekproef niet repesentatief (niet overeen komt) is voor de gehele bevolking.

Als je bijvoorbeeld alleen maar aan mannen boven de 80 vraagt of zij een huisdier hebben krijg je misschien dat 80% nee zegt en 20% ja. Terwijl in heel Nederland misschien 50% van de mensen een huisdier heeft of meer.
Om te zorgen dat je wel een represenatief beeld krijgt moet je in dit geval de vraag stellen aan een aantal mensen van verschillende leeftijd, geslacht, inkomen en woonplaats.

 

Conclusies:

Uit zowel de telling als de steekproef kun je conclusies trekken. Op basis van deze conclusies kunnen verschillende beslissingen gemaakt worden.

Hieronder zie je enkele voorbeelden van onderzoeken, conclusies en de beslissingen die daaruit voort komen (die op basis van de conclusies zijn gemaakt):

 

Extra oefeningen

4.2 Gemiddelde

Theorie

Gemiddelde en gewogen gemiddelde

 

Gemiddelde uit frequentie tabellen

 

Gemiddelde uit frequentie tabellen met klassen

 

Theorie van 4.2

\

Extra theorie

Centrummaten
Er zijn 3 centrummaten. Gemiddelde, modus en mediaan. Deze centrummaten vertalen grote hoeveelheden data/waarnemingen in 1 getal die iets zegt over de waarnemingen of data. Alle informatie in een onderzoek word dus weergegeven in 1 getal. Het is dus heel belangrijk om te weten wat er precies gebeurt wanneer er gerekend wordt met een centrummaat en wat dit precies over de informatie en het onderzoek zegt.
In deze theorie behandelen wij het gemiddelde.


Gemiddelde
Het gemiddelde van getallen is de optelsom van die getallen gedeeld voor het totaal aantal getallen.

Dus som van alle getallen : aantal getallen

Als voorbeeld:
We hebben in de school klassen van verschillend grote. Er is een klas met 24 leerlingen, een klas met 26 leerlingen, een klas met 22 leerlingen en een klas van 32 leerlingen. Hoeveel leerlingen zitten er gemiddeld in een klas?

24 + 26 + 22 + 32 = 104
we hebben 4 klassen in totaal

Dus per klas zitten er gemiddeld 104 : 4 = 25 leerlingen

 

Gewogen gemiddelde
Veelal wil je graag weten hoeveel je gemiddeld staat voor een vak. Nu is het zo dat soms een cijfer vaker mee telt dan een anders cijfer. Hoeveel een cijfer meetelt noemen we een gewicht.
Als we vervolgend van gewogen cijfers het gemiddelde willen weten, spreken wij over het gewogen gemiddelde.
Deze wordt als volgt berekend som van (cijfers x gewicht) : totaal gewicht.

voorbeeld:
Stel je cijfers voor Engels zijn als volgt:

cijfer gewicht
5,6 2
7,4 3
2,1 1
6 2

 

 

 

 


Zoals je ziet telt het eerste cijfer 2x mee het tweede 3x etc.
Om het gewogen gemiddelde te berekenen doe je het volgende:
((5,6 x 2) + (7,4 x 3) + (2,1 x 1) + (6 x 2)) : ( 2 + 3 + 1 + 2)  =

47,5 : 8 = 5,9

 

Frequentietabellen
Een frequentietabel is een tabel waar waarnemingen in staan en hoevaak deze voorkomen.
Een voorbeeld van een frequentie tabel is:
Er is bijvoorbeeld onderziek gedaan naar de leeftijd van jongeren onder de 17 die kickboxen doen. Er is geteld hoevaak de verschillende leeftijden voorkomen. Dit noemen we de frequentie.

 



Een gemiddelde uit een frequentietabel halen werkt niet veel anders dan het gewogen gemiddelde berekenen. Je moet namelijk:
som (leeftijd x frequentie) : totale frequentie
Als we kijken naar het voorbeeld van de frequentietabel en we willen berekenen wat de gemiddelde leeftijd van jongeren onder de 17 is die aan kickboxen doet gaan wij als volgt te werk:
(12 x 5) + ( 13 x 12) + (14 x 28) + (15 x 16) + (16 x 5) : (5 + 12 + 28 + 16 + 5) =

928 : 66 = 14 jaar is de gemiddelde leeftijd.

 


Belangrijk:
Het is belangrijk om te onthouden dat het gemiddelde niet altijd goede informatie geeft over waarnemingen of data die verzameld zijn. Wanneer er tussen de waarnemingen een hele hoge waarde in vergelijking met de rest tussen zit, vertekend het gemiddelde het beeld.
Bijvoorbeeld:
Stel ik vraag aan 10 mensen uit mavo 4 de leeftijd. Hieruit krijg ik de volgende gegegevens:

leeftijd frequentie
12 2
16 4
17 4

Het gemiddelde zou uit komen op 15,6 als gemiddelde leeftijd. Terwijl die 12 personen van 12 erg jong zijn om in mavo 4 te zitten en toevallig veel klassen over geslagen hebben mogelijk. In dit geval geeft het gemiddelde geen goed beeld van de wekelijkheid want in werkelijkheid zou de leeftijd rond de 16,5 zitten in mavo 4. In zulke gevallen kan het handig zijn om een andere centrummaat te kiezen om in 1 getal iets te zeggen over de leeftijd van mavo 4 leerlingen.

Extra oefeningen

4.3 Modus en Mediaan

Theorie Modus en mediaan

Modus en mediaan:

 

Modus en mediaan:

 

Modus en mediaan met frequentietabel

 

Modus en mediaan met een histogram:

 

 

Gemiddelde, modus en mediaan:

 

Extra theorie

Centrummaten
Er zijn 3 centrummaten. Gemiddelde, modus en mediaan. Deze centrummaten vertalen grote hoeveelheden data/waarnemingen in 1 getal die iets zegt over de waarnemingen of data. Alle informatie in een onderzoek word dus weergegeven in 1 getal. Het is dus heel belangrijk om te weten wat er precies gebeurt wanneer er gerekend wordt met een centrummaat en wat dit precies over de informatie en het onderzoek zegt.
In deze theorie behandelen wij de modus en de mediaan

 

Modus en mediaan:
Modus betekend het meest voorkomende getal. Dit wil zeggen dat wanneer je een reeks getallen hebt je moet kijken welk getal het meeste voorkomt.​ Dit is het makkelijkste om te doen wanneer je de reeks getallen geordend hebt.

Mediaan betekent het middelste getal, als je de getallen van laag naar hoog hebt geordend moet je dus kijken wat het middelste getal is.

 

Modus en mediaan uit een getallenreeks:

Bekijk de onderstaande getallenreeks

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Modus:
Wanneer je kijkt naar de andere manier van ordenen kun je heel snel zien dat 39 het meest voorkomende getal is. De modus is dus 39 in deze getallen reeks.

Mediaan:
De mediaan is minder snel gevonden. Ik heb namelijk te maken met een even aantal getallen. Er is dus geen middelste getal. Toch kunnen wij hier een mediaan uit halen. We kunnen namelijk de 2 middelste getallen pakken, daar het gemiddelde van nemen en dat is dan de mediaan.
Om snel te weten wat het middelste getal/getallen zijn deel ik het totaal aantal getallen door 2.

Namelijk:
Het zijn 28 getallen. 28 : 2 = 14. Het 14e en het 15e getal zijn dus samen de middelste getallen.
Dat is dus (41+41) : 2 = 41. Omdat de twee middelste getallen toevallig hetzelfde zijn is het gemiddelde ook gelijk hieraan. Dit hoeft echter niet altijd zo te zijn!

Soms is er een oneven aantal getallen. Stel we hebben 31 getallen.
Ik deel dan 31 door 2.  31 : 2 = 15,5. (rond dit altijd naar boven af).
In dit geval weet ik dan dan het 16de getal het middelste getal is. En dus de mediaan
Het zelfde geldt voor 25 getallen. 25 : 2 = 14,5. Dus het 15de getal is het middelste getal. Dus de mediaan.

Modus en mediaan uit een tabel of staafdiagram:
De modus is direct af te lezen uit een staafdiagram of frequentietabel.
Voor de mediaan moet vaak wat gerekend worden.
Bekijk het onderstaande voorbeeld:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Waarom wordt er gekozen voor gemiddelde, mediaan of modus:
Mediaan:
Stel dat je een reeks van vijf cijfers hebt: 1, 2, 3, 4 en 20.
Als je daar het gemiddelde van berekent, komt je uit op 6. (1 + 2 + 3 + 4 + 20 = 30 ... 30 delen door aantal cijfers = 6).
Als je dus die reeks samenvat, dan merk je al snel op dat die 20 in de reeks deels een "verkeerd" beeld geeft.
Stel dat dit cijfers waren op een examen, en je moeder vraagt je naar het gemiddelde omdat jij slechts een 4/20 hebt gehaald, dan ga je het moeilijk hebben om aan te geven dat jij eigenlijk niet zo héél slecht hebt gescoord. Die persoon met de 20 vertekent immers het beeld.
In de statistiek zeggen ze dat "het gemiddelde gevoelig is voor outliers". Een outlier is een Engelstalig woord voor buitenbeentje.

Gemiddelde
Stel dat je wederom een reeks hebt van vijf cijfers: 1, 2, 5, 150, 10000.
De mediaan is hier 5, gezien ik de reeks al op volgorde heb gezet en het middenste cijfer is 5.
Begrijp je dat er veel informatie verloren gaat als je alléén de mediaan hebt? Je weet immers niet dat er "boven" de 5 ook nog 150 en 10000 staan.
De mediaan geeft dus te weinig informatie over de rest.
Om deze redenen, geef je dus best zowel een gemiddelde als een mediaan: beiden geven extra informatie.

Modus:
De modus geeft informatie over het meest voorkomende getal. Dit wordt in de medische wereld veel gebruikt.
De modus wordt vaak gebruikt bij het vergelijken van inkomens of levensverwachting: dit is het getal dat het vaakst voorkomt in het rijtje.
Voor inkomen wordt vaak het modale (modus) inkomen gebruikt. Dit is relevant omdat dit het meest voorkomende inkomen is. Een gemiddeld inkomen kan door uitschieters een vertekend beeld geven (denk aan het inkomen van de minister president).

Ook bij de levensverwachting is de modus relevant: Rond 1860 was de gemiddelde levensverwachting in Nederland 37 jaar. Tegenwoordig is dat ongeveer 78 jaar. Je zou denken dat er rond 1860 nauwelijks bejaarde mensen rondliepen. Maar ook toen al waren er veel mensen die 70 werden of ouder. De leeftijd waarop de meeste mensen overleden (de modus!) was 73 jaar (tegenwoordig is dat 85). De kindersterfte was alleen erg hoog en dat verlaagde de gemiddelde levensverwachting.
Ook in de medische wereld wordt het veel gebruikt.

Extra oefeningen

4.4 Diagrammen lezen

Theorie

Boxplot wat is het en hoe werkt het:

 

Diagrammen aflezen:

 

Boxplot aflezen:

Extra theorie

Boxplot aflezen:
Hieronder zie je een boxplot weergegeven over een toets die gemaakt is door 120 leerlingen en het aantal punten dat zij hebben gehaald.

Een boxplot geeft verschillende informatie:
We weten dat er 120 leerlingen een toets gemaakt hebben. maar verder weten we:
Minimum = 18
Mediaan = 30
Maximum = 45
Deze gegevens zijn direct af te lezen. Een boxplot geeft echter nog meer informatie.
Namelijk zoals je kan zien is een boxplot opgesplitst in 4 delen:
18-25 is deel 1
25-30 is deel 2
30-40 is deel 3
40-45 is deel 4

Elk deel in een boxplot geeft 25% weer. In dit geval heeft dus 25% van de leerlingen tussen de 18 en 25 punten gehaald. Dus er zijn 30 leerlingen die tussen de 18 en 25 punten gehaald hebben. Maar zo zijn er dus ook 30 leerlingen die tussen 40 en 45 punten gehaald hebben.

Het aflezen van een boxplot kan ingewikkeld zijn maar met oefenen kun je dit snel doorkrijgen. Maak dus genoeg opgaven om dit te oefenen!

Aflezen van diagrammen:
Om diagrammen goed af te lezen moet je kijken naar:

  1. De assen en welke getallen hierbij staan
  2. De legenda en de titel
  3. De hele diagram

Vervolgens probeer je te begrijpen hoe de diagram in elkaar zit. Wederom kan dit soms lastig zijn en het beste is om dit veel te oefenen en naar verschillende diagrammen te kijken en hier oefeningen mee te maken.

 

 

 

 

 

Extra oefeningen

4.5 Samengestelde Diagrammen

Samen gestelde diagrammen aflezen:

 

Samengestelde diagrammen:

Diagrammen aflezen

Ga naar https://allecijfers.nl/gemeente/zwijndrecht/
Bekijk een aantal diagrammen en probeer 1 of 2 alinea's te schrijven over een of 2 van de diagrammen die staan weergegeven (bijv over de inkomsten, of huizenprijzen etc).
Hierdoor leer je diagrammen af te lezen en kritisch naar hun betekenis te kijken.

  • Het arrangement Hoofdstuk 4 Statistiek is gemaakt met Wikiwijs van Kennisnet. Wikiwijs is hét onderwijsplatform waar je leermiddelen zoekt, maakt en deelt.

    Auteur
    Denise Norton Je moet eerst inloggen om feedback aan de auteur te kunnen geven.
    Laatst gewijzigd
    2022-01-13 11:51:51
    Licentie

    Dit lesmateriaal is gepubliceerd onder de Creative Commons Naamsvermelding 4.0 Internationale licentie. Dit houdt in dat je onder de voorwaarde van naamsvermelding vrij bent om:

    • het werk te delen - te kopiëren, te verspreiden en door te geven via elk medium of bestandsformaat
    • het werk te bewerken - te remixen, te veranderen en afgeleide werken te maken
    • voor alle doeleinden, inclusief commerciële doeleinden.

    Meer informatie over de CC Naamsvermelding 4.0 Internationale licentie.

    Aanvullende informatie over dit lesmateriaal

    Van dit lesmateriaal is de volgende aanvullende informatie beschikbaar:

    Eindgebruiker
    leerling/student
    Moeilijkheidsgraad
    gemiddeld
    Studiebelasting
    4 uur en 0 minuten