Gemiddelde en standaarddeviatie

Gemiddelde en standaarddeviatie

Gemiddelde en standaarddeviatie

Wat ga ik leren?

Je gaat in deze paragraaf nog andere methodes leren om naar verschillen te kijken.

We gaan het gemiddelde berekenen, om het evenwichtspunt van een groep te bepalen.
Op dat punt wegen de deviaties (=afwijkingen) links op tegen de deviaties rechts.
Door de deviaties te berekenen kom je meer te weten over de spreiding en variantie binnen een groep.

Opgaven

Gemiddelde uren

Deviaties

Getallenlijn

Gemiddelde wiskundecijfers

Met de getallenlijn als een wip (balans) kun je het gemiddelde beschouwen als het evenwichtspunt. De scores zijn even zware poppetjes op de wip. De deviaties links wegen op tegen de deviaties rechts: de som van de deviaties is 0.

Het gemiddelde is, net als de mediaan, een centrummaat; dat is een maat voor het centrum van de verdeling van de scores.

Het gemiddelde wordt aangegeven met een liggend streepje boven de gebruikte letter. Als je de letter \(\small h\) gebruikt voor het aantal huiswerkuren, is \(\small \bar{h}\) hun gemiddelde.

Het gemiddelde bereken je door alle scores bij elkaar op te tellen en te delen door het totale aantal scores, in formule: \(\small \bar{h}= {\sum{s}\over n}\).
Soms komt een score vaker dan één keer voor. De score 5 kan bijvoorbeeld 10 keer voorkomen. De score 5 heeft dan dus frequentie 10 en telt 10 keer mee in de berekening van het gemiddelde. In de som van de scores krijg je dus … + 5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 + … . In plaats daarvan schrijf je liever 10 × 5, dus de frequentie maal de score.

Als \(\small s\) alle verschillende scores zijn met bijbehorende frequentie \(\small f\), dan kun je het gemiddelde berekenen met de formule: \(\small \bar{h}= {\sum{f} \cdot s\over n}\), waarbij \(\small n\) de som van alle frequenties is, dus het totale aantal scores, in formule: \(\small \sum{f}=n\).

Dit is vooral handig als veel scores met hoge frequenties voorkomen.

Spreidingen in groepen

Gemiddelde absolute deviatie van huiswerkuren

We willen de grootte van de spreiding in een getal uitdrukken. Dat wil zeggen dat we een spreidingsmaat willen hebben. Daarvoor zijn er verschillende mogelijkheden. In paragraaf 3 werd de spreiding vastgelegd door de kwartielafstand en gevisualiseerd in een boxplot.

Je kunt de spreiding ook goed uitdrukken met behulp van de deviaties (van het gemiddelde). Als er veel kleine deviaties zijn en weinig grote, is de spreiding gering. Maar de spreiding is groot als er grote positieve en negatieve deviaties voorkomen.

Een goede spreidingsmaat is de gemiddelde absolute deviatie of kortweg gad. Bij het aantal uren huiswerk van het het B-groepje (zie de 'Gemiddelde uren'-opgave) zijn de deviaties \(\small \text{-}4\), \(\small \text{-}1\) en \(\small \text{+}5\); dus zijn de absolute deviaties \(\small 4\), \(\small 1\) en \(\small 5\), en is de spreidingsmaat gad gelijk aan \(\small {4+1+5\over3}=3\text{,}3\).

Gemiddelde deviatie als spreidingsmaat

Variantie van huiswerkuren

Een andere maat voor spreiding, de variantie, gebruikt de kwadraten van de deviaties. Door de kwadraten te nemen, heb je ook alleen met positieve getallen of nul te maken. Dit lijkt nodeloos ingewikkeld, maar het blijkt dat allerlei formules veel beter uitkomen als je met de kwadraten van de deviaties werkt in plaats van met de absolute waarden.

De variantie (afgekort: var) is het gemiddelde van de \(\small d^{2}\)-waarden in de laatste kolom, dus \(\small {1+16+25\over3}={42\over3}=14\).

Voor \(\small n\) scores luidt de formule voor de variantie: \(\small \text{var} = {\sum{d^{2}}\over n}\).

 

 

Huiswerktijd in kwartieren

Standaarddeviatie

Als je het huiswerk in uren rekent, is het gemiddelde ook in uren. De variantie is echter het gemiddelde van een kwadraat en daarmee zou die \(\small \text{uur}^{2}\) als eenheid krijgen. Maar het ligt voor de hand om de spreiding van de huiswerkuren ook in uren te berekenen. Dat kan door de wortel van de variantie te nemen. Dat blijkt voor het latere formulewerk ook handig te zijn. De wortel uit de variantie is de standaarddeviatie of standaardafwijking, aangeduid met sd of met de enkele Griekse letter \(\small σ\).

Voor het groepje met wiskunde B is de standaardafwijking van de huiswerktijd in uren \(\small \sqrt{14}≈3\text{,}74\) uur.

 

\(\small σ = \sqrt{\sum{d^{2}} \over n}\)

 

Vuistregels controleren

In de praktijk bereken je de standaardafwijking (evenals het gemiddelde) met de Grafische Rekenmachine of met een computerprogramma. Het (laten) berekenen van gemiddelde en standaardafwijking is dus niet echt een probleem. Belangrijker is dat je een juiste voorstelling hebt van het begrip spreiding. Bekijk daarom eens het histogram van de huiswerkinspanningen van de hele A/C-groep.

Het gemiddelde \(\small 8\text{,}74\) is met een pijltje aangegeven en de standaarddeviatie \(\small 5\text{,}099\) is met pijlen langs de urenschaal afgepast, vanaf het gemiddelde. Eén pijl is één standaardafwijking naar links of naar rechts, twee pijlen zijn twee standaardafwijkingen naar links of naar rechts. In dit geval reiken de pijlen tot
\(\small 8\text{,}74 - 2 \cdot 5\text{,}099 =\text{-}1\text{,}458\) , tot \(\small 8\text{,}74 - 5\text{,}099 =3\text{,}641\), tot \(\small 8\text{,}74 +5\text{,}099 =13\text{,}839\) en tot
\(\small 8\text{,}74 +2 \cdot 5\text{,}099 =18\text{,}938\)

Voor veel verdelingen gelden de volgende vuistregels:

  • Tussen het gemiddelde-min-sd en het gemiddelde-plus-sd ligt ongeveer \(\small 68\%\) van de gehele verdeling.

  • Tussen het gemiddelde-min-2-keer-sd en het gemiddelde-plus-2-keer-sd ligt ongeveer \(\small 95\%\) van de gehele verdeling.

Hoe nauwkeurig die \(\small 68\%\) en die \(\small 95\%\) kloppen hangt erg af van de verdeling zelf. Komen in het midden (dicht bij het gemiddelde) veel scores voor en neemt hun aantal af naar de uiteinden, dan kloppen deze percentages heel aardig.

Horizontaal histogram

IQ

Voorbeeld: het IQ

Oorspronkelijk definieerde Henry Goddard het intelligentiequotiënt als volgt: \(\small \text{IQ} = {verstandelijke\space leeftijd \over werkelijke \space leeftijd} \cdot 100\). Voor kinderen was dit aanvankelijk een bruikbare definitie, maar voor volwassenen niet. David Wechsler ontwikkelde een IQ-meting door de prestatie van de proefpersoon te vergelijken met de scores van grote normgroepen, een principe dat sindsdien algemeen verspreid werd.

Intelligentietests worden zó ontworpen dat de verdeling van IQ-scores ongeveer 'normaal' is, met als gemiddelde 100 en als standaardafwijking 15. Normaal betekent ”klokvormig” zoals in de figuur van de 'IQ'-opgave hieronder: met de meeste waarnemingen in het midden van de verdeling, en naar links en rechts duidelijk afnemende aantallen. Het gemeten IQ wordt gezien als een schatting van het ware, maar onbekende, IQ. Herhaalde proeven bij een zelfde persoon wijzen uit dat diens testuitslag soms tot twintig punten kan verschillen met een eerdere test, door allerlei oorzaken zoals gezondheid, vermoeidheid, stress en gewenning aan materiaal en situatie.

De indeling van IQ-waarden is als volgt:

  • 146-160 Zeer hoogbegaafd

  • 131-145 Hoogbegaafd

  • 116-130 Bovengemiddeld begaafd

  • 101-115 Begaafd

  • 100 Gemiddeld

  • 85-99 Beneden gemiddeld

  • 70-84 Moeilijk lerend

  • 55-69 Lichte verstandelijke beperking

  • 40-54 Matige verstandelijke beperking

  • 25-39 Ernstige verstandelijke beperking

  • < 25 Zeer ernstige verstandelijke beperking

  • Het arrangement Gemiddelde en standaarddeviatie is gemaakt met Wikiwijs van Kennisnet. Wikiwijs is hét onderwijsplatform waar je leermiddelen zoekt, maakt en deelt.

    Auteur
    VO-content
    Laatst gewijzigd
    2021-10-12 13:08:46
    Licentie

    Dit lesmateriaal is gepubliceerd onder de Creative Commons Naamsvermelding-GelijkDelen 4.0 Internationale licentie. Dit houdt in dat je onder de voorwaarde van naamsvermelding en publicatie onder dezelfde licentie vrij bent om:

    • het werk te delen - te kopiëren, te verspreiden en door te geven via elk medium of bestandsformaat
    • het werk te bewerken - te remixen, te veranderen en afgeleide werken te maken
    • voor alle doeleinden, inclusief commerciële doeleinden.

    Meer informatie over de CC Naamsvermelding-GelijkDelen 4.0 Internationale licentie.

    Aanvullende informatie over dit lesmateriaal

    Van dit lesmateriaal is de volgende aanvullende informatie beschikbaar:

    Eindgebruiker
    leerling/student
    Moeilijkheidsgraad
    gemiddeld
    Studiebelasting
    4 uur en 0 minuten

    Gebruikte Wikiwijs Arrangementen

    Wiskunde Wageningse Methode. (2022).

    Statistiek

    https://maken.wikiwijs.nl/154963/Statistiek