Frequentieverdelingen
In een groep letten we op een zekere eigenschap (variabele). Die eigenschap kan bijvoorbeeld vier waarden hebben. De groep is verdeeld over de vier waarden: elke waarde komt een zeker aantal keren voor. We spreken van een frequentieverdeling. Zie figuur 1.
Als de verdeling in procenten van de totale groep is, spreken we van een relatieve frequentieverdeling.
De som van de relatieve frequenties is \(100\%\).
figuur 1
|
figuur 2
|
Bij een frequentieverdeling kunnen we een staafdiagram of een frequentiehistogram maken. Zie figuur 2.
De hoogte van een staaf geeft het aantal of het percentage in de bijbehorende klasse. In plaats van de hoogte kun je ook op de oppervlakte letten.
Voorbeeld: de totale oppervlakte van het histogram links van \(27\), inclusief \(27\) zelf, geeft het percentage van de gevallen dat de waarde \(27\) of lager is.
Als we in een frequentiehistogram de middens van de opvolgende balken verbinden, ontstaat een frequentiepolygoon.
Als in een frequentiehistogram de balken heel smal zijn, is de frequentiepolygoon goed te benaderen met een continue gladde kromme.
Een zekere variabele (bijvoorbeeld gewicht, tijdsduur, bedrag) neemt waarden aan tussen \(1\) en \(8\). Hieronder staat zijn frequentieverdeling:
Hoe vaak de grootheid een waarde kleiner dan \(8\) heeft, wordt gegeven door de oppervlakte van het grijze gebied.
Preciezer: het percentage van het gebied onder de kromme dat gekleurd is, is gelijk aan het percentage van de gevallen dat de variabele kleiner dan \(8\) is.
Kans
Als in \(3,8\%\) van de gevallen een variabele een waarde kleiner dan \(20\) heeft, zeggen we: de kans dat de variabele kleiner dan \(20\) is, is \(3,8\%\). Van een discrete variabele staat hieronder een relatief frequentie-staafdiagram.
De kans op een waarde kleiner dan \(\bf 10\) is de som van de percentages van de waarden \(5\) t/m \(9\).
Dat is \(\frac{{{\text{oppervlakte van de staven bij 5}}{\text{, 6}}{\text{, 7}}{\text{, 8 en 9}}}}{{{\text{oppervlakte van alle staven}}}}\).
Van een continue variabele staat hieronder een relatieve frequentiepolygoon.
De kans op een waarde kleiner dan \(\bf 10\) is dan hoeveel procent het deel tussen \(5\) en \(10\) is van het geheel. Dat is oppervlakte links van 10totale oppervlakte.
Een kans laat zich uitdrukken als een percentage (tussen \(0\%\) en \(100\%\)) en ook als een breuk (tussen \(0\) en \(1\)).
De wet van de grote aantallen
Veronderstel dat bij een zeker experiment de kans op een treffer \(0,6\) is.
Als het experiment vaak herhaald wordt, nadert het gemiddelde aantal treffers altijd tot \(0,6\).
We voeren het experiment bij herhaling uit en volgen het verloop van het aantal treffers. Dan zal op den duur het percentage treffers zeer dicht in de buurt komen van de kans op een treffer.
Theoretische kansen
De kans op vijf ogen bij een worp met een dobbelsteen is \(\frac{1}{6}\).
De kans op kop bij een worp met een muntstuk is \(\frac{1}{2}\).
Een randomgenerator produceert de cijfers \(0\) t/m \(9\). De kans op het cijfer \(5\) is \(\frac{1}{10}\).
Bij een toevalsexperiment zijn er verschillende uitkomsten mogelijk. De totale kans van \(100\%\) is verdeeld over de verschillende uitkomsten. We spreken van een kansverdeling. Veronderstel dat er zeven uitkomsten mogelijk zijn. Als die gelijkwaardig zijn (gemiddeld even vaak voorkomen) zeggen we dat elk van die uitkomsten kans \(\frac{1}{7}\) heeft.
Simulaties
Soms is het ondoenlijk een experiment in werkelijkheid vaak uit te voeren. Om dan toch zicht te krijgen op de kansen maken we gebruik van simulatie. Dat wil zeggen dat we het experiment nabootsen. Hierbij kan de computer worden ingeschakend of de randomgenerator op de GR.
Rekenen met kansen
Een experiment wordt opgesplitst in deelexperimenten. We voeren het experiment in gedachten een groot aantal keren uit, zeg \(1600\) keer. In een stroomdiagram splitst dat aantal zich na elk deelexperiment. Bij elke splitsing vraag je je af: "hoe vaak mag ik verwachten dat de ene uitslag voorkomt, en hoe vaak de andere". Aan de toppen (de uiteinden) van het diagram kun je tellen hoe vaak je mag verwachten dat een speciale uitkomst optreedt.
Als bij elk deelexperiment de kans op G \(\frac{1}{4}\) is en op F \(\frac{3}{4}\), dan gaat de stroom als volgt:
Bij * lees je af dat je \(225\) keer het resultaat "2G en 1F" mag verwachten.
De kans op 2G en 1F is \(\frac{{225}}{{1600}} = \frac{9}{{64}}\).
Je hoeft niet een (geschikt) aantal experimenten te kiezen om in het stroomdiagram te beginnen. Je kunt ook rekenen met de fracties (kansen) langs de wegen van het diagram. In het voorbeeld wordt dat zoals hieronder.
De kans op het resultaat * laat zich als volgt berekenen:
\(\frac{1}{4} \cdot \frac{1}{4} \cdot \frac{3}{4} + \frac{1}{4} \cdot \frac{3}{4} \cdot \frac{1}{4} + \frac{3}{4} \cdot \frac{1}{4} \cdot \frac{1}{4} = \frac{9}{{64}}\).
Bij een kansexperiment geldt: de som van de kansen op alle mogelijke uitkomsten gelijk aan \(\bf 1\).
Als bij een kansexperiment bijvoorbeeld de mogelijke uitkomsten \(7\), \(8\), \(9\), \(10\) en \(11\) zijn, dan is het volgende vaak handig:
-
de kans op minstens waarde \(8 = 1 −\) de kans op waarde \(7\),
-
de kans op hoogstens waarde \(10 = 1 −\) de kans op waarde \(11\).
Voorwaardelijke kansen
In een groep van \(20\) jongens en \(10\) meisjes komt een eigenschap voor bij \(12\) jongens en \(4\) meisjes.
Dan lezen we uit de tabel af dat:
-
\(\frac{{12}}{{20}} \cdot 100\% = 60\% \) van de jongens die eigenschap heeft,
-
\(\frac{{12}}{{16}} \cdot 100\% = 75\%\) van de mensen met die eigenschap jongen is.
Met kansen zeggen we het zó:
-
de kans dat een jongen die eigenschap heeft is \(\text P\)(eigenschap | jongen) \(=0,6\),
-
de kans dat de drager van de eigenschap een jongen is, is \(\text P\)(jongen | eigenschap) \(=0,75\).
Men spreekt hier van voorwaardelijke kansen; de voorwaarden zijn “jongen” respectievelijk “eigenschap”.