Theorie Bayes

Inleiding

De 18e eeuwse dominee Thomas Bayes was een stevige gokker. Hij wilde dan ook graag weten hoe groot de kans op een hoge score was bij het gooien met de dobbelstenen. En dan vooral wanneer hij al wist welke worpen er geweest waren.

Zijn idee was dat als er bijvoorbeeld vijfmaal achter elkaar een zes gegooid was, de kans op wéér een zes wel erg klein zou moeten zijn. Dus hij zocht naar de kans op een zes onder de voorwaarde dat er al een rijtje van vijf zessen gegooid was. We noemen dat een voorwaardelijke kans. Op zoek naar de oplossing voor zijn probleem ontdekte hij een mooie wiskundige theorie, waarmee we kunnen laten zien hoe een juiste toepassing verrassende inzichten oplevert.

Om je te laten zien hoe je de regel van Bayes kunt toepassen kijken we nu eerst naar een paar andere voorbeelden: dobbelen, wintersport, ongelukje en een toepassing van de regel van Bayes op het quizmasterprobleem.

Wat is de oplossing van het Quizmasterprobleem? Hoe houd je rekening met de betrouwbaarheid van een getuigenverklaring?

Je maakt in dit werkdocument een aantal opdrachten en je moet je antwoorden en berekeningen op je werkblad noteren.

Quizmaster

Je staat in de finale van een spelshow. Je wordt meegenomen naar een wand met drie gesloten deuren. Achter één van de deuren staat een prachtige auto, achter de andere twee deuren staat niets. De quizmaster vraagt je voor een van de deuren te gaan staan. Om de spanning op te voeren, opent de quizmaster, die weet achter welke deur de auto staat, een van de twee overgebleven deuren waarachter niets staat. Vervolgens geeft de quizmaster jou de mogelijkheid om over te lopen naar de andere dichte deur.

Activiteit

2. Wat doe je: verander je van keus of blijf je staan? Leg je keuze uit.

In de wiskunde zijn er maar weinig problemen die zoveel stof hebben doen opwaaien als deze vraag. In het Amerikaanse tijdschrift Parade Magazine schreef Marilyn Vos Savant erover in haar column 'AskMarilyn'. Zij schreef dat de kans om de auto te winnen twee keer zo groot is als de kandidaat wisselt van deur. Haar redenering is schematisch weergegevenin figuur 1.

Figuur 1. De drie mogelijke scenario's van het spelverloop bij wisselen van deur, als de auto achter deur A staat. De scenario's 2 en 3 leiden allebei tot het winnen van de auto, alleen bij scenario 1 leidt wisselen tot het winnen van niets. De kans op het winnen van de auto bij wisselen van deur is dus gelijk aan 2/3.

Vos Savant, die in het Guinness Book of Records wordt vermeld als de vrouw met het hoogste IQ: 228, maakte met haar redenering een storm van protest los. Bij de redactie van Parade Magazine kwam de ene brief na de andere binnen, onder andere van hoogleraren wiskunde. De meest lezenswaardige brieven werden geplaatst in volgende nummers van Parade Magazine. Het merendeel van de brievenschrijvers was van mening dat wisselen van deur niets uithaalt: blijven staan voor je eerste keus of wisselen van deur zouden allebei kans 1/2 hebben op het winnen van de auto. Lezers maakten Vos Savant uit voor stommeling en stelden dat het er niets toe deed of de kandidaat zou wisselen van deur.

Activiteit

In de formulering van het drie-deuren-probleem wordt nadrukkelijk vermeld dat de quizmaster weet achter welke deur de auto staat. De quizmaster handelt dus met voorkennis: van de twee overgebleven deuren opent hij bewust een deur waarachter niets staat. Voor de strategie die de kandidaat volgt, is dit een belangrijk gegeven.

3. Als de quizmaster een deur opent waarachter niets staat, geeft deze informatie dan een verdubbeling van de winstkans als de kandidaat wisselt van deur? Leg je antwoord uit.

 

Je ziet dat je dit probleem kunt oplossen door de mogelijkheden in een plaatje te laten zien. Als er meer zaken een rol spelen, zoals bij een ingewikkelde rechtszaak kun je beter gebruik maken van de wiskunde. Daarvoor moet je dan wel heel precies alle mogelijkheden en kansen nauwkeurig beschrijven en dan de wiskundige berekening uitvoeren.

We zullen straks laten zien dat je dit quizmasterprobleem ook kunt oplossen met de regel van Bayes.

Activiteit

Je kunt jezelf ook laten overtuigen door dit drie-deuren probleem een aantal keren uit te voeren met de volgende applet, maar of dat een echt bewijs is?

http://www.stat.sc.edu/~west/javahtml/LetsMakeaDeal.html

4. Probeer een aantal keren of je een prijs gewonnen hebt of niet. Bedenk wel eerst hoeveel keer proberen jij wel overtuigend vindt. Hoeveel keer is dat? Hoe vaak heb je gewonnen?

 

Dobbelen

Iemand die na een aantal rondjes bij Mens-erger-je-niet nog steeds niet in het spel is, omdat hij nog geen zes heeft gegooid, twijfelt aan de dobbelsteen. De statisticus geeft aan dat er een bepaalde kans is om 20 x achter elkaar geen zes te gooien. Die kans is klein, maar niet 0….

Hoe zit het bij de kans op twee gebeurtenissen?
Dat hangt er vanaf, of de gebeurtenissen onafhankelijk van elkaar optreden of niet. De twee worpen met een dobbelsteen zijn onafhankelijke gebeurtenissen. De eerste worp heeft geen invloed op de uitkomst van de tweede. De kans op een bepaalde gebeurtenis heet dan een onvoorwaardelijke kans.

Activiteit

5. Hoe groot is de kans om geen zes te gooien, in formule P(geen zes)? Hoe groot is de kans om 2 x achter elkaar geen zes te gooien? En de kans dat dit mij 20 x achter elkaar overkomt?

 

Wintersport

Van de jongeren die op wintersport gaan (20% van de jongeren), komt 1% terug met minstens één been in het gips.
Nu zijn de gebeurtenissen niet onafhankelijk! De jongeren op wintersport hebben een veel grotere kans op een botbreuk dan de jongeren die thuisblijven. We noemen P(A) de kans voor een jongere om op wintersport te gaan. P(B) is de kans om in het gips te belanden met een botbreuk. Maar P(B) weten we niet, die geldt voor iedereen! We weten alleen de kans dat als een jongere op wintersport gaat, de kans 0,01 is dat hij of zij een bot breekt. Deze 0,01 is dus een voorwaardelijke kans. Dan zeggen we: P(B|A) = 0,01. Je kunt dit lezen als: dekans op B, onder de voorwaarde dat A optreedt, is 0,01.

Activiteit

7. a Hoe zeg je dat in woorden: P(A|B)?
b Als je nu weet dat P(A) = 0,2 en dat P(B|A) = 0,01, kun je dan iets zinnigs zeggen over P(A|B)?
Gebruik de onderstaande kanstabel met 1000 jongeren.

 

 

Wintersport

Gips

 

Ja

Nee

 

 

Ja

2

 

 

 

Nee

198

 

 

 

 

200

800

1000


De onvoorwaardelijke kans P(B) (dus een kans zonder dat daar een voorwaarde voor geldt) wordt wel de a priori kans genoemd en de voorwaardelijke kans P(B|A) de a posteriori kans, dat wil zeggen: de kans op B, nadat we de extra informatie A hebben gekregen.

Ongelukje

Bij een aanrijding was volgens een getuige een blauwe taxi betrokken en doorgereden. Dat het een taxi was, is wel zeker, maar over de kleur twijfelt de politie nog. Bij navraag blijkt, dat in de stad 85% van de taxi's geel is en slechts 15% blauw. Zonder de extra informatie van de getuige moet de politie ervan uitgaan, dat de kans 15% is, dat de taxi blauw was. De betrouwbaarheid van de getuige wordt op 80% geschat, dat wil zeggen, dat hij in 80 van de 100 gevallen een juiste verklaring pleegt af te leggen. Die extra informatie maakt, dat de kans dat de taxi blauw was aanzienlijk toeneemt, maar niet tot 80%. Als B = "de taxi was blauw" en A = "de getuige zegt dat de taxi blauw was", dan is de a priori kans, dat de taxi blauw was P(B) = 0.15 en dus P(niet B)=0.85
We schrijven de kans niet B ook wel zo:

De a posteriori kans, dat de getuige zegt, dat de taxi blauw is, als hij dat ook werkelijk is, is = 0.8 en de kans, dat hij dat zegt, als de taxi geel is, is = 0.2 De kans, dat de taxi blauw is, is nadat de politie de informatie van de getuige heeft verkregen kan nu worden uitgerekend met de regel van Bayes.

Bayes

De regel luidt:

Om de kans op B als de kans op bewijs A al gegeven is te berekenen, vermenigvuldig je dus a priori kans op B met de verhouding van de voorwaardelijke kans op het bewijs A, gedeeld door de a priori kans op het bewijs A.
Waarin voor de a priori kans op A geldt:


Activiteit

8. Wat is jouw conclusie? Is de informatie van de getuige waardevol genoeg voor een verder onderzoek of zelfs een veroordeling? Leg uit.?


Activiteit

9. Natuurlijk mag je niet door 0 delen, dus P(A) moet ongelijk aan 0 zijn. Wat betekent dat in woorden??


?

Bayes in de quiz

Het Quizmasterprobleem

Een toepassing van de regel van Bayes vind je bij de wiskundige oplossing van het quizmasterprobleem. Het moeilijke is nu om precies te formuleren welke kansen je op moet nemen in de regel van Bayes. Je zult zien dat je de kennis van de quizmaster (die immers weet achter welke deur de prijs is verborgen) moet gebruiken. Dat doe je door op het goede moment uit te gaan van het standpunt van de quizmaster!

 

Nu je hebt gezien hoe de regel van Bayes toegepast wordt kijken we nog eens naar het drie-deuren-probleem . Daarvoor moeten we weer de kansen en mogelijkheden heel precies opschrijven en daarna de voorwaardelijke kans volgens de regel van Bayes uitwerken.
De a priori kans op een prijs P(Prijs) is 1/3, want achter elke deur kan de prijs staan.
We noemen de deur die jij kiest deur 1. We noemen de deur die de quizmaster aanwijst deur 3. De deur die je nu nog kan kiezen noemen we deur 2.
De kans dat de prijs achter deur 1 ligt, als je weet dat er achter deur 3 niets ligt (de quizmaster heeft die deur namelijk geopend) is:

Kijk als je wilt naar deze Engelse uitleg:

Bayes' theorem

Krantenbericht

Klik voor vergroting
Klik voor vergroting
Klik voor vergroting
Klik voor vergroting

Activiteit

10. Werk het rekenprobleem dat Ionica in het artikel oplost, uit met de regel van Bayes. Volg daarvoor de stappen die we hebben gemaakt in het voorbeeld van Ongelukje. Kom je op hetzelfde uit als Ionica?


  • Het arrangement Theorie Bayes is gemaakt met Wikiwijs van Kennisnet. Wikiwijs is hét onderwijsplatform waar je leermiddelen zoekt, maakt en deelt.

    Auteurs
    Bètapartners Je moet eerst inloggen om feedback aan de auteur te kunnen geven.
    Laatst gewijzigd
    2014-11-16 16:52:16
    Licentie

    Dit lesmateriaal is gepubliceerd onder de Creative Commons Naamsvermelding-GelijkDelen 3.0 Nederland licentie. Dit houdt in dat je onder de voorwaarde van naamsvermelding en publicatie onder dezelfde licentie vrij bent om:

    • het werk te delen - te kopiëren, te verspreiden en door te geven via elk medium of bestandsformaat
    • het werk te bewerken - te remixen, te veranderen en afgeleide werken te maken
    • voor alle doeleinden, inclusief commerciële doeleinden.

    Meer informatie over de CC Naamsvermelding-GelijkDelen 3.0 Nederland licentie.

    Dit materiaal is achtereenvolgens ontwikkeld  en getest in een SURF-project  (2008-2011: e-klassen als voertuig voor aansluiting VO-HO) en een IIO-project (2011-2015: e-klassen&PAL-student).  In het SURF project zijn in samenwerking met vakdocenten van VO-scholen, universiteiten en hogescholen e-modules ontwikkeld voor Informatica, Wiskunde D en NLT.  In het IIO-project (Innovatie Impuls Onderwijs) zijn in zo’n samenwerking modules ontwikkeld voor de vakken Biologie, Natuurkunde en Scheikunde (bovenbouw havo/vwo).  Meer dan 40 scholen waren bij deze ontwikkeling betrokken.

    Organisatie en begeleiding van uitvoering en ontwikkeling is gecoördineerd vanuit Bètapartners/Its Academy, een samenwerkingsverband tussen scholen en vervolgopleidingen. Zie ook www.itsacademy.nl

    De auteurs hebben bij de ontwikkeling van de module gebruik gemaakt van materiaal van derden en daarvoor toestemming verkregen. Bij het achterhalen en voldoen van de rechten op teksten, illustraties, en andere gegevens is de grootst mogelijke zorgvuldigheid betracht. Mochten er desondanks personen of instanties zijn die rechten menen te kunnen doen gelden op tekstgedeeltes, illustraties, enz. van een module, dan worden zij verzocht zich in verbinding te stellen met de programmamanager van de Its Academy (zie website). 

    Gebruiksvoorwaarden:  creative commons cc-by sa 3.0

    Handleidingen, toetsen en achtergrondmateriaal zijn voor docenten verkrijgbaar via de bètasteunpunten.

     

    Aanvullende informatie over dit lesmateriaal

    Van dit lesmateriaal is de volgende aanvullende informatie beschikbaar:

    Toelichting
    Deze les maakt onderdeel uit van de e-klas 'Forensisch onderzoek' voor havo 4 en 5 voor het vak NLT.
    Leerniveau
    HAVO 4; HAVO 5;
    Leerinhoud en doelen
    Natuur, leven en technologie;
    Eindgebruiker
    leerling/student
    Moeilijkheidsgraad
    gemiddeld
    Trefwoorden
    e-klassen rearrangeerbaar

    Bronnen

    Bron Type
    https://youtu.be/SQA1djyIjHE?rel=0
    https://youtu.be/SQA1djyIjHE?rel=0
    Video
    Bayes' theorem
    https://youtu.be/pPTLK5hFGnQ?rel=0
    Video