Didactiek van statistiek

Didactiek van statistiek

1. Inleiding

Statistiek neemt niet alleen een steeds belangrijker plaats in zowel in de samenleving als in het wiskundeonderwijs, ook is het een vakgebied waarin misverstanden op de loer liggen. Denk aan het beroemde boekje van Huff uit 1954 met de fraaie titel 'How to lie with statistics'!

Deze module didactiek van de statistiek heeft een dubbele insteek. Statistiek is een vak waarmee je vanzelf te maken krijgt, in de samenleving, via berichten in de media, in veel opleidingen en in een aantal beroepspraktijken. Het vertrekpunt daarbij zijn data uit  metingen, steekproeven, vragenlijsten. De eerste insteek is dan hoe je als burger, als student, als beroepsbeoefenaar omgaat met die informatie. Hoe maak je daar op een verstandige manier chocola van? Daarvoor moet je data overzichtelijk kunnen interpreteren en beschrijven. Data beschrijven, de beschrijvende statistiek, die in de onderbouw aan de orde komt, en de ‘statistical literacy’ die daarbij komt kijken, vormen de eerste insteek van deze module.

De tweede insteek is het overstijgen van de data, de verklarende statistiek. Want conclusies over je steekproefgegevens wil je graag extrapoleren naar een grotere populatie. Je weet nooit zeker of zo’n extrapolatie klopt, maar je kunt wel iets zeggen over de waarschijnlijkheid van je methode. Daarvoor heb je kansmodellen nodig, die je als het ware over de data legt. Dat leidt tot 95%-betrouwbaarheidsintervallen, of tot 1% significantie of tot het verwerpen van een hypothese. Maar wat betekent dat nu eigenlijk precies? Hoe ziet dat schaakspel met kansen en data, met steekproef en populatie, met model en realiteit, er nu eigenlijk precies uit? Welke valkuilen zijn er en hoe ga je daarmee om in de klas? Daarop gaan we antwoorden zoeken.

Paul Drijvers licht het in de volgende video kort toe.

2. Data beschrijven

De kern van de module betreft de thema’s data beschrijven en data overstijgen. Bij data beschrijven wordt allereerst aandacht besteed aan de verschillende manieren om data in beeld te brengen (2.1). Het is goed om (aanstaande) docenten met verschillende vormen van datarepresentatie in aanraking te brengen, omdat immers in media ook steeds orginelere en meer diverse grafische representaties worden gebruikt. Vervolgens komt het begrip meetniveau aan de orde (2.2). Het meetniveau  van een variabele is bepalend voor het type statistische technieken dat kan worden gebruikt maar blijft in statistiekonderwijs vaak onderbelicht. Het derde onderwerp is statistische geletterdheid (2.3), het onderliggende begrip waarmee de statistische vaardigheid van de 'geletterde burger' wel wordt aangeduid. Ten slotte is een discussieopdracht toegevoegd n.a.v. een discussie op Facebook waarin verschillende (mis)concepten aan bod komen (2.4).

2.1 Data in beeld brengen

Een manier om statistische data overzichtelijk weer te geven is om er een plaatje van te maken. Datavisualisatie is een belangrijke vorm van datareductie, ook voor bijvoorbeeld communicatieve doelen. Daarom zie je in media dan ook in toenemende mate statistische plaatjes van allerlei soorten en typen. Ze zien er vaak heel "flashy" uit. Maar wat betekenen ze precies en hoe kun je data optimaal in beeld brengen?

De Zweed Hans Rosling heeft hierover een aantal interessante TEDtalks gegeven (met daarbij onze kijktips):

  • 2006: The best stats you've ever seen
  • 2009: Let my dataset change your mindset
    Kijktip: ga met name na waarom goede statistische representaties belangrijk zijn.
  • 2010: The good news of the decade? We're winning the war against child mortality
    Kijktip: bekijk met name het stuk over millenniumdoelen, 10:59 - 12:38.
  • 2014: How not to be ignorant about the world (samen met zoon Ola)
    Kijktip: het stuk over hoe je vooroordelen kunt onderkennen, 9:30 - 16:30.

Opdracht

  1. Bekijk een aantal van de hierboven beschreven videos en in elk geval het stuk TEDlezing uit 2010 over de millenniumdoelen (10:59 - 12:38).
  2. Met gapminder zijn prachtige statistieken in beeld te brengen. Met deze tool kunnen op inzichtelijke manier gegevens worden vergeleken. Bedenk zelf een onderzoeksvraag en bestudeer deze met deze tool
  3. Vergelijk twee landen met gapminder en trek conclusies uit deze vergelijking.
  4. Verwerk je ervaringen met de opdrachten 1-2-3 in vergelijkbare opdrachten die je leerlingen uit het voortgezet onderwijs zou willen geven. Formuleer de opdracht, en ook de doelgroep (klas, niveau) en het leerdoel.

2.2 Meetniveaus

Begrippenkader

(hier als Word-document beschikbaar)

Als je onderzoek doet, maak je gebruik van gegevens ofwel data. Alle gegevens samen vormen de dataset. Met de huidige technieken en communicatiemiddelen beschikken we al snel over heel grote datasets: big data.

Bij een onderzoek staat een onderzoeksvraag centraal. Vaak is het mogelijk die onderzoeksvraag te vertalen naar het meten van een aantal variabelen. De variabele is kenmerkend voor de eigenschap of karakteristiek die voor het onderzoek van belang is. Een variabele kan kwantitatief of kwalitatief zijn.

Voorbeeld

We willen onderzoeken welke klas de leerstof van het hoofdstuk ‘Evenredigheden’ beter beheerst: klas 2A of klas 2B. We gaan daartoe de proefwerkcijfers van dat hoofdstuk vergelijken. We gebruiken hier dus de variabele ‘proefwerkcijfer’. Deze variabele is kwantitatief.

De docent heeft bij het afnemen van het proefwerk ook gevraagd of de leerlingen het hoofdstuk lastig vonden. Deze variabele kun je de ‘ervaren moeilijkheid’ noemen en is kwalitatief. Om de resultaten op deze vraag te kunnen verwerken, heeft de docent zijn leerlingen antwoorden laten aankruisen van 1 (makkelijk) tot en met 4 (moeilijk). Hij heeft zodoende de variabele ‘ervaren moeilijkheid’ gekwantificeerd: de mogelijke meetwaarden zijn 1, 2, 3 en 4.

 

Onder meetwaarde verstaan we de uitkomsten van een variabele, die zijn toegestaan.

Voorbeeld

De meetwaarden van de variabele ‘proefwerkcijfer’ zijn alle cijfers, die een leerling kan behalen, in Nederland meestal van 1,0 tot en met 10,0 (in stapjes van 0,1), in Duitsland van 5,0 tot en met 1,0.

De meetwaarden van de variabele ‘ervaren moeilijkheid’ zijn in het voorbeeld geworden: 1, 2, 3, 4.

Variabelen zijn op basis van hun meetwaarden in vier categorieën te verdelen. Die categorieën worden meetniveaus of meetschalen genoemd.

1.       Nominaal

2.       Ordinaal

3.       Interval

4.       Ratio

Een handig ezelsbruggetje voor de vier meetschalen is: N-O-I-R, het Franse woord voor zwart.

Meetniveaus en busterminal

Een mooi voorbeeld van nominaal meetniveau. Theo van den Bogaart legt in dit filmpje uit dat busnummers van nominaal meetniveau zijn.

Meetniveaus en KNMI

(hieronder beschikbaar als Word-document)

Het KNMI doet allerlei metingen die op het weer betrekking hebben. In onderstaand filmpje bespreken Jop Schaap en Marcel Voorhoeve welk meetniveau bij diverse metingen een rol spelen:

- type neerslag (regen, sneeuw, droog, .. dus nominaal)

- bewolking (onbewolkt, ...., geheel bewolkt, ... dus ordinaal)

- temperatuur in graden Celsius (interval)

- luchtdruk in (milli)bar (ratio)

Het filmpje geeft aanleiding tot diverse vragen:

1. Welke metingen worden besproken? Omschrijf steeds de variabele (met bijbehorende eenheid) en het meetniveau.

2. Windkracht wordt gemeten in Beaufort. Onderzoek hoe de schaal van Beaufort is vastgelegd. Van welke meetschaal is hier sprake?

3. Ook het zicht wordt door het KNMI gemeten. Zowel op het land (denk aan het verkeer) als op zee zijn deze metingen van belang. Onderzoek hoe het zicht wordt gemeten en welke meetwaarden hiervoor gebruikt worden. Van welk meetniveau is hier sprake?

Open bestand Opdracht bij meetniveaus

Vier meetniveaus

Paul Drijvers bespreekt met Marcel Voorhoeve de vier meetniveaus, waarbij in beeld wordt gebracht wat de verschillen zijn met betrekking tot ordening, verschillen tussen meetwaarden (wel of niet betekenisvol) en of verhoudingen en daarmee het nulpunt betekenis hebben. N.a.v. dit filmpje zijn er verwerkingsopdrachten beschikbaar.

Socrative quiz meetniveaus

Een serie vragen waar steeds bepaald moet worden van welk meetniveau er sprake is. De vragen zijn hier in te zien en kunnen als Socrative quiz worden afgenomen. Ga dan naar socrative.com, log in als teacher en kies de quiz met code SOC-17385490 (naam: Cijfers en prognoses: meetniveaus).

Bij elke vraag wordt uitleg gegeven over het antwoord.

2.3 Statistical literacy

Waarom statistiekonderwijs?

Het doel van statistiekonderwijs is niet zozeer het opleiden van toekomstige statistici, maar eerder het bevorderen dat iedere toekomstige burger in staat is om statistische informatie verstandig en kritisch te beoordelen en daaruit eigen conclusies te trekken. Een centraal begrip in deze kijk op de doelen van statistiekonderwijs is statistical literacy, dat wel als volgt wordt gedefinieerd:

It is proposed here that in this context, the term 'statistical literacy' refers broadly to two interrelated components, primarily (a) people's ability to interpret and critically evaluate statistical information, data-related arguments, or stochastic phenomena, which they may encounter in diverse contexts, and when relevant (b) their ability to discuss or communicate their reactions to such statistical information, such as their understanding of the meaning of the information, their opinions about the implications of this information, or their concerns regarding the acceptability of given conclusions. These capabilities and behaviors do not stand on their own but are founded on several interrelated knowledge bases and dispositions which are discussed in this paper. (Gal, 2002, p.2-3)

Leesopdracht statistical literacy

Inleiding

Deze leesopdracht gaat over een bekend engelstalig artikel over statistical literacy. We proberen je eerst handvatten te bieden om de kern er op een efficiënte manier uit te halen. Daarna volgt een korte verwerkingsopdracht. Het gaat om het volgende artikel:

Wild, C. J., & Pfannkuch, M. (1999). Statistical thinking in empirical enquiry. International Statistics Review, 67, 223-265.

Handvatten om de kern eruit te halen

Op de volgende manier zou je het bestuderen van dit artikel in het kader van deze module kunnen aanpakken.

  • Blader het artikel door en lees de titels van de paragrafen. Wat valt je op bij het doorbladeren? De opbouw is Summary – Introduction – Framework - Variation, Randomness and Statistical Models – Thinking tools – Discussion; het begin daarvan, de summary en de introduction, is de klassieke start van dit soort artikelen uit de wereld van het onderwijsonderzoek.
  • Lees de Summary aandachtig door. Geeft je dit een idee van de globale inhoud van het artikel? Kennelijk staat het hele statistische traject van probleem tot conclusie centraal; dat kennen we al van de statistische cyclus van Van Streun, Zwaneveld en Drijvers hierboven. Er komt kennelijk een vierdimensionaal framework voor statistisch denken en het begrip variabiliteit staat daarbij centraal.
  • Paragraaf 1 is voor het doel van deze module minder belangrijk. Cruciaal daarentegen is paragraaf 2.1., waarin de PPDAC onderzoekscyclus wordt beschreven. De afkorting staat voor Problem, Plan, Data, Analysis, Conclusions. Lees 2.1 dus goed. Hoe verhoudt deze cyclus zich tot die van het hoofdstuk dat hierboven is beschreven?

 

 

 

 

 

 

 

 

 

  •  
  •  
  •  
  •  
  •  

 

  • Paragraaf 2.2.1 gaat over de fundamenten van statistisch denken. Ook dit is een belangrijke paragraaf om goed te lezen. Samen met het model van het vorige punt vormt dit de kern van het artikel in het kader van deze module.

  • Paragrafen 2.2.2 en 2.3 en 3 sluiten minder aan bij de doelstellingen van deze modules en zijn daarom minder belangrijk. Paragraaf 4 over Thinking tools is interessant, ook met het oog op het denkactiever maken van de statistieklessen.
  • In paragraaf 5 is Figuur 10 interessant, omdat het de te nemen stappen bij het verzamelen van meetgegevens expliciet maakt, inclusief mogelijke problemen.

Verwerkingsopdracht

Bedenk een drietal vragen die je aan medestudenten zou kunnen stellen, nadat ze het artikel hebben bestudeerd, om na te gaan of ze de essentie ervan hebben begrepen. Beantwoord zelf ook deze drie vragen.

Stel je voor dat je de auteurs van dit artikel zou kunnen interviewen en bedenk drie vragen die je aan hen zou willen stellen. Bespreek deze vragen en mogelijke antwoorden met medestudenten.

 

Leesopdracht statistische cyclus

Inleiding

Deze leesopdracht gaat over de statistische cyclus, die centraal staat in het hoofdstuk over statistiek in het Handboek Wiskundedidactiek. We proberen je eerst handvatten te bieden om de kern van dit hoofdstuk er op een efficiënte manier uit te halen. Daarna volgt een korte verwerkingsopdracht. Het gaat om het volgende hoofdstuk:

Van Streun, A., Zwaneveld, B., & Drijvers, P. (2012). Statistiek. In P. Drijvers, A., van Streun, & B. Zwaneveld (Red.), Handboek Wiskundedidactiek (pp. 205-234). Utrecht: Epsilon.

Handvatten om de kern eruit te halen

Op de volgende manier zou je het bestuderen van dit artikel in het kader van deze module kunnen aanpakken.

  • Blader het hoofdstuk in hoogstens 10 minuten door en lees de titels van de paragrafen 7.1, 7.2, .... Wat valt je op bij het doorbladeren? De opbouw van het hoofdstuk (Oriëntatie, Probleemstelling, Probleemverkenning, Wat we al weten, Ontwerpen,  Conclusie)  wordt in alle hoofdstukken van het boek gevolgd.
  • Lees de paragrafen 7.1 en 7.2 in detail. In 7.1 wordt het kader geschetst en in 7.2 wordt als centrale vraag geformuleerd: hoe kunnen leerlingen de stap van steekproef naar populatie zetten?
  • In 7.3 wordt het probleem verkend. Voor deze module is met name 7.3.2 van belang. Bestudeer deze paragraaf. Daarin wordt een aantal mogelijke valkuilen beschreven bij de overgang van steekproef naar populatie. Herken je deze uit je lespraktijk? Paragrafen 7.3.1 en 7.3.3 zijn voor deze module minder van belang.
  • Paragraaf 7.4 is de meest theoretische van het hoofdstuk. De kern is de cyclus die wordt beschreven in 7.4.2. Lees dus deze paragraaf nauwkeurig; dit is het zwaartepunt van het hoofdstuk. Misschien komt het plaatje in Figuur 7.3 je wel bekend voor: ook modelleren wordt vaak met een dergelijke cyclus beschreven. Als je behoefte hebt aan een uitgewerkt voorbeeld, lees dan ook 7.4.3; als de cyclus voldoende helder is, is dit niet nodig.

  • Paragraaf 7.5 gaat over het ontwerpen van lessen. In 7.5.1 wordt het voorbeeld van de lichaamslengte van meisjes uit Zeeland uitgebreid besproken. Belangrijker is 7.5.2, en lees met name de handvatten 1 t/m 8 aan het einde daarvan.
  • In 7.6 wordt een en ander nog eens samengevat. Is aardig om te lezen, maar niet strikt noodzakelijk.
  • Het hoofdstuk sluit af met een aantal noten. Lees met name noot 4 over de meetniveau’s, die in deze module een belangrijke rol spelen.

 

Verwerkingsopdracht

Maak een presentatie van 15 minuten waarin je de kern van dit hoofdstuk presenteert aan medestudenten of docenten die het niet hebbe gelezen. Leg de nadruk op de bruikbaarheid van de inhoud voor het statistiekonderwijs in de klas.

Opdracht verschillende statistische cycli

Bekijk de drie afbeeldingen van de statitische cyclus en bespreek de overeenkomsten en verschillen.

 

Bron: Wild, C. J., & Pfannkuch, M. (1999). Statistical thinking in empirical enquiry. International Statistics Review, 67, 223-265.

Bron: presentatie Sharleen Forbes, Statistics New Zealand, Victoria University, dia 10, http://slideplayer.com/slide/7083971/

Bron: Van Streun, A., Zwaneveld, B., & Drijvers, P. (2012). Statistiek. In P. Drijvers, A., van Streun, & B. Zwaneveld (Red.), Handboek Wiskundedidactiek (pp. 205-234). Utrecht: Epsilon.

2.4 Discussieopdracht standaarddeviatie

Open bestand Discussie Facebook (jan. 2017)

Open bestand Opdracht bij facebookdiscussie

Hierboven staat een discussie uit de (besloten) Facebookgroep Leraar Wiskunde (geraadpleegd 18 januari 2017).

Bestudeer de vraag van de discussiestarter en de antwoorden die worden gegeven.

Bespreek met je medestudenten de volgende vragen:

  1. A stelt dat de grafiek rechtsscheef is. Wat betekent dat? Hoe kan je dat (snel) zien?
  2. A stelt dat het gemiddelde 2,13 is. Welke berekening leidt tot deze waarde? Is de gemiddelde grootte van huishoudens  2,13? Wat vind je van het aantal significnte cijfers?
  3. De reacties door B, D en I spreken over de 68%-regel. Fris nog even op wat deze regel precies is. In hoeverre is deze regel van toepassing? In hoeverre is deze regel bruikbaar? Wat vind je ervan als en leerling op deze vraag een toelichting geeft waarbij hij gebruik maakt van de 68%-regel?
  4. G en H voeren een discussie over de implicaties van de gehele getallen. Bedenk welke argumenten mogelijk een rol spelen. Heb je een uitgesproken idee of standaarddeviatie en gemiddelde van toepassing zijn bij discrete meetwaarden?
  5. A heeft er schijnbaar spijt van deze opgave in het SE gestopt te hebben (citaat: "dom, het leek zo simpel"). Kan je inschatten waarom A spijt heeft van het selecteren van deze opgave? Zou je zelf deze opgave willen gebruiken in jouw toets? Hoe zou je de opgave eventueel aanpassen?
  6. Je hebt hier een discussie in een Facebookgroep bekeken. Is dit voor jou een bruikbaar medium? In welke gevallen zou je hiervan gebruik maken en in welke gevallen juist niet?

3. Data overstijgen

De kern van de module betreft de thema’s data beschrijven en data overstijgen. Bij data overstijgen gaat om het beantwoorden van onderzoeksvragen over de hele populatie aan de hand van data van een steekproef. Daarbij kan het van belang zijn de begrippen causaliteit en correlatie te kennen en te kunnen onderscheiden (3.1). Het gebruik van de normale verdeling en het trekken van conclusies bij het toetsen van hypotheses (NHST) vraagt, naast kennis van deze concepten, om een kritische houding van de gebruiker. Het statistiekonderwijs kan bijdragen aan zo'n kritische houding en aan een kijk op de bruikbaarheid en de beperkingen van NHST (3.2). Dit geldt ook voor het formuleren van conclusies aan de hand van betrouwbaarheidsintervallen (3.3). In scholen zijn leerlingresultaten (zoals eindexamencijfers) veel geanalyseerde datasets. Een statistiekopdracht waarin een kritische kijk wordt gevraagd op de Wolfrapportages staat in 3.4.

3.1 Correlatie en causaliteit

Bekijk de onderstaande video van Ionica Smeets over de verwarring tussen correlatie en causaliteit.

Eventueel kun je nog (delen van) het interview met Richard Nisbett bekijken.

Bestudeer de pdf over het PISA2012 onderzoek, waarin wordt aangegeven hoe de resultaten aanleiding zijn voor de media om te stellen dat het gebruik van computers leidt tot lagere prestaties in het onderwijs.

Open bestand Powerpoint over correlatie en causaliteit in de media rond PISA2012

Opdracht Correlatie en causaliteit

In de video’s heb je een aantal voorbeelden gezien van wat we C3 noemen: de Correlatie - Causaliteit - Confusion. Maak nu de volgende opdrachten.

  1. Wat is nu eigenlijk precies het probleem in de presentatie over PISA2012? Wat zouden oorzaken kunnen zijn van de negatieve correlaties op de laatste dia?
  2. Ga na hoe je ook al weer een correlatiecoëfficiënt berekent. Hoe kun je aan de formule ervoor zien dat de correlatiecoëfficiënt tussen variabele A en variabele B gelijk is aan die tussen B en A, dus dat de volgorde niet uit maakt?
  3. Bedenk zelf een voorbeeld van C3, of zoek een aansprekend voorbeeld hiervan in media of in andere bronnen.
  4. Bedenk een manier om leerlingen hiermee aan het werk te zetten. Hoe zou je dit punt aan de orde kunnen stellen in, zeg, een les wiskunde A in een vwo-5 klas?

3.2 Kansen en significanties

In het filmpje 'Appelboom discussie' legt docent Jop in de docentenkamer aan collega Marcel zijn idee voor. Hij wil zijn klas laten nadenken over een toepassing van de normale verdeling in een praktijksituatie. In de discussie komen enkele problemen bij het modelleren van de appelboom-praktijksituatie naar de normale verdeling boven tafel:

- wordt de normaal verdeelde variabele het aantal appels of het gewicht ervan (of de massa?)

- is hier eigenlijk wel sprake van een normale verdeling?

- de variabele kan geen negatieve meetwaarden opleveren: wat is het gevolg voor het berekenen van kansen?

 

 

Opdracht ‘modelleren naar normale verdeling’

Bespreek met elkaar de volgende vragen:                              

  1. Vind je de context goed en geschikt? Waarom?
  2. Hoe zou jij dit voorbeeld inzetten om je leerlingen met de normale verdeling te laten werken?
  3. Welk advies zou jij je collega geven, als deze met dit idee bij jou feedback komt vragen?

Besteed bij de bespreking aandacht aan:

  1. het modelleren van de appelboom naar de normaal verdeelde kansvariabele (denk aan de discussie over aantal, massa en gewicht);
  2. het in het filmpje genoemde punt dat er geen negatieve aantallen en massa’s zijn;
  3. de vraag of hier sprake zal zijn van een normale verdeling;
  4. welke leerdoelen jullie hierbij van belang vinden.

Opdrachten significantie

Opdracht 1: Jelly beans en acne

Heeft het veel snoepen van die heerlijke jelly beans invloed op het ontstaan van jeugdpuistjes (acne)?

Bekijk de comic, waarin de resultaten worden weer van twintig onderzoeken met een significantie van 5% naar de invloed van jelly beans op acne.

a. Wat kun je zeggen over de waarschijnlijkheid van de uitslagen van deze twintig onderzoeken?

b. Geef in één zin de boodschap van deze comic weer.

 

Opdracht 2: Waarde van p-waarde

 

Er is nogal wat discussie over het toetsen van hypotheses, in de wetenschappelijke wereld ook wel NHST genoemd. Bekijk het artikel in Nature van 26-2-2015.

a. Waarvan is NHST de afkorting?

b. Welke argumenten tegen NHST worden in dit artikel genoemd?

c. En welke argumenten zijn er om deze statistische techniek wél in te zetten? En onder welke voorwaarden?

Opdracht 3:

In het overzicht van handouts en PowerPoints van lezingen en workshops tijdens de Nationale Wiskundedagen 2015 vind je een PowerPoint van Peter Grünwald over Paranormale Statistiek. Blader erdoorheen, nadat je het volgende hebt gelezen:

Peter Grünwald liet het publiek kiezen achter welk gordijn (links of rechts) een erotisch plaatje is te zien. De centrale vraag is: hoe vaak kiezen mensen het linker gordijn, hoe vaak het rechter?

a. Wat zegt Peter Grünwald over de uitkomst van wetenschappelijk onderzoek naar het keuzegedrag tussen deze twee gordijnen?

b. Zoek op Wikipedia uit, wat bedoeld wordt met publicatiebias en wat het verband is met het onderzoek naar de voorkeur voor linker of rechter gordijn.

c. Loop vanaf de laatste PP-sheet op blz. 3 de berekening na van Peter Grünwald tot en met de 4e dia op blz. 4. Is het van belang de significantie tevoren vast te stellen? Waarom?

Opgave examen vwo wiskunde A 2011

Zie hier voor de tekst in Word.

1. Ga naar https://www.examenblad.nl/examen/wiskunde-a-vwo/2011 en werk de opgave Remweg uit (vragen 18 t/m 22).

Vraag 22 (zie de tekst hieronder) gaat over de kans dat de autobanden van de heer Groenwold worden afgekeurd. Zie de onderstaande tekst. Over deze vraag is wat ophef ontstaan.

 

 

  1.  
  2.  
  3.  

 

2. Lees de reactie op vraag 22 op https://www.nrc.nl/nieuws/2011/05/28/nu-ook-al-op-het-vwo-wiskundedebilisering-12018372-a731754

3. Het argument is in feite dat niet van een kansmechanisme sprake is als het gaat om die ene specifieke auto van meneer Groenwold en de banden die daarop liggen. Bespreek dit argument met je medestudenten.

4. Verander de vraag bij het examen zodanig dat het bezwaar tegen de vraag wordt ondervangen.

3.3 Betrouwbaarheidsintervallen

Kwart getest vuurwerk onveilig (NRC, 22 dec 2016)

Open bestand Opdracht bij krantenartikel vuurwerk

Opdracht bij krantenartikel vuurwerk

Hieronder staan enkele denk- en discussie- en rekenvragen bij het krantenartikel over vuurwerk. De vragen zijn bedoeld om te verkennen in de vorm van een discussie, bepaal je eigen standpunt en bespreek met elkaar je overwegingen. Eventueel is de opdracht ook individueel uit te voeren.

1. lees het artikel en ga in discussie / formuleer een standpunt over de volgende stelling
- In 2016 was een kwart van het vuurwerk met een CE keurmerk onveilig

2. Uit het artikel blijkt dat er hier sprake is van een jaarlijks onderzoek. Neem aan dat de manier waarop de partijen vuurwerk die worden geselecteerd jaarlijks op eenzelfde manier tot stand komen en dat we evengoed kunnen spreken van een steekproef. Is dit een redelijke aanname? Ga hierover in discussie / formuleer een standpunt.

3. Laten we het vuurwerk dat ILT als risicovol beschouwt en mogelijk aan een onderzoek onderwerpt  een naam geven, bijvoorbeeld "risicovol CE-vuurwerk". In het artikel staat dat het gedeelte risiscovol vuurwerk dat is afgekeurd is toegenomen van 2015 tot 2016. Betekent dat ook dat het gedeelte risicovol vuurwerk dat niet aan de eisen op de markt ook is toegenomen? Waarom wel of waarom niet? Ga hierover in discussie / formuleer een standpunt.

4. In 2016 bleek dat -bij een steekproef va 250 stuks- een 25% van het risicovol CE-vuurwerk afgekeurd werd. De daadwerkelijke fractie van risicovol CE-vuurwerk dat niet in orde is is mogelijk iets meer of iets minder.

5. Het interval waarbinnen de daadwerkelijke fractie van risicovol CE-vuurwerk dat niet in orde is met enige redelijkheid moet liggen heet het 95%-betrouwbaarheidsinterval. Bereken dit interval met de gegevens van 2016: steekproefgrootte 250, waarvan een kwart werk afgekeurd.

6. Bereken het 95%-betrouwbaarheidsinterval voor de gegevens van 2015. Ga uit van een steekproefgrootte van 250 en een afgekeurde fractie van 21%. Bereken ook dit interval.

7. Vergelijk deze twee intervallen met elkaar. Is het mogelijk dat het gedeelte risicovol vuurwerk op de markt dat niet aan de eisen voldoet juist is afgenomen van 2015 naar 2016? Ga hierover in discussie / formuleer een standpunt.

8. Reflecteer op deze opdracht: kijk je nu anders aan tegen dergelijke onderzoeken? Wat zou je je hierover aan je lerlingen willen vertellen? Ga hierover in discussie / formuleer een standpunt.

3.4 Opdracht Statistiek in de schoolorganisatie

Open bestand Wolf-rapportage Nederlands

Open bestand Wolf-rapportage wiskunde

In de schoolorganisatie spelen statistische gegevens uiteraard ook een rol. In deze opdracht bekijken we een aantal realistische voorbeelden.

Hierboven zijn twee Wolf-rapportages opgenomen. Zo'n rapportage ontvangt een docent die de gegevens van een examenklas ontvangt over de scores van zijn of haar groep(en). De landelijke score wordt in zo'n document vergeleken met de groepsscore. Deze opdracht gaat over de Wolf-rapportage voor het vak Nederlands.

Bestudeer het document en bestudeer de toelichting.

Suggestie voor werkvorm: Rollenspel voor tweetallen:

Student 1: Docent Nederlands komt met deze Wolf-rapportage naar docent wiskunde toe om hulp te vragen bij de interpretatie van de Wolf-rapportage. De docent Nederlands krijgt alleen pagina 2 ter voorbereiding en de vragen. De opdracht voor docent 2 is om goed door te vragen zodat e.e.a. goed duidelijk wordt.

Student 2: Docent wiskunde bereidt zich voor op de adviesvraag van de docent door de gehele Wolf-rapportage te bestuderen.

 

1. Jouw collega vraagt wat de betekenis is van het sterretje bij Samenvatten. Leg dit op een begrijpelijke manier uit.

2. De docent Nederlands vraagt zich af waarom 4 punten boven het gemiddelde bij samenvatten leidt tot een sterretje en 5 punten boven het gemiddelde bij Argumentatieve vaardigheden niet

3. De collega Nederlands vraagt zich af hoe ze dat nou uitrekenen en of dat niet heel moeilijk is. Geef daar een uitleg van.

4. De collega Nederlands vraagt zich af of er hier sprake is van een steekproef: de docent heft immers alle leerlingen van de klas beoordeeld.

5. Bestudeer samen de informatie die het cito biedt door de website  (link hieronder) te bekijken.

Wolf: achtergronden
Wolf: achtergronden

4. Bronnen en literatuur

Open bestand Literatuurlijst Didactiek van Statistiek met toelichtingen

Open bestand Leesopdracht Statistiek

Overige bronnen Type Metadata

Paul Drijvers - inleiding Statistiek
https://youtu.be/OzHGVavHSjY

Video  
TED Talk Hans Rosling 200...st stats you've ever seen
https://www.ted.com/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen?language=nl
Video  
TED talk Hans Rosling 200...taset change your mindset
https://www.ted.com/talks/hans_rosling_at_state
Video  
TED talk Hans Rosling 201... against child mortality.
https://www.ted.com/talks/hans_rosling_the_good_news_of_the_decade
Video  
TED talk Hans en Ola Rosl... ignorant about the world
https://www.ted.com/talks/hans_and_ola_rosling_how_not_to_be_ignorant_about_the_world
Video  
Gapminder
http://www.gapminder.org/tools
Link  
Meetniveaus
https://youtu.be/lXKIWhyqdi0 
Video  
Meetniveaus KNMI
https://youtu.be/Wflp-tPuYt8
Video  
Analyse Meetniveaus
https://youtu.be/21a2RWxnjKk
Video  
Slideplayer (dia 10)
http://slideplayer.com/slide/7083971/
Link  
Ionica Smeets over Correlatie en Causaliteit
https://youtu.be/8B271L3NtAw
Video  
Interview met Richard Nis...n causaliteit impliceert.
http://edge.org/conversation/richard_nisbett-the-crusade-against-multiple-regression-analysis
Video  
Kwart getest vuurwerk onveilig (NRC, 22 dec 2016)
https://www.nrc.nl/nieuws/2016/12/22/tijdens-de-jaarlijkse-vuurwerktest-gaat-het-nog-geregeld-mis-a1537789
Link  
Didactische duscussie Discussie appelboom (hypothese toetsen / misconcepten)
https://youtu.be/QLGdVmVytAQ
Video  
xkdc- een grapje in een strip over statistisch onderzoek
https://xkcd.com/882/
Link  
Artikel in Nature: discussie over p-waarde
http://www.nature.com/news/psychology-journal-bans-p-values-1.17001
Link  
Handout paranormale Statistiek (Peter Grünwald, 2016)
http://www.fisme.science.uu.nl/nwd/nwd2015/handouts/handouts.html
Link  
Eindexamen wiskunde, aanleiding voor discussie
https://www.examenblad.nl/examen/wiskunde-a-vwo/2011
Link  
Discussie in NRC (mei 2011) n.a.v. examensom
https://www.nrc.nl/nieuws/2011/05/28/nu-ook-al-op-het-vwo-wiskundedebilisering-12018372-a731754
Link  
Artikel in NRC over Vuurwerk - aanleiding voor opgave betrouwbaarheidsinterval
https://www.nrc.nl/nieuws/2016/12/22/tijdens-de-jaarlijkse-vuurwerktest-gaat-het-nog-geregeld-mis-a1537789
Link  
Wolf: achtergronden
http://www.cito.nl/onderwijs/voortgezet%20onderwijs/centrale_examens/wolf-2017/wolf-algemeen
Link  
Voorbeelden correlatie en causaliteit (NWD 2015)
http://www.fisme.science.uu.nl/nwd/nwd2015/handouts/handouts.html
Link  

5. Suggesties voor de lerarenopleider

Uitgangspunten van deze module

Een eerste vraag waar we bij het ontwerp van deze module Vakdidactiek Statistiek mee te maken hebben, is hoe de vakinhoudelijke kennis zich verhoudt tot de vakdidactische kennis. Een didactische blik veronderstelt in het algemeen al de nodige vakinhoudelijke kennis en bij het lesgeven maak je als docent natuurlijk tegelijkertijd gebruik van vakdidactische vakinhoudelijke kennis. De twee zijn verweven. Ons idee is dat het met name bij statistiek nodig is om aan bepaalde vakinhoudelijke aspecten aandacht te besteden. Dat heeft de keuze van de onderwerpen die aan de orde komen mede bepaald. Daarnaast is gepoogd aandacht te besteden aan onderwerpen voor zowel het tweede- als het eerstegraads gebied.

De kern van de module betreft de thema’s data beschrijven en data overstijgen. Bij data beschrijven wordt allereerst aandacht besteed aan de verschillende manieren om data in beeld te brengen (2.1). Het is goed om (aanstaande) docenten met verschillende vormen van datarepresentatie in aanraking te brengen, omdat immers in media ook steeds orginelere en meer diverse grafische representaties worden gebruikt. Vervolgend komt het begrip meetniveau aan de orde (2.2). Het meetniveau  van een variabele is bepalend voor het type statistische technieken dat kan worden gebruikt maar blijft in statistiekonderwijs vaak onderbelicht. Het derde onderwerp is statistische geletterdheid (2.3), het onderliggende begrip waarmee de statistische vaardigheid van de “geletterde burger” wel wordt aangeduid. Ten slotte is een discussieopdracht toegevoegd n.a.v. een discussie op facebook waarin verschillende (mis)concepten aan bod komen (2.5)

Het tweede thema is data overstijgen. Daar gaat het over de uitspraken die we op basis van data doen over de onderliggende populatie. Als eerste komt correlatie en causaliteit aan de orde (3.1). De kern hier is dat studenten leren onderscheid te maken tussen deze twee: correlatie impliceert geen causaliteit. Het tweede onderwerp is kansen en significantie (3.2). Het idee hier is vooral dat het begrip van kansen en significanties subtiel is en dat een significant resultaat, net als een correlatie, nog geen causaliteit impliceert. Als derde komt de interpretatie  van betrouwbaarheidsintervallen (3.3) aan de orde. Hierbij is een opdracht beschikbaar die zowel kan dienen als verwerkingsopdracht bij betrouwbaarheidsintervallen, maar ook als aanleiding om het concept te introduceren. Een tweede opdracht (3.5) gaat over de interpretatie van statistieken in de dagelijkse schoolpraktijk.

Sectie 4 bevat bronnen en een geannoteerde literatuurlijst, gevolgd door een leesopdracht  voor studenten.

Vorm van de module

De kern van de module zit in secties 2 en 3. Deze secties bevatten een mengeling van tekst, video’s en opgaven voor studenten van de lerarenopleiding. Een aantal opdrachten is ook beschikbaar in de vorm van een document in Word, zodat ze eenvoudig aan te passen zijn naar eigen inzicht en behoefte. In enkele gevallen wordt verwezen naar artikelen of bronnen die in sectie 4 te vinden zijn. Deze sectie bevat behalve literatuuritems ook een geannoteerde literatuurlijst en een leesopdracht voor studenten.

Hoe deze module te gebruiken?

Deze module is geen kant-en-klare leerlijn voor een cursus statistiek; daarom is aan de opmaak ook maar beperkt aandacht besteed. Wel bevat de module een aantal elementen die in een dergelijke cursus zouden kunnen functioneren en die wij van belang achten. Als mogelijk gebruik stellen we ons voor dat een opleider statistiek van de lerarenopleiding, met de eigen opleidingspraktijk als uitgangspunt, deze module doorzoekt op bruikbare aanvullende elementen. Vervolgens  kan de module (of elementen ervan) worden gekopieerd naar de eigen ELO. Een alternatief is dat delen ervan, al dan niet via de beschikbare Word documenten, worden aangepast aan de eigen insteek van de opleider of de behoefte van de student.

We hopen deze opleidershandleiding aan te kunnen vullen met suggesties uit de praktijk. Mocht u op basis van uw ervaring tips hebben voor het gebruik van deze module in de lerarenopleiding, stel ons daar dan svp van op de hoogte via p.drijvers@uu.nl.

Toelichting bij 3.1

Aardige voorbeelden over correlatie en causaliteit zijn te vinden in http://www.fisme.science.uu.nl/nwd/nwd2015/handouts/handouts.html

Open bestand Toelichting bij opdracht 2.2 Meetniveau en KNMI

Open bestand Toelichting bij opdracht 2.2. Verwerkingsopdrachten meetniveaus

Open bestand Toelichting bij opdracht 2.4

  • Het arrangement Didactiek van statistiek is gemaakt met Wikiwijs van Kennisnet. Wikiwijs is hét onderwijsplatform waar je leermiddelen zoekt, maakt en deelt.

    Laatst gewijzigd
    2018-03-09 11:55:20
    Licentie

    Dit lesmateriaal is gepubliceerd onder de Creative Commons Naamsvermelding 3.0 Nederlands licentie. Dit houdt in dat je onder de voorwaarde van naamsvermelding vrij bent om:

    • het werk te delen - te kopiëren, te verspreiden en door te geven via elk medium of bestandsformaat
    • het werk te bewerken - te remixen, te veranderen en afgeleide werken te maken
    • voor alle doeleinden, inclusief commerciële doeleinden.

    Meer informatie over de CC Naamsvermelding 3.0 Nederland licentie.

    Het project "Open Online Betadidactiek" is uitgevoerd in het kader van de stimuleringsregeling Open en online onderwijs 2016 van het ministerie van OCW en SURF (beschikking nr 865015). Deze module is ontwikkeld door Paul Drijvers (Universiteit Utrecht / Hogeschool Utrecht), Jop Schaap (Hogeschool Utrecht) en Marcel Voorhoeve (Hogeschool van Amsterdam).

    Aanvullende informatie over dit lesmateriaal

    Van dit lesmateriaal is de volgende aanvullende informatie beschikbaar:

    Toelichting
    Professionaliseringsmodule voor leraren. Dit project is uitgevoerd in het kader van de stimuleringsregeling Open en online onderwijs 2016 van het ministerie van OCW en SURF. Samenstellers: Marcel Voorhoeve (HvA), Paul Drijvers (UU) en Jop Schaap (HU).
    Leerniveau
    VWO 2; WO - Bachelor; WO - Master; HAVO 4; HAVO 1; VWO 6; VWO 1; HAVO 3; VWO 3; HAVO 5; HBO - Master; VWO 4; HAVO 2; VWO 5; HBO - Bachelor;
    Leerinhoud en doelen
    Informatieverwerking en onzekerheid; Kansen en kansverdelingen; Informatieverwerking; Toetsen van hypothesen; Wiskunde A; Wiskunde D;
    Eindgebruiker
    leerling/student
    Moeilijkheidsgraad
    gemiddeld
    Trefwoorden
    betrouwbaarheidsinterval, correlatie, didactiek, hypothese toetsen, meetniveau, significantie, statistical literacy, statistiek