In 1812 trok het Franse leger onder aanvoering van de Franse keizer Napoléon ten strijde tegen Rusland. Deze campagne begon aan de rivier de Niemen en leidde naar Moskou. Het leger van Napoléon stuitte op flinke weerstand en werd bij Moskou verslagen. De terugtocht was vreselijk, mede door de extreme kou. De Franse ingenieur Charles Joseph Minard (1781 – 1870) tekende onderstaande figuur om het verloop van deze Russische veldtocht weer te geven.
Bij de weergave van de data heeft een onderzoeker meestal een bepaald doel. Minard wilde de verschrikkingen van de veldtocht van Napoléon in beeld brengen. Eén van de onderwerpen van Minards onderzoek betrof het aantal soldaten tijdens deze barre tocht. Dit aantal noemen we een statistische variabele. Minard heeft de vorm van zijn diagram zo gekozen dat de enorme verliezen duidelijk zichtbaar worden.
Voor een duidelijkere weergave in kleur van deze grafiek zie de link Minard: Napoleon's mars.
Een bewerkte versie waarin de getallen duidelijker zijn gemaakt vind je hier: Napoleons March Redux.
Drie beweringen
Wat is statistiek?
Wat is statistiek?
Om verantwoorde uitspraken te kunnen doen in onzekere situaties, is statistiek nodig.
Je begint met een vraag of een bewering.
Dan moet je keuzes maken. Bijvoorbeeld wat het fileprobleem betreft.
Hoever ga je terug in de tijd? Onderscheid je verschillende seizoenen?
Kijk je alleen naar Nederland of betrek je ook andere landen in je onderzoek? Onderscheid je verschillende delen van Nederland?
Let je op het aantal files per dag, of op de lengte, of …
Let je op oorzaken van files? Wegwerkzaamheden, weer, vakanties, …
Als je gemiddeldes neemt, doe je dat dan per dag, per week, per maand?
Vervolgens ga je gegevens verzamelen.
Dat levert een gigantische verzameling getallen op waar je in het begin geen grip op hebt. Daartoe ga je ze ordenen en in beeld brengen.
Dan moet je de gegevens analyseren: je berekent bijvoorbeeld gemiddeldes en de spreiding.
Tot slot worden er conclusies getrokken; je beantwoordt de vraag.
Opmerking:
Persoonlijke gegevens zijn goud waard! Zo verdient Facebook enorme bedragen met de bergen persoonlijke informatie die het over zijn gebruikers heeft. Het socialemediabedrijf verkoopt deze gegevens door aan adverteerders die er reclame op maat mee maken; je weet wel, banners over schoenen die je achtervolgen nadat je een onlineschoenenwinkel hebt bezocht.
Gezinsomvang
Kwalitatieve en kwantitatieve variabelen
Statistische variabelen kun je onderverdelen in kwalitatieve en kwantitatieve variabelen.
Statistische variabelen als het geslacht, de kleur ogen, de godsdienst, de bloedgroep, de naam, enzovoorts, geven een kenmerk van de populatie weer maar hoeven niet noodzakelijkerwijs in een getal te zijn uitgedrukt. We noemen dit kwalitatieve variabelen.
Statistische variabelen als de lengte, de hoogte van het inkomen, de omvang van het gezin, enzovoorts, worden wel in een getal uitgedrukt; dit zijn kwantitatieve variabelen.
Het is vaak handig om je gegevens te ordenen in frequentietabellen. Daarin hebben niet alleen de data een logische volgorde, maar is ook meteen te zien hoe vaak een bepaalde waarde van de statistische variabele voorkomt, zijn absolute frequentie.
Bij de gegevens over de gezinsomvang van leerlingen uit twee havo 4 klassen heb je twee datasets bij eenzelfde kwantitatieve variabele. Om beide datasets goed te kunnen vergelijken, is het handiger om met relatieve frequenties te werken, dat wil zeggen absolute frequenties gedeeld door het totaal, eventueel uitgedrukt in procenten.
Onderzoek onder examenkandidaten
Eeuwelingen
Gapminder
Vermogen van een huishouden
Ontstaan van statistiek
Statistiek is ontstaan in Duitsland in de achttiende eeuw. In Nederland werden voor het eerst in 1802 te Leiden statistiekcolleges gegeven, door de hoogleraar Adriaan Kluit. Het vak heette toen nog statenkunde en bestond uit kennis die nodig was voor een goed bestuur van een land, zoals over de bevolking, het leger, het klimaat, de handel, enzovoort.
Statistiek kan ook misleidend zijn. De waarheid spreken kan namelijk op vele manieren. Bekijk maar eens de volgende opdrachten.
Het arrangement Wat is statistiek? is gemaakt met
Wikiwijs van
Kennisnet. Wikiwijs is hét onderwijsplatform waar je leermiddelen zoekt,
maakt en deelt.
Dit lesmateriaal is gepubliceerd onder de Creative Commons Naamsvermelding-GelijkDelen 4.0 Internationale licentie. Dit houdt in dat je onder de voorwaarde van naamsvermelding en publicatie onder dezelfde licentie vrij bent om:
het werk te delen - te kopiëren, te verspreiden en door te geven via elk medium of bestandsformaat
het werk te bewerken - te remixen, te veranderen en afgeleide werken te maken
voor alle doeleinden, inclusief commerciële doeleinden.
Leeromgevingen die gebruik maken van LTI kunnen Wikiwijs arrangementen en toetsen afspelen en resultaten
terugkoppelen. Hiervoor moet de leeromgeving wel bij Wikiwijs aangemeld zijn. Wil je gebruik maken van de LTI
koppeling? Meld je aan via info@wikiwijs.nl met het verzoek om een LTI
koppeling aan te gaan.
Maak je al gebruik van LTI? Gebruik dan de onderstaande Launch URL’s.
Arrangement
IMSCC package
Wil je de Launch URL’s niet los kopiëren, maar in één keer downloaden? Download dan de IMSCC package.
Wikiwijs lesmateriaal kan worden gebruikt in een externe leeromgeving. Er kunnen koppelingen worden gemaakt en
het lesmateriaal kan op verschillende manieren worden geëxporteerd. Meer informatie hierover kun je vinden op
onze Developers Wiki.