Je zult tijdens deze module met gegevens gaan werken. Deze gegevens zijn geselecteerd omdat ze gaan over thema's die te maken hebben met natuur, leven of technologie. We hebben ervoor gekozen om je met een aantal vaste sets met gegevens te laten werken zodat je aan het einde van de module niet alleen iets over statistiek hebt geleerd, maar ook iets over interessante thema's binnen het domein van NLT. De gegevens zijn vrij beschikbare gegevens waarbij we soms, afhankelijk van het doel van de opdracht een selectie hebben toegepast. Hieronder worden de verschillende sets toegelicht.
Wanneer je de gegevens nodig hebt kun je ze bij de opdrachten downloaden, soms is er dan een selectie gemaakt zodat de dataset precies past bij het soort opdracht dat je moet maken.
Dataset 1 - Ziektes
In deze dataset bevinden zich gegevens over alle staten in de Verenigde Staten van een aantal ziektes: Hepatitis A, Mazelen, de Bof, Mumps, Kinkhoest, Polio, Rodehond, en Pokken. Per staat is het aantal ziektegevallen voor elke ziekte gegeven.
Referentie: Willem G. van Panhuis, John Grefenstette, Su Yon Jung, Nian Shong Chok, Anne Cross, Heather Eng, Bruce Y Lee, Vladimir Zadorozhny, Shawn Brown, Derek Cummings, Donald S. Burke. Contagious Diseases in the United States from 1888 to the present. NEJM 2013; 369(22): 2152-2158
Dataset 2 - Broeikasgassen
3 broeikasgassen (CO2, N2O, CH4) gemeten uit ijskernen van Antarctica. Van het jaar 1-2000 is voor elk gas elke 20 jaar een meting verricht (dit is mogelijk omdat hoe dieper je in een ijskern meet, des te langer je teruggaat (link). CO2 is gegeven in ppm (parts per million), N2O en CH4 zijn gegeven in pbb (parts per billion).
Referentie: MacFarling Meure et al. 2006 via NOAA.