12.2 - Data exploratie

Als je zo'n dataset van bijv. het CBS download zie je dat het ander soort data zijn (data zijn meervoud) dan we verder in deze module zien. Bij de andere opdrachten zien we steeds alle gegevens, waarvan jij dan gemiddeldes en bijv. standaardafwijking kunt berekenen en als het gegevens van een steekproef zijn dan kun je er statistische conclusies uit trekken.

Deze data zijn anders. Vaak zie per groep alleen het gemiddelde gegeven, of een percentage. Dat betekent dat er eigenlijk heel veel werk al voor jou gedaan is. Maar dat betekent ook dat we er dus geen hypothese-toetsende-statistiek op los kunnen laten. Dat is de statistiek van hoofdstuk 7 tot en met 9. Er is een onderzoeksvraag, en je kunt een H0 opstellen, en met je statistiek kun je kijken of die hypothese verworpen mag worden.

Met dit soort grote datasets betreft het meer beschrijvende statistiek. Als je wilt weten hoeveel procent van de mensen wekelijks contact heeft met zijn ouders en dat blijkt uit een hele grote steekproef 43 % te zijn, dan is dat dus zo. Wel is er vaak een onzekerheid over dit percentage (zie het hoofdstuk over de betrouwbaarheidsintervallen (10.2 & 10.3).