Verklarende statistiek
In veel gevallen is het interessant om na te gaan of meer te zeggen is dan alleen centrum- of spreidingsmaten. Bijvoorbeeld of er sprake is van een samenhang of verband tussen twee of meer variabelen.
Iedereen weet dat er een samenhang, correlatie of verband bestaat tussen longkanker en het roken van sigaretten. Dat zegt overigens nog niks of niet veel over oorzaak. Longkanker kan ook door andere factoren dan alleen roken worden bepaald. Denk aan asbest. Een samenhang is niet gelijk aan een causaal (oorzakelijk) verband.
In dit blok gaan we in op 2 maten die inzicht geven in de samenhang van variabelen:
1. Kruistabel
2. Correlatiecoefficient
Kruistabel
Voorbeeld: kinderen uit lagere sociaal economisch milieus presteren in het onderwijs doorgaans minder dan kinderen uit hogere sociaal –economische milieus. Vervolgens wordt er gemeten op twee variabelen.Beide variabelen kennen we waardes toe:
mileu (hoog – middel en laag) en prestatieniveau (1 - 2 - 3 – 4)
Bij een kruistabel treffen vaak ook andere termen aan:
- analyse-eenheden
- 4x 3 celfrequenties
- horizontaal staan de rijen
- verticaal staan de kolommen
- rijtotaal en kolomtotaal beide zijn randtotalen meestal uitgedrukt in frequenties en of percentages
- de gevolgvariabele wordt de rijvariabele en de oorzaak-variabele wordt de kolom variabele, hier is prestatie een afhankelijke van milieu
Dus:
Prestatie Niveau |
Soc. eco. milieu |
Totaal |
||
Hoog |
Middel |
Laag |
||
1 |
- |
- |
3 |
3/23% |
2 |
1 |
1 |
1 |
3/23% |
3 |
1 |
3 |
- |
4/31% |
4 |
2 |
- |
1 |
3/23% |
Totaal |
4 |
4 |
5 |
N = 13/ 1 |