En wanneer je alle 500 enquêtes terug hebt gekregen komt het meeste werk en ook wel het vervelende werk. Je kunt natuurlijk alle enquêtes door spitten en tellen hoeveel mannen en vrouwen van een bepaalde muzieksoort houden tijdens het sporten, maar met 500 lijsten is dit niet te doen. Bij een tiental lijsten is dit misschien nog wel te doen maar wanneer er dan een samenhangende vraag bijkomt zoals het wel of niet hebben van kinderen kan alles weer opnieuw.
Dus er moet een eenvoudige manier gevonden worden om deze enorme berg gegevens te analyseren.
Er zijn speciale programma’s hiervoor zoals SPSS. Dit is een veel gebruikt statistisch programma dat sinds 1978 te koop is en aanvankelijk voor marketing doeleinden is ontwikkeld. Later in 2009 is het door IBM gekocht en nog steeds te koop. Het programma kan heel veel maar het programma is juist hierdoor zo complex dat het ook een lastig te doorgronden programma is en dat gaat voor nu te ver.
Er zijn er verder honderden programma’s die veel kunnen van wat SPSS kan, kijk maar eens op Wikipedia en zoek dan maar eens naar ‘statische programma’s’ en zo ook is er ook Excel.
Microsoft Excel heeft ook statische functies en veel andere programma’s lezen ook standaard Excel werkbladen. Waarom? Eigenlijk heel eenvoudig, de statische programma’s zijn heel goed in het maken van allerlei grafieken en analyses maar zijn heel slecht in het beheren van de gegevens en de ordening hiervan. Dus eigenlijk gebruiken ze hierbij Excel om dit deel te doen. Wat alle programma nodig zijn is een ‘Codeboek’. En hierin schuilt de kracht van Excel.
Codeboek
In oude statistische analyseprogramma’s moesten de gegevens worden aangeleverd in een vorm van een datamatrix. Een datamatrix is niet veel meer dan een bestand met alleen maar getallen. Per regel kon de onderzoeker maximaal 80 tekens kwijt, hetgeen soms tot gevolg had dat er meerdere regels per ondervraagde gebruikt moesten worden. De onderzoeker moest het programma (en eventueel ook anderen) duidelijk maken hoe het de gegevens moest lezen. Daarvoor schreef hij een codeboek. Het codeboek is een document waarin wordt aangegeven in welke kolom een gegeven staat, wat de minimale en maximale waarden zijn en wat de getallen betekenen. Het codeboek vormt daarmee het scharnierpunt tussen enerzijds de verzamelde gegevens zoals die met behulp van het meetinstrument of enquête zijn verkregen en anderzijds de getallen die in een datamatrix staan.
De huidige statistische analyseprogramma’s kunnen bijna allemaal de gegevens lezen uit een spreadsheet-programma. In een spreadsheet heeft elke kolom een vaste dikte en maakt het niet zoveel uit of het gegeven een getal of een woord is. De voorkeur gaat echter nog steeds uit naar getallen omdat de meeste analyseprogramma’s niets kunnen beginnen met woorden. Waar de getallen voor staan en welke betekenis ze hebben, wordt aangegeven in het codeboek. Het codeboek is dus nog steeds een belangrijk document.
Hieronder staat een voorbeeld van een datamatrix en daaronder het codeboek. Het is duidelijk dat zonder het codeboek de datamatrix niet is te begrijpen.
Excel Codeboek
In de afbeelding van de vorige paragraaf staat een simpel voorbeeld van een codeboek in Excel. Kenmerkend is dat:
Dat klinkt heel simpel maar dat is het ook. Wanneer je je aan deze 3 basisregels houdt dan kan er in het vervolg niets mis gaan. Wanneer alle antwoorden ingevuld zijn in het codeboek dan kun je analyse met de gegevens maken. Maar eerst zal het codeboek gevuld moeten gaan worden.
Dit kan in 4 stappen:
Uiteraard kun je in Excel daarnaast nog allerlei verfraaiingen aanbrengen, maar voor nu zal dit voldoende zijn. Ook kan je direct uit de overgebleven dataset grafieken genereren die je weer kunt gebruiken binnen Word om je gegevens te presenteren.
LET OP!
Het is aan te raden om tijdens de analyse veelvuldig je codeboek te bewaren. Geef elke analyse een eigen naam zodat je snel en eenvoudig terug kunt naar een vorige situatie. Er kan namelijk heel snel iets mis gaan en dan ben je alles kwijt.