verwerking van de enquête

En wanneer je alle 500 enquêtes terug hebt gekregen komt het meeste werk en ook wel het vervelende werk. Je kunt natuurlijk alle enquêtes door spitten en tellen hoeveel mannen en vrouwen van een bepaalde muzieksoort houden tijdens het sporten, maar met 500 lijsten is dit niet te doen. Bij een tiental lijsten is dit misschien nog wel te doen maar wanneer er dan een samenhangende vraag bijkomt zoals het wel of niet hebben van kinderen kan alles weer opnieuw.

Dus er moet een eenvoudige manier gevonden worden om deze enorme berg gegevens te analyseren.

Er zijn speciale programma’s hiervoor zoals SPSS. Dit is een veel gebruikt statistisch programma dat sinds 1978 te koop is en aanvankelijk voor marketing doeleinden is ontwikkeld. Later in 2009 is het door IBM gekocht en nog steeds te koop. Het programma kan heel veel maar het programma is juist hierdoor zo complex dat het ook een lastig te doorgronden programma is en dat gaat voor nu te ver.
Er zijn er verder honderden programma’s die veel kunnen van wat SPSS kan, kijk maar eens op Wikipedia en zoek dan maar eens naar ‘statische programma’s’ en zo ook is er ook Excel.
Microsoft Excel heeft ook statische functies en veel andere programma’s lezen ook standaard Excel werkbladen. Waarom? Eigenlijk heel eenvoudig, de statische programma’s zijn heel goed in het maken van allerlei grafieken en analyses maar zijn heel slecht in het beheren van de gegevens en de ordening hiervan. Dus eigenlijk gebruiken ze hierbij Excel om dit deel te doen. Wat alle programma nodig zijn is een ‘Codeboek’. En hierin schuilt de kracht van Excel.

 

Codeboek
In oude statistische analyseprogramma’s moesten de gegevens worden aangeleverd in een vorm van een datamatrix. Een datamatrix is niet veel meer dan een bestand met alleen maar getallen. Per regel kon de onderzoeker maximaal 80 tekens kwijt, hetgeen soms tot gevolg had dat er meerdere regels per ondervraagde gebruikt moesten worden. De onderzoeker moest het programma (en eventueel ook anderen) duidelijk maken hoe het de gegevens moest lezen. Daarvoor schreef hij een codeboek. Het codeboek is een document waarin wordt aangegeven in welke kolom een gegeven staat, wat de minimale en maximale waarden zijn en wat de getallen betekenen. Het codeboek vormt daarmee het scharnierpunt tussen enerzijds de verzamelde gegevens zoals die met behulp van het meetinstrument of enquête zijn verkregen en anderzijds de getallen die in een datamatrix staan.

De huidige statistische analyseprogramma’s kunnen bijna allemaal de gegevens lezen uit een spreadsheet-programma. In een spreadsheet heeft elke kolom een vaste dikte en maakt het niet zoveel uit of het gegeven een getal of een woord is. De voorkeur gaat echter nog steeds uit naar getallen omdat de meeste analyseprogramma’s niets kunnen beginnen met woorden. Waar de getallen voor staan en welke betekenis ze hebben, wordt aangegeven in het codeboek. Het codeboek is dus nog steeds een belangrijk document.

Hieronder staat een voorbeeld van een datamatrix en daaronder het codeboek. Het is duidelijk dat zonder het codeboek de datamatrix niet is te begrijpen.

Excel Codeboek

In de afbeelding van de vorige paragraaf staat een simpel voorbeeld van een codeboek in Excel. Kenmerkend is dat:

Dat klinkt heel simpel maar dat is het ook. Wanneer je je aan deze 3 basisregels houdt dan kan er in het vervolg niets mis gaan. Wanneer alle antwoorden ingevuld zijn in het codeboek dan kun je analyse met de gegevens maken. Maar eerst zal het codeboek gevuld moeten gaan worden.
Dit kan in 4 stappen:

  1. Maak eerst een afsprakenlijst van mogelijke antwoorden n.a.v. je enquête. Een voorbeeld zie je in het tweede gedeelte van de afbeelding in de vorige paragraaf.
  2. Maak nu de eerste regel van je Excel-codeboek. Hierin staan dus alleen de  vragen. Niet de antwoorden. Je kunt ‘Vrg 1’, ‘Vrg 2’ enzovoort gebruiken, maar zelf vindt ik een nummer en een sleutelwoord handiger. Dus bijvoorbeeld ‘1 – Leeftijd ondervraagde’, ‘2 – Leeftijd partner’. Dit heeft als voordeel dat je niet steeds het codeboek bij de hand moet hebben wanneer je met je analyse bezig bent en dat je aan de steekwoorden al kan zien waar de antwoorden betrekking op hebben.
    Doordat de sleutelwoorden vaak wat langer zijn is het aan te raden om de uitlijning van het Excelvakje op een verticale stand te zetten. Dit kan doordat je in het vakje op de linkermuisknop klikt, vervolgens kiest voor ‘celeigenschappen’ en dan het tabblad ‘Uitlijning’. Hier in het deel ‘Stand’ klikken op het bovenste stipje en alles gaat verticaal staan.
  3. Nu het blanco codeboek met alle vragen klaar is gaat het invullen beginnen. Dit kan veel en saai werk zijn. Dus:
    1. Je doet het zelf en neemt de tijd, want een fout is snel gemaakt,
    2. Je maakt meerdere kopieën en neemt als team allemaal een deel van het invul werk op je. Later kun je in 1 versie alle regels, behalve de eerst, onder elkaar plakken om zo de complete gegevensset te hebben.
  4. Maak nu in de eerste regel een ‘Autofilter’ aan binnen Excel om hiermee analyses te kunnen maken. Excel zal hierdoor alleen nog maar de data regels laten zien die aan de ´zoekwaarde´ voldoen en door deze te combineren kun je eenvoudig tellingen en verbanden ontdekken.

Uiteraard kun je in Excel daarnaast nog allerlei verfraaiingen aanbrengen, maar voor nu zal dit voldoende zijn. Ook kan je direct uit de overgebleven dataset grafieken genereren die je weer kunt gebruiken binnen Word om je gegevens te presenteren.

LET OP!
Het is aan te raden om tijdens de analyse veelvuldig je codeboek te bewaren. Geef elke analyse een eigen naam zodat je snel en eenvoudig terug kunt naar een vorige situatie. Er kan namelijk heel snel iets mis gaan en dan ben je alles kwijt.