8.2 - Gegevens ordenen

Er zijn een aantal huisregels waar je je aan moet houden als je gegevens ordent. Die zijn er zodat als je gegevens uitwisselt met iemand anders er minder snel onduidelijkheid kan ontstaan.

De eerste vuistregel is dat gegevens die op hetzelfde moment van dezelfde 'agent' (of dat nu een mens, een dier of een zak chips is) op dezelfde rij staan.

De tweede vuistregel is dat gegevens die hetzelfde betekenen in dezelfde kolom staan. Dus als je bij 1000 mensen op 4 verschillende momenten in twee verschillende landen de lichaamstemperatuur hebt gemeten heb je 1 kolom lichaamstemperatuur. Zie hieronder voor hoe zo'n dataset eruit kan zien:

structuur gegevens.xlsx

De derde vuistregel is dat je nooit zomaar gegevens mag verwijderen. Ook als er hele gekke uitschieters in je gegevens zijn mag dat niet zonder goede reden. Als je het wel doet, moet je nauwkeurig beschrijven wat je hebt verwijderd en waarom. Mocht het dan toch niet toegestaan zijn dan kan iemand anders dat altijd later lezen en eventueel repareren.

In dit filmpje kun je zien wat er anders kan gebeuren (laatste 8 minuten).