Kwaliteit en bruikbaarheid

Om te bepalen welke open datasets (dus met een licentie) geschikt zijn voor gebruik in het onderwijs kun je diverse beoordelingscriteria gebruiken.
Zoek vooral naar downloadbare datasets en niet naar real time data die via een API ("application programming interface") continu wordt geactualiseerd. Dat laatste geldt bevoorbeeld voor beursdata. Daarbij is het namelijk lastig om met een groep studenten over dezelfde data te kunnen beschikken.

Metadata

Is er metadata aanwezig, zodat je kan zien hoe deze data is/wordt verzameld?

Bron

Wie (persoon of instantie) is de maker van de dataset en in hoeverre wekt deze vertrouwen?
Kun je erop vertrouwen dat deze voor de duur van het onderwijsblok stabiel zal zijn?

Grootte

Is de dataset niet te groot?
Houd rekening met het feit dat studenten niet allemaal een hele moderne computer hebben. Als het werkgeheugen (RAM) van een computer 4GB is, kan die een dataset van maximaal 4GB aan, maar dan kunnen niet tegelijk ook andere programma's worden gebruikt.

Bestandsformaat

Is het bestandsformaat geschikt voor verwerking door de studenten?
De formaten .csv, .tsv en .txt zijn zonder problemen door elke computer te lezen.
De formaten .zip, en .gz beduiden dat dit mapjes met "ingepakte" bestanden zijn; wat het werkelijke formaat is wordt pas duidelijk na het uitpakken.