Om te bepalen welke open datasets (dus met een licentie) geschikt zijn voor gebruik in het onderwijs kun je diverse beoordelingscriteria gebruiken.
Zoek vooral naar downloadbare datasets en niet naar real time data die via een API ("application programming interface") continu wordt geactualiseerd. Dat laatste geldt bevoorbeeld voor beursdata. Daarbij is het namelijk lastig om met een groep studenten over dezelfde data te kunnen beschikken.
Wie (persoon of instantie) is de maker van de dataset en in hoeverre wekt deze vertrouwen?
Kun je erop vertrouwen dat deze voor de duur van het onderwijsblok stabiel zal zijn?
Is de dataset niet te groot?
Houd rekening met het feit dat studenten niet allemaal een hele moderne computer hebben. Als het werkgeheugen (RAM) van een computer 4GB is, kan die een dataset van maximaal 4GB aan, maar dan kunnen niet tegelijk ook andere programma's worden gebruikt.
Is het bestandsformaat geschikt voor verwerking door de studenten?
De formaten .csv, .tsv en .txt zijn zonder problemen door elke computer te lezen.
De formaten .zip, en .gz beduiden dat dit mapjes met "ingepakte" bestanden zijn; wat het werkelijke formaat is wordt pas duidelijk na het uitpakken.