Gestructureerde data

Van gestructureerde data is sprake als data op een standaard manier worden beschreven en de relaties die er bestaan tussen de data helder zijn. Hoe doen we dat? Lees daarvoor de volgende teksten.

Rijen en kolommen
Door in documenten of bestanden gebruik te maken van rijen en kolommen waarin telkens dezelfde typen gegevens worden ondergebracht. Dat kan een tabel zijn met de NAW-gegevens van werknemers van een bedrijf of een spreadsheet waarin per maand een gemiddelde temperatuur wordt vermeld. NAW staat voor Naam, Adres en Woonplaats.




Metadata
Structuur kan ook worden aangebracht door gebruik te maken van metadata. Metadata zijn gegevens die eigenschappen van bepaalde andere gegevens beschrijven. Het zijn dus eigenlijk 'data over data'. Het aanbrengen van structuur in data door data te voorzien van metadata noemen we ook wel het verrijken van data.

Een document kan metadata bevatten zoals de naam van de auteur, de uitgever, het aantal pagina's en de taal waarin het document is geschreven. Een zoekmachine die gebruik maakt van metadata kan dan direct zoeken naar documenten van de hand van een specifieke auteur. Zou de zoekmachine geen gebruik maken van metadata dan zou het resultaat ook documenten bevatten waarin de naam van de auteur voorkomt, maar die niet van de hand zijn van de gezochte auteur. De zoekmachine snapt door het gebruik van de metadata dus de inhoud van de doorzochte documenten.


Computers kunnen niet zelf denken. Dus ook niet zelfstandig beslissen welke data wel of niet belangrijk zijn. Of bepalen hoe data gebruikt moeten worden. Door structuur aan te brengen in data zorgen mensen ervoor dat computers data zelfstandig kunnen analyseren en doorzoeken.