5.2 Statistische betrouwbaarheid

Omvangrijke gegevensbestanden zoals de Landelijke Vegetatie Databank, die informatie bevatten uit een lange tijdsperiode (wat betreft de Landelijke Vegetatie Databank uit de periode 1867 tot heden), lenen zich bij uitstek voor het analyseren van trends. Tot voor kort richtte het onderzoek naar veranderingen in de vegetatie zich vooral op lokale situaties, waarbij men was aangewezen op het vergelijken van vegetatiekaarten, het bestuderen van permanente kwadraten of op de interpretatie van plantengemeenschappen via zogenaamde plaats-tijd-substitutie. Bij deze laatste manier van werken worden plaatsen met elkaar vergeleken die verschillen in ouderdom. Voorbeelden zijn de vegetatiereeks van strand, via primaire en jonge duintjes naar oudere duinen, en de vegetatieontwikkeling op kapvlakten waar het bos in verschillende jaren is gekapt. Analyses op basis van grote aantallen vegetatieopnamen uit diverse perioden zijn uitgevoerd voor begroeiingen met Krabbenscheer (Stratiotetum), akkergemeenschappen (Weeda et al. 2003), stroomdalgrasland van de associatie Medicagini-Avenetum pubescentis en voedselarme eikenbossen van het Betulo-Quercetum roboris (Schaminée et al. 2002), en ook voor een iets bredere groep van voedselarme eikenbossen van het Quercion roboris (Haveman & Schaminée 2005).

De pionierbegroeiingen van de Tandzaad-klasse (Bidentetea tripartitae), hier met Moerasdroogbloem (Gnaphalium uliginosum) en Zeegroene ganzevoet (Chenopodium glaucum), hebben in het verleden maar weinig aandacht gekregen van plantensociologen. Mogelijk kan het feit dat deze gemeenschappen thans - althans binnen het rivierengebied - deel uitmaken van een Natura 2000 habitattype ('Rivieren met slikoevers met vegetaties behorend tot het Chenopodietum rubri p.p. en Bidention p.p.', habitattype 3270). hier verandering in brengen. Fotograaf: Ruud Knol

Betrekkelijk eenvoudige berekeningen lieten zien welke veranderingen in de loop van de tijd zijn opgetreden in het voorkomen van afzonderlijke plantensoorten in de desbetreffende gemeenschappen. Bij de trendanalyse op basis van gegevens uit de Landelijke Vegetatie Databank treden twee problemen op de voorgrond. Op de eerste plaats zijn de analyses niet gebaseerd op een lukrake (random) steekproef, maar zijn de gebruikte vegetatieopnamen afkomstig uit een grote diversiteit van projecten, meetreeksen en losse waarnemingen, die met verschillende doelen zijn gemaakt. Hierdoor is onduidelijk in hoeverre de basisgegevens onderling vergelijkbaar en dus de resultaten van de berekeningen betrouwbaar zijn. Ook in de vegetatieopnamen zelf zitten onbetrouwbaarheden, die eveneens invloed kunnen hebben op de resultaten van de analyse. Voorbeelden hiervan zijn het ontbreken van gegevens over mossen, foutieve determinaties van soorten, of opnamen die betrekking hebben op heterogene of relatief grote proefvlakken.

Om deze problemen het hoofd te bieden worden momenteel methoden ontwikkeld om te komen tot een set van betrouwbare basisgegevens. De beschikbare opnamen worden hierbij gefilterd op basis van kwaliteit en verdeling over ruimte en tijd, en afhankelijk van de beoogde analyse (Haveman & Janssen 2006). In eerste instantie wordt door een deskundige de kwaliteit gecontroleerd, zo veel mogelijk door gebruik te maken van geautomatiseerde filters. Zo kunnen opnamen worden verwijderd waarvan de grootte van het proefvlak niet is aangegeven, of waarvan niet bekend is wanneer (jaartal) of waar (kilometerhok) deze zijn gemaakt. Het is bekend dat in het verleden doorgaans grotere proefvlakken werden bemonsterd dan tegenwoordig. Ook vegetatieopnamen die zijn gemaakt in een te groot of te klein proefvlak, kunnen zo nodig worden uitgesloten, evenals opnamen die vermoedelijk geen betrekking hebben op een homogeen proefvlak. Dit is dikwijls het geval bij Tansley-opnamen (waarbij in principe geen eisen worden gesteld aan de homogeniteit van het proefvlak) of wanneer de opname betrekking heeft op een permanent kwadraat waarvan de vegetatie in de loop van de tijd heterogeen is geworden. De kwaliteitscontrole omvat ook de compleetheid en juistheid van de soortenlijst, waarbij in de beslissing kan worden meegewogen wie de opname heeft gemaakt. Voor bepaalde gemeenschappen, zoals hoogvenen, trilvenen en begroeiingen van stuifzanden, is het van groot belang dat de moslaag compleet en nauwgezet is bestudeerd, wat specialistenwerk betekent.

In een tweede fase van het onderzoek wordt bekeken hoe de verdeling is van de resterende opnamen in ruimte en tijd. Hierbij kunnen diverse methoden van 'herbemonstering' worden toegepast. Voor deze herbemonstering kan worden gekozen voor een aselecte steekproef van een vast aantal opnamen per tijdsperiode (bijvoorbeeld per jaar of per vijf jaar), voor een aselecte steekproef van een vast aantal opnamen per kilometerhok, of voor een combinatie van beide methoden. Dit alles om oververtegenwoordiging van bepaalde tijdsperioden of gebieden tegen te gaan. Omwille van de statistische betrouwbaarheid kunnen de lukrake selecties een aantal malen, bijvoorbeeld tienmaal, worden herhaald en geanalyseerd. Ook is het voor de herbemonstering mogelijk gebruik te maken van floradistricten of andere fysisch-geografische eenheden. De gebruikte methodiek is afhankelijk van het begroeiingstype, de omvang van het 'ruwe' bestand en het doel van de analyse. Naarmate de bestanden groter zijn, kunnen de filters stringenter worden ingezet om voldoende gegevens over te houden voor de uiteindelijke analyse. Het past niet in de aard van dit betoog om uitvoerig in te gaan op de techniek van de diverse vormen van filtering, maar wel willen we enkele resultaten noemen. Voor de analyse wordt gebruik gemaakt van een Chi-kwadraattoets, waarbij gekeken wordt welke plantensoorten significante verschillen vertonen in de datasets die met elkaar vergeleken worden. Zo bleken de resultaten van een analyse naar mogelijke veranderingen in blauwgraslanden de perioden voor en na 1970 sterk gekleurd te worden door een uitermate scheve ruimtelijke verdeling van het materiaal. Maar liefst eenderde van alle opnamen uit de periode vóór 1970 bleek afkomstig te zijn van één enkel terrein, te weten De Bruuk bij Groesbeek, waar in 1968 een uitvoerige inventarisatie was verricht. Veronderstelde veranderingen in het voorkomen van soorten als Moerasspirea (Filipendula ulmaria) en Gewone engelwortel (Angelica sylvestris) konden geheel worden toegeschreven aan de ongelijke inventarisatie. Wanneer verschillende filters op het materiaal worden toegepast, blijkt daarentegen de Blauwe knoop (Succisa pratensis) in alle gevallen achteruit te zijn gegaan. Een ander voorbeeld laat de analyse van de droge heide in ons land (associatie Genisto anglicae-Callunetum) zien. Wanneer we het totale gegevensbestand zonder verdere bewerking verdelen over dezelfde twee tijdsperioden, voor en na 1970, dan blijken maar liefst 41 soorten significant achteruitgegaan te zijn, waaronder 35 bladmossen, levermossen en korstmossen. Een nadere studie van de dataset leerde dat ruim een kwart van de opnamen afkomstig was uit Noord-Limburg, waarbij de cryptogamen met meer dan gemiddelde grondigheid onderzocht waren.