De regressie kennen jullie allemaal al, zonder dat je het weet. We gaan in deze paragraaf iets afwijken van alle andere paragrafen over statistische toetsen. We gaan hier namelijk niet toetsen of het effect significant is. Dat is niet goed mogelijk in Excel. De docent kan jullie dit desgewenst in een ander programma wel laten zien.
Bij de regressie kijk je of een bepaalde variabele (de onafhankelijke of voorspellende variabele) invloed heeft op een andere variabele (de afhankelijke of reactievariabele). De regressie maakt vervolgens een vergelijking van de vorm y=ax+b, waarbij x de voorspellende variabele is en y de reactievariabele.
Voorbeeld:
Stel dat je een onderzoekje aan het doen bent of het geven van extra kunstmest aan je planten de groeisnelheid vergroot. Je hebt 15 potjes gekocht, en kweekt in elk potje een plantje op. Je hebt een mooie reeks met kunstmestconcentraties gemaakt en elke pot krijgt steeds iets meer kunstmest. Je kunt nu kijken hoe groot het effect van het toevoegen van kunstmest is op je groeisnelheid. Zie onderstaande grafiek.
Je ziet in figuur 29 goed dat in de potjes waar meer kunstmest zat, de plantjes ook sneller groeien. Je ziet echter ook dat sommige potjes afwijken van wat de trend lijkt te zijn.
In onderstaande grafiek (figuur 30) zien we de trendlijn getekend in de grafiek.
Je ziet dat sommige punten heel dicht bij de lijn zitten, en sommige er ver vanaf. Je kunt in Excel ook de vergelijking van deze lijn laten zien door deze optie te selecteren bij het plusje en dan bij trendlijn ‘meer opties’ te kiezen.
Je ziet nu twee dingen in figuur 31 ingevoegd. Bovenaan zie je een vergelijking. Er staat dat met het toevoegen van 1 ml kunstmest per liter water er steeds gemiddeld 0,38 cm/week harder gegroeid wordt door de plantjes, waarbij de standaardgroei per week 4,4 cm/week is.
Er staat nog iets. Er staat R2= 0,4219. Dat betekent dat 42% van de variatie in je gegevens door de trendlijn voorspeld wordt. Als dit getal dicht bij 0 ligt, wordt er bijna geen variatie door de lijn voorspeld, als het getal dicht bij 1 ligt wordt bijna alle variatie door de lijn voorspeld. Als je wilt weten hoe dit getal wordt berekend, kan de docent je dit uitleggen, maar je hoeft dat niet te kunnen.
Je kunt je voorstellen dat als je een voorspelling doet, je graag zo goed mogelijk voorspelt. Een hoge R2 is dus prettig.
Je ziet hieronder een paar filmpjes. In het 1e filmpje wordt getoond hoe je de regressie in Excel uitvoert.
In het tweede filmpje wordt in detail getoond hoe de R-kwadraat berekend wordt.
In het derde filmpje wordt nog gedetailleerder getoond hoe de regressie tot stand komt.
Regressie in Excel https://youtu.be/dY-KYlQrVD0
R-kwadraat met de hand https://youtu.be/QzG6W_BTsWs
R-kwadraat detail https://youtu.be/rH0bF0VnU0Y