Als je twee groepen met elkaar vergelijkt die dezelfde individuen bevatten, bijv. begrip van de stof voor of na een uitleg, is het handig om het gegeven dat je een individu meerdere keren meet te gebruiken voor je analyse. Stel, je geeft een klas een toets over zuur-base reacties om te kijken wat leerlingen er al van weten voordat je het gaat uitleggen. Stel dat het gemiddelde cijfer dan een 6 is. Het kan zijn dat als je dit na de uitleg weer test dat het gemiddelde 6,5 is geworden. Je zou dan kunnen concluderen dat de uitleg gewerkt heeft. Maar wat nou als er 1 leerling veel beter heeft gescoord en de rest allemaal iets slechter (het was een verwarrende uitleg). Je zou dan de verkeerde conclusie hebben getrokken.
Je ziet in onderstaande grafiek de hoeveelheid melk die 10 koeien (maar 10 koeien gebruiken voor zo'n onderzoek is natuurlijk niet heel betrouwbaar) geven voor en na de toevoeging van een extra stof aan het voer. De gemiddeldes op beide momenten zijn gelijk. Elk lijntje verbindt de meetpunten van 1 koe.
Je ziet dat de meeste koeien bij het tweede meetpunt minder melk geven en dat er 1 koe veel meer melk gaat geven. Dit soort gegevens noemen we gepaarde gegevens. Van elke koe zijn de meetpunten een paartje, ze horen bij elkaar. Vergelijk het eens met onderstaande figuur.
Je ziet hier dat op een na alle koeien meer melk geven en dat 1 koe volledig de weg kwijt is. Als je nu gewoon naar de gemiddeldes had gekeken had je dit niet opgemerkt. De t-test voor gepaarde gegevens houdt rekening met de verandering per individu tussen twee meetmomenten en gebruikt dat om iets te zeggen over de groepsverschillen en dus het effect van de tijd of wat je dan ook doet tussen de twee momenten in.
Je gebruikt hiervoor de functie =t.test( , vervolgens selecteer je de beide groepen (voor en na), vervolgens typ je een 2. Je krijgt nu van excel de keus tussen 3 mogelijkheden: 1) gekoppeld, 2) 2 steekproeven met gelijke variantie, 3) 2 steekproeven met ongelijke variantie. Je kiest hier 1.
Het getal dat verschijnt nadat je op enter hebt gedrukt is de kans dat met deze data H0 waar is. Als deze kans kleiner is dan 0,05 mag je zeggen dat er een significant verschil is tussen de twee meetmomenten. Als dat zo is, moet je ook beschrijven wat dat verschil dan is.
T-test gekoppeld https://www.youtube.com/watch?v=PJpb2dYVB5Y&feature=youtu.be
Je ziet uit bovenstaande vraag het belang van het meenemen van gepaardheid van gegevens. Je bent dan namelijk veel beter in staat om te zeggen of er een effect is met de tijd.
Je zult zien dat je straks uit de vragen zult moeten afleiden of er sprake is van gepaarde gegevens. Als je leest dat er metingen voor en na een bepaalde behandeling gedaan worden en die vergeleken moeten worden, of dat ze individuen na een lange tijd weer meten, dan moet je beseffen dat je met gepaarde gegevens te maken hebt.