11.4 - R en statistiek - deel 1

We hebben al even naar de statistieken van regressies gekeken. Hierboven is een simpel model gemaakt, en je hebt gezien hoe je bij een boxplot meerdere variabelen kunt combineren in een model. Dat geeft veel mogelijkheden voor regressies met meerdere variabelen.

We gaan hier dieper in op de t-testen. t-testen zijn testen die in de gewone praktijk niet zo vaak voorkomen. Het is bijna nooit zo dat je groepen zo maar 1 op 1 kunt vergelijken. Er zijn heel vaak andere variabelen die een rol spelen. Typ dit:

voorplot<- read.table("https://maken.wikiwijs.nl/bestanden/934933/structuur%20gegevens.csv", header=TRUE, dec=",", sep=";")

Nu heb je gegevens waarin zich twee groepen bevinden, namelijk de twee landen. We gaan testen of die groepen verschillen.

Typ:

t.test(voorplot$Lichaamstemperatuur~voorplot$Land, paired=FALSE)

Dit commando voert een t-test uit, van lichaamstemperatuur per land, en het is een ongepaarde test. Je krijgt nu het volgende scherm:

Je ziet rechtsbovenin de kans op onterecht verwerpen van H0, in dit geval 0,06. We mogen H0 dus niet verwerpen, er lijkt geen verschil te zijn.

Je ziet daaronder het 95% betrouwbaarheidsinterval, in 95% van de gevallen ligt het verschil tussen deze twee groepen binnen deze waarden. Je ziet dat de ondergrens lager is dan 0 en de bovengrens hoger, 0 zit tussen deze grenzen, vandaar dat er geen significant verschil is.

Verder zie je de gemiddeldes van beide groepen. Je ziet ook direct dat de verschillen erg klein zijn.

Met 1 regeltje krijg je dus ontzettend veel informatie.

We gaan nu even alleen Nederland selecteren:

Nederland<- voorplot[voorplot$Land=="Nederland",]

Hier geef je aan dat van voorplot we alle regels gaan selecteren waarvan de variabele "Land" gelijk is aan Nederland. Binnen vierkante haakjes binnen R wordt namelijk voor de komma de regels aangegeven en na de komma de kolommen.

Binnen Nederland hebben we namelijk 4 momenten van dezelfde personen.

Als we nu eens de 1e twee momenten selecteren op dezelfde manier als hierboven.

Vervolgens willen we weten of deze personen een verandering in de tijd laten zien in hun temperatuur. Hiervoor kunnen we de gepaarde t-test uitvoeren tussen moment 1 en moment 2.