11.3 - R en grafieken

Een van de mooiste grafieken is de boxplot. Veel informatie op weinig ruimte.

Typ:

voorplot<- read.table("https://maken.wikiwijs.nl/bestanden/934933/structuur%20gegevens.csv", header=TRUE, dec=",", sep=";")

En typ dan:

boxplot(voorplot$Lichaamstemperatuur, ylab="Lichaamstemperatuur")

Je ziet nu een prachtige boxplot verschijnen. Maar als je

summary(voorplot) typt zie je dat er verschillende variabelen zijn in deze dataset, namelijk ook nog land en moment.

Je kunt heel makkelijk de boxplot meer informatie laten vertellen door een afhankelijkheid te formuleren:

boxplot(voorplot$Lichaamstemperatuur~voorplot$Land, ylab="Lichaamstemperatuur")

Het golfje (tilde) geeft aan dat temperatuur afhankelijk is van land. Je kunt met het vermenigvuldigingsteken (*) of de dubbele punt (:) ook een combinatie van factoren gebruiken om conditionele boxplots te maken.

 

Een andere grafiek is het spreidingsdiagram (Engels: scatter plot). Plot is Engels voor grafiek.

Hier is een simpel commando voor:

plot(x, y)

Dus bijvoorbeeld voor twee groepen random gegevens gegenereerd met

afhankelijke<- rnorm(100,10,2) (hier worden 100 getallen gegenereerd met een gemiddelde van 10 en een standaardafwijking van 2)

onafhankelijke<- c(1:100) Dit geeft een reeks van 1 tot 100.

En dan:

plot(onafhankelijke, afhankelijke)

Aan zo'n grafiek kun je een hoop dingen wijzigen, de naam van de x-as, de minima en maxima van de assen, de kleur van de punten, het soort punten (rondjes, vierkantjes etc.). Als je

?par typt krijg je het helpmenu met alle opties voor grafieken. Die kun je toevoegen aan het plot commando. Bijv.: als je de kleur van de punten wil wijzigen voeg je een "col=" commando toe:

plot(onafhankelijke, afhankelijke, col="red")

Stel dat je door deze punten een trendlijn wil trekken. Dan moet je eerst die trendlijn bepalen. Zoals je misschien nog weet doe je dat met het lm commando.

trendlijn<- lm(afhankelijke~onafhankelijke)

als je nu summary(trendlijn) typt krijg je de statistieken voor deze lijn.

Maar als je abline(trendlijn) typt, voegt dit commando de bepaalde lijn toe aan de grafiek.

Een andere simpele grafiek is de histogram. Dit is heel eenvoudig:

hist(afhankelijke)

Je kunt ook het aantal staafjes nog beinvloeden door dit te typen:

hist(afhankelijke, breaks=20)of

hist(afhankelijke, breaks=40)

We hebben eerder al de grafieken gezien met de standaardfout of het 95% betrouwbaarheidsinterval. Even herhaald:

gegevens<- read.table("https://maken.wikiwijs.nl/bestanden/934023/gegevens%20r1.csv", sep=";", dec=",", header=TRUE)

library(sciplot) Dit is belangrijk anders herkent hij bargraph.CI niet.

bargraph.CI(gegevens$Groep, gegevens$Waarde,  ylab="Waarde", xlab="Groep")

 

cijfersklassen.csv