Hoofdstuk 9 - Chi-kwadraattest

Deze test is eigenlijk de makkelijkste statistische test, die je in bijna alle situaties kunt toepassen. Bij deze test toets je namelijk of datgene wat je waarneemt statistisch significant afwijkt van wat je verwacht.

 

Een voorbeeld: stel ik gooi 100x een munt op. Dan verwacht ik dat er 50x kop en 50x munt uit komt. Nu krijg ik 43x kop en 57x munt. Is mijn munt raar is dit toeval?

Je kunt dit onderzoeken met de Chi-kwadraattest. Veel statistische testen werken alleen met schaalgegevens of continue. Dat zijn gegevens zoals lengte, temperatuur, hoogte etc. Allemaal grootheden die je op een bepaalde manier kunt meten en waarbij een 2x zo groot getal ook echt iets zegt. Als je wilt onderzoeken of een zak m&m’s meer snoepjes van een kleur heeft dan van een andere kun je die niet gebruiken, want de mogelijke opties van kleur zijn: rood, bruin, groen etc. Die verschillende mogelijke waarden staan niet kwantitatief tot elkaar maar kwalitatief. Of als je wilt weten of een bepaalde naam vaker voorkomt dan een andere. Zulke gegevens noemen we nominale gegevens. De Chi-kwadraattest kun je altijd voor nominale gegevens gebruiken. De conclusie is echter ook beperkt. Je kunt alleen maar een conclusie trekken of de waarneming statistisch significant afwijkt van je verwachting.

Hoe voer je deze test uit?

Stappenplan Chi-kwadraat test:

  1. Bereken de totalen per rij en kolom.
  2. De verwachting gaat berekend worden volgens jouw hypothese. Als je verwacht dat de kans op alle mogelijke uitkomsten gelijk gaat zijn (t.o.v. hoe veel gegevens er zijn) kies je onderstaande methode.
  3. Je deelt het totaal van een kolom te delen door het totaal van de hele tabel, en dit te vermenigvuldigen met hoeveel er totaal in een rij staan. Door met F4 ofwel de rij of de kolom vast te zetten, kun je zo’n tabel heel makkelijk maken.

Het berekenen van de verwachting voor 5H1 en hoeveel katten er verwacht worden.

Hoe kopieer je nu de functie op een juiste manier naar de andere cellen, zonder dat er de verkeerde uitkomsten komen te staan?

Als je de functie gewoon kopieert naar rechts of beneden, dan verplaatst ook de verwijzing zich, zoals je hieronder ziet.

Door de verwijzing naar de verschillende cellen op een verschillende manier vast te zetten kun je voorkomen dat de verwijzing verkeerd verplaatst.

Je ziet hieronder dat bij de cel D5 er nu een $ staat voor de 5 (D$5). Dat betekent dat rij 5 vast staat, en dat de D wel nog kan veranderen in een C of E etc. Dat betekent dat de verwijzing wel naar rechts en links kan verplaatsten, maar niet naar boven of beneden. Omdat we steeds willen verwijzen naar de totalen van de kolommen (die naast elkaar staan) is dit handig.

Je ziet ook dat we bij F5 zowel de F als de 5 vastzetten ($F$5). Daarmee kan de verwijzing helemaal niet verplaatsen. Bij de F4 hebben we alleen de kolom vastgezet, hij kan dus wel omhoog en omlaag verplaatsen maar niet naar links of rechts ($F4). Let op, je ziet hier het resultaat van iets dat ik in cel B9 heb aangepast en wat dit voor gevolg had voor cel D11.

  1. Je hebt nu twee tabellen, één met de waarnemingen en één met de verwachtingen op basis van gelijke frequenties.
  2. Kies een lege cel en typ daar het volgende in: =chi.toets(

Je moet nu eerst de waarnemingen selecteren met je muis. Daarna typ je een puntkomma en selecteer je de verwachtingen. Haakje sluiten en enter geeft de kans op het onterecht verwerpen van H0. Dit is dus de kans dat je zegt dat er verschil is, terwijl er eigenlijk geen verschil is. Als deze kans kleiner is dan 0,05 mag je zeggen dat de kans klein is dat jouw waarnemingen voor kunnen komen als de nulhypothese waar is. Dan is hij waarschijnlijk dus niet waar.

Chi-kwadraattest 1 https://youtu.be/rlJpuakSN8A

Chi-kwadraattest 2 https://youtu.be/0Cv23fdB9hQ

opdracht 64.xlsx

opdracht 65.xslx