Data Beschrijven

Boxplot maken

Maak twee datasets van dezelfde set: 1 origineel en 1 plotversie

Aantal respondenten

Aantal deelnemers zowel voor- en nameting CIV per hogeschool

Syntax =

SORT CASES BY HS.
SPLIT FILE SEPARATE BY HS.

FREQUENCIES VARIABLES=GESLACHT LEEFTIJD
/BARCHART FREQ
/ORDER=ANALYSIS.

Select specific cases to analyse in SPSS

Vraag: Hoe kan ik bepaalde respondenten -die niet aan zowel voor- en nameting hebben deelgnomen- uitsluiten van de analyses inzake metingen over de tijd?

Stel ik wel HS4 buiten de analyses houden en dus wegstrepen

Data > select cases > if codition

HS=1 or HS=2 or HS=3 (let op: spatie)

Gepaarde T-test

Toepassing van de gepaarde T-toets

Let op :

aantal respondenten < 30
skweness en kurtosis tussen de - 1,96 en + 1,96

Syntax

T-TEST PAIRS=M1_CIV_MEAN WITH M2_CIV_MEAN (PAIRED)
/ES DISPLAY(TRUE) STANDARDIZER(SD)
/CRITERIA=CI(.9500)
/MISSING=ANALYSIS.

Uitleg OU

Voor interpretatie van uitkomsten zie --> https://spsshandboek.nl/paired-samples-t-test/

Zie voor uitgebreide Uitleg

https://wiki.uva.nl/methodologiewinkel/index.php/Normaliteit -->

Wanneer we normaliteit testen met behulp van de Kolmogorov-Smirnov of de Shapiro Wilk, geldt dat de nulhypothese een normale verdeling inhoudt, en de alternatieve een hypothese duidt een van normaliteit afwijkende verdeling.

p-waarde < 0.05 = we weerleggen de nulhypothese.
Conclusie: de steekproefverdeling is afwijkend is van een normaalverdeling.

Een niet-significante p-waarde duidt erop dat we de nulhypothese aanhouden, en dat we aan mogen nemen dat de data normaal verdeeld is.

Wat betreft de keuze voor één van beide testen, wordt over het algemeen aangenomen dat de Shapiro-Wilk test beter is voor kleinere samples.

Normaliteit

Hoi

hoi

Kolmogorov-Smirnov of de Shapiro Wilk?

Wanneer we normaliteit testen met behulp van de Kolmogorov-Smirnov of de Shapiro Wilk, geldt dat de nulhypothese een normale verdeling inhoudt, en de alternatieve een hypothese duidt een van normaliteit afwijkende verdeling. Wanneer de p-waarde lager is dan 0.05 (ons significantieniveau) weerleggen we de nulhypothese, en concluderen we dat de verdeling afwijkend is van een normaalverdeling. Een niet-significante p-waarde duidt erop dat we de nulhypothese aanhouden, en dat we aan mogen nemen dat de data normaal verdeeld is. In dit geval is er volgens beide testen aan de aanname van normaliteit voldaan op beide afhankelijke variabelen (angst en depressie) voor beide groepen. Wat betreft de keuze voor één van beide testen, wordt over het algemeen aangenomen dat de Shapiro-Wilk test beter is voor kleinere samples.

Wat is klein? < 50

Ron Pat over de S-W

https://onderzoeksvragen.ou.nl/index.php/8030/variabelen-voldoen-normaliteit-basis-shapiro-rapporteren

Syntax

Normaliteit alle Hogescholen samen

SPLIT FILE OFF.

EXAMINE VARIABLES=M1_CIV_MEAN M2_CIV_MEAN
/PLOT BOXPLOT HISTOGRAM NPPLOT
/COMPARE GROUPS
/STATISTICS DESCRIPTIVES EXTREME
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.

Normaliteit per Hogeschool

syntax -->

SORT CASES BY HS.
SPLIT FILE SEPARATE BY HS.

EXAMINE VARIABLES=M1_CIV_MEAN M2_CIV_MEAN
/PLOT BOXPLOT HISTOGRAM NPPLOT
/COMPARE GROUPS
/STATISTICS DESCRIPTIVES EXTREME
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.

Wilcoxon signed rank toets als niet voldaan aan normaliteit

Gebruik de Wilcoxon signed rank toets om te toetsen of de som van de rangnummers1 van de verdelingen van twee gepaarde groepen van elkaar verschillen.2 Deze toets is een alternatief voor de gepaarde t-toets als de verschilscores van de gepaarde groepen niet normaal verdeeld zijn.

https://sh-studiedata.nl/R/07-Wilcoxon-signed-rank-toets-I-R.html

Je vindt de test in SPSS 16 onder Analyze->Non-parametric Tests->2 Related Samples.

Samenhang tussen CIV en DSL

http://www.wynneconsult.com/forum%20statistiek/viewtopic.php?f=4&t=1703

Het aanmaken van de schalen:

Een somschaal is het gemiddelde van alle items die tot de schaal behoren: (IT1+IT2+…ITn)/n = Somschaal
Deze somschaal kan aangemaakt worden via compute en wordt bijgevolg een nieuwe variabele in de datafile.
Opmerking voor verdere analyses met deze nieuwe variabele: een somschaal is altijd metrisch!

Betrouwbaarheid van de schalen

Syntax =

RELIABILITY
/VARIABLES=M1_CIV1 M1_CIV2 M1_CIV3 M1_CIV4 M1_CIV5 M1_CIV6 M1_CIV7 M1_CIV8
/SCALE('Cognitieve Interactievaardigheden') ALL
/MODEL=ALPHA
/STATISTICS=DESCRIPTIVE SCALE
/SUMMARY=TOTAL.

FACTOR ANALYSE

KMO test

zie -->

https://wiki.uva.nl/methodologiewinkel/index.php/Principal_Component_Analysis_(PCA)

notities hieruit =

geen vaste assumpties om een PCA (factoranalyse) uit te voeren, wel als je analyses wilt uitvoeren dan;

is een normaal verdeling van de data wenselijk
- steekproef adequaat? Kaiser-Meyer-Olkin (KMO) test uitvoeren --> Als de KMO statistic (ligt tussen 0 en 1) een waarde van 0,5 of hoger heeft, is aan deze assumptie voldaan.

an adequate sample size = een voldoende grote steekproef

"Een volgend deel van de output komt de KMO en Bartlett’s test en de Anti image matrix. Bij de KMO kan gekeken worden of de steekproefgrootte goed genoeg is voor de factoranalyse. In de diagonaal van de Anti-image matrices is de KMO voor individuele variabelen te zien. Wanneer een waarde onder de 0.5 is, kan die variabele beter uit de analyse verwijderd worden. De getallen die niet op de diagonaal liggen, zijn de partiële correlaties en die moeten zo klein mogelijk zijn" (bron).

"De Kaiser-Meyer-Olkin measure of sampling adequacy (KMO) is de ratio van de gekwadrateerde correlatie tussen variabelen en de gekwadrateerde partiële correlatie tussen variabelen. Het kan berekend worden voor een individu en voor meerdere variabelen. De KMO varieert tussen 0 en 1. Wanneer de waarde dicht bij 1 ligt, is een factoranalyse geschikt en betrouwbaar. Een waarde onder de 0.5 is onacceptabel." (bron).

Voorbeeld van een beschrijving uit een methodeparagraaf

"Vervolgens is de Kaiser-Meyer-Olkin measure of sampling adequacy (KMO) gebruikt om te bepalen of de data geschikt is voor factor analyse (Field, 2009). Volgens Field (2009) is een waarde tussen .5 en .7 matig, tussen .7 en .8 is goed, tussen .8 en .9 is zeer goed en hoger dan .9 is uitmuntend." (bron)

Analyze > Dimension Reduction > Factor

Bartlett's test of sphericity

Voorwaarde is een normaalverdeling van de data te testen met KMO.

Als de "KMO" test niet significant is kan je aanemen dat je steekproef groot genoeg is. In het geval dat de "Bartlett's Test of Sphericity" significant is mag je aanemen dat het probleem van te lage correlaties tussen de variabelen niet bestaat.

VRAGEN EN ANTWOORDEN

Ik wil graag een 5 punts likert schaal analyseren. Ik heb de categorien gecodeerd van o tot 5. Is dit correct?

https://onderzoeksvragen.ou.nl/index.php/6782/graag-likert-schaal-analyseren-categorien-gecodeerd-correct

"Hoewel ieder individueel item in de schaal een ordinaal meetniveau heeft, is het meetniveau van de somscore of het gemiddelde iets tussen ordinaal en interval in (quasi-interval). Een nonparametrische toets hierop gebruiken levert in de basis onnodig veel powerverlies op. Omdat in de meeste gevallen de samengestelde Likert-schalen zich voldoende continue gedragen kun je beter eerst toetsen of de samengestelde schaal zich bijvoorbeeld voldoende normaal verdeeld gedraagt. Zo ja, dan heeft een parametrische toets (linear model in dit geval) meer power.

Non-parametrische toetsen hebben hun voordelen, maar doordat er voor het gedrag van de data geen onderliggende verdeling wordt gebruikt, is een non-parametrische toets minder 'scherp' dan een parametrische toets. Het kiezen voor een nonparametrisch alternatief moet dus altijd gezien worden als een trade-off; een kosten-baten analyse. Hoeveel power 'red' ik wanneer ik nonparametrisch ga?

In het geval van het gemiddelde of de som van Likert-schalen zou ik zeker niet beginnen met nonparametrische middelen. Toets eerst of je met een goed geweten de parametrische opties kunt kiezen, zoals t-toets, anova, of regressie. Maar dat hangt ook van het aantal items af. Als je schaal maar uit twee of drie items bestaat (en stel dat je dan ook nog geen 5-punts, maar een 2 of 3-puntsschaal zou hebben), dan zou ik wel eerder naar het nonparametrische zoeken".

Z-scores

Video

https://deafstudeerconsultant.nl/statistiek-met-spss/data-analyse/z-score-berekenen-met-de-z-toets/

Antwoord Ron Patei

https://onderzoeksvragen.ou.nl/index.php/7192/outliers-verschillen-via-z-scores-of-boxplot

https://onderzoeksvragen.ou.nl/index.php/3654/wat-is-de-juiste-manier-om-te-zien-of-er-uitbijters-zijn

Colofon
Het arrangement Data Analyse met SPSS is gemaakt met Wikiwijs van Kennisnet. Wikiwijs is hét onderwijsplatform waar je leermiddelen zoekt, maakt en deelt.

Auteur

Geertje Blanket

Laatst gewijzigd

2022-01-16 21:41:20

Licentie

Dit lesmateriaal is gepubliceerd onder de Creative Commons Naamsvermelding 4.0 Internationale licentie. Dit houdt in dat je onder de voorwaarde van naamsvermelding vrij bent om:

het werk te delen - te kopiëren, te verspreiden en door te geven via elk medium of bestandsformaat

het werk te bewerken - te remixen, te veranderen en afgeleide werken te maken

voor alle doeleinden, inclusief commerciële doeleinden.

Meer informatie over de CC Naamsvermelding 4.0 Internationale licentie.

Aanvullende informatie over dit lesmateriaal

Van dit lesmateriaal is de volgende aanvullende informatie beschikbaar:

Toelichting

Hier sla ik informatie op die ik nodig heb voor het analyseren van mijn data

Eindgebruiker

leerling/student

Moeilijkheidsgraad

gemiddeld

Studiebelasting

4 uur 0 minuten

Data Analyse met SPSS

nl

Geertje Blanket

Geertje Blanket

2022-01-16 21:41:20

Hier sla ik informatie op die ik nodig heb voor het analyseren van mijn data

leerling/student

PT4H
Download
Downloaden

Het volledige arrangement is in de onderstaande formaten te downloaden.

pdf

json

IMSCP package

Metadata

Metadata overzicht (Excel)

LTI

Leeromgevingen die gebruik maken van LTI kunnen Wikiwijs arrangementen en toetsen afspelen en resultaten terugkoppelen. Hiervoor moet de leeromgeving wel bij Wikiwijs aangemeld zijn. Wil je gebruik maken van de LTI koppeling? Meld je aan via info@wikiwijs.nl met het verzoek om een LTI koppeling aan te gaan.

Maak je al gebruik van LTI? Gebruik dan de onderstaande Launch URL’s.

Arrangement

IMSCC package

Wil je de Launch URL’s niet los kopiëren, maar in één keer downloaden? Download dan de IMSCC package.

IMSCC package

Voor developers

Wikiwijs lesmateriaal kan worden gebruikt in een externe leeromgeving. Er kunnen koppelingen worden gemaakt en het lesmateriaal kan op verschillende manieren worden geëxporteerd. Meer informatie hierover kun je vinden op onze Developers Wiki.
Sluiten
Opties
Gebruik
Weergave
Wikiwijs is een dienst van

Data Beschrijven

Aantal respondenten

Aantal deelnemers zowel voor- en nameting CIV per hogeschool

Select specific cases to analyse in SPSS

Gepaarde T-test

Normaliteit

Kolmogorov-Smirnov of de Shapiro Wilk?

Syntax

Wilcoxon signed rank toets als niet voldaan aan normaliteit

Samenhang tussen CIV en DSL

Betrouwbaarheid van de schalen

FACTOR ANALYSE

KMO test

Bartlett's test of sphericity

VRAGEN EN ANTWOORDEN

Ik wil graag een 5 punts likert schaal analyseren. Ik heb de categorien gecodeerd van o tot 5. Is dit correct?

Z-scores

Downloaden

Metadata

LTI

Arrangement

IMSCC package

Voor developers

Gebruik

Weergave