Data Analyse met SPSS

Data Analyse met SPSS

Data Beschrijven

Boxplot maken 

 

Maak twee datasets van dezelfde set: 1 origineel en 1 plotversie 

 

 

 

Aantal respondenten

Aantal deelnemers zowel voor- en nameting CIV per hogeschool

Syntax =

 

SORT CASES  BY HS.
SPLIT FILE SEPARATE BY HS.


FREQUENCIES VARIABLES=GESLACHT LEEFTIJD
  /BARCHART FREQ
  /ORDER=ANALYSIS.

 

 

 

 

 

 

 

Select specific cases to analyse in SPSS

Vraag: Hoe kan ik bepaalde respondenten -die niet aan zowel voor- en nameting hebben deelgnomen- uitsluiten van de analyses inzake metingen over de tijd?


Stel ik wel HS4 buiten de analyses houden en dus wegstrepen 

Data > select cases > if codition

HS=1 or HS=2 or HS=3 (let op: spatie) 

Gepaarde T-test

Toepassing van de gepaarde T-toets

 

Let op :

 

  • aantal respondenten < 30
  • skweness en kurtosis tussen de - 1,96 en + 1,96

Syntax

T-TEST PAIRS=M1_CIV_MEAN WITH M2_CIV_MEAN (PAIRED)
  /ES DISPLAY(TRUE) STANDARDIZER(SD)
  /CRITERIA=CI(.9500)
  /MISSING=ANALYSIS.

 

Uitleg OU

Voor interpretatie van uitkomsten zie --> https://spsshandboek.nl/paired-samples-t-test/

Zie voor uitgebreide Uitleg

https://wiki.uva.nl/methodologiewinkel/index.php/Normaliteit -->

Wanneer we normaliteit testen met behulp van de Kolmogorov-Smirnov of de Shapiro Wilk, geldt dat de nulhypothese een normale verdeling inhoudt, en de alternatieve een hypothese duidt een van normaliteit afwijkende verdeling.  

p-waarde < 0.05  = we weerleggen de nulhypothese.
Conclusie: de steekproefverdeling is afwijkend is van een normaalverdeling.

Een niet-significante p-waarde duidt erop dat we de nulhypothese aanhouden, en dat we aan mogen nemen dat de data normaal verdeeld is.

 

Wat betreft de keuze voor één van beide testen, wordt over het algemeen aangenomen dat de Shapiro-Wilk test beter is voor kleinere samples.

Normaliteit

Hoi

hoi

 

 

 

 

Kolmogorov-Smirnov of de Shapiro Wilk?

Wanneer we normaliteit testen met behulp van de Kolmogorov-Smirnov of de Shapiro Wilk, geldt dat de nulhypothese een normale verdeling inhoudt, en de alternatieve een hypothese duidt een van normaliteit afwijkende verdeling. Wanneer de p-waarde lager is dan 0.05 (ons significantieniveau) weerleggen we de nulhypothese, en concluderen we dat de verdeling afwijkend is van een normaalverdeling. Een niet-significante p-waarde duidt erop dat we de nulhypothese aanhouden, en dat we aan mogen nemen dat de data normaal verdeeld is. In dit geval is er volgens beide testen aan de aanname van normaliteit voldaan op beide afhankelijke variabelen (angst en depressie) voor beide groepen. Wat betreft de keuze voor één van beide testen, wordt over het algemeen aangenomen dat de Shapiro-Wilk test beter is voor kleinere samples.

 

Wat is klein? < 50

Syntax

  • Normaliteit alle Hogescholen samen

SPLIT FILE OFF.

EXAMINE VARIABLES=M1_CIV_MEAN M2_CIV_MEAN
  /PLOT BOXPLOT HISTOGRAM NPPLOT
  /COMPARE GROUPS
  /STATISTICS DESCRIPTIVES EXTREME
  /CINTERVAL 95
  /MISSING LISTWISE
  /NOTOTAL.

  • Normaliteit per Hogeschool

 

syntax -->

SORT CASES  BY HS.
SPLIT FILE SEPARATE BY HS.

 

EXAMINE VARIABLES=M1_CIV_MEAN M2_CIV_MEAN
  /PLOT BOXPLOT HISTOGRAM NPPLOT
  /COMPARE GROUPS
  /STATISTICS DESCRIPTIVES EXTREME
  /CINTERVAL 95
  /MISSING LISTWISE
  /NOTOTAL.

Wilcoxon signed rank toets als niet voldaan aan normaliteit

Gebruik de Wilcoxon signed rank toets om te toetsen of de som van de rangnummers1 van de verdelingen van twee gepaarde groepen van elkaar verschillen.2 Deze toets is een alternatief voor de gepaarde t-toets als de verschilscores van de gepaarde groepen niet normaal verdeeld zijn.

 

https://sh-studiedata.nl/R/07-Wilcoxon-signed-rank-toets-I-R.html

 

Je vindt de test in SPSS 16 onder Analyze->Non-parametric Tests->2 Related Samples.

Samenhang tussen CIV en DSL

http://www.wynneconsult.com/forum%20statistiek/viewtopic.php?f=4&t=1703

 

Het aanmaken van de schalen:

  • Een somschaal is het gemiddelde van alle items die tot de schaal behoren: (IT1+IT2+…ITn)/n = Somschaal

  • Deze somschaal kan aangemaakt worden via compute en wordt bijgevolg een nieuwe variabele in de datafile.

  • Opmerking voor verdere analyses met deze nieuwe variabele: een somschaal is altijd metrisch!

 

 

Betrouwbaarheid van de schalen

Syntax =

 

 

RELIABILITY
  /VARIABLES=M1_CIV1 M1_CIV2 M1_CIV3 M1_CIV4 M1_CIV5 M1_CIV6 M1_CIV7 M1_CIV8
  /SCALE('Cognitieve Interactievaardigheden') ALL
  /MODEL=ALPHA
  /STATISTICS=DESCRIPTIVE SCALE
  /SUMMARY=TOTAL.

FACTOR ANALYSE

KMO test

zie -->

https://wiki.uva.nl/methodologiewinkel/index.php/Principal_Component_Analysis_(PCA)

 

notities hieruit =

 

geen vaste assumpties om een PCA (factoranalyse) uit te voeren, wel als je analyses wilt uitvoeren dan;

  • is een normaal verdeling van de data wenselijk
    • steekproef adequaat? Kaiser-Meyer-Olkin (KMO) test uitvoeren --> Als de KMO statistic (ligt tussen 0 en 1) een waarde van 0,5 of hoger heeft, is aan deze assumptie voldaan.

 

 an adequate sample size = een voldoende grote steekproef

 

"Een volgend deel van de output komt de KMO en Bartlett’s test en de Anti image matrix. Bij de KMO kan gekeken worden of de steekproefgrootte goed genoeg is voor de factoranalyse. In de diagonaal van de Anti-image matrices is de KMO voor individuele variabelen te zien. Wanneer een waarde onder de 0.5 is, kan die variabele beter uit de analyse verwijderd worden. De getallen die niet op de diagonaal liggen, zijn de partiële correlaties en die moeten zo klein mogelijk zijn" (bron).

"De Kaiser-Meyer-Olkin measure of sampling adequacy (KMO) is de ratio van de gekwadrateerde correlatie tussen variabelen en de gekwadrateerde partiële correlatie tussen variabelen. Het kan berekend worden voor een individu en voor meerdere variabelen. De KMO varieert tussen 0 en 1. Wanneer de waarde dicht bij 1 ligt, is een factoranalyse geschikt en betrouwbaar. Een waarde onder de 0.5 is onacceptabel." (bron).


Voorbeeld van een beschrijving uit een methodeparagraaf

"Vervolgens is de Kaiser-Meyer-Olkin measure of sampling adequacy (KMO) gebruikt om te bepalen of de data geschikt is voor factor analyse (Field, 2009). Volgens Field (2009) is een waarde tussen .5 en .7 matig, tussen .7 en .8 is goed, tussen .8 en .9 is zeer goed en hoger dan .9 is uitmuntend." (bron)

 

Analyze > Dimension Reduction >  Factor

 

 

 

 

Bartlett's test of sphericity

Voorwaarde is een normaalverdeling van de data te testen met KMO.

Als de "KMO" test niet significant is kan je aanemen dat je steekproef groot genoeg is. In het geval dat de "Bartlett's Test of Sphericity" significant is mag je aanemen dat het probleem van te lage correlaties tussen de variabelen niet bestaat.

 

 

 

 

VRAGEN EN ANTWOORDEN

Ik wil graag een 5 punts likert schaal analyseren. Ik heb de categorien gecodeerd van o tot 5. Is dit correct?

 

https://onderzoeksvragen.ou.nl/index.php/6782/graag-likert-schaal-analyseren-categorien-gecodeerd-correct

 

"Hoewel ieder individueel item in de schaal een ordinaal meetniveau heeft, is het meetniveau van de somscore of het gemiddelde iets tussen ordinaal en interval in (quasi-interval). Een nonparametrische toets hierop gebruiken levert in de basis onnodig veel powerverlies op. Omdat in de meeste gevallen de samengestelde Likert-schalen zich voldoende continue gedragen kun je beter eerst toetsen of de samengestelde schaal zich bijvoorbeeld voldoende normaal verdeeld gedraagt. Zo ja, dan heeft een parametrische toets (linear model in dit geval) meer power.

Non-parametrische toetsen hebben hun voordelen, maar doordat er voor het gedrag van de data geen onderliggende verdeling wordt gebruikt, is een non-parametrische toets minder 'scherp' dan een parametrische toets. Het kiezen voor een nonparametrisch alternatief moet dus altijd gezien worden als een trade-off; een kosten-baten analyse. Hoeveel power 'red' ik wanneer ik nonparametrisch ga?

In het geval van het gemiddelde of de som van Likert-schalen zou ik zeker niet beginnen met nonparametrische middelen. Toets eerst of je met een goed geweten de parametrische opties kunt kiezen, zoals t-toets, anova, of regressie. Maar dat hangt ook van het aantal items af. Als je schaal maar uit twee of drie items bestaat (en stel dat je dan ook nog geen 5-punts, maar een 2 of 3-puntsschaal zou hebben), dan zou ik wel eerder naar het nonparametrische zoeken".

Z-scores

  • Het arrangement Data Analyse met SPSS is gemaakt met Wikiwijs van Kennisnet. Wikiwijs is hét onderwijsplatform waar je leermiddelen zoekt, maakt en deelt.

    Auteur
    Geertje Blanket Je moet eerst inloggen om feedback aan de auteur te kunnen geven.
    Laatst gewijzigd
    2022-01-16 21:41:20
    Licentie

    Dit lesmateriaal is gepubliceerd onder de Creative Commons Naamsvermelding 4.0 Internationale licentie. Dit houdt in dat je onder de voorwaarde van naamsvermelding vrij bent om:

    • het werk te delen - te kopiëren, te verspreiden en door te geven via elk medium of bestandsformaat
    • het werk te bewerken - te remixen, te veranderen en afgeleide werken te maken
    • voor alle doeleinden, inclusief commerciële doeleinden.

    Meer informatie over de CC Naamsvermelding 4.0 Internationale licentie.

    Aanvullende informatie over dit lesmateriaal

    Van dit lesmateriaal is de volgende aanvullende informatie beschikbaar:

    Toelichting
    Hier sla ik informatie op die ik nodig heb voor het analyseren van mijn data
    Eindgebruiker
    leerling/student
    Moeilijkheidsgraad
    gemiddeld
    Studiebelasting
    4 uur en 0 minuten
  • Downloaden

    Het volledige arrangement is in de onderstaande formaten te downloaden.

    Metadata

    LTI

    Leeromgevingen die gebruik maken van LTI kunnen Wikiwijs arrangementen en toetsen afspelen en resultaten terugkoppelen. Hiervoor moet de leeromgeving wel bij Wikiwijs aangemeld zijn. Wil je gebruik maken van de LTI koppeling? Meld je aan via info@wikiwijs.nl met het verzoek om een LTI koppeling aan te gaan.

    Maak je al gebruik van LTI? Gebruik dan de onderstaande Launch URL’s.

    Arrangement

    IMSCC package

    Wil je de Launch URL’s niet los kopiëren, maar in één keer downloaden? Download dan de IMSCC package.

    Meer informatie voor ontwikkelaars

    Wikiwijs lesmateriaal kan worden gebruikt in een externe leeromgeving. Er kunnen koppelingen worden gemaakt en het lesmateriaal kan op verschillende manieren worden geëxporteerd. Meer informatie hierover kun je vinden op onze Developers Wiki.