Samenvatting

weergeven in plaatjes

Een databestand kan o.a. worden gevisualiseerd met

 

 

 

kruistabel

In een kruistabel worden het wel/niet hebben van twee eigenschappen tegen elkaar uitgezet. Uit een kruistabel kan worden afgelezen hoe vaak de twee eigenschappen tegelijk voorkomen. En dus of de twee eigenschappen (sterk of zwak) samenhangen.

 

 

tijdgrafieken

Als een aantal bijvoorbeeld elk jaar gemeten wordt, kunnen die waarden in een grafiek worden uitgezet, met de tijd op de horizontale as. Door de stippen
(de waarden) met rechte lijntjes te verbinden, krijg je een polygoon.
Je kunt de gemiddelde waarde aangeven door een horizontale lijn. De oppervlakte van het gebied onder die lijn en boven de polygoon is gelijk aan de
oppervlakte van het gebied boven de lijn en onder de polygoon.

 

 

gemiddelde

Het gemiddelde van een stel waarden ligt "midden" tussen die waarden in. De
waarden die kleiner zijn dan het gemiddelde wijken tezamen evenveel van dat
gemiddelde af als de waarden die groter zijn dan het gemiddelde.
Het gemiddelde kan worden berekend door alle waarden op te tellen en de som
te delen door het aantal waarden. Als een waarde met een zekere frequentie
voorkomt, moet die waarde zo vaak geteld worden als de frequentie bedraagt.

Ook kan men een schatting maken voor het gemiddelde, alle afwijkingen ten
opzichte van die schatting nemen (positief en negatief), de gemiddelde afwijking
berekenen en die optellen bij de schatting.

 

 

klassenindeling 

Gegeven is een verzameling data (waarden).

spreidingsbreedte =

grootste − kleinste van alle waarnemingen

frequentie van een waarde =

het aantal keer dat de waarde voorkomt

modus =

de meest voorkomende waarde

Vaak worden de data in klassen ingedeeld.

klassenbreedte =

grootst mogelijke verschil binnen een klasse

frequentie van een klasse =

het aantal keer dat een waarde in de klasse viel

modale klasse =

klasse met de hoogste frequentie

 

 

 

in gelijke delen

Je kunt de verzameling data splitsen in twee stukken van elk 50%. Het grensgetal
tussen de kleinste helft en de grootste helft heet de mediaan. De mediaan is dus
de middelste waarde (als je de waarden op volgorde zet van klein naar groot).


Je kunt de verzameling data splitsen in drie stukken van elk 33%.


Je kunt de verzameling data ook splitsen in vier delen van elk 25%. De drie
grensgetallen heten eerste kwartiel, tweede kwartiel en derde kwartiel.
Het tweede kwartiel is de mediaan.


Je kunt de verzameling data splitsen in tien stukken van elk 10%, enzovoort.