Doelstelling Practicum 4
A1 | Invoeren data op basis van een kruistabel
|
A2 | Cases wegen met frequentie
|
A3 | Betekenis van een waarde/code vastleggen
|
B | Kruistabel maken met alleen aantallen
|
C | Meest geschikte soort kruistabel kiezen
|
D | Kruistabel grafisch weergeven
|
E | Verband tussen 2 categorische variabelen toetsen met chikwadraat
|
F | Verandering bij dichotome, gepaarde waarnemingen toetsen met McNemar
|
Practicum 4
Het gaat in dit practicum alweer om een hypothesetoets
waarvoor de verslagsrichtlijnen bekend zijn.
.
In dit practicum worden twee hypothesen getoetst, in delen
E en F. Geef voor deze twee delen verslag, d.w.z. vertel waarover
het gaat, noem de hypothese, rechtvaardig de keuze van toets, geef
de resultaten zowel in term van waarden (van chi-kwadraat) en in
termen van p-waarden, en zeg welke conclusies men hieruit mag
trekken ten aanzien van de hypothese. Voeg geschikte grafieken
bij, maar probeer niet antwoorden op alle tussenliggende vragen te
geven.
Achtergrond
Bestaat er een verband tussen sekse en prestaties? Een grote
universiteit deelde de promovendi die 6 jaar daarvoor begonnen
waren met hun promotieonderzoek in op basis van hun vorderingen
(STATUS) en sekse. Dat leverde een kruistabel op waarin men
de (on)afhankelijkheid van de twee categorische variabelen
(vorderingsstatus en sekse) kan controlleren.
A. INVOEREN DATA OP BASIS VAN EEN KRUISTABEL
Een
kruistabel is een tabel waarin de frequenties van twee
(categorische) variabelen met elkaar gekruist worden.
----------------------------------------------
Sekse
----------------------------------------------
Status Man Vrouw
----------------------------------------------
Afgehaakt 238 98
Nog bezig 134 33
Gepromoveerd 423 98
Let op dat de vragen met de blauwe vraagtekens meestal
worden gesteld om begrip voor de materie te
kweken. Ze hoeven daarom *niet* in het verslag terug tenzij
anders expliciet vermeld wordt.
- Hoeveel variabelen zitten er in deze tabel en welke?
??
- Hoeveel cases hebben we hier?
??
- Als we deze gegevens normaal zouden invoeren, zouden we dus
een datatabel in SPSS nodig hebben van ... kolommen bij ...
regels.
??
Om deze gegevens sneller in te voeren, gebruiken we een
SPSS-trucje: we gaan de cases wegen met de frequentie. Om dit te
kunnen doen hebben we dus een extra variabele nodig met het aantal
of de frequentie van de desbetreffende cel.
- Hoeveel cellen hebben we dan nodig (om frequentie in te voeren)?
??
- Hoeveel cases/regels hebben we dus nodig?
??
- En welke kolommen/variabelen?
??
- Voer deze gegevens in en geef de variabelen de namen SEKSE,
STATUS en AANTAL.
- Weeg de cases met hun frequentie.
Hint: Data, Weight Cases... Hierna doet SPSS bij berekeningen en
plaatjes alsof de regel met gepromoveerde mannen 423 keer voorkomt.
- Hoe kun je zien dat SPSS nu de cases weegt?
??
- Geef via VARIABLE VIEW aan SPSS op welke betekenis hoort bij
je coderingen.
Hint: kolom Values.
- Welke coderingen heb je gebruikt voor status en sekse?
- Laat je datatabel checken door de practicumdocent of check hem
bij een medestudent die hem al heeft laten checken.
??
B. EEN KRUISTABEL MAKEN MET ALLEEN AANTALLEN
- Check je invoer en weging door een kruistabel van SEKSE en
STATUS te maken met daarin de aantallen per cel, dus geen
percentages e.d. en copieer de tabel naar je verslag.
Hint: Analyze, Descriptive Statistics, Crosstabs.
- Wat laat SPSS aan de randen van deze tabel zien? Wat is de
juiste term?
??
- Check de waarden in je tabel en kopieer de tabel naar je
verslag.
- Sla je datafile op in SPSS-sav format.
C. MEEST GESCHIKTE SOORT KRUISTABEL KIEZEN
Een probleem met de kruistabel hierboven is dat een verband tussen
SEKSE en STATUS niet gemakkelijk te zien is.
- Maak voor SEKSE en STATUS een tabel met alleen rijpercentages.
- Maak voor SEKSE en STATUS een tabel met alleen kolompercentages.
- Maak voor SEKSE en STATUS een tabel met alleen percentages van
het totale aantal.
Hint: Descriptive Statistics, Crosstabs. Klik op Cells en kies wat
je moet hebben. Zorg --om de tabel overzichtelijk te houden-- dat je
steeds maar één ding tegelijk in je tabel laat zien.
- Welke tabel is in jouw geval het duidelijkst om het verschil
tussen mannen en vrouwen te laten zien?
??
(Dit antwoord kan per student verschillen, afhankelijk van de
vraag wat je als kolom of als rij gebruikt hebt.)
- Kopieer deze tabel naar je verslag.
D. WAARDEN UIT DE KRUISTABEL GRAFISCH WEERGEVEN
Een grafiek spreekt de meeste lezers meer aan dan een tabel.
- Maak een grafiek (bijvoorbeeld een staafdiagram) die het
verschil tussen mannen en vrouwen zo duidelijk mogelijk laat zien.
- Kopieer deze grafiek naar je verslag.
??
- Wat is hier beter: aantallen weergeven of percentages? (Pas
zonodig je grafiek aan.)
??
Hint: Graphs, Bar...
E. VERBAND TUSSEN TWEE CATEGORISCHE VARIABELEN TOETSEN MET
CHIKWADRAAT
- Wat is het meetniveau van SEKSE?
??
- Wat is het meetniveau van STATUS?
??
- Wanneer is de chikwadraat toets de beste oplossing om een
verband tussen twee variabelen aan te tonen?
??
- Wat is de nulhypothese van de chi-kwadraat toets om een
verband aan te tonen (in woorden)?
??
- Wat is de alternatieve hypothese?
??
De chikwadraat toets vergelijkt de geobserveerde aantallen in de
kruistabel met de op basis van de randtotalen verwachte aantallen.
- Bereken via SPSS de kruistabel met alleen de verwachte
aantallen en copieer deze naar je verslag.
- Wanneer mag je de chikwadraat toets niet gebruiken?
??
- Mag je de chikwadraat toets hier toepassen en waarom?
??
- Voer de chikwadraat toets uit via SPSS.
Hint: Ga weer naar CROSSTABS en kies STATISTICS.
- Welke waarde berekent SPSS hier voor chikwadraat (afgerond op
1 decimaal nauwkeurig)?
??
- Welk aantal vrijheidsgraden vermeldt SPSS voor chikwadraat?
??
- Bereken zelf het aantal vrijheidsgraden. Klopt dit met SPSS?
??
- Welke kans hoort volgens SPSS bij de berekende chikwadraat?
??
- Is deze uitkomst significant (alfaniveau: 5%)?
??
- Wat is je conclusie?
??
- Is een significant verband hetzelfde als een sterk verband? Of
klopt dit niet?
??
- Wat zegt de chikwadraat-toets over de richting van het
verband?
??
- Als je een idee wilt krijgen van de sterkte
van het verband, zou je Cramer's V kunnen
berekenen. Ga hiervoor naar Crosstabs, dan Statistics en fink dan
Cramer's V aan. De uitkomst ligt altijd tussen 0 en 1, en hoe hoger
de uitkomst, des te sterker het verband tussen de twee variabelen.
Welke waarde berekent SPSS voor Cramer's V?
??
- Wat betekent dit t.o.v. de sterkte van het verband? Is
het sterk of niet?
??
F.VERANDERING BIJ DICHOTOME, GEPAARDE WAARNEMINGEN MET McNemar
Soms wil men kijken naar gepaarde categorische waarden, b.v. of meer
mensen het nodige niveau halen ná een cursus. We gaan hier laten
zien hoe dit kan. Voor de McNemar toets moeten de variabelen VOORAF
en ACHTERAF in de gegevens van Practiucm 3 eerst gedichotomiseerd
worden. (N.b. normaliter wil men numerieke variabelen niet tot
categorische variabelen hercoderen. We doen het toch nu om ook te
laten zien wat daarbij gebeurt.)
- Laad het databestand van practicum 3A met de variabelen
ACHTERAF en VOORAF.
- Maak via RECODE uit deze variabelen 2 nieuwe variabelen aan
ACHTERD en VOORD met de waarden 0 en 1. Alle oude waarden van 30
en hoger beschouwen we als een succes en krijgen een nieuwe
waarde 1. Alle oude waarden onder de 30 krijgen een nieuwe
waarde 0.
(De waarde van 30 om op te dichotomiseren is
arbitrair.) We stellen de vraag of er meer successen zijn ná de
cursus.
Hint: Gebruik Range om een gebied op te geven dat de waarde 0 of 1
moet opleveren.
Alle cases waarbij beide gedichotomiseerde (d.w.z. binaire) scores
gelijk zijn, worden door McNemar buiten beschouwing gelaten. Het
gaat om de cases waar veranderingen in zijn opgetreden. De toets
vergelijkt in feite het aantal positieve veranderingen met het
aantal negatieve veranderingen.
- Wat is de nulhypothese?
??
- Wat is de alternatieve hypothese?
??
- Toets je eenzijdig of tweezijdig?
??
- Voer de McNemar toets uit.
Hint: Analyze, Non-parametric tests, 2 Related samples.
- Hoeveel successen zijn er?
??
- Hoeveel mislukkingen zijn er?
??
- Wat is de kans op dit resultaat of een extremer uitgaande van
de nulhypothese (afronden op 2 decimalen nauwkeurig)?
??
- Is dit significant op 5%-niveau?
??
- Wat is je conclusie?
??
- Verschilt deze conclusie met je eerdere conclusie met t-toets
related?
??
- Welke toets is gevoeliger: McNemar of de t-toets?
??
Opmerking. In plaats van McNemar kun je ook de gepaarde tekentoets
(Engl. paired Sign Test) gebruiken. Dit levert dezelfde p-waarde op.