Doelstelling Practicum 4

A1 Invoeren data op basis van een kruistabel
A2 Cases wegen met frequentie
A3 Betekenis van een waarde/code vastleggen
B Kruistabel maken met alleen aantallen
C Meest geschikte soort kruistabel kiezen
D Kruistabel grafisch weergeven
E Verband tussen 2 categorische variabelen toetsen met chikwadraat
F Verandering bij dichotome, gepaarde waarnemingen toetsen met McNemar

Practicum 4

Het gaat in dit practicum alweer om een hypothesetoets waarvoor de verslagsrichtlijnen bekend zijn.

.

In dit practicum worden twee hypothesen getoetst, in delen E en F. Geef voor deze twee delen verslag, d.w.z. vertel waarover het gaat, noem de hypothese, rechtvaardig de keuze van toets, geef de resultaten zowel in term van waarden (van chi-kwadraat) en in termen van p-waarden, en zeg welke conclusies men hieruit mag trekken ten aanzien van de hypothese. Voeg geschikte grafieken bij, maar probeer niet antwoorden op alle tussenliggende vragen te geven.

Achtergrond

Bestaat er een verband tussen sekse en prestaties? Een grote universiteit deelde de promovendi die 6 jaar daarvoor begonnen waren met hun promotieonderzoek in op basis van hun vorderingen (STATUS) en sekse. Dat leverde een kruistabel op waarin men de (on)afhankelijkheid van de twee categorische variabelen (vorderingsstatus en sekse) kan controlleren.

A. INVOEREN DATA OP BASIS VAN EEN KRUISTABEL

Een kruistabel is een tabel waarin de frequenties van twee (categorische) variabelen met elkaar gekruist worden.

    ----------------------------------------------                          
                                 Sekse
    ----------------------------------------------
    Status                Man              Vrouw
    ----------------------------------------------
    Afgehaakt             238                98
    Nog bezig             134                33
    Gepromoveerd          423                98
    

Let op dat de vragen met de blauwe vraagtekens meestal worden gesteld om begrip voor de materie te kweken. Ze hoeven daarom *niet* in het verslag terug tenzij anders expliciet vermeld wordt.

  1. Hoeveel variabelen zitten er in deze tabel en welke? ??
  2. Hoeveel cases hebben we hier? ??
  3. Als we deze gegevens normaal zouden invoeren, zouden we dus een datatabel in SPSS nodig hebben van ... kolommen bij ... regels. ??

Om deze gegevens sneller in te voeren, gebruiken we een SPSS-trucje: we gaan de cases wegen met de frequentie. Om dit te kunnen doen hebben we dus een extra variabele nodig met het aantal of de frequentie van de desbetreffende cel.

  1. Hoeveel cellen hebben we dan nodig (om frequentie in te voeren)? ??
  2. Hoeveel cases/regels hebben we dus nodig? ??
  3. En welke kolommen/variabelen? ??
Hint: Data, Weight Cases... Hierna doet SPSS bij berekeningen en plaatjes alsof de regel met gepromoveerde mannen 423 keer voorkomt.
  1. Hoe kun je zien dat SPSS nu de cases weegt? ??
Hint: kolom Values.
  1. Welke coderingen heb je gebruikt voor status en sekse?

B. EEN KRUISTABEL MAKEN MET ALLEEN AANTALLEN

Hint: Analyze, Descriptive Statistics, Crosstabs.
  1. Wat laat SPSS aan de randen van deze tabel zien? Wat is de juiste term? ??
  2. Check de waarden in je tabel en kopieer de tabel naar je verslag.

C. MEEST GESCHIKTE SOORT KRUISTABEL KIEZEN

Een probleem met de kruistabel hierboven is dat een verband tussen SEKSE en STATUS niet gemakkelijk te zien is. Hint: Descriptive Statistics, Crosstabs. Klik op Cells en kies wat je moet hebben. Zorg --om de tabel overzichtelijk te houden-- dat je steeds maar één ding tegelijk in je tabel laat zien.
  1. Welke tabel is in jouw geval het duidelijkst om het verschil tussen mannen en vrouwen te laten zien? ??
    (Dit antwoord kan per student verschillen, afhankelijk van de vraag wat je als kolom of als rij gebruikt hebt.)
  2. Kopieer deze tabel naar je verslag.

D. WAARDEN UIT DE KRUISTABEL GRAFISCH WEERGEVEN

Een grafiek spreekt de meeste lezers meer aan dan een tabel.
  1. Kopieer deze grafiek naar je verslag. ??
  2. Wat is hier beter: aantallen weergeven of percentages? (Pas zonodig je grafiek aan.) ??
Hint: Graphs, Bar...

E. VERBAND TUSSEN TWEE CATEGORISCHE VARIABELEN TOETSEN MET CHIKWADRAAT

  1. Wat is het meetniveau van SEKSE? ??
  2. Wat is het meetniveau van STATUS? ??
  3. Wanneer is de chikwadraat toets de beste oplossing om een verband tussen twee variabelen aan te tonen? ??
  4. Wat is de nulhypothese van de chi-kwadraat toets om een verband aan te tonen (in woorden)? ??
  5. Wat is de alternatieve hypothese? ??

De chikwadraat toets vergelijkt de geobserveerde aantallen in de kruistabel met de op basis van de randtotalen verwachte aantallen.

  1. Bereken via SPSS de kruistabel met alleen de verwachte aantallen en copieer deze naar je verslag.
  2. Wanneer mag je de chikwadraat toets niet gebruiken? ??
  3. Mag je de chikwadraat toets hier toepassen en waarom? ??
Hint: Ga weer naar CROSSTABS en kies STATISTICS.
  1. Welke waarde berekent SPSS hier voor chikwadraat (afgerond op 1 decimaal nauwkeurig)? ??
  2. Welk aantal vrijheidsgraden vermeldt SPSS voor chikwadraat? ??
  3. Bereken zelf het aantal vrijheidsgraden. Klopt dit met SPSS? ??
  4. Welke kans hoort volgens SPSS bij de berekende chikwadraat? ??
  5. Is deze uitkomst significant (alfaniveau: 5%)? ??
  6. Wat is je conclusie? ??
  7. Is een significant verband hetzelfde als een sterk verband? Of klopt dit niet? ??
  8. Wat zegt de chikwadraat-toets over de richting van het verband? ??
  9. Als je een idee wilt krijgen van de sterkte van het verband, zou je Cramer's V kunnen berekenen. Ga hiervoor naar Crosstabs, dan Statistics en fink dan Cramer's V aan. De uitkomst ligt altijd tussen 0 en 1, en hoe hoger de uitkomst, des te sterker het verband tussen de twee variabelen. Welke waarde berekent SPSS voor Cramer's V? ??
  10. Wat betekent dit t.o.v. de sterkte van het verband? Is het sterk of niet? ??

F.VERANDERING BIJ DICHOTOME, GEPAARDE WAARNEMINGEN MET McNemar

Soms wil men kijken naar gepaarde categorische waarden, b.v. of meer mensen het nodige niveau halen ná een cursus. We gaan hier laten zien hoe dit kan. Voor de McNemar toets moeten de variabelen VOORAF en ACHTERAF in de gegevens van Practiucm 3 eerst gedichotomiseerd worden. (N.b. normaliter wil men numerieke variabelen niet tot categorische variabelen hercoderen. We doen het toch nu om ook te laten zien wat daarbij gebeurt.)

(De waarde van 30 om op te dichotomiseren is arbitrair.) We stellen de vraag of er meer successen zijn ná de cursus.
Hint: Gebruik Range om een gebied op te geven dat de waarde 0 of 1 moet opleveren.

Alle cases waarbij beide gedichotomiseerde (d.w.z. binaire) scores gelijk zijn, worden door McNemar buiten beschouwing gelaten. Het gaat om de cases waar veranderingen in zijn opgetreden. De toets vergelijkt in feite het aantal positieve veranderingen met het aantal negatieve veranderingen.

  1. Wat is de nulhypothese? ??
  2. Wat is de alternatieve hypothese? ??
  3. Toets je eenzijdig of tweezijdig? ??
Hint: Analyze, Non-parametric tests, 2 Related samples.
  1. Hoeveel successen zijn er? ??
  2. Hoeveel mislukkingen zijn er? ??
  3. Wat is de kans op dit resultaat of een extremer uitgaande van de nulhypothese (afronden op 2 decimalen nauwkeurig)? ??
  4. Is dit significant op 5%-niveau? ??
  5. Wat is je conclusie? ??
  6. Verschilt deze conclusie met je eerdere conclusie met t-toets related? ??
  7. Welke toets is gevoeliger: McNemar of de t-toets? ??
Opmerking. In plaats van McNemar kun je ook de gepaarde tekentoets (Engl. paired Sign Test) gebruiken. Dit levert dezelfde p-waarde op.