Statistiek I

Last lecture

Multiple regression with an interaction (continuation)
Cronbach’s alpha to assess the reliability of questionnaires
Recap of all lectures

This lecture

Part I:
- Practice exam
Part II:
- Answers of practice exam

Practice exam: procedure

Read the question and the answer options from the text (available on Brightspace)
Enter your answers to the questions via waistwel.nl
- Code: 55258
- Use scratch paper for drawing whenever this is useful for the questions!
Please enter your answers before the break
During the break, please fill in the course evaluation (see link in email)
After the break, the correct answers to the questions are discussed
- If time is insufficient to discuss all answers, the remaining answers are made available via Brightspace (in this presentation)

Bij het bepalen van of twee groepen verschillen in hun reactietijd (RT) vind je een $p$-waarde van 0.02. Wat betekent dit?

A. Als de groepen niet verschillen in RT, is de kans op steekproeven met zo’n verschil of groter 2%
B. De twee groepen verschillen significant in hun reactietijd van elkaar
C. Uitgaande van deze steekproeven, is de kans 2% dat de nulhypothese (H0) onjuist is
D. Uitgaande van deze steekproeven, is de kans 2% dat de alternatieve hypothese (Ha) onjuist is

Marie scoorde 324 punten in een spreekvaardigheidstoets Spaans. Dit kwam overeen met een $z$-score van -1.2. Wat wil dat zeggen?

A. De $z$-score laat zien hoever de score 324 afligt van het gemiddelde in standaardfouten
B. De $z$-score laat zien hoever de score 324 afligt van het gemiddelde in standaardafwijkingen
C. De $z$-score geeft genormaliseerde waarden aan voor niet-normale verdelingen
D. De $z$-score laat de afstand zien van de waarneming 324 tot de mediaan

Wat zijn de kenmerken van een normale verdeling?

A. Gemiddelde is 0 en standaardafwijking is 1
B. Mediaan en gemiddelde zijn gelijk
C. Asymmetrisch, een enkele top en klokvormig
D. Overlapt met $t$-distributie bij laag aantal vrijheidsgraden

Een onderzoek naar het effect van verschillende therapieën voor dyslectische kinderen gebruikte de volgende variabelen:

(i) Sekse (1 = mannelijk, 2 = vrouwelijk)
(ii) Leeftijdscategorie (4 tot 7, 8 tot 12, 13 tot 16)
(iii) Leesvaardigheid (0 = slecht, 1 = voldoende, 3 = goed)
(iv) Vormherkenning (tijd in seconden)

Hoeveel ordinale variabelen zijn er?

A. 0
B. 1
C. 2
D. 3

Je hebt de Engelse taalvaardigheid gemeten in een groep van 50 personen. Je hebt vervolgens een regressiemodel gemaakt, waarbij je hebt gekeken wat de invloed van leeftijd en geslacht (M/V) was op de Engelse taalvaardigheid. Om de $p$-waarde te berekenen van iedere variabele, moet nadat de $t$-waarde is berekend rekening gehouden worden met een aantal vrijheidsgraden. Met hoeveel vrijheidsgraden moet rekening gehouden worden bij de variabele leeftijd?

A. 50
B. 49
C. 48
D. 47

De gemiddelde IQ score van een groep van 100 Groningers levert 104,5 op. Hoe groot is de kans (in procenten) op deze of een hoger score voor deze groep wanneer de IQ scores van Groningers normaal verdeeld zijn met $N(100,15)$?

A. 4,5%
B. 2,5%
C. 0,15%
D. Ongeveer 38%

Berekening:
- $z = \frac{m-\mu}{\sigma/\sqrt{n}} = \frac{104,5 - 100}{15 / \sqrt{100}} = \frac{4,5}{1,5} = 3$
- Dus 3 standaardfouten rechts van het gemiddelde: 99,7% zit tussen -3 en 3 standaardfouten (dit moet je weten) $\rightarrow$ 0,3 % aan beide uiteinden, dus 0,15% aan de rechterzijde

Een boxplot laat in plaats van de doos (box) een enkele horizontale streep zien. Hoe groot is de interkwartielafstand?

A. 0
B. 1
C. Een boxplot met een horizontale streep in plaats van een doos is onmogelijk
D. Ik heb meer informatie nodig om deze vraag te kunnen beantwoorden

Wat is de juiste manier om nominale data te visualiseren?

A. Met een histogram
B. Met een staafdiagram
C. Met een spreidingsdiagram
D. Met een boxplot

Wat is een vereiste om lineaire regressie te kunnen toepassen?

A. De afhankelijke variabele moet normaal verdeeld zijn
B. Alle numerieke variabelen moeten normaal verdeeld zijn
C. De voorspelde waardes moeten normaal verdeeld zijn
D. De residuen moeten normaal verdeeld zijn

Een regressiemodel levert de volgende (vereenvoudigde) uitvoer op voor het effect van kleur en tekstgrootte van de tekst op de leessnelheid:

	Est.	p-value
(Intercept)	15.3	< 0.001
KleurGroen	0.5	0.25
KleurRood	5.1	0.01
KleurZwart	10.5	< 0.001
Tekstgrootte	3.0	< 0.001

Het referentieniveau van de variabele Kleur is Blauw. Als we het referentieniveau van deze variabele zouden wijzigen naar Zwart, wat zou dan de waarde van de intercept zijn?

A. 5.2
B. 10.5
C. 15.3
D. 25.8

Een regressiemodel levert de volgende (vereenvoudigde) uitvoer op voor het effect van kleur en tekstgrootte van de tekst op de leessnelheid:

	Est.	p-value
(Intercept)	15.3	< 0.001
KleurGroen	0.5	0.25
KleurRood	5.1	0.01
KleurZwart	10.5	< 0.001
Tekstgrootte	3.0	< 0.001

Het referentieniveau van de variabele Kleur is Blauw. Als we het referentieniveau van deze variabele zouden wijzigen naar Zwart, wat zou dan de waarde van de intercept zijn?

A. 5.2
B. 10.5
C. 15.3
D. 25.8 (Berekening: 15.3 + 10.5)

Het vak Statistiek I lijdt onder een slecht imago onder studenten. De docent organiseert daarom een grote PR-campagne met pagina-vullende advertenties in de landelijke dagbladen om de populariteit van het vak te verhogen. Om het effect van de campagne te meten vraagt de docent een groep van 25 willekeurig gekozen studenten voor de start van de campagne en een andere groep van 25 willekeurige studenten na de campagne via een korte vragenlijst hoe ze tegenover het vak staan. De vragenlijst resulteert in een positiviteitsscore (de gemiddelde score berekend over alle vragen). Welke analyse is het meest geschikt om de invloed van de campagne op de positiviteitsscore te meten, als je aanneemt dat de docent ook wil controleren voor het effect van geslacht?

A. Enkelvoudige (simpele) lineare regressie
B. Meervoudige lineaire regressie
C. Cronbach’s α
D. Géén van de andere antwoorden

Om te kijken of studenten een beter begrip krijgen van statistiek, neemt een docent iedere week een toets af onder dezelfde 50 studenten. De variabele weeknummer (waardes van 1 t/m 7) houdt bij in welke week de toets is gehouden en de variabele toetsscore geeft de score van de toets aan. Welke statistische methode is geschikt om deze data te analyseren?

A. Cronbach’s α over de 7 verschillende toetsmomenten
B. Lineaire regressie met weeknummer als onafhankelijke en toetsscore als afhankelijke variabele
C. Correlatie tussen weeknummer en toetsscore
D. Géén van de andere antwoorden

Om te kijken of studenten een beter begrip krijgen van statistiek, neemt een docent iedere week een toets af onder dezelfde 50 studenten. De variabele weeknummer (waardes van 1 t/m 7) houdt bij in welke week de toets is gehouden en de variabele toetsscore geeft de score van de toets aan. Welke statistische methode is geschikt om deze data te analyseren?

A. Cronbach’s α over de 7 verschillende toetsmomenten
B. Lineaire regressie met weeknummer als onafhankelijke en toetsscore als afhankelijke variabele
C. Correlatie tussen weeknummer en toetsscore
D. Géén van de andere antwoorden (mixed-effects regressie)

Je gebruikt een vragenlijst om de effectiviteit van een website voor een reisbureau te meten. In deze vragenlijst staat een schaal met vier vragen m.b.t. hoe aantrekkelijk de site is en een schaal met vier vragen m.b.t. hoe prettig de site is om mee te werken. Je verwacht dat hoe aantrekkelijker de site bevonden wordt, hoe prettiger de site is om mee te werken. Dit kun je nagaan door te verifiëren dat …

A. De verdeling van de scores voor iedere vraag normaal is verdeeld
B. Het lineaire regressie model signficiant is
C. De correlatie tussen de schalen positief is
D. Cronbach’s α tenminste 0.7 is

Je bepaalt de gemiddelde leessnelheid voor een groep studenten voor fictie versus non-fictie. Je hypotheses zijn als volgt gespecificeerd. $H_0$: er is geen verschil in leessnelheid tussen fictie en non-fictie en $H_a$: fictie wordt sneller gelezen dan non-fictie. In een geschikte grafiek zie je dat de gemiddelde leessnelheid voor fictie inderdaad sneller is dan voor non-fictie. Je hebt een α-niveau gekozen van 0.05, en je voert een lineaire regressie analyse uit, met leessnelheid als afhankelijke variabele en type literatuur als onafhankelijke variabele. Aan de voorwaarden voor de regressie-analyse wordt voldaan. In de uitvoer van je regressiemodel zie je een $p$-waarde van 0.08 behorend bij type literatuur. Wat is je conclusie?

A. De $p$-waarde moet met twee vermenigvuldigd worden
B. De α-waarde moet door twee gedeeld worden
C. Ik verwerp $H_0$ en accepteer $H_a$
D. Ik handhaaf $H_0$

Je bepaalt de gemiddelde leessnelheid voor een groep studenten voor fictie versus non-fictie. Je hypotheses zijn als volgt gespecificeerd. $H_0$: er is geen verschil in leessnelheid tussen fictie en non-fictie en $H_a$: fictie wordt sneller gelezen dan non-fictie. In een geschikte grafiek zie je dat de gemiddelde leessnelheid voor fictie inderdaad sneller is dan voor non-fictie. Je hebt een α-niveau gekozen van 0.05, en je voert een lineaire regressie analyse uit, met leessnelheid als afhankelijke variabele en type literatuur als onafhankelijke variabele. Aan de voorwaarden voor de regressie-analyse wordt voldaan. In de uitvoer van je regressiemodel zie je een $p$-waarde van 0.08 behorend bij type literatuur. Wat is je conclusie?

A. De $p$-waarde moet met twee vermenigvuldigd worden
B. De α-waarde moet door twee gedeeld worden
C. Ik verwerp $H_0$ en accepteer $H_a$ (want: tweezijdige $p$-waarde!)
D. Ik handhaaf $H_0$

In een regressiemodel waarmee je het tentamencijfer van studenten voor Statistiek I voorspelt, met geslacht (twee niveaus: M en V; het referentieniveau is zoals gebruikelijk automatisch - dus alfabetisch - bepaald) als onafhankelijke variabele, vind je een significante intercept waarde van 5. Wat betekent dit?

A. Het gem. tentamencijfer voor alle studenten is een 5
B. Het gem. tentamencijfer voor vrouwelijke studenten is een 5
C. Het gem. tentamencijfer voor mannelijke studenten is een 5
D. Het verschil in tentamencijfer tussen vrouwelijke en mannelijke studenten is 5 punten

Je ziet de volgende grafiek. Wat is de beste specificatie van het bijbehorende model?

A. lm(y ~ x1 + gender, data = dat)
B. lm(y ~ x1 * gender, data = dat)
C. lm(y ~ x1 + x1:gender, data = dat)
D. lm(x1 ~ y * gender, data = dat)

Je ziet de volgende grafiek. Wat is de beste specificatie van het bijbehorende model?

A. lm(y ~ x1 + gender, data = dat)
B. lm(y ~ x1 * gender, data = dat)
C. lm(y ~ x1 + x1:gender, data = dat)
D. lm(x1 ~ y * gender, data = dat)

De correlatie tussen het aantal bladzijden dat iemand in een uur leest en de score die iemand haalt op een geheugentest is $r$ = -0.8. Wat kun je hier uit afleiden?

A. Sneller lezende personen hebben in het algemeen een lagere score op de geheugentest
B. Sneller lezende personen hebben in het algemeen een hogere score op de geheugentest
C. Langzamer lezende personen hebben in het algemeen een lagere score op de geheugentest
D. De correlatie is onjuist, deze kan alleen tussen de 0 en 1 liggen

Een regressiemodel waarin je de Engelse taalvaardigheid probeert te voorspellen aan de hand van een interactie tussen leeftijd (in jaren) en de hoeveelheid gedronken alcohol (BAC) in promille, levert de volgende vereenvoudigde resultaten. De significantiegrens $\alpha$ is 0.05. Variabelen zijn niet gecentreerd of gestandaardiseerd.

	Est.	p-value
(Intercept)	-10.0	0.25
Leeftijd	0.5	0.32
BAC	-0.2	0.75
Leeftijd:BAC	1.3	0.04

Welke conclusie is juist op basis van de bovenstaande informatie? A. Leeftijd heeft geen significant effect op Engelse taalvaardigheid voor nuchtere sprekers
B. BAC heeft geen significant effect op de Engelse taalvaardigheid
C. De intercept laat zien dat Engelse taalvaardigheidsscores ook negatief kunnen zijn
D. Géén van de andere antwoorden is juist

Een regressiemodel waarin je de Engelse taalvaardigheid probeert te voorspellen aan de hand van een interactie tussen leeftijd (in jaren) en de hoeveelheid gedronken alcohol (BAC) in promille, levert de volgende vereenvoudigde resultaten. De significantiegrens $\alpha$ is 0.05. Variabelen zijn niet gecentreerd of gestandaardiseerd.

	Est.	p-value
(Intercept)	-10.0	0.25
Leeftijd	0.5	0.32
BAC	-0.2	0.75
Leeftijd:BAC	1.3	0.04

Welke conclusie is juist op basis van de bovenstaande informatie? A. Leeftijd heeft geen significant effect op Engelse taalvaardigheid voor nuchtere sprekers
B. BAC heeft geen significant effect op de Engelse taalvaardigheid
C. De intercept laat zien dat Engelse taalvaardigheidsscores ook negatief kunnen zijn
D. Géén van de andere antwoorden is juist

Je leest een verslag over een studie welke zich richtte op de taalvaardigheid van thuiszorgmedewerkers in de VS:

We vermoedden dat de Spaanse taalvaardigheid van thuiszorgmedewerkers afhankelijk was van waar ze werkten. De residuen van het lineaire regressie model waren normaal verdeeld en lieten geen ongelijke variantie zien. De groepsvariabele was significant met een β van 0.3 en p = 0.02. Omdat de p-waarde kleiner was dan onze significantiegrens van 0.05 verwierpen we de nulhypothese dat de twee groepen niet verschilden in hun taalvaardigheid

Wat is je reactie op dit verslag?

A. Er had geen regressie gebruikt mogen worden
B. Er is geen melding van de effectgrootte
C. De p-waarde moet nog gedeeld worden door twee
D. Het verslag is in grote lijnen in orde

Een onderzoeker is geïnteresseerd in het effect van formeel versus informeel taalgebruik op de overtuigingskracht. Wat zijn de juiste hypotheses?

A. $H_0$: formeel taalgebruik heeft een grotere overtuigingskracht dan informeel taalgebruik; $H_a$: informeel taalgebruik heeft een grotere overtuigingskracht dan formeel taalgebruik
B. $H_0$: er is geen verschil in overtuigingskracht van formeel vs informeel taalgebruik; $H_a$: informeel taalgebruik en formeel taalgebruik verschillen in hun overtuigingskracht
C. $H_0$: informeel taalgebruik en formeel taalgebruik verschillen in hun overtuigingskracht; $H_a$: er is geen verschil in overtuigingskracht van formeel vs informeel taalgebruik;
D. $H_0$: het type taalgebruik is afhankelijk van de overtuigingskracht; $H_a$: het type taalgebruik is niet afhankelijk van de overtuigingskracht

Je leest het volgende in een wetenschappelijk artikel: “We vonden een correlatie tussen leeftijd en de frequentie waarmee men computerspellen speelt van $r$ = -0.7. We concluderen daarom dat jongere mensen vaker computerspellen spelen dan oudere mensen.” Wat is je kritiek op deze tekst?

A. Onjuiste conclusie: een negatieve correlatie betekent juist dat er geen verband bestaat tussen leeftijd en de frequentie van het spelen van computerspellen
B. Het aantal vrijheidsgraden mist
C. De correlatie zou door een uitschieter veroorzaakt kunnen worden
D. Er mist een maat voor effectgrootte

Je analyse resulteert in de volgende figuur:

Welke rapportage hierover is juist?

A. De verdeling is symmetrisch
B. Q1 ligt dichter bij de median dan Q3
C. De interkwartielafstand is 20
D. De 25% hoogste waardes hebben een grotere spreiding dan de laagste 25%

Je analyse resulteert in de volgende figuur:

Welke rapportage hierover is juist?

A. De verdeling is symmetrisch
B. Q1 ligt dichter bij de median dan Q3
C. De interkwartielafstand is 20
D. De 25% hoogste waardes hebben een grotere spreiding dan de laagste 25%

Je verkrijgt het bovenstaande normaal-kwantiel diagram. Wat rapporteer je in je verslag?

A. De verdeling is vermoedelijk niet normaal, omdat de rechte lijn slechts door één punt gaat
B. De verdeling is vermoedelijk niet normaal, omdat de punten duidelijk afwijken van de rechte lijn
C. De verdeling is bij benadering normaal
D. Dat er geen uitspraak gedaan kan worden over normaliteit basis van deze grafiek

Welke functie gebruik je in R om de validiteit te bepalen van een meetinstrument?

A. cronbach()
B. alpha()
C. validity()
D. Géén van de andere antwoorden

Met welk commando in R kun je de variantie uitrekenen van de variabele grade in de dataset dat?

A. var(dat$grade)
B. diff(dat$grade)
C. variance(dat$grade)
D. sqrt(sd(dat$grade))

Please evaluate this lecture!

Questions?

Thank you for your attention!

https://www.martijnwieling.nl

m.b.wieling@rug.nl