# Statistiek I

## Summary and practice exam

Martijn Wieling
University of Groningen

## This lecture

• Overview of material covered in this course
• Practice exam (and course evaluation)

## What have we covered in the past lectures? (1)

• Lecture 1: statistics and R
• Why use statistics?
• How to use R:
• Variables, functions, importing data, viewing data, modifying data, visualization, and statistics
• Lecture 2: descriptive statistics
• Four variable types
• Measures of central tendency and spread
• Standardized scores ($$z$$-scores)
• Distribution of a variable: normal distribution

## What have we covered in the past lectures? (2)

• Lecture 3: sampling
• Sample vs. population
• Standard deviation for comparing individual to population
• Standard error for comparing sample to population
• Statistical significance ($$p$$-value vs. $$\alpha$$-value)
• Reasoning about population: confidence interval
• Reasoning about population: hypothesis tests ($$H_0$$ vs. $$H_a$$)
• One-sided vs. two-sided hypothesis
• Comparing two groups on standardized test: $$z$$-test

## What have we covered in the past lectures? (3)

• Lecture 4: $$t$$-tests
• Used when population $$\sigma$$ unknown
• Single sample $$t$$-test
• Independent samples $$t$$-test
• Paired $$t$$-test
• Effect size
• Reporting results
• Lecture 5: non-parametric tests
• Mann-Whitney U test (alternative to independent samples $$t$$-test)
• Wilcoxon signed-rank test (alternative to paired and single sample $$t$$-test)
• Sign test (alternative to Wilcoxon signed-rank test)

## What have we covered in the past lectures? (4)

• Lecture 6: Relating same-type variables
• $$\chi^2$$-test for assessing relationship between 2 nominal variables
• Pearson correlation $$r$$ for assessing relationship between 2 numerical variables
• Cronbach's $$\alpha$$ for assessing reliability (not validity!) of multiple numerical variables
• (Cor)relation is no causation
• Sensitivity of correlation to outliers (importance of visualization!)
• Hidden variables

## Practice exam: procedure

• Read the question and the answer options from the text (available on Nestor)
• Enter your answers to the questions via Mentimeter (www.menti.com: 8022 4158)
• Use scratch paper for drawing whenever this is useful for the questions!
• After the break, the correct answers to the questions are discussed
• If time is insufficient to discuss all answers, the remaining answers are made available via Nestor (in this presentation)

## Break!

Je bepaalt de gemiddelde reactietijd (RT) van twee groepen studenten op een test waarbij zinnen en plaatjes moeten worden gematcht. De ene groep bestaat uit 10 studenten die Nederlands als moedertaal spreken, de andere groep uit 10 studenten met andere moedertalen. Je voert een geschikte toets uit om te zien of ze in RT verschillen. Na het uitvoeren van de toets blijkt de $$p$$-waarde 0.02 (tweezijdig) vermeld te zijn. Wat betekent dit?

A. Als de groepen gelijk zijn, is de kans op steekproeven met zo'n verschil of groter 2%
B. De kans op de steekproeven, gegeven dat de alternatieve hypothese ($$H_a$$) waar is, is 2%
C. Uitgaande van deze steekproeven, is de kans 2% dat de nulhypothese ($$H_0$$) onjuist is
D. Uitgaande van deze steekproeven, is de kans 2% dat de alternatieve hypothese ($$H_a$$) onjuist is

Je bepaalt de gemiddelde reactietijd (RT) van twee groepen studenten op een test waarbij zinnen en plaatjes moeten worden gematcht. De ene groep bestaat uit 10 studenten die Nederlands als moedertaal spreken, de andere groep uit 10 studenten met andere moedertalen. Je voert een geschikte toets uit om te zien of ze in RT verschillen. Na het uitvoeren van de toets blijkt de $$p$$-waarde 0.02 (tweezijdig) vermeld te zijn. Wat betekent dit?

A. Als de groepen gelijk zijn, is de kans op steekproeven met zo'n verschil of groter 2%
B. De kans op de steekproeven, gegeven dat de alternatieve hypothese ($$H_a$$) waar is, is 2%
C. Uitgaande van deze steekproeven, is de kans 2% dat de nulhypothese ($$H_0$$) onjuist is
D. Uitgaande van deze steekproeven, is de kans 2% dat de alternatieve hypothese ($$H_a$$) onjuist is

Marie scoorde 324 punten in een spreekvaardigheidstoets Spaans. Dit kwam overeen met een $$z$$-score van -1.2. Wat wil dat zeggen?

A. De $$z$$-score laat zien hoever de score 324 afligt van het gemiddelde in standaardfouten
B. De $$z$$-score laat zien hoever de score 324 afligt van het gemiddelde in standaardafwijkingen
C. De $$z$$-score geeft genormaliseerde waarden aan voor niet-normale verdelingen
D. De $$z$$-score laat de afstand zien van de waarneming 324 tot de mediaan

Marie scoorde 324 punten in een spreekvaardigheidstoets Spaans. Dit kwam overeen met een $$z$$-score van -1.2. Wat wil dat zeggen?

A. De $$z$$-score laat zien hoever de score 324 afligt van het gemiddelde in standaardfouten
B. De $$z$$-score laat zien hoever de score 324 afligt van het gemiddelde in standaardafwijkingen
C. De $$z$$-score geeft genormaliseerde waarden aan voor niet-normale verdelingen
D. De $$z$$-score laat de afstand zien van de waarneming 324 tot de mediaan

Wat zijn kenmerken van een normale verdeling?

A. Het gemiddelde is 0 en de standaardafwijking 1
B. Mediaan en gemiddelde zijn gelijk
C. Asymmetrisch, een enkele top en klokvormig
D. Overlapt met $$t$$-distributie bij laag aantal vrijheidsgraden

Wat zijn kenmerken van een normale verdeling?

A. Het gemiddelde is 0 en de standaardafwijking 1
B. Mediaan en gemiddelde zijn gelijk
C. Asymmetrisch, een enkele top en klokvormig
D. Overlapt met $$t$$-distributie bij laag aantal vrijheidsgraden

Een onderzoek naar het effect van verschillende therapieën voor dyslectische kinderen gebruikte de volgende variabelen:

(i) Sekse (1 = mannelijk, 2 = vrouwelijk)
(ii) Leeftijdscategorie (4 tot 7, 8 tot 12, 13 tot 16)
(iii) Leesvaardigheid (0 = slecht, 1 = voldoende, 3 = goed)
(iv) Vormherkenning (tijd in seconden)

Hoeveel ordinale variabelen zijn er?

A. 0
B. 1
C. 2
D. 3

Een onderzoek naar het effect van verschillende therapieën voor dyslectische kinderen gebruikte de volgende variabelen:

(i) Sekse (1 = mannelijk, 2 = vrouwelijk)
(ii) Leeftijdscategorie (4 tot 7, 8 tot 12, 13 tot 16)
(iii) Leesvaardigheid (0 = slecht, 1 = voldoende, 3 = goed)
(iv) Vormherkenning (tijd in seconden)

Hoeveel ordinale variabelen zijn er?

A. 0
B. 1
C. 2
D. 3

Je toetst drie groepen buitenlandse studenten (eerstejaars, master studenten, en promovendi) op hun taalvaardigheid in het Nederlands na een studieverblijf van zes maanden. De toets geeft numerieke scores tussen 0 en 100, en de scores zijn redelijk normaal verdeeld. Het gemiddelde en de standaardafwijking van de toets zijn niet bekend. Je wilt weten of de drie groepen verschillen. Welke toets is geschikt om deze gegevens te analyseren?

A. $$\chi^2$$-toets
B. $$t$$-toets voor onafhankelijke steekproeven
C. Mann-Whitney U toets
D. Géén van [a] t/m [c]

Je toetst drie groepen buitenlandse studenten (eerstejaars, master studenten, en promovendi) op hun taalvaardigheid in het Nederlands na een studieverblijf van zes maanden. De toets geeft numerieke scores tussen 0 en 100, en de scores zijn redelijk normaal verdeeld. Het gemiddelde en de standaardafwijking van de toets zijn niet bekend. Je wilt weten of de drie groepen verschillen. Welke toets is geschikt om deze gegevens te analyseren?

A. $$\chi^2$$-toets
B. $$t$$-toets voor onafhankelijke steekproeven
C. Mann-Whitney U toets
D. Géén van [a] t/m [c]

Je wilt de gemiddelde reactietijd (RT) van twee groepen studenten vergelijken op een test waarbij zinnen aan technische plaatjes moeten worden gekoppeld. De ene groep bestaat uit 10 bachelor studenten en de andere groep uit 10 masterstudenten. Na de data onderzocht te hebben, realiseer je je dat de RT van een van de groepen niet normaal verdeeld is. Welke toets moet je gebruiken?

A. $$\chi^2$$-toets
B. Mann-Whitney U toets
C. Wilcoxon rangtekentoets
D. $$t$$-toets

Je wilt de gemiddelde reactietijd (RT) van twee groepen studenten vergelijken op een test waarbij zinnen aan technische plaatjes moeten worden gekoppeld. De ene groep bestaat uit 10 bachelor studenten en de andere groep uit 10 masterstudenten. Na de data onderzocht te hebben, realiseer je je dat de RT van een van de groepen niet normaal verdeeld is. Welke toets moet je gebruiken?

A. $$\chi^2$$-toets
B. Mann-Whitney U toets
C. Wilcoxon rangtekentoets
D. $$t$$-toets

Je analyseert het effect van een PR campagne ten behoeve van de acceptatie van een referendum voor een verdrag met Oekraïne, en onderzoekt specifiek of de campagne er in is geslaagd de attitudes ten aanzien van het verdrag te verbeteren. Je gebruikt een toets die numerieke scores tussen de 0 en 100 toewijst aan attitudes, waarbij hogere scores positievere attitudes betekenen. Je vraagt naar de attitudes vóór en ná de campagne bij een groep van 50 burgers. De verdeling van de attitude-verschillen tussen de twee meetpunten is niet normaal, maar de verdeling van de attitudes zowel voor als na de campagne is wel normaal.

Welke statistische toets gebruik je om deze resultaten te analyseren?

A. $$\chi^2$$-toets
B. $$t$$-toets voor onafhankelijke steekproeven
C. Wilcoxon rangtekentoets
D. $$t$$-toets voor gepaarde data

Je analyseert het effect van een PR campagne ten behoeve van de acceptatie van een referendum voor een verdrag met Oekraïne, en onderzoekt specifiek of de campagne er in is geslaagd de attitudes ten aanzien van het verdrag te verbeteren. Je gebruikt een toets die numerieke scores tussen de 0 en 100 toewijst aan attitudes, waarbij hogere scores positievere attitudes betekenen. Je vraagt naar de attitudes vóór en ná de campagne bij een groep van 50 burgers. De verdeling van de attitude-verschillen tussen de twee meetpunten is niet normaal, maar de verdeling van de attitudes zowel voor als na de campagne is wel normaal

Welke statistische toets gebruik je om deze resultaten te analyseren?

A. $$\chi^2$$-toets
B. $$t$$-toets voor onafhankelijke steekproeven
C. Wilcoxon rangtekentoets
D. $$t$$-toets voor gepaarde data

Je neemt bij een groep afasie patiënten een toets af naar het correcte gebruik van voornaamwoorden. De voornaamwoorden kunnen in de zin op 3 verschillende posities voorkomen. Voor iedere positie (1e, 2e, 3e) wordt het totaal aantal fouten geteld. Verder worden de fouten onderverdeeld in 3 typen fouten (A: geen verwijzing, B: verwijzing zonder voornaamwoorden, C: verwijzing met onjuist voornaamwoord).

Gegeven de tabel bij deze opgave, welke toets moet gebruikt worden om na te gaan of er een verband is tussen de positie van het voornaamwoord en het type fout?

A. Wilcoxon rangtekentoets
B. $$\chi^2$$-toets
C. Exacte toets van Fisher
D. Tekentoets

Je neemt bij een groep afasie patiënten een toets af naar het correcte gebruik van voornaamwoorden. De voornaamwoorden kunnen in de zin op 3 verschillende posities voorkomen. Voor iedere positie (1e, 2e, 3e) wordt het totaal aantal fouten geteld. Verder worden de fouten onderverdeeld in 3 typen fouten (A: geen verwijzing, B: verwijzing zonder voornaamwoorden, C: verwijzing met onjuist voornaamwoord).

Gegeven de tabel bij deze opgave, welke toets moet gebruikt worden om na te gaan of er een verband is tussen de positie van het voornaamwoord en het type fout?

A. Wilcoxon rangtekentoets
B. $$\chi^2$$-toets
C. Exacte toets van Fisher (Verwachting 2e pos & C: 20/140 $$\times$$ 20 ≈ 3)
D. Tekentoets

Je bepaalt de gemiddelde reactietijden (RT) voor een groep studenten voor naamwoorden versus werkwoorden. Je hypotheses zijn: er is geen verschil in RT tussen naamwoorden en werkwoorden ($$H_0$$) en er is wel een verschil in RT tussen naamwoorden en werkwoorden ($$H_a$$). Je hebt een $$\alpha$$-niveau gekozen van 0.01, en je voert een geschikte toets uit om te bepalen of er een verschil is tussen de twee types woorden. Na het uitvoeren van de toets blijkt de $$p$$-waarde 0.015 (tweezijdig) te zijn. Wat is je conclusie?

A. Het $$\alpha$$-niveau moet verhoogd worden naar bijv. 0.05
B. De $$p$$-waarde moet door 2 gedeeld worden
C. Ik verwerp $$H_0$$ en accepteer $$H_a$$
D. Ik handhaaf $$H_0$$

Je bepaalt de gemiddelde reactietijden (RT) voor een groep studenten voor naamwoorden versus werkwoorden. Je hypotheses zijn: er is geen verschil in RT tussen naamwoorden en werkwoorden ($$H_0$$) en er is wel een verschil in RT tussen naamwoorden en werkwoorden ($$H_a$$). Je hebt een $$\alpha$$-niveau gekozen van 0.01, en je voert een geschikte toets uit om te bepalen of er een verschil is tussen de twee types woorden. Na het uitvoeren van de toets blijkt de $$p$$-waarde 0.015 (tweezijdig) te zijn. Wat is je conclusie?

A. Het $$\alpha$$-niveau moet verhoogd worden naar bijv. 0.05
B. De $$p$$-waarde moet door 2 gedeeld worden
C. Ik verwerp $$H_0$$ en accepteer $$H_a$$
D. Ik handhaaf $$H_0$$

Een onderzoek resulteert in de tabel die afgebeeld staat bij deze opgave. Wat kun je zeggen over het verband tussen beide variabelen op basis van deze tabel?

A. De verschillen verwacht-geobserveerd zijn klein, dus er is ver-moedelijk een significant verband
B. Op basis van de geobserveerde frequenties is de exacte toets van Fisher nodig
C. Bij een nominaal meetniveau valt de vraag naar het verband niet te beantwoorden
D. Op basis van de verwachte frequenties is de $$\chi^2$$-toets nodig

Een onderzoek resulteert in de tabel die afgebeeld staat bij deze opgave. Wat kun je zeggen over het verband tussen beide variabelen op basis van deze tabel?

A. De verschillen verwacht-geobserveerd zijn klein, dus er is ver-moedelijk een significant verband
B. Op basis van de geobserveerde frequenties is de exacte toets van Fisher nodig
C. Bij een nominaal meetniveau valt de vraag naar het verband niet te beantwoorden
D. Op basis van de verwachte frequenties is de $$\chi^2$$-toets nodig

Je leest een verslag over een studie die zich richtte op de taalvaardigheid van thuiszorgmedewerkers in de VS:

We vermoedden dat de Spaanse taalvaardigheid van thuiszorgmedewerkers afhankelijk was van waar ze werkten. ... We toetsten of de twee groepen in hun taalvaardighed verschilden en we verkregen $$t(38)= -2.38, p < 0.05$$. Omdat de $$p$$-waarde kleiner was dan onze significantiegrens van 0.05 verwierpen we de nulhypothese dat de twee groepen niet verschilden in hun taalvaardigheid. De thuiszorgmedewerkers in de grote steden waren 0.4 standaardafwijkingen beter dan de andere groep.

Wat is je reactie op dit verslag?

A. Er is geen melding van de effectgrootte
B. Er had een $$z$$-toets gebruikt moeten worden
C. Het aantal vrijheidsgraden wordt niet vermeld
D. Het verslag is in grote lijnen in orde

Je leest een verslag over een studie die zich richtte op de taalvaardigheid van thuiszorgmedewerkers in de VS:

We vermoedden dat de Spaanse taalvaardigheid van thuiszorgmedewerkers afhankelijk was van waar ze werkten. ... We toetsten of de twee groepen in hun taalvaardighed verschilden en we verkregen $$t(38)$$ $$= -2.38, p < 0.05$$. Omdat de $$p$$-waarde kleiner was dan onze significantiegrens van 0.05 verwierpen we de nulhypothese dat de twee groepen niet verschilden in hun taalvaardigheid. De thuiszorgmedewerkers in de grote steden waren 0.4 standaardafwijkingen beter dan de andere groep.

Wat is je reactie op dit verslag?

A. Er is geen melding van de effectgrootte
B. Er had een $$z$$-toets gebruikt moeten worden
C. Het aantal vrijheidsgraden wordt niet vermeld
D. Het verslag is in grote lijnen in orde

Je leest het volgende in een wetenschappelijk artikel: "De groepen verschilden significant in de mate waarin ze de advertenties waardeerden, zoals we dit d.m.v. een $$t$$-toets konden bevestigen: $$t(51) = 2.3, p = 0.03$$."

Hoe zou je dit verslag willen verbeteren?

A. Toevoegen van de standaardafwijkingen
B. Toevoegen van de standaardfouten
C. Toevoegen van Cohen's $$d$$
D. Gebruiken van een Mann-Whitney U toets in plaats van een $$t$$-toets

Je leest het volgende in een wetenschappelijk artikel: "De groepen verschilden significant in de mate waarin ze de advertenties waardeerden, zoals we dit d.m.v. een $$t$$-toets konden bevestigen: $$t(51) = 2.3, p = 0.03$$."

Hoe zou je dit verslag willen verbeteren?

A. Toevoegen van de standaardafwijkingen
B. Toevoegen van de standaardfouten
C. Toevoegen van Cohen's $$d$$
D. Gebruiken van een Mann-Whitney U toets in plaats van een $$t$$-toets

Op een taaltoets haalt Anna een score van 10 en Christina 20. Het gemiddelde van deze leeftijdsklasse is 20 met een standaardafwijking van 5. Binnen een steekproef van 25 personen wordt de taaltoets ook afgenomen en is de score 19. Wat de $$z$$-score voor Anna?

A. -2
B. -9
C. -1
D. 0.5

Op een taaltoets haalt Anna een score van 10 en Christina 20. Het gemiddelde van deze leeftijdsklasse is 20 met een standaardafwijking van 5. Binnen een steekproef van 25 personen wordt de taaltoets ook afgenomen en is de score 19. Wat de $$z$$-score voor Anna?

A. -2
B. -9
C. -1
D. 0.5

• Berekening: $$z = \frac{x-\mu}{\sigma} = \frac{10 - 20}{5} = \frac{-10}{5} =$$ -2

De gemiddelde IQ score van een groep van 100 Groningers levert 104.5 op. Hoe groot is de kans (in procenten) op deze of een hoger score voor deze groep wanneer de IQ scores van Groningers normaal verdeeld zijn met $$N(100,15)$$?

A. 4.5%
B. 2.5%
C. 0.15%
D. Ongeveer 38%

De gemiddelde IQ score van een groep van 100 Groningers levert 104.5 op. Hoe groot is de kans (in procenten) op deze of een hoger score voor deze groep wanneer de IQ scores van Groningers normaal verdeeld zijn met $$N(100,15)$$?

A. 4.5%
B. 2.5%
C. 0.15%
D. Ongeveer 38%

• Berekening:
• $$z = \frac{m-\mu}{\sigma/\sqrt{n}} = \frac{104.5 - 100}{15 / \sqrt{100}} = \frac{4.5}{1.5} = 3$$
• Dus 3 standaardfouten rechts van het gemiddelde: 99.7% zit tussen -3 en 3 standaardfouten (dit moet je uit je hoofd kennen) $$\rightarrow$$ 0.3 % aan beide uiteinden, dus 0.15% aan de rechterzijde

Je hebt onderzocht of Twitter de bekendheid van een nieuw product kan verbeteren door twee campagnes op te starten voor vergelijkbare producten (één met gebruik van Twitter, en één zonder gebruik van Twitter) en één groep van 300 mensen te vragen naar de bekendheid van de twee producten aan het einde van de campagnes. In het wetenschappelijke artikel schrijf je "Uit een telefonische enquête onder 300 mensen bleek dat er een significant positief effect was van het gebruik van Twitter: $$t = 2.1, p = 0.04$$. Cohen's $$d$$: 0.5."

Welk element is essentieel om aan de rapportage toe te voegen?

B. De effectgrootte
C. Of er eenzijdig of tweezijdig getoetst is
D. Of de verdelingen (ongeveer) normaal waren

Je hebt onderzocht of Twitter de bekendheid van een nieuw product kan verbeteren door twee campagnes op te starten voor vergelijkbare producten (één met gebruik van Twitter, en één zonder gebruik van Twitter) en één groep van 300 mensen te vragen naar de bekendheid van de twee producten aan het einde van de campagnes. In het wetenschappelijke artikel schrijf je "Uit een telefonische enquête onder 300 mensen bleek dat er een significant positief effect was van het gebruik van Twitter: $$t = 2.1, p = 0.04$$. Cohen's $$d$$: 0.5."

Welk element is essentieel om aan de rapportage toe te voegen?

B. De effectgrootte
C. Of er eenzijdig of tweezijdig getoetst is
D. Of de verdelingen (ongeveer) normaal waren

Je schrijft in een onderzoeksverslag "dat een voorkeur voor Twitter i.p.v. SMS samenhangt met geslacht bij jonge mensen, $$\chi^2(1) = 6.7, p < 0.01$$".
Je wilt het verslag verbeteren, wat voeg je toe?

A. Een box plot om de spreiding van de groepen te visualiseren
B. Het gemiddelde van de groepen
C. Cramer's $$V$$
D. Een normaal-kwantiel diagram per groep

Je schrijft in een onderzoeksverslag "dat een voorkeur voor Twitter i.p.v. SMS samenhangt met geslacht bij jonge mensen, $$\chi^2(1) = 6.7, p < 0.01$$".
Je wilt het verslag verbeteren, wat voeg je toe?

A. Een box plot om de spreiding van de groepen te visualiseren
B. Het gemiddelde van de groepen
C. Cramer's $$V$$
D. Een normaal-kwantiel diagram per groep

In de bovenstaande box plot is 1 punt onderaan bijzonder gemarkeerd. Waarom?

A. Omdat het om een uitschieter gaat, dus met een $$z$$-score van -2 of kleiner
B. Omdat het om een uitschieter gaat, dus > 1,5 IQR beneden $$Q_1$$
C. Omdat het de kleinste waarde in de steekproef is
D. Géén van [a] t/m [c]

In de bovenstaande box plot is 1 punt onderaan bijzonder gemarkeerd. Waarom?

A. Omdat het om een uitschieter gaat, dus met een $$z$$-score van -2 of kleiner
B. Omdat het om een uitschieter gaat, dus > 1,5 IQR beneden $$Q_1$$
C. Omdat het de kleinste waarde in de steekproef is
D. Géén van [a] t/m [c]

Je ziet het bovenstaande normaal-kwantiel diagram voor gegevens die normaal verdeeld horen te zijn. Wat rapporteer je in je verslag?

A. De verdeling is vermoedelijk niet normaal, omdat de rechte lijn slechts door één punt gaat
B. De verdeling is vermoedelijk niet normaal, omdat de punten duidelijk afwijken van de rechte lijn
C. De verdeling is bij benadering normaal
D. Dat er geen uitspraak gedaan kan worden over normaliteit op basis van deze grafiek

Je ziet het bovenstaande normaal-kwantiel diagram voor gegevens die normaal verdeeld horen te zijn. Wat rapporteer je in je verslag?

A. De verdeling is vermoedelijk niet normaal, omdat de rechte lijn slechts door één punt gaat
B. De verdeling is vermoedelijk niet normaal, omdat de punten duidelijk afwijken van de rechte lijn
C. De verdeling is bij benadering normaal
D. Dat er geen uitspraak gedaan kan worden over normaliteit op basis van deze grafiek

Welke functie gebruik je in R om de validiteit te bepalen van een meetinstrument?

A. cronbach()
B. alpha()
C. validity()
D. Géén van [a] t/m [c]

Welke functie gebruik je in R om de validiteit te bepalen van een meetinstrument?

A. cronbach()
B. alpha()
C. validity()
D. Géén van [a] t/m [c]

Wat is het juiste commando om de absolute afwijking van de mediaan uit te rekenen in R van de kolom english_grade in dataframe dat?

A. abs_med(dat$english_grade) B. abs.med(dat$english_grade)
C. mad(dat$english_grade) D. Géén van [a] t/m [c] Wat is het commando om de absolute afwijking van de mediaan uit te rekenen in R van de kolom english_grade in dataframe dat? A. abs_med(dat$english_grade)
B. abs.med(dat$english_grade) C. mad(dat$english_grade)
D. Géén van [a] t/m [c]

N.B. dit is niet tijdens het college behandeld, maar staat in de hoofdstukken van het boek die ter voorbereiding op het college gelezen moesten worden (zie studiehandleiding): dit is tentamenstof!