Opdracht 3 ---------- Enkelvoudige lineaire regressie Kan de leeftijd waarop een kind begint te spreken voorspellen hoe zijn sco- re zal zijn bij een latere test op verstandelijke vermogens? Een studie o- ver de cognitieve ontwikkeling van jonge kinderen registreerde voor ieder van 21 kinderen de leeftijd (in maanden) waarop het eerste woord werd ge- sproken en de score van de Gesell Aanpassingstoets die veel later werd af- genomen. Hieronder staan de resultaten. (Gegevens uit N. R. Draper en J. A. John, 'Influential observations and outliers in regression', Technometrics, 23 (1981), blz. 21-26.) geval leeftijd score 1 15 95 2 26 71 3 10 83 4 9 91 5 15 102 6 20 87 7 18 93 8 11 100 9 8 104 10 20 94 11 7 113 12 9 96 13 10 83 14 11 84 15 11 102 16 10 100 17 12 105 18 42 57 19 17 121 20 11 86 21 10 100 a. Teken drie spreidingsdiagrammen: leeftijd vs. score, geval vs. residu, en leeftijd vs. residu. Zorg dat in de eerste grafiek ook de kleinste- kwadratenlijn wordt getekend. Zijn er opvallend verdachte patronen of abnormale waarnemingen? b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn. c. Onderzoek de verschillen tussen de waargenomen waarden en de waarden die voorspeld worden door de kleinste-kwadratenlijn. Teken de residuen in een normaal-kwantiel grafiek om de normaliteit te toetsen. d. Bepaal de standaardfouten voor b1 en b0. e. We verwachten dat een kind dat op jonge leeftijd al het eerste woord spreekt later een hoge score zal hebben. Geef voor beta1 een 95%-be- trouwbaarheidsinterval. Formuleer H_0 en H_a en bewijs dat de score ne- gatief samenhangt met de leeftijd. f. De constante beta0 representeert de gemiddelde score van kinderen die op de leeftijd van 0 maanden al het eerste woord spraken. Geef voor beta0 een 95%-betrouwbaarheidsinterval. e. Hoeveel van de variantie in de scores van de aanpassingstoetsen wordt door de leeftijd wanneer het eerste woord wordt gesproken verklaard?