Opdracht 3
----------

Enkelvoudige lineaire regressie

Kan de leeftijd waarop een kind begint te spreken voorspellen hoe zijn sco-
re zal zijn bij een latere test op verstandelijke vermogens? Een studie o-
ver de cognitieve ontwikkeling van jonge kinderen registreerde voor ieder
van 21 kinderen de leeftijd (in maanden) waarop het eerste woord werd ge-
sproken en de score van de Gesell Aanpassingstoets die veel later werd af-
genomen. Hieronder staan de resultaten. (Gegevens uit N. R. Draper en J. A.
John, 'Influential observations and outliers in regression', Technometrics,
23 (1981), blz. 21-26.)

geval   leeftijd  score

 1       15        95
 2       26        71
 3       10        83
 4        9        91
 5       15       102
 6       20        87
 7       18        93
 8       11       100
 9        8       104
10       20        94
11        7       113
12        9        96
13       10        83
14       11        84
15       11       102
16       10       100
17       12       105
18       42        57
19       17       121
20       11        86
21       10       100

a. Teken drie spreidingsdiagrammen: leeftijd vs. score, geval vs. residu,
   en leeftijd vs. residu. Zorg dat in de eerste grafiek ook de kleinste-
   kwadratenlijn wordt getekend. Zijn er opvallend verdachte patronen of
   abnormale waarnemingen?
   
b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.

c. Onderzoek de verschillen tussen de waargenomen waarden en de waarden
   die voorspeld worden door de kleinste-kwadratenlijn.  Teken de residuen
   in een normaal-kwantiel grafiek om de normaliteit te toetsen.

d. Bepaal de standaardfouten voor b1 en b0.

e. We verwachten dat een kind dat op jonge leeftijd al het eerste woord 
   spreekt later een hoge score zal hebben. Geef voor beta1 een 95%-be-
   trouwbaarheidsinterval. Formuleer H_0 en H_a en bewijs dat de score ne-
   gatief samenhangt met de leeftijd. 
   
f. De constante beta0 representeert de gemiddelde score van kinderen die
   op de leeftijd van 0 maanden al het eerste woord spraken. Geef voor
   beta0 een 95%-betrouwbaarheidsinterval. 

e. Hoeveel van de variantie in de scores van de aanpassingstoetsen wordt
   door de leeftijd wanneer het eerste woord wordt gesproken verklaard?