Opdracht: Enkelvoudige logistische regressie

Opdracht 5 ----------

Enkelvoudige logistische regressie In 1972 deed William Labov, de grondlegger van de sociolinguïstiek, onderzoek naar de uitspraak van de /r/ door mensen van verschillende sociale klassen in New York. De /r/ kan als [r] uitgesproken worden, maar deze klank kan ook worden vervangen door een [@] (schwa) of helemaal weggelaten worden. Hij wilde zien of de uitspraak van /r/ afhankelijk was van de sociale klasse. Om de uitspraak binnen verschillende sociale klassen te onderzoeken bezocht Labov drie warenhuizen van verschillende ketens, die meer of minder chic waren. De namen van de warenhuizen waren respectievelijk Saks (meest chic), Macy's en S.Klein (minst chic). In Nederland zou je dit kunnen vergelijken met het verschil tussen de kledingzaken Gucci, Hennes & Mauritz en Zeeman. In ieder warenhuis vroeg Labov naar een bepaald artikel, waarvan hij wist dat het zich op de vierde verdieping bevond. De medewerkers gaven dus als antwoord "On the fourth floor" en Labov luisterde hoe de [r] in deze woorden werd uitgesproken. Vervolgens deed hij alsof hij de medewerker niet goed verstaan had, zodat de medewerker het antwoord herhaalde. Hierdoor kreeg Labov tevens een beeld van de uitspraak van de [r] in met nadruk uitgesproken woorden. Hieronder is voor elk van de drie warenhuizen aangegeven hoe de medewerkers de [r] uitspraken. In de tabel is per warenhuis weergegeven hoeveel werknemers de [r] altijd, soms of nooit uitspraken. We willen nagaan of er daadwerkelijk een verschil is in de uitspraak van de [r] in verschillende sociale klassen. (Bron: William Labov, Sociolinguistic Patterns, 1972. University of Pennsylvania Press, Philadelphia) [r] altijd [r] soms [r] nooit Saks 30 32 6 Macy's 20 31 74 S.Klein 4 17 50 Voer de gegevens handmatig in in SPSS. Definieer de variabelen, (en vergeet niet de trick om frequentie door een weging te bepalen). a. Om het verschil in uitspraak tussen de verschillende sociale klassen te onderzoeken kijken we hieronder alleen nog naar de medewerkers die de [r] altijd uitspraken en de medewerkers die de [r] nooit uitspraken. Waarom mag men dit doen? Filter de gegevens van de overige medewerkers uit het gegevensbestand in SPSS. Zo verkrijgen we een tweewaardige variabele -- wel of niet [r] uitgesproken. b. Denk erover na welke soort grafiek de geschiktste is voor deze gegevens, maak hem, en zet hem in je verslag. c. Formuleer de nulhypothese en de alternatieve hypothese voor de logistische regressie. Benoem de onafhankelijke en de afhankelijke variabelen. Maak een goede keuze voor de representatie van de categorische variabele die met sociale klasse te maken heeft. Voer vervolgens de logistische regressie-procedure uit en geef de tabel weer. d. Wat is je conclusie met betrekking tot de uitspraak van de [r] in verschillende sociale klassen? e. Geef een schatting van de verklaarde variantie. f. Bekijk ook de geschatte waarden met bijbehorende 95%-betrouwbaarheidsintervallen voor de odds ratio's van het verschil tussen S.Klein en Saks en het verschil tussen S.Klein en Macy's. Wat laten de schattingen zien?

Voor een zeer gedetailleerd uitleg van logistische regressie, en vooral het bijzondere pakket voor taalkundige variatie, VARBRULE, zie John Paolillo. 2002. Analyzing Linguistic Variation: Statistical Models and Methods. Stanford: CSLI.