Harry Schreuder (2000)
Klemtoonvoorspelling op woordniveau. Een aanzet tot het maken van een voorleesmachine
Master's thesis, Rijksuniversiteit Groningen.
[ Paper (PDF, 245 kb) ]

Inleiding

Een interessant onderdeel van de informatica is de kunstmatige intelligentie. De vraag die hierbij past is: "In hoeverre kan een computer de menselijke intelligentie nabootsen?". Het antwoord op deze vraag zal jaar na jaar wel verschillen omdat computers steeds krachtiger worden en de menselijke kennis van zowel de hersenen als computers toeneemt. Reeds bekend is dat de menselijke hersenen een groot aantal taken verrichten. Naast onder andere denken, rekenen en verbanden leggen kunnen mensen leren lezen. Een mens kan lezen om iets te leren, te begrijpen. Bovendien kan een mens ook kennis die op schrift is vastgelegd over brengen op andere mensen door het voor te lezen. Deze scriptie is gewijd aan deze betreffende functie van de menselijke hersenen.

Mensen kunnen pas voorlezen als ze hebben geleerd te lezen. Het proces van het leren lezen door mensen begint op de basisschool waar kinderen letters en de bijbehorende klanken leren. Voordat ze naar de basisschool gaan hebben ze al veel woordjes en de bijbehorende betekenis geleerd. Op school leren ze hoe ze met behulp van letters deze woordjes kunnen samenstellen. Na het samenstellen van de woordjes wordt kinderen geleerd waar lettergrepen zich binnen deze woordjes bevinden. Met behulp van deze lettergrepen kan de reeds eerder geleerde kennis van klemtoon worden toegepast op de uitspraak. Voor het lezen en dus voorlezen gebruiken mensen hun hersenen. De dingen die op de basisschool zijn geleerd worden opgeslagen en toegepast in de praktijk. Hierdoor zijn mensen in staat teksten begrijpelijk voor te lezen aan andere mensen.

Een computer bevat geen hersenen. Alles wat een computer kan zal eerst door mensen moeten worden geprogrammeerd. Een computer kan echter op verschillende manieren worden geprogrammeerd. Voor het maken van een voorleesmachine, een computer die teksten kan voorlezen op een manier zoals mensen dat doen, zijn reeds verschillende programma s geschreven. Bij het onderzoek naar deze programma s is duidelijk geworden dat er nog geen afgerond geheel is. De programma s zijn slecht stukjes van de puzzel die nog gelegd moeten worden. In deze scriptie is ook een stukje van de puzzel onderzocht met die aantekening dat de gehele puzzel niet uit het oog verloren is. Het gedeelte betreft het toekennen van klemtoon aan woorden. Voor dit onderdeel van de voorleesmachine is een programma geschreven. Daarnaast is er met betrekking tot het geheel een mogelijk ontwerp gemaakt. Het ontwerp is gebaseerd op de elementen die kinderen worden geleerd.

In de scriptie zal de volgende probleemstelling worden behandeld:

Daarnaast komen er nog een tweetal vragen aan bod:

Algemene vraag:

Deelvraag: De benodigde gegevens zijn in beperkte mate verkregen via literatuur over het leerproces van mensen van het lezen. Daarnaast is literatuur geraadpleegd over bestaande tekst-naar-spraak theorieën en modellen. Deze literatuur is te splitsen in twee onderdelen, statistische taalverwerking door computers en kunstmatige intelligentie. Ook is er gekeken naar bestaande programma s. Deze programma s betreffen de onderdelen van het gehele concept, zoals nader omschreven is in hoofdstuk drie. Tot slot is er een programmeeropdracht voltooid. De resultaten en bevindingen hiervan zijn de laatste gegevens. De theorieën zijn nauwkeurig omschreven in de volgende twee hoofdstukken. Het betreft hier theorieën die betrekking hebben op het leerproces van lezen en voorlezen door mensen, theorieën die zijn bedacht om computers geschreven taal te laten uitspreken en theorieën over het bepalen van klemtoon binnen woorden.

De doelstelling van het onderzoek en de scriptie bevat twee elementen waarvan de een theoretisch en de ander praktisch is. Het theoretisch kader behelst een mogelijkheid te geven voor ontwikkeling van een voorleesmachine. Hiervoor is van belang te weten dat er tot nu toe programma s zijn geschreven die een directe grafeem-naar-foneem conversie bevatten. Nadat kinderen letters leren lezen ontwikkelen ze zich verder in het proces van lezen. Deze ontwikkeling is onderzocht en met de gegevens ervan is gekeken in hoeverre een computer deze ontwikkelingen kan overnemen. Het praktisch gedeelte bestaat uit de implementatie van een programma voor het voorspellen van klemtoon binnen woorden door een computer. In dit gedeelte zijn theoretische elementen uit voorgaande hoofdstukken overgenomen indien ze tot verbetering leidden. Daarnaast zijn de elementen die het resultaat negatief beïnvloedden getest en van het mogelijke commentaar voorzien.