Karen Keune (2003)
Hoofdklemtoon op Nederlandse woorden bepalen met behulp van Transformation-Based Learning
Master's thesis, Rijksuniversiteit Groningen.
[ Paper (PDF, 257 kb) ]

Samenvatting

Wanneer een geschreven tekst in spraak wordt omgezet, is het belangrijk dat woorden klemtoon krijgen. Wanneer woorden geen klemtoon zouden krijgen zou de uitgesproken tekst namelijk erg saai en robotachtig klinken.

Het is voor veel woorden mogelijk om in een corpus, waar het woord en de bijbehorende prosodische informatie in staan, op te zoeken op welke lettergreep van dat woord hoofdklemtoon ligt. Het is echter niet mogelijk om alle Nederlandse woorden in een corpus te zetten. Denk alleen al eens aan alle samenstellingen die voor het Nederlands mogelijk zijn. Om deze reden is het nuttig om klemtoon automatisch te kunnen bepalen.

Voor het automatisch bepalen van de klemtoon, heb ik gebruik gemaakt van Transformation-Based Learning. Dit is een machine learning programma waarmee regels gevonden kunnen worden die bepalen op welke lettergreep van een woord hoofdklemtoon komt te liggen.

In mijn onderzoek heb ik bekeken welke taalkundige informatie die een lettergreep bevat nuttig is bij het vinden van de regels die bepalen of een lettergreep wel of niet beklemtoond is.

Ook heb ik rekening gehouden met de positie van de lettergrepen binnen een woord. Hiervoor heb ik onderzocht naar hoeveel context van een lettergreep het beste gekeken kan worden bij het bepalen van de klemtoon.

In dit onderzoek is alleen gekeken naar waar de hoofdklemtoon van een woord komt te liggen. Met andere soorten klemtoon is geen rekening gehouden.