Wat je ook doet
de semantiek gooit roet
Battus
Het belangrijkste probleem waar een natuurlijke-taalinterface tegen aanloopt is het probleem van de meerduidigheid of ambiguïteit. Bijna elke taaluiting is in isolatie meerduidig. Mensen hebben daarmee geen enkele moeite. Na het horen van het zinnetje:
komen alleen taalkundigen op het idee dat deze zin ook zou kunnen
betekenen dat Jan boven op het stationsgebouw aan het wachten
is.
Waarom weten mensen nu wat de bedoelde betekenis is? Het lijkt
erop dat je om zulke vragen te kunnen beantwoorden in het algemeen
ontzettend veel informatie moet hebben over hoe de wereld in elkaar
zit, en wat `normale' acties van mensen zijn. Een computer ontbeert
zulke kennis en heeft dus vaak de neiging teveel analyses aan een uiting toe te kennen: namelijk ook allerlei
zeer onwaarschijnlijke analyses. Disambiguatie
(het toekennen van de bedoelde lezing aan een meerduidige zin)
is daarom een belangrijke taak.
Het omgekeerde probleem doet zich ook voor. Natuurlijke taal-interfaces zijn vaak niet robuust. Mensen maken vaak `foutjes' in hun taalgebruik (vooral in gesproken taal), ze gebruiken nieuwe woorden, ze gebruiken soms even een vreemde taal. Een typische opmerking van een gebruiker tegen een openbaar vervoer informatie systeem zou kunnen zijn:
Dus zelfs wanneer het systeem de regels van het Nederlands perfect
beheerst moet het systeem in dit voorbeeld eerst ontdekken dat de
gebruiker zichzelf enige malen in de rede viel en stukjes van zijn
eigen uiting corrigeerde.
Opnieuw geldt dat mensen met dit probleem geen enkele
moeite hebben; voor machines is dit echter wel degelijk een groot
struikelblok.
Zoals in hoofdstuk XXX al is aangetoond kan ook het (door een computer) omzetten van spraak naar tekst (spraakherkenning) nog niet beschouwd worden als een opgelost probleem. Dit betekent voor het systeem eigenlijk dat in input `onzeker' is. Vaak levert een spraakherkenner bijvoorbeeld verschillende kandidaatzinnen op. De bovengenoemde problemen worden hierdoor alleen maar moeilijker op te lossen.