Computer begrijpt nog niet veel van taal

Hoewel de sprekende computer haar intrede doet in de maatschappij blijkt dat computers nog maar weinig van taal begrijpen. De sprekende computer beperkt zich dan ook tot gespecialiseerde taken zoals het opzoeken van telefoonnummers of het doorgeven van openbaar vervoer reisinformatie. De problemen waar de computer tegenaan loopt hebben te maken met de meerduidigheid en ingewikkeldheid van taal. NWO heeft dr. Gertjan van Noord een PIONIER-subsidie toegekend om de computationele verwerking van het Nederlands beter te begrijpen. Hierdoor kan het in de toekomst mogelijk worden dat de sprekende computer ook ingezet kan worden voor veel ingewikkeldere taken.

illustration by Robbert Prins

De Nederlandse taal is voor een computer slechts in zeer beperkte mate te begrijpen. Eén van de problemen ontstaat omdat taal meerduidig is. Een voorbeeld is het zinnetje Vader zagen wij niet meer. Wanneer een computer probeert zo'n zin te begrijpen is de kans aanwezig dat de computer hieruit concludeert dat wij blijkbaar niet meer bezig zijn om vader in stukjes te zagen. Het blijkt dat zelfs de meest onschuldige zinnetjes veel van zulke onbedoelde betekenissen kunnen hebben. Mensen zijn zich meestal niet bewust van deze extra betekenissen.

Een ander probleem ontstaat door de complexiteit van bepaalde zinsconstructies. Wanneer zulke zinsconstructies tot in detail moeten worden gereconstrueerd kan worden aangetoond dat de benodigde rekentijd uit de hand loopt voor langere zinnetjes. Een voorbeeld van zo'n constructie is de mogelijkheid om een hulpwerkwoord zoals helpen, laten, of zien aan de zin toe te voegen. In dat geval kan er ook een extra lijdend voorwerp worden toegevoegd. Stel dat we beginnen met het zinnetje Ik zei dat de kok de maaltijd bereidt, dan kunnen we daar volgens dit procedé van maken Ik zei dat de presentator de kok de maaltijd helpt bereiden. In principe, zeggen de taalkundigen, kun je hier steeds mee doorgaan: Ik zei dat het publiek de presentator de kok de maaltijd ziet helpen bereiden. De zinnetjes worden wel steeds vreemder, en moeilijk te begrijpen (bijvoorbeeld: ik zei dat de televisieploeg het publiek de presentator de kok de maaltijd laat zien helpen bereiden). In het onderzoek wordt de hypothese getoetst dat zulke constructies niet tot in detail gereconstrueerd kunnen worden, net zoals mensen bij ingewikkeldere varianten in de problemen raken. In plaats daarvan wordt uitgegaan van een eenvoudig model, gebaseerd op finite-state automata, waarvoor benodigde rekentijd gegarandeerd beperkt is. De vraag is of het mogelijk is met zo'n eenvoudig model voldoende van de complexiteit van de taal te reconstrueren.

Meer informatie over dit project via http://www.let.rug.nl/~vannoord/alp