Home Project Summary RuG logoNWO logo

Automatisch vragen beantwoorden met behulp van dependentie-relaties

Question Answering for Dutch using Dependency Relations

Zowel eenvoudige gebruikers als gespecialiseerde ICT-professionals hebben tegenwoordig toegang tot grote hoeveelheden elektronische informatie. Informatie die on-line te vinden is, is echter nauwelijks gestructureerd en georganiseerd, bevat herhalingen, is niet altijd accuraat of consistent, is in verschillende talen geschreven, en kan uit tekst maar ook uit spraak bestaan. De huidige (web-)zoekmachines maken het mogelijk ondanks deze tekortkomingen te zoeken naar informatie, maar laten toch ook veel aan gebruiksvriendelijkheid te wensen over. Er is met name behoefte aan hulpmiddelen die het mogelijk maken om alleen relevante informatie te vinden, om informatie uit verschillende bronnen samen te vatten, en die interactief zijn, d.w.z. dat ze in staat zijn een informatie-dialoog aan te gaan met de gebruiker. De ontwikkeling van zulke hulpmiddelen vereist een combinatie van technieken ontleend aan de information retrieval en de computionele taalkunde.

Question Answering (QA) is een techniek die probeert om de effectiviteit van information retrieval te verbeteren door gebruik te maken van computationele taalkunde. Een vraag van een gebruiker kan een hele zin zijn, en het systeem zal proberen een antwoord te geven dat is gebaseerd op een selectie van relevante passages in een verzameling tekst of web-documenten. De vraag Op welk eiland ligt de Etna? wordt bijvoorbeeld beantwoord met Sicilië, en niet met een lijst van web-adressen die wellicht het antwoord bevatten.

Dit project onderzoekt hoe een QA-systeem gemaakt kan worden met behulp van geavanceerde technieken voor de automatische analysere van taal. We onderzoeken in hoeverre syntactische en semantische relaties in een vraag en een potentieel antwoord gebruikt kunnen worden om de accuratesse van QA te verbeteren. Er zal een demonstratie-systeem worden ontwikkeld in samenwerking met uitgeverij Het Spectrum, die onder andere de elektronische tekst van een encyclopedie beschikbaar stelt. Daarnaast zal worden deelgenomen aan systematische evaluatie van QA-systemen, zoals CLEF.

Een gedetailleerde (Engelstalige) beschrijving van het project is te vinden in Project Description (pdf)