European Assocication for Computational Linguistics

Dr. Gertjan van Noord, EACL Voorzitter 2005-2006, maart 2005

JN: De aanleiding voor dit interview is jouw benoeming tot voorzitter van de European chapter of the Association for Computational Linguistics. Dit klinkt als een grote eer, maar misschien kan je vertellen wat dit concreet inhoudt. Wie zijn de leden van deze organisatie, hoeveel zijn er, en wat zijn de activiteiten?

GvN: De ACL is DE internationale wetenschappelijke en professionele organisatie voor de computationele taalkunde. De organisatie verenigt momenteel meer dan 1600 onderzoekers op dit terrein. De EACL is de Europese afdeling van de ACL, en verenigt zo'n 700 onderzoekers die gesitueerd zijn in Europa, het midden-Oosten en noordelijk Afrika.

De belangrijkste activiteiten van de ACL bestaan uit de organisatie van de jaarlijke ACL conferentie. Dit is de belangrijkste conferentie op het gebied van de computationele taalkunde. Met een acceptance rate van soms minder dan 20% is deze conferentie maatgevend. De ACL geeft ook het toonaangevende tijdschrift uit op dit gebied: Computational Linguistics. Daarnaast zijn er een groot aantal special interest groups met hun eigen organisatie en workshops op allerlei deelgebieden.

De belangrijkste activiteiten van de EACL bestaan uit het organiseren van de driejaarlijkse EACL conferentie. Daarnaast wordt de jaarlijkse ACL conferentie eens per drie jaar in Europa georganiseerd. De volgende EACL conferentie is in april 2006 in Trento. De voorbereidingen voor deze conferentie zijn inmiddels in volle gang. Daarnaast bevordert de EACL ook initiatieven op het gebied van opleiding, en op het gebied van infrastructuur.

Het vakgebied van de computationale taalkunde wordt overigens bij deze activiteiten breed opgevat. Alles wat zowel met natuurlijke taal als met computers te maken heeft, vindt al gauw een plekje. Daarbij kan de nadruk zowel liggen op het maken van concrete toepassingen op dit gebied (bijvoorbeeld automatische spellingcorrectie, de sprekende computer voor informatiediensten, hulpmiddelen om SMS-berichtjes zo efficiënt mogelijk te kunnen invoeren, etc), als ook op de theoretische modellering van natuurlijke taal en natuurlijke-taalverwerking, waarbij preciese wiskundige en/of statistische modellen worden geconstrueerd.

JN: Dat klinkt trouwens als een activiteit waar ook de industrie een bepaalde belangstelling moet hebben. Of is de belangstelling zuiver wetenschappelijk?

GvN: De ACL is een wetenschappelijke organisatie, maar de industrie heeft op dit terrein altijd grote interesse gehad, en heeft die nu nog. Een flink aantal leden van de ACL is overigens in dienst van onderzoekslaboratoria, zoals bijvoorbeeld Xerox, AT&T, IBM, Microsoft, Philips, Siemens en Google. Bij de ACL en EACL conferenties is ook altijd plaats ingeruimd voor exhibities van met name industriële partijen die hun producten daarbij kunnen presenteren.

JN: Jij zit zelf echter wel in een taalkundig instituut. Heeft jouw werk ook taalkundige belangstelling, of wordt het vooral gezien als techniek?

GvN: De computationele taalkunde in Groningen is altijd sterk geworteld in de taalkunde. Dit betekent dat we proberen de taalkundige complexiteit van de natuurlijke taal serieus te nemen. Aan de andere kant is het soms ook heel leuk en leerzaam om aan concrete toepassingen te werken. Je loopt daarbij ook regelmatig tegen kleine onverwachte probleempjes op die ook taalkundig interessant of op zijn minst wonderlijk zijn. Waarom kun je bijvoorbeeld in het Nederlands 'dit keer' zeggen, terwijl 'keer' toch een de-woord is? En waarom kom je wel tegen 'een beroemd man' terwijl je nooit 'een beroemd vrouw' aantreft?

JN: Hoe wordt men voorzitter van zo'n club? En wat wordt de voorzitter geacht te doen?

GvN: De EACL heeft een "nominating committee" die een kandidaat voor deze post nomineert. Ik werd door de nominating committee voorgedragen, en er waren geen alternatieve kandidaten. Je komt dan in het bestuur van de EACL, en gedurende twee jaar ben je vice-voorzitter. Daarna ben je gedurende twee jaar voorzitter. Deze twee jaar zijn dus nu net ingegaan.

Mijn belangrijkste concrete taak is om te zorgen dat de EACL conferentie in 2006 wordt georganiseerd. Deze conferentie vindt dus volgend jaar in Trento plaats. Ik ben kort geleden in Trento op "site visit" geweest. Behalve de feitelijke organisatie ter plekke moeten daarnaast vooraanstaande wetenschappers benaderd worden om plaats te nemen in de verschillende wetenschappelijke commissies van de conferentie. In het kader van de conferentie worden verder tal van kleinere workshops en tutorials georganiseerd, en hiervoor worden momenteel ook allerlei mensen benaderd.

JN: Hoe zit het met dit onderzoek in de FdL? Jouw eigen pionierproject loopt langzaam maar zeker af, dus zal dit een grote daling in de Groningen activiteit betekenen? Of hebben jullie al nieuwe activiteiten in petto?

GvN: Ten dele is de continuïteit van het onderzoek gewaarborgd door een promotieplaats en een postdoc die de FdL bij het begin van het project als onderdeel van de matching heeft toegezegd voor de komende jaren. Hiervoor gaan we binnenkort werven. Het IMIX project van collega Gosse Bouma garandeert overigens ook al continuïteit vanwege de raakvlakken van dit project met het pionieronderzoek.

Daarnaast is ons in het kader van de succesvolle visitatie voor de komende jaren een parelsubsidie toegezegd door het CvB. Hierbij gaan de gedachten uit om de resultaten van het pionierproject te combineren met onderzoeksvragen op het gebied van discourse. We gaan hier samenwerken met Gisela Redeker en de nieuwe UHD bij communicatiekunde, dr. Markus Egg.

Ten slotte zijn we heel succesvol geweest bij de eerste aanvraagronde van het STEVIN programma. STEVIN is een meerjarig onderzoeks- en stimuleringsprogramma voor Nederlandstalige taal- en spraaktechnologie dat gezamenlijk door de Vlaamse en Nederlandse overheid wordt gefinancierd. Het programma wordt gecoördineerd en financieel beheerd door de Nederlandse Taalunie. In de eerste ronde werden maar liefst drie voorstellen gehonoreerd waarbij we betrokken zijn. De voorstellen bouwen alle drie duidelijk voort op het onderzoek binnen pionier. Begona Villada (AiO binnen pionier) kan in het kader van een project met prof. Jan Odijk (Utrecht) en uitgever van Dale twee jaar als post-doc haar onderzoek op het gebied van de multi-word expressies voortzetten. Gosse Bouma, die ook een belangrijke inbreng in het pionier onderzoek had, zal samen met prof. Daelemans (Antwerpen) technieken ontwikkelen voor het semi-automatisch annoteren van co-reference. Zelf zal ik de komende twee jaar druk zijn in het kader van een samenwerkingsverband waarin een groot geannoteerd corpus van het Nederlands wordt gemaakt (vergelijkbaar met het Corpus Gesproken Nederlands, maar dan voor geschreven materiaal). Hierbij zal mijn groep samen met de groep van Frank van Eynde (Leuven) verantwoordelijk zijn voor de syntactische annotatie. Hierbij neemt de automatische parser Alpino, die in pionier werd ontwikkeld, een prominente plaats in.