BCN Nieuws Interview met John Nerbonne


Interview: John Nerbonne, Letteren en de Computer (of zoiets)

Interviewer: Ron van Zonneveld, BCN Nieuws


Inleiding (dit is een bijzonder interview, namelijk een electronische dialoog enz)


RvZ John, tien jaar geleden stond er een groepsinterview in de BCN-Nieuwsbrief, in het 'BCN-groepsportret Taalwetenschap en Alfa-Informatica', waar jij aan het woord was, naast Jan Koster en Frans Zwarts. Hoe heet Alfa-Informatica tegenwoordig, en heeft die naamsverandering ook nog vakinhoudelijke gevolgen?


JN: De opleiding heeft in 2000 de naam 'Informatiekunde' gekregen in een actie van de minister toen, Ritzen, denk ik, die er vond dat er te veel verschillende opleidingen in Nederland waren. We hanteren echter nog steeds de naam 'Alfa-informatica' als naam van de afdeling. Dit was een typische bureaucratische verandering met weinig inhoudelijke consequenties tot nog toe. We missen de oude naam die beter dat dekt datgene we doen: alfa-onderzoek middels de computer.


RvZ Destijds stond dit op je programma: "We richten ons op de constructie van computermodellen van menselijke taalvaardigheden vanuit het standpunt van de informatica. Wij vragen ons bijvoorbeeld af hoe de noodzakelijke datastructuren eruit zien, wat de algoritmen zijn, en hoeveel geheugen en tijd ze in beslag nemen. Zodoende krijgen we ook meer inzicht in menselijke taalproductie- en verwerkingsprocessen. Een belangrijke vraagstelling hierbij is hoe woordbetekenissen kunnen worden opgeslagen in een computer. Woorden vormen de belangrijkste sleutel tot de structuur van een zin. Doordat woorden vaak dubbelzinnig zijn, is het voor een computer moeilijk structuur aan te brengen in een zin'. En zo ga je nog even door. Als je dit nu terugleest, heb je daar vast wel commentaar op.


JN: Nou, op dat allgemene niveau klopt de beschrijving nog steeds heel aardig. Het was toen al de ervaring dat ook de beste discrete regelsystemen de taalstructuren te weinig beperken. Dat heeft als consequentie dat zinnen van 20 woorden al honderden analysen krijgen, waarbij het aantal analysen exponentieel in de lengte van zinnen stijgt. Een pure regelsysteem lijkt dus geen verklaring voor wezenlijke aspecten van taal aan te kunnen bieden, b.v. het feit dat we elkaar begrijpen -want daarvoor zou je moeten aanvullen hoe we vanuit de onzeggelijk vele analysen de juiste vinden. Dit probleem dat we trouwens 'disambiguatie' noemen, staat nog steeds zeer in het centrum van belangstelling. Woorden blijven hierbij de meeste betrouwbare indicaties voor structuur alhoewel het huidige onderzoek zich qua techniek niet meer op woordbetekenissen concentreert, maar veel meer op de informatie die impliciet in grote dataverzamelingen ligt, en die statistisch gebruikt moet worden. Ons onderzoek in Groningen heeft zich ook in deze richting ontwikkeld.


RvZ Nu we toch aan het terugblikken zijn: ben je tevreden over wat jij en je medewerkers de afgelopen tien jaar gepresteerd hebben? Of waarover wel, waarover niet?


JN: Tien jaar geleden kon ik wel vermoeden dat mijn jongere collega's Gertjan van Noord en Gosse Bouma door zouden blijven groeien, maar dit zou vandaag erg onderdreven zijn als samenvatting van hun prestaties in de afgelopen periode. Dankzij hun herhaalde en zware prestaties is Groningen vandaag de onomstreden leider in Nederland op het gebied van computationele taalkunde, wat we tien jaar geleden niet mochten roepen - daar hadden we drie serieuze concurrenten. Het is mij een genoegen te rapporteren dat Leonie Bosveld ook nu meedraait in de vaste staf van alfa-informatica met een nieuwe onderzoekslijn in diagrammatisch redeneren. Verder kan ik met tevredenheid constateren dat we alert op nieuwe ontwikkelingen hebben gereageerd, vooral de opkomst van de web, de beschikbaarheid van grote dataverzamelingen, en de kansen om mee te werken aan de "statistische omwenteling" van ons vak.


Maar je vraagt ook over onze mislukkelingen, en die zijn er ook: te weinig studenten willen het van ons overnemen, en we hebben helaas maar beperkte belangstelling bij het bedrijfsleven kunnen stimuleren. Alleen incidenteel krijgen we subsidies daar vandaan.


RvZ Wat staat er voor de komende tien jaar op het programma?


JN: Het fascinerende aan taalkunde voor mij is het feit dat je taal van zoveel perspectieven kunt benaderen, en dat de wisselende perspectieven steeds waardevol blijken te zijn. Er kan geen vraag zijn dat we allemaal op de schouders van Chomsky staan die een radicaal cognitieve blik op taal richtte die hij bovendien creatief met wiskunde wist te verbinden. Het is alleen consequent dat we proberen in BCN de neuronale basis voor deze cognitie beter te begrijpen. De onderzoekslijn waarin men probeert leermodellen voor taal computationeel te simuleren boeit mij enorm, en daar zal ik zeker in blijven ploeteren. Voor mij zijn de vele recente benoemingen in taalkunde van experts op het gebied van taalverwerving een bron voor optimisme -ik denk aan Angeliek van Hout, Heike Behrens, Kees de Bot en Kees de Glopper.


Maar het werken met taalcorpora heeft op mij ook in andere opzet indruk gemaakt. We hebben niet alleen een zeer capabele cognitieve apparat voor taal, maar ook een enorme ervaring. Ik rekende eens uit dat je tot je twintigste wel minimaal 70 Miljoen woorden (woord-optredens) had gehoord, gesproken of gelezen, en dat is een heleboel. Misschien draait deze fantastische taalknobbel die we allemaal in onze moedertaal laten zien op een as van enorme gemeenschappelijke ervaring -cultuur. En dit is een perspectief aan taal die vroeger - zeg maar tot de komst van Chomsky - centraal stond. Ik vermoed dat het een grote stap vooruit zou zijn om te begrijpen hoe cultuur en cognitie tot elkaar verhouden. Misschien ontwikkelen wij nu in de computationele taalkunde de juiste bouwstenen om aan dit project een begin te maken. Het vereist in ieder geval dat men leert met grote hoeveelheden daten om te gaan, en daar boeken wij zeker vooruitgang.


RvZ Het letterenonderzoek krijgt het eigenlijk steeds moeilijker, en de onderzoekers komen daardoor steeds meer onder druk te staan. Kun je in dit verband ook een positief geluid laten horen?


JN: Ten eerste, hoeft men niet ver te zoeken om positieve resultaten te zien. De +/- 20 taalkundige in BCN halen regelmatig goede resultaten op verschillende deelgebieden. Voor BCN zijn dit Laurie Stowe en Roelien Bastiaanse, onze "trekkers" in de neurolinguistiek, maar er gebeurt veel op vele fronten. Maar ten tweede ik geef toe dat we dit vooral te danken is aan de persoonlijke gedrevenheid van de taalkundigen zelf. Onderzoek is bij de Letterenfaculteit een ondersgeschoven post, wat je het duidelijkst ziet in aanstellingsbeleid. Ik heb nog niet beleefd dat men een positie op basis van onderzoeksbelang door kan zetten. Of laat je zien dat je studenten al hebt die onderwijs moeten ontvangen ofwel maak je plausibel dat je een toekomstige vraag naar onderwijs kan bedienen. Dit is voor een lange termijn ontwikkeling t.a.v. onderzoek niet vergemakkelijkend. Gechargeerd kan men zeggen dat de opleidingsvoorkeuren van achttienjarigen ons aanstellingsbeleid bepalen. Ten derde maken we het ons zelf zeer moeilijk in onderzoek door te veel onderwijs te programmeren. Volgend jaar worden UHD's en hoogleraren geacht ca. zes 10-pt. colleges/jaar te geven, en UD's zeven. Hier moeten we ons eigen huis in orde brengen. De te ambitieuze programma's komen van docenten die trots op hun eigen specialisme, wat toe te juichen is, maar die ook willen weigeren hun handen buiten deze specialisme vies te maken -geen zeer professionele opstelling.


RvZ Wat is jouw positie in het taalkunde-onderzoek van letteren, en in het BCN-onderzoek?


JN: Mijn primaire veld blijft de samenwerking binnen de computationele taalkunde, maar ik ben ook betrokken bij andere samenwerkingen binnen en buiten BCN. Theo Kuipers, Nicolai Petkov, Hans van Halteren en ik hebben een leuke samenwerking binnen het kader van de breedtestrategie gehad. Het ging over compuationele simulaties van gedrag en de rol van structuuraannamen, en het bleek dat we allemaal met informatie-theorie bezig waren (kwaliteitsmaten die op de entropie, of onzekerheid van informatie gebaseerd zijn), en dat er verder interessante technische overeenkomsten waren, b.v. de inzet van afstandsmaten bij stimuli. Ik was ook de leider van een EU postdoc netwerk waar we 21 postdoc jaren aan toepassingen van leeralgoritme binnen de taalkunde hebben besteed. Het ging om samenwerking met Cambridge, Tübingen, Antwerpen, Geneve, Dublin en Grenoble (Xerox). Lambert Schomaker, Nicolai Petkov en ik hebben nu bij ICES/KIS een aanvraag lopen over multimedia, en met Laurie Stowe heb ik een artikel geschreven over de verwerving van leesvaardigheid. Vanaf sept. leid ik een NWO programma dat uitspraakverschillen in dialecten gaat meten.


In het algemeen zie ik mezelf primair als taalkundige, en dan met een specialisme in computationele verwerking. Net zoals vele BCNers probeer ik het neurowetenschappelijke kwesties serieus te nemen binnen een disciplinaire perspectief, wat voor mij de taalkunde is. En daar zijn de uitdagingen en de kansen enorm -de meeste taalkundige theorieën sporen weinig met alles wat we over de hersen weten. Er is veel te doen!


RvZ Denk je dat je hier in Groningen je emeritaat haalt, of overweeg je af en toe om nog eens elders te gaan kijken?


JN: Er gaat uiteraard niets boven Groningen! -Maar grappen terzijde zijn er heus niet al te veel plekken waar ik liever zou willen werken: ik heb het hier naar mijn zin. Net zoals iedereen mopper ik af en toe over toestanden hier, maar we hebben een ongewone concentratie van zeer goed onderzoekers in taalkunde hier, en dat is leuk. Hoeveel universiteiten hebben 50 taalkundige in dienst? En waar is de bewezen belangstelling voor neurolinguïstiek groter?


En dan de persoonlijke situatie: Ik word dit jaar 52 en daardoor langzamerhand een minder aantrekkelijke candidaat voor nieuwe banen: Te korte MTBB zoals de productie ingenieurs het noemen ('mean time between breakdowns').


RvZ Heb je nog adviezen voor het BCN-bestuur? (Waar je zelf deel van uitmaakt: wat staat ons te wachten, waar stuur je op aan? enz.)


JN: Als BCN invloed binnen de taalkunde wil hebben, moeten we goede benoemingen zien te effectueren. Op dit ogenblik zitten in benoemingsadviescommissies een overgewicht aan stemmen voor onderwijs (steeds een student, een opleidingsdirecteur, een afdelingsvoorzitter, en een 'naaste collega' die soms wel maar vaak geen affiniteit met taalkundig onderzoek hebben), en een beleidsmatig bepaalde vertegenwoordiging van emancipatie en van managementkwaliteit. Dit zijn legitieme belangen, maar onderzoek -een van onze twee primaire taken -dreigt ondergesneeuwd te worden.