Alfa-informatica

UNDER DEVELOPMENT

Bronnen:

Informatiekunde

Van rekenmachine tot taalautomaat

30 years Alfa-Informatica in Groningen (27 januari 2017) — In 1986, Alfa-informatica started in Groningen at the Faculty of Arts as one of the specializations of the "Algemene Letteren" program. In the early years, the program focused on topics that nowadays would probably be called "Digital Humanities". Staff members included Jan de Vuyst, Harry Gaylord and George Welling. Frans Zwarts was one of the initiators. Highlight of the early years was the organization of the very first ESSLLI Summer School in Groningen in 1989.

In 1993, John Nerbonne became professor in Alfa-informatica, and his presence was an important reason for the success of the group in the following years. The focus of the group shifted more and more towards computational linguistics, with staff members Gosse Bouma and Gertjan van Noord, and PhD student Erik Tjong Kim Sang. At the same time, PhD student Bert Bos implemented one of the first web-servers in the Netherlands, and George Welling with his students built an extremely successfull web-site on the history of the United States - in this way establishing web-technology as a further important focus of expertise. By 2000, Alfa-informatica had been replaced by "Informatiekunde" (Information Science), as a full-fledged study programme. The focus of the programme: Language technology and Web technology.

Participation in the NWO Language and Speech Priority Programme, participation in an EU Mobility of Researchers program, and van Noord's NWO Pionier project strengthened the development of research in computational linguistics. John Nerbonne with help of Wilbert Heeringa and various students developed a new discipline, computational dialectology. Bouma and van Noord developed the Dutch Alpino parser, with help from a variety of post-docs and students, including Rob Malouf, Mark-Jan Nederhof, Miles Osborne and many others. Through participation in various STEVIN projects, various tools and resources for Dutch were developed and are now widely used.

Currently, students can choose Information Science as a Bachelors programme. The master programme is now formally part of the Communication and Information Science master programme. Cooperation with researchers in communication science has led to a separate programme in Computer Communication, which is quite popular with students.

About five years ago, Johan Bos - former Alfa-informatica student! - was awarded the Endowed Chair position of the Faculty of Arts, and now is Professor of Computational Semantics. In addition, Gertjan van Noord became Professor of Language Technology. With staff members Gosse Bouma, Barbara Plank, Malvina Nissim, Leonie Bosveld, George Welling, Gregory Mills, Martijn Wieling, Kilian Evang, Antonio Toral, the group is healthier than ever and still going strong. This year, a new master program in Digital Humanities has started - some 30 years after the start of Alfa-informatica.

Lustrum alfa-informatica Groningen — Lustrum alfa-informatica: 25 jaar onderzoek naar taal en computers

Kan de computer ooit onze taal doorgronden?

Dinsdag 31 januari 2012 viert de opleiding alfa-informatica (informatiekunde) aan de Rijksuniversiteit Groningen haar 25-jarig bestaan. Dat gebeurt met een symposium en twee oraties van hoogleraren informatiekunde aan de RUG. Zij gaan in op het begrijpen van taal door de computer.

De studie informatiekunde begon 25 jaar geleden onder de naam alfa-informatica, en de afdeling die de studie verzorgt draagt die naam nog steeds. Op het lustrum kijken vier betrokkenen en twee vakgenoten uit het buitenland terug op het verleden en vooruit naar de toekomst: prof.dr. Gerry Wakker, prof.dr. Frans Zwarts, prof.dr. Eduard Hovy, dr. Melissa Terras, dr. George Welling en drs. Jori Mur. Daarna is er een dubbeloratie waarmee de nieuwe hoogleraren Johan Bos en Gertjan van Noord hun ambt aanvaarden.

Alfa-informatica

Alfa-informatica is een vakgebied dat taal, communicatie en informatietechnologie combineert. In Groningen ligt daarbij sterk de nadruk op taal en tekst en het analyseren en begrijpen van taal door computers. Bij de studie staan twee thema’s centraal. Enerzijds is er veel aandacht voor computertaalkunde, waarbij computers worden ingezet om taalkundige problemen op te lossen, zoals het automatisch ontleden van zinnen. Veel aandacht gaat hierbij naar het ontwikkelen van programma’s waarmee computers de nuances in menselijke taal kunnen begrijpen. Anderzijds worden er toepassingen voor het web ontwikkeld, zoals een systeem om twitterberichten te analyseren op trends.

Begrijpt de computer onze taal?

Het lustrum wordt luister bijgezet door twee oraties over het doorgronden van de betekenis van taal door de computer. De oratie van prof.dr. Johan Bos, getiteld Rekenen met betekenis, gaat over computationele semantiek. Dat is het vakgebied waarbij computers worden ingezet om verschillende aspecten van betekenis te bestuderen en te modelleren. Voor mensen is het redelijk eenvoudig om de juiste betekenis van woorden te kiezen, maar voor computers is dat uiterst lastig. Dat geldt bijvoorbeeld voor dubbelzinnige zinnen als ‘Kees is gelukkig getrouwd’ en ‘Hij pakte een broodje, ging bij de piano zitten, en nam er een hap van.’ Bos zal laten zien hoe betekenissen van woorden, zinnen en teksten concreet gemaakt kunnen worden, zodat we er mee kunnen rekenen. Op die manier kan menselijke taal begrijpelijker worden gemaakt voor computers. De techniek is van belang voor vele toepassingen waarin automatische verwerking van taal een rol speelt.

Prof.dr. Gertjan van Noord behandelt in zijn oratie, getiteld Het ontleedkundig laboratorium, het automatisch ontleden van het Nederlands. Om een computer taal te laten begrijpen, is een belangrijke eerste stap automatische ontleding: welke woorden horen bij elkaar, en wat is de rol van de verschillende woorden en woordgroepen? Van Noord legt uit uit welke problemen de computer moet oplossen en tot welke prestaties de computer nu in staat is. Hij ziet twee trends. Aan de ene kant is de kwaliteit van de ontleding nog voor enorme verbeteringen vatbaar. Daarbij gaat het vooral om problemen die een computer heeft met onvolkomenheden in de invoer, zoals spelfouten of de taal op social media. Daarentegen is de kwaliteit van de automatische ontleding voor verzorgd geschreven taal heel goed en vermoedelijk nauwelijks voor verbetering vatbaar.