Natuurlijke-Taalverwerking II 2006/07

eerste college: dinsdag 10 april

Eindige automaten (finite state automata), die kunnen worden gedefinieerd m.b.v. reguliere expressies worden binnen de computationele taalkunde gebruikt om efficiente en robuuste implementaties te realiseren voor toepassingen als spelling-correctie, tekst-naar-spraak, automatische tekstclassificatie, etc. In deze cursus worden de belangrijkste eigenschappen van eindige automaten besproken, en worden een aantal toepassingen behandeld aan de hand van concrete data.

Daarnaast besteden we aandacht aan multi-lingual question answering, dat is het beantwoorden van (bv) Engelstalige vragen op basis van informatie ontleend aan Nederlandstalige teksten.

Het college Natuurlijke-Taalverwerking II is een inleiding in de computationele taalkunde en maakt deel uit van het curriculum van Informatiekunde en Kunstmatige Intelligentie.


Practisch

Tijd en plaats tweede deel tweede semester (4e periode)
Hoorcollege: dinsdag 9-11 uur, Academiegebouw, Zernikezaal
Practicum: woensdag 9-11 u, Harmonie, zaal 12.102 (unix ruimte)
Accounts: Wanneer je nog geen account hebt op hagen (de linux server voor studenten), kun je die aanvragen bij de computer-afdeling.
Toetsing
Het eindcijfer is het gemiddelde van het resultaat van de practicumopdrachten.

Collegeoverzicht

Week 1 (10/4): Inleiding Finite State Methods
College-aantekeningen
Literatuur:
Practicum FSA tutorial
Lever de oplossingen voor de exercises, de advanced exercises, en 1 van de 2 voorgestelde projecten in.
Deadline: vrijdag 20 april.
Week 2 (17/4): Transducers
College-aantekeningen
Literatuur:
Practicum FSA transducers tutorial
Lever de oplossingen voor de exercises, en de 2 grotere opdrachten (american vs british en hyphenation) in.
Deadline: vrijdag 4 mei.
Week 3 (24/4): Fonologische regels en de replace-operator
College-aantekeningen
1/5: Collegevrije week Letteren
Week 4 (8/5): Question Answering en Informatie Extractie met Reg Ex
College-aantekeningen
Practicum Spelling van werkwoorden
Deadline: vrijdag 18 mei.
Week 5 (15/05): Question Answering en Informatie Extractie met Reg Ex (2)
College-aantekeningen
Practicum Betekenis van Afkortingen
Deadline: vrijdag 25 mei.
Week 6 (22/05): Web-based Question Answering
College-aantekeningen
Practicum Web-based Question Answering
Deadline: vrijdag 1 juni.
Week 7 (29/05): Afsluiting
Geen hoorcollege
Wel practicum