Werkoverleg met GvN.
Taken:
- ✔ webserver moses Nederlands ↔ Engels
- ✔ Truecaser/detruecaser
- ✔ Na dubbele punt die niet gevolgd wordt door citaat → geen hoofdletter
- ✔ De-tokenizer
✔ Engels: spatie weg voor enkele quote alleen als het het begin van een langer woord is Was in orde.
- ✔ Als los programma
→ Getest op Nederlandse en Engelse tekst uit corpus OpenSubtitles, kleine correctie in untok() gemaakt
- ✔ Xmlrpc
- ✔ logrotate
- ✔ Code ordenen
- ✔ Truecaser/detruecaser
- ✔ webserver moses Nederlands ↔ Engels