Actueel…
Alpino/Tokenization/{libtok.c,libtok_no_breaks.c} → update in GoIndexOptions +Charset=UTF-8 in .htaccessLater…
Invoer is extreem traag. Op het moment dat ik dit schrijf (26 juni) is de hoofdletter-gevoelige versie gevorderd tot de letter n:
https://urd2.let.rug.nl/~alfa/suar/bin/suar?corpus=dbnl&text=n&pre=true&col=bin&fmt=context
Hoofdletter-ongevoelig tot o:
https://urd2.let.rug.nl/~alfa/suar/bin/suar?corpus=dbnl&text=o&pre=true&col=case&fmt=context
Unicode tot g:
https://urd2.let.rug.nl/~alfa/suar/bin/suar?corpus=dbnl&text=g&pre=true&col=uni&fmt=context
Kijk op de onderste regel om te zien hoe ver de letter is gevorderd.