Taken:
Implementeren van isValidQuery in alpinocorpus, RemoteCorpus.
Gedaan.In Dact, valideren van query niet direct bij elke letter?
Vervallen.In Dact, interface voor kiezen van Remote Corpus implementeren.
Gedaan.Eerst verdiepen in Qt.
Perl-script 'GetNgramData' omgezet naar Go en C++
Sneller in C++ door unordered_map te gebruiken i.p.v. map.
Gedaan: C++ is nu ruim twee keer zo snel als Go.- Testen van snelheid (Perl, Go, C++) over het hele corpus.
Op volker of vingolf.
- Tijd en gebruik van geheugen.
Gedaan: Geen probleem.
Eerst verwerking per bestand, daarna resultaten combineren, zodat als één bestand wordt bijgewerkt niet alle bestanden opnieuw verwerkt hoeven te worden.
Gedaan.- Optie: per bestand fourgrams weggooien die maar één keer voorkomen.