[PetersWerkWiki] [TitleIndex] [WordIndex

Werkoverleg met GvN en DdK.

Taken:

  1. DactRemoteCorpus

    • Implementeren van isValidQuery in alpinocorpus, RemoteCorpus.
      Gedaan.

    • In Dact, valideren van query niet direct bij elke letter?
      Vervallen.

    • In Dact, interface voor kiezen van Remote Corpus implementeren.
      Gedaan.

      • Eerst verdiepen in Qt.

  2. Perl-script 'GetNgramData' omgezet naar Go en C++

    • Sneller in C++ door unordered_map te gebruiken i.p.v. map.
      Gedaan: C++ is nu ruim twee keer zo snel als Go.

    • Testen van snelheid (Perl, Go, C++) over het hele corpus.
      • Op volker of vingolf.

      • Tijd en gebruik van geheugen.

      Gedaan: Geen probleem.

    • Eerst verwerking per bestand, daarna resultaten combineren, zodat als één bestand wordt bijgewerkt niet alle bestanden opnieuw verwerkt hoeven te worden.
      Gedaan.

      • Optie: per bestand fourgrams weggooien die maar één keer voorkomen.


CategoryDact CategoryPerl CategoryGo