4 maart 2020

Taken:

  1. PaQu
    • omschrijvingen toevoegen aan alle globale corpora
      • Gertjan kijkt ernaar
  2. Cypher
    • alle SPOD-query’s omzetten naar Cypher
    • corpus newspapers opnieuw invoeren, met nieuwe attributen
      • _vorfeld indexeren
      • leesrechten voor guest niet vergeten
    • attributen toevoegen
      • _np : bool
        • een conj van een conj van een np is ook een np
      • _vorfeld : bool
      • rel:id : int — nodig voor topicalisatie
      • meer…
    • capaciteitsprobleem bij bevragen van heel groot corpus?
      • valt mee als directory’s voor tijdelijke bestanden op /dev/shm staan, maar gebruik bij complexe query’s kan oplopen van 2% naar 82%
      • op één na zijn alle query’s binnen een half uur voltooid voor corpus Newspapers
cypher paqu