5 juli 2023

  1. Corpora
    • LassyLarge
      • labels toevoegen: bestandnaam + regelnummer
        • EINDHOVEN
        • SENSEVAL
        • TROONREDE
      • UD-bestanden toevoegen
      • eigenaarschap laten overdragen
    • Lassy Groot Extra
      • labels toevoegen: bestandnaam + regelnummer
        • GELOOFDERKAMERADEN
      • suites met alleen regelnummers als label: corpusnaam toevoegen als prefix
        • Books
        • DGT
        • GlobalVoices
        • JRC-Acquis
        • News-Commentary11
        • OpenSubtitles2018
        • ParaCrawl
        • TED2013
        • Tatoeba
      • nieuwe DACT-bestanden maken voor:
        • Dutch Web Corpus, zodra er plaats is
          • extra ruimte was niet genoeg
      • UD-bestanden toevoegen
      • eigenaarschap laten overdragen
  2. PaQu
    • corpora opnieuw invoeren:
      • LassyLarge:
        • Dutch Web Corpus
      • LATER: corpora in /net/corpora/paqu die afkomstig zijn uit LassyLarge of LassyLargeExtra
        • Childes Dutch: extra metadata
        • Eindhoven
  3. AlpinoGraph
    • corpora opnieuw invoeren
  4. Suffix Arrays, toevoegen
    • gigacorpus-books toevoegen, openbaar
    • LassyLarge en LassyLargeExtra openbaar maken
  5. Alpino
    • documentatie van nieuwe attributen
      • zie implementatie van is_nachfeld, is_np, is_vorfeld in alpinods
  6. urd2
    • binnenkort upgrade naar Ubuntu 22.04
  7. migratie naar colossus
  8. index voor semantic web
    • datasets toevoegen, zoals corpora
    • applicaties toevoegen van andere mensen bij Alfa-informatica
  9. Back-up
    • een beter systeem voor back-up van hele pc
  10. PC
    • upgrade naar Debian 12
corpora lassy