14 april 2021

  1. update haytabo
    • vrijdag 14 mei
  2. alud
    • TODOs in alud docs
    • kwesties
      1. misplaced (or not) heads in conjunctions, zie hier
      2. ingevoegde woorden in Enhanced UD
        • xpath: //dep[@elided] of //*[@ud="enhanced" and contains(@id,".")]
    • release 2.8 begin mei
      • release software
        • tools updaten
          • PaQu (pqudep, pqserve, pqalpino)
            • ook in Docker
          • AlpinoGraph (alpino2agens, download)
            • ook in Docker
          • lassymod, novelmod, alpinomod, alpiner
          • /net/corpora/paqu/wablieft
      • release LassyKlein
      • corpora bijwerken
        • PaQu
          • melding under development weg
        • AlpinoGraph
      • evaluatie door Anouk B.
  3. PaQu — SPOD
    • download tabel per zin — nog te doen:
      • probleem met @his in topnode: //node[@id="0" and @his]
      • formattering van waardes
      • commentaar bovenin tabel met naam van corpus, en eventuele problemen
      • items niet voor dit corpus filteren
      • onbekende woorden en zo: ook lengte (voor welke?)
      • metadata
      • telling van pos, postag
      • documentatie voor gebruiker: labels van kolommen
      • direct downloaden i.p.v. bekijken in browser
      • verbeteringen aan parser ook gebruiken in alud
        • vervanging topnode
      • beperkingen van parser met oplossingen documenteren
      • aangepaste sources van libxml2 voor testXPath naar repository
      • tests in parser (cmp…) voor elke match een true zodat je ze kunt tellen (net zoals voor equal)
    • voor later: nieuwe techniek toepassen in de rest van spod
      • gevarieerde testdata nodig om na verandering van spod-definities de implementatie te vergelijken met DbXML
      • bij invoer van corpus gelijk alle spod-waardes afleiden
      • waardes voor nieuwe of veranderde spod-expressies afleiden op het moment dat de data opgevraagd wordt
      • ook voor de grootste corpora
paqu spod universal dependencies