27 mei 2020

Taken:

  1. Alpino
    • alpino_ds.dtd versie 1.11
    • alpinods aanpassen aan versie 1.11
    • Alpino-API aanpassen aan versie 1.11: metadata bool
    • programma om hulp-attributen in corpora toe te voegen, zoals _deste, _np en _vorfeld
      • zie beneden
  2. AlpinoGraph
    • voorlopig alleen met globale corpora
    • database beschermen, zie bug
    • documentatie
    • automatisch ontdubbelen
      • link naar volgende pagina ontbreek bij deze query
      • mogelijk onduidelijkheden
    • lijst van attributen voor relaties van type :rel
    • attribuut op :relprimary:true|false
    • AlpinoGraph download xml: <nattr> en <rattr>
    • corpus met schrijfrechten voor GvN
    • dact2agens
      • aanpassen aan alpino_ds.dtd versie 1.11
      • hernoemen naar alpino2agens
      • ook voor losse xml-bestanden, gzip, tar, zip
      • lijst met bestanden inlezen van stdin
    • een beter _vorfeld
    • snellere file-server
      • meer/alle globale corpora uit PaQu invoeren
  3. Corpus Query Language
    • zie BlackLab
    • server op urd2
      • verwijderd, te weinig geheugen
    • server op haytabo
    • de rest van LassyLarge invoeren
      • al ingevoerd: EINDHOVEN EMEA EUROPARL NLWIKI20110804 SENSEVAL TROONREDE
        • samen 18G
      • WR-* en WS-*
      • totaal: 64G
  4. PaQu
    • Metadata met type boolean

Hulp-attributen toevoegen

Voorbeeld:

dact_attrib \
  -m macros.txt \
  infile.dact \
  outfile.dact \
  '//node[%PQ_vorfeld%]' 'nattr:vorfeld' \
  '//node[%PQ_np%]' 'nattr:np' \
  '//node[node[@graad="comp"] and node[@lemma=("hoe", "deste") or (node[@lemma="des"] and node[@lemma="te"])]]' 'nattr:deste'

Het argument na een xpath is een van:

Daarbij is:

In xml wordt het zoiets:

<node>
  <nattr name="vorfeld" type="bool" value="true" />
  <nattr name="np"      type="bool" value="true" />
  <nattr name="deste"   type="bool" value="true" />
</node>
alpino alpinograph blacklab cql