AlpinoGraph

Webapp

Tools

dact_attrib

Met dact_attrib kun je op basis van xpath-expressies attributen toevoegen aan xml-bestanden in een dact-bestand. Wanneer je zo’n aangepast dact-bestand inleest in AlpinoGraph in Docker worden die extra attributen verwerkt.

Voor het gebruik van dact_attrib, run het prorgamma zonder argumenten voor een overzicht van het gebruik.

Op haytabo staan twee versies, dact_attrib leest en schrijft dact-bestanden met DbXML versie 2, en dact_attrib_v6 schrijft dact-bestanden met DbXML versie 6.

Programma’s gelinkt met DbXML versie 6 kunnen wel bestanden gemaakt met versie 2 lezen, maar omgekeerd niet.

Voorbeeld gebruik van dact_attrib:

dact_attrib \
  -m macros.txt \
  infile.dact \
  outfile.dact \
  '//node[%PQ_vorfeld%]' 'node:vorfeld' \
  '//node[%PQ_np%]' 'node:np' \
  '//node[node[@graad="comp"] and node[@lemma=("hoe", "deste") or (node[@lemma="des"] and node[@lemma="te"])]]' 'node:deste'

dact_attrib genereert data-elementen in het formaat dat door AlpinoGraph wordt herkend. Elementen zonder een name die begint met ag:node: of ag:rel: worden genegeerd. Voorbeeld:

<node    >
  <data name="ag:rel:bool:primary">false</data>
  <data name="ag:node:bool:vorfeld"/>            <!-- true -->
  <data name="ag:node:text:kleur">groen</data>
  <data name="ag:node:int:score">12</data>

</node>

upgrade

Docker:

docker pull rugcompling/alpinograph:latest

Heb je nog corpora gemaakt met een oudere versie van dact_attrib, de versie met nattr en rattr? Corpora die je al hebt ingevoerd hebben een update nodig als je individuele Alpino-bomen wilt opslaan als xml, vanuit AlpinoGraph. Dat kan via de commandline-versie van agensgraph. Start agens, en geeft dan voor elke corpus dat extra attributen bevat de volgende opdrachten:

set graph_path = 'mycorpus';
match (n:nattr) create (:data{class: 'node', name: n.name, oriname: n.oriname, type: n.type});
match (n:rattr) create (:data{class: 'rel', name: n.name, oriname: n.oriname, type: n.type});
match (n:nattr) delete n;
match (n:rattr) delete n;

Wil je een corpus dat al extra attributen heeft opnieuw invoeren, en is dat corpus bewerkt met de oude versie van dact_attrib, dan moet je de extra attributen eerst opnieuw toevoegen met de nieuwe versie van dact_attrib.

alpino alpinograph cypher