Met dact_attrib kun je op basis van xpath-expressies attributen
toevoegen aan xml-bestanden in een dact-bestand. Wanneer je zo’n
aangepast dact-bestand inleest in AlpinoGraph in Docker worden die
extra attributen verwerkt.
Voor het gebruik van dact_attrib, run het prorgamma zonder
argumenten voor een overzicht van het gebruik.
Op haytabo staan twee versies, dact_attrib leest en schrijft
dact-bestanden met DbXML versie 2, en dact_attrib_v6 schrijft
dact-bestanden met DbXML versie 6.
Programma’s gelinkt met DbXML versie 6 kunnen wel bestanden gemaakt met versie 2 lezen, maar omgekeerd niet.
Voorbeeld gebruik van dact_attrib:
dact_attrib \
-m macros.txt \
infile.dact \
outfile.dact \
'//node[%PQ_vorfeld%]' 'node:vorfeld' \
'//node[%PQ_np%]' 'node:np' \
'//node[node[@graad="comp"] and node[@lemma=("hoe", "deste") or (node[@lemma="des"] and node[@lemma="te"])]]' 'node:deste'
dact_attrib genereert data-elementen in het formaat dat door
AlpinoGraph wordt herkend. Elementen zonder een
name die begint met ag:node: of ag:rel: worden genegeerd.
Voorbeeld:
<node > <data name="ag:rel:bool:primary">false</data> <data name="ag:node:bool:vorfeld"/> <!-- true --> <data name="ag:node:text:kleur">groen</data> <data name="ag:node:int:score">12</data> </node>
Docker:
docker pull rugcompling/alpinograph:latest
Heb je nog corpora gemaakt met een oudere versie van dact_attrib, de
versie met nattr en rattr? Corpora die je al hebt ingevoerd hebben
een update nodig als je individuele Alpino-bomen wilt opslaan als xml,
vanuit AlpinoGraph. Dat kan via de commandline-versie van agensgraph.
Start agens, en geeft dan voor elke corpus dat extra attributen
bevat de volgende opdrachten:
set graph_path = 'mycorpus';
match (n:nattr) create (:data{class: 'node', name: n.name, oriname: n.oriname, type: n.type});
match (n:rattr) create (:data{class: 'rel', name: n.name, oriname: n.oriname, type: n.type});
match (n:nattr) delete n;
match (n:rattr) delete n;
Wil je een corpus dat al extra attributen heeft opnieuw invoeren, en
is dat corpus bewerkt met de oude versie van dact_attrib, dan moet je de
extra attributen eerst opnieuw toevoegen met de nieuwe versie van
dact_attrib.