Actueel…
%q in SQL gebruiken in SQLite (MySQL is oké)
dbxml_*, alpinocorpus_* en dtsearch
Later…
1 = geconverteerd
2 = getest
| status | file(s) |
|---|---|
| 1 | AlpinoUserGuide.html |
| 1 | Documentation/UserGuide/AlpinoUserGuide.txt |
| 2 | EvalUD/goodkeys.py |
| 1 | Makefile.hpc |
| 2 | UD2.0/conll17_ud_eval.py |
Een uitbreiding van het huidige programma mkcorpus.
Invoer — een corpus bestaand uit één of meer bestanden:
Namen als argumenten, of gelezen vanaf stdin
Uitvoer — een corpus of verzameling naar één bestand of één directory:
Optioneel selectie:
Optioneel omzetting:
Corpora:
alpinocorpus-get kun je een gematchte node markeren,
bijvoorbeeld met <node active="1" ... >.alpinocorpus-xpath kun je in plaats van zinnen
een reeks van waardes van een ander attribuut laten zien, bijvoorbeeld
lemma of pos. Je zou dit kunnen uitbreiden met combinaties, zoals
pos:word.alpinocorpus-xquery kun XQuery-programma loslaten op corpora.alpinocorpus-stats doet.dact_attrib voeg je data in, zoals: <data name="ag:node:bool:TEST">true</data> .
We gebruikten dit voor AlpinoGraph.aluddbxml2to6 en dbxml6to2: er zijn simpelere (snellere?) versies to2 en to6
beschikbaar in Alpino in Docker.