31 januari 2024

Actueel…

  1. Apache op urd2
    • rechten voor y.
  2. Overleaf
    • aparte drive voor data
  3. DbXML: functionaliteit van dbxml_*, alpinocorpus_* en dtsearch
    • alto filter fp:null vervangen door optie -1
    • alto handleiding maken
    • alto integreren in Alpino
      • dtview, dtsearch: eigen detectie aanwezigheid alto
      • dtsearch: alto gebruiken indien aanwezig, anders Python-pakket lxml.etree
        • voor dtview: xml-bestand zonodig uit archief halen
        • gebruikt nu alleen alto als optie --dtview is gegeven
      • Alpino in Docker
        • mkcorpus verwijderen
        • tekst in info aanpassen
  4. Alpino
    • Pythonprobleem met installeren van IndexedCorpus oplossen
    • Alpino bundelen vanuit Docker
      • zie: /net/corpora/docker/16-xenial-sp
    • diverse pythonscripts werken niet op Xenial: Python 3 te oud
    • problemen met conflicterende library’s voor Tk in Alpino in Docker: upgrade naar Tk 8.6?
  5. alpinods
    • DTD versie 1.3
      • 1.3 is niet gelijk aan alpino_schema.xml voor TrEd
        • zie beneden
      • toevoegen als filter in alto

Later…

  1. urd2
    • binnenkort upgrade naar Ubuntu 22.04
  2. migratie naar colossus

AlpinoDS in TrEd

Welke attributen laten staan?

Lijst van gebruikte attributen volgens alpino2pml.xsl:

aform
begin
case
cat
comparative
def
end
frame
gen
id
iets
index
infl
lcat
lemma
mwu_root
mwu_sense
neclass
num
pb
per
personalized
pos
postag
pron
refl
rel
rnum
root
sc
sense
special
stype
tense
vform
wh
wk
word

Lijst van gebruikte attributen volgens alpino_schema.xml:

begin
cat
end
id
index
lemma
pos
postag
rel
root
sense
word

Sommige van de attributen uit de lange lijst die in de korte lijst ontbreken worden automatisch toegevoegd door TrEd bij het opslaan, maar niet allemaal, bijvoorbeeld frame niet. Wel deze:

conjtype
dial
lwtype
ntype
numtype
positie
pt
spectype
vwtype
vztype
wvorm

Combinatie van laatste twee korte lijsten gebruiken?

alpino dbxml latex overleaf