29 mei 2019

Taken:

  1. Website Alfa-informatica
    • Tekst over geschiedenis van Alfa-informatica
    • Foto’s
  2. webserver urd2
  3. PaQu
    • Meer van LassyLarge gebruiken?
    • UDs:
      • geen prefix e_ en niet wrappen in <roots>
        • pqudep
        • pqserve (ook dact → dactx)
        • pqdactx
      • pqserve, telling van attributen uit <ud> en <node>
        • lijkt te werken, maar moet gecontroleerd worden voor geëxpandeerde nodes
          • dit heeft geleid tot herziening van manier van tellen van attribuut rel op nodes met een index na zoeken met geëxpandeerde index-nodes, zie: //*[@form='dat']
      • pqserve, syntax check en completion in tekstveld voor xpath-query
      • DTD aanpassen, versie 1.10
      • wat te doen met dubbele IDs in conllu? Bijvoorbeeld: //node[@word="arrstantenwagen"] in Alpino Treebank → twee regels met ID = 7.1
        • zie onder
      • nieuw versie van script van Gosse: pqudep crasht als gelinkt tegen DbXML versie 6 vanwege bug in xqilla
      • Gosse noemen op infopagina als ontwikkelaar van conversie naar UD
    • pqserve, xpath, selectie op onderdeel: Alpino en/of Basic UD en/of Enhanced UD
      • /(self::node|self::ud|self::dep)
      • /self::*[@ud="basic"]
      • /self::*[@ud="enhanced"]
    • pqserve, xpath, foutmeldingen bij query //*/@word

cdb.dact / 1100.xml

7    en      en        CCONJ  VG|neven            _                                    11  cc   11:cc        _
7.1  werd    worden    AUX    WW|pv|verl|ev       Number=Sing|Tense=Past|VerbForm=Fin  _   _    11:aux:pass  CopiedFrom=3
7.1  werd    worden    AUX    WW|pv|verl|ev       Number=Sing|Tense=Past|VerbForm=Fin  _   _    22:aux:pass  CopiedFrom=3

→ samenvoegen

eindhoven.dact / gbl-2283.xml

1    Begint  beginnen  AUX    WW|pv|tgw|met-t     Number=Sing|Tense=Pres|VerbForm=Fin  7   aux  7:aux        _
1.1  Begint  beginnen  AUX    WW|pv|tgw|met-t     Number=Sing|Tense=Pres|VerbForm=Fin  _   _    7:conj:en    CopiedFrom=1
1.1  Begint  beginnen  AUX    WW|pv|tgw|met-t     Number=Sing|Tense=Pres|VerbForm=Fin  _   _    7:conj:en    CopiedFrom=1

→ ontdubbelen

lassysmallmeta.dact / WR-P-P-I-0000000155.p.3.s.2.xml

8    en      en        CCONJ  VG|neven            _                                    13  cc   13:cc        _
8.1  kan     kunnen    AUX    WW|pv|tgw|ev        Number=Sing|Tense=Pres|VerbForm=Fin  _   _    13:aux       CopiedFrom=5
8.1  worden  worden    AUX    WW|inf|vrij|zonder  VerbForm=Inf                         _   _    13:aux:pass  CopiedFrom=6

→ hernummeren? kan niet als 8.1 ergens als HEAD gebruikt wordt

alpino paqu universal dependencies urd xqilla