22 februari 2023

  1. PaQu
    • nieuwe attributen kopiëren naar UD
      • alles van sense t/m v_per (zie alpino_ds.dtd)
      • zie beneden
      • ook DTD aanpassen
    • toepassing van is_nachfeld, is_np, is_vorfeld
      • zie tests beneden
      • in standaard macro’s
      • in SPOD
        • oppassen met grote corpora die niet veranderd zijn: hashwaardes aanpassen zodat PaQu niet probeert SPOD opnieuw af te leiden → leuk idee, maar werkt niet, er zijn vaker aanpassingen.
        • SPOD weer uitschakelen voor heel grote corpora?
    • corpusinfo: DTD-versie vermelden
      • iets andere oplossing gekozen, zie hier
  2. Alpino
    • documentatie van nieuwe attributen
    • implementatie van is_nachfeld, is_np, is_vorfeld in alpinods
  3. AlpinoGraph
  4. Tred
    • alpino_full testen
    • wel iconen op haytabo, niet op colossus
      • Tred gebruikt heel oude library die nog wel op haytabo aanwezig is, maar niet meer op colossus. Toegevoegd.
  5. alpinoviewer
    • diverse TODOs
  6. JATOS
    • website bijwerken
    • oude gebruikers overzetten?
    • server stoppen

PaQu tests met Alpino Treebank

//node[
  ( /alpino_ds[@version = ("1.16", "1.17")] and @is_np )
    or 
  ( /alpino_ds[not(@version = ("1.16", "1.17"))] and %PQ_np% )
]

items:	41181	
zinnen:	7071
tijd:	3m53s
tijd:	3m52s
//node[@is_np]

items:	41181	
zinnen:	7071
tijd:	3m26s
tijd:	3m24s
//node[%PQ_np%]

items:	41179	// 2 minder
zinnen:	7071
tijd:	4m7s
tijd:	3m56s
//node[
  ( /alpino_ds[@version = ("1.16", "1.17")] and @is_nachfeld )
    or 
  ( /alpino_ds[not(@version = ("1.16", "1.17"))] and %PQ_nachfeld% )
]

items:	3178	
zinnen:	2317
tijd:	43s
tijd:	43s
//node[@is_nachfeld]

items:	3178	
zinnen:	2317
tijd:	22s
tijd:	22s
//node[%PQ_nachfeld%]

items:	3165  // 13 minder
zinnen:	2317
tijd:	5m29s
tijd:	5m29s
//node[
  ( /alpino_ds[@version = ("1.16", "1.17")] and @is_vorfeld )
    or 
  ( /alpino_ds[not(@version = ("1.16", "1.17"))] and %PQ_vorfeld% )
]

items:	7242	
zinnen:	6482
tijd:	57s
tijd:	56s
//node[@is_vorfeld]

items:	7242	
zinnen:	6482
tijd:	34s
tijd:	36s
//node[%PQ_vorfeld%]

items:	7223  // 19 minder	
zinnen:	6482
tijd:	4m5s
tijd:	4m5s

Nieuwe attributen kopiëren naar UD

Huidige lijst van attributen:

Voorgestelde lijst van attributen

Dit is een compleet andere lijst. Is dit de bedoeling?

alpino alpinograph nachfeld paqu