24 maart 2021

  1. Van Alpino naar UD: hoe zit het precies?
    1. speciale gevallen
      • ingevoegde woorden in Enhanced UD
        • xpath: //dep[@elided] of //*[@ud="enhanced" and contains(@id,".")]
        • cypher: match p = (:word)-[e:eud]->(:word) where e.to is not null or e.from is not null return p
      • recursielimiet in Enhanced UD
        • xpath: //*[@recursion_limit]
      • misplaced (or not) heads in conjunctions
        • zie beneden
    2. alud docs
      • voorbeelden
      • TODOs vermelden
  2. alud
    • release 2.8 begin mei
      • release software
        • tools updaten
          • PaQu (pqudep, pqserve, pqalpino)
            • ook in Docker
          • AlpinoGraph (alpino2agens, download)
            • ook in Docker
          • lassymod, novelmod, alpinomod, alpiner
          • /net/corpora/paqu/wablieft
      • release LassyKlein
      • corpora bijwerken
        • PaQu
        • AlpinoGraph
    • diverse problemen, zie hier
  3. CoNLL-U viewer
  4. PaQu
    • wanneer UD niet beschikbaar is:
      • vermelding in tabel met corpusinfo
      • waarschuwing op xpath-pagina

misplaced (or not) heads in conjunctions

Zie ook hier

Zoeken met xpath is zeer complex. Zie misplacedheads-in.go

Zoeken in Alpinograph, dit geeft valse hits:

match p = (n1:node)-[:rel]->(w:nw)<-[:rel]-(n2:node)
where n1.id < n2.id  -- geen dubbelen
match q = (n1)<-[:rel*1..]-(x:node{sentid:w.sentid, cat:'conj'})-[:rel*1..]->(n2)

return p, q

Veel beperkter:

match p = (n1:node)-[:rel{rel:'hd'}]->(w:nw)<-[:rel{rel:'hd'}]-(n2:node)
where n1.id < n2.id  -- geen dubbelen
match q = (n1)<-[:rel*1..2]-(x:node{sentid:w.sentid, cat:'conj'})-[:rel*1..2]->(n2)

return p, q

Bij de tweede versie:

Variant op de eerste versie, valse hits er uit filteren, extreem traag, zelfs voor Alpino Treebank:

match p = (n1:node)-[:rel]->(w:nw)<-[:rel]-(n2:node)
where n1.id < n2.id  -- geen dubbelen
match q = (n1)<-[:rel*1..]-(x:node{sentid:w.sentid, cat:'conj'})-[:rel*1..]->(n2)

return p, q

except

match p = (n1:node)-[:rel]->(w:nw)<-[:rel]-(n2:node)
where n1.id < n2.id  -- geen dubbelen
match q = (n1)<-[:rel*1..]-(x:node{sentid:w.sentid, cat:'conj'})-[:rel*1..]->(n2)

match (n1)<-[:rel*1..]-(x2:node{sentid:w.sentid})-[:rel*1..]->(n2)
where x.id != x2.id
match (x)-[:rel*1..]->(x2)

return p, q

CoNNL-U

Alpino

alpino universal dependencies