2 september 2020

  1. AlpinoGraph
    • voorlopig alleen met globale corpora
    • documentatie
    • menu met voorbeelden aanpassen
      • inleiding
      • woorden en woordgroepen
      • woordpaar-relaties
      • Alpino-structuren
        • meer basale dingen
        • kan beter: zie Dact cookbook
      • Universal Dependencies
        • meer basale dingen
        • een advmod van een amod van een subject → een advmod van een amod van een zelfstandig naamwoord
      • heterogene relaties
      • metadata
    • in menu, toelichting onder kopje SPOD: verwijzing naar online paper
    • query beneden, op een andere, snellere manier
  2. Zowel in Alpino als in AlpinoGraph
    • onderscheid herkennen van constructies zoals:
      1. het rode huis en het groene
      2. het rode en het groene huis
  3. webL04
    • updates, meer Levenshtein-opties, utf-8 in afbeeldingen, klankafstanden visualiseren…
    • overleg met Wilbert Martijn

Dit kan efficiënter:

match (w:word)<-[:rel{rel:'hd'}]-()-[:rel{rel:'obj1'}]->(:node{cat:'whrel'}),
      (w1:word{lemma:w.lemma})<-[:rel{rel:'hd'}]-()-[:rel{rel:'vc'}]->(:node{cat:'whsub'}),
      (w2:word{lemma:w.lemma})<-[:rel{rel:'hd'}]-()-[:rel{rel:'vc'}]->(:node{cat:'whsub'})
where w1.sentid != w.sentid 
  and w2.sentid != w.sentid
  and w1.sentid != w2.sentid
  and w.pt = 'ww'
return w

… en veel, veel sneller:

match (w1:word{pt:'ww'})<-[:rel{rel:'hd'}]-()-[:rel{rel:'vc'}]->(:node{cat:'whsub'})
with w1.lemma as lemma1, count(w1.lemma) as n
where n > 1
match (w:word{pt:'ww'})<-[:rel{rel:'hd'}]-()-[:rel{rel:'obj1'}]->(:node{cat:'whrel'})
where w.lemma in lemma1
return w

De tweede variant is niet identiek aan de eerste. De tweede variant kijkt wel of een lemma met de vc/whsub-constructie meer dan eens voorkomt, maar niet of het in meerdere zinnen voorkomt. Als je die laatste eis wilt toevoegen wordt het een stuk complexer:

match (w:word{pt:'ww'})<-[:rel{rel:'hd'}]-()-[:rel{rel:'obj1'}]->(:node{cat:'whrel'})
where w.lemma in (
  select lemma
  from (
    select lemma, count(lemma) as n
    from (
      match (w1:word{pt:'ww'})<-[:rel{rel:'hd'}]-()-[:rel{rel:'vc'}]->(:node{cat:'whsub'})
      return distinct w1.lemma, w1.sentid
    ) as foo
    group by lemma
  ) as bar
  where n > 1
)
return w
alpinograph