25 september 2019

Taken:

  1. Voornamen: man of vrouw?
  2. alud
    • cookbook
    • functies mogen geen panic doen als het resultaat in een test gebruikt wordt of optioneel is
    • geen eindeloze loops in fixMisplacedHeadsInCoordination()
  3. Nieuw beleid van Twitter
  4. Website Alfa-informatica
    • tekst over geschiedenis van Alfa-informatica
    • foto’s

En verder, misschien…

  1. Urd
  2. alud
    • validatie als optie → waarschuwingen

Voornamen: man of vrouw?

Macro’s voor het herkennen van namen:

naam1 = """(
  (@ntype="eigen" and @pos="name") or
  (@cat="mwu" and node[@spectype="deeleigen"] and not(../node[@rel="det"]))
)"""

naam2 = """(
  (@neclass="PER" and not(@rel="mwp")) or
  (@cat="mwu" and not(node[not(@neclass="PER")]))
)"""

naam2 lijkt beter dan naam1 maar is niet bij elk corpus toepasbaar.

Zoeken in Lassy Klein:

//node[%naam1%]

Dit levert 12501 verschillende namen op.

Zoeken naar zoiets als Chris en zijn/haar… in Lassy Klein:

//node[@cat="conj" and node/node[@lemma=("zijn","haar") and @pt="vnw" ]]/node[%naam1%]

Dit levert veel foute constructies op, en 80 verschillende namen.

Zoeken naar zoiets als Chris pakt zijn/haar… in Lassy Klein. Gebruik hierbij geëxpandeerde indexnodes:

//node[node[@rel="obj1"]/node[@vwtype="bez" and @lemma=("zijn","haar")]]/node[@rel="su" and %naam1%]

Dit levert 173 verschillende namen op.

twitter universal dependencies voornamen