[PetersWerkWiki] [TitleIndex] [WordIndex


Zie als diagrammen

Download: ud1.xml ud2.xml

De standaard Universal Dependencies zijn toegevoegd met een tag <ud> als dochter van de tag <node> van het woord.
Relaties voor Enhanced Universal Dependencies zijn toegevoegd met de tag <dep> als dochter(s) van de tag <ud>
Zie het tweede voorbeeld voor de behandeling van ingevoegde woorden. Ik neem aan dat dit altijd een kopie is van een bestaand woord in de zin.

Zie regels 42 en 43 waar twee enhanced dependencies zijn:

   1 <?xml version="1.0" encoding="UTF-8"?>
   2 <alpino_ds version="1.8">
   3   <node begin="0" cat="top" end="4" id="0" rel="top">
   4     <node begin="0" cat="smain" end="4" id="1" rel="--">
   5       <node begin="0" case="nom" def="def" end="1"
   6             frame="pronoun(nwh,fir,sg,de,nom,def)" gen="de" getal="ev"
   7             his="normal" his_1="normal" id="2" lcat="np" lemma="ik"
   8             naamval="nomin" num="sg" pdtype="pron" per="fir"
   9             persoon="1" pos="pron"
  10             postag="VNW(pers,pron,nomin,vol,1,ev)" pt="vnw" rel="su"
  11             rnum="sg" root="ik" sense="ik" status="vol" vwtype="pers"
  12             wh="nwh" word="ik">
  13         <ud id="1" head="2" deprel="nsubj" deprel_main="nsubj" upos="PRON"
  14                Case="Nom" Person="1" PronType="Prs"
  15                xpos="VNW|pers|pron|nomin|vol|1|ev">
  16           <dep id="1" head="2" deprel="nsubj" deprel_main="nsubj" />
  17         </ud>
  18       </node>
  19       <node begin="1" end="2" frame="verb(hebben,sg1,aci)"
  20             his="normal" his_1="normal" id="3" infl="sg1" lcat="smain"
  21             lemma="zien" pos="verb" postag="WW(pv,tgw,ev)" pt="ww"
  22             pvagr="ev" pvtijd="tgw" rel="hd" root="zie" sc="aci"
  23             sense="zie" stype="declarative" tense="present" word="zie"
  24             wvorm="pv">
  25         <ud id="2" head="0" deprel="root" deprel_main="root" upos="VERB"
  26                Number="Sing" Tense="Pres" VerbForm="Fin"
  27                xpos="WW|pv|tgw|ev">
  28           <dep id="2" head="0" deprel="root" deprel_main="root" />
  29         </ud>
  30       </node>
  31       <node begin="2" case="dat_acc" def="def" end="3"
  32             frame="pronoun(nwh,thi,sg,de,dat_acc,def)" gen="de"
  33             genus="masc" getal="ev" his="normal" his_1="normal" id="4"
  34             index="1" lcat="np" lemma="hem" naamval="obl" num="sg"
  35             pdtype="pron" per="thi" persoon="3" pos="pron"
  36             postag="VNW(pers,pron,obl,vol,3,ev,masc)" pt="vnw"
  37             rel="obj1" rnum="sg" root="hem" sense="hem" status="vol"
  38             vwtype="pers" wh="nwh" word="hem">
  39         <ud id="3" head="2" deprel="obj" deprel_main="obj" upos="PRON"
  40                Case="Acc" Person="3" PronType="Prs"
  41                xpos="VNW|pers|pron|obl|vol|3|ev|masc">
  42           <dep id="3" head="2" deprel="obj" deprel_main="obj" />
  43           <dep id="3" head="4" deprel="nsubj:xsubj"
  44                deprel_main="nsubj" deprel_aux="xsubj" />
  45         </ud>
  46       </node>
  47       <node begin="2" cat="inf" end="4" id="5" rel="vc">
  48         <node begin="2" end="3" id="6" index="1" rel="su"/>
  49         <node begin="3" buiging="zonder" end="4"
  50               frame="verb('hebben/zijn',inf,intransitive)"
  51               his="normal" his_1="normal" id="7" infl="inf" lcat="inf"
  52               lemma="fietsen" pos="verb" positie="vrij"
  53               postag="WW(inf,vrij,zonder)" pt="ww" rel="hd"
  54               root="fiets" sc="intransitive" sense="fiets"
  55               word="fietsen" wvorm="inf">
  56           <ud id="4" head="2" deprel="xcomp" deprel_main="xcomp" upos="VERB"
  57                  VerbForm="Inf"
  58                  xpos="WW|inf|vrij|zonder">
  59             <dep id="4" head="2" deprel="xcomp" deprel_main="xcomp" />
  60           </ud>
  61         </node>
  62       </node>
  63     </node>
  64   </node>
  65   <sentence>ik zie hem fietsen</sentence>
  66   <root id="2" form="zie" lemma="zien" upos="VERB"
  67         xpos="WW|pv|tgw|ev"
  68         Number="Sing" Tense="Pres" VerbForm="Fin"
  69         deprel="root">
  70     <nsubj id="1" form="ik" lemma="ik" upos="PRON"
  71            xpos="VNW|pers|pron|nomin|vol|1|ev"
  72            Case="Nom" Person="1" PronType="Prs"
  73            deprel="nsubj"/>
  74     <obj id="3" form="hem" lemma="hem" upos="PRON"
  75          xpos="VNW|pers|pron|obl|vol|3|ev|masc"
  76          Case="Acc" Person="3" PronType="Prs"
  77          deprel="obj"/>
  78     <xcomp id="4" form="fietsen" lemma="fietsen" upos="VERB"
  79            xpos="WW|inf|vrij|zonder"
  80            VerbForm="Inf"
  81            deprel="xcomp"/>
  82   </root>
  83   <conllu status="OK" auto="PQU1.0"><![CDATA[
  84 1       ik      ik      PRON    VNW|pers|pron|nomin|vol|1|ev    Case=Nom|Person=1|PronType=Prs  2       nsubj   2:nsubj _
  85 2       zie     zien    VERB    WW|pv|tgw|ev    Number=Sing|Tense=Pres|VerbForm=Fin     0       root    0:root  _
  86 3       hem     hem     PRON    VNW|pers|pron|obl|vol|3|ev|masc Case=Acc|Person=3|PronType=Prs  2       obj     2:obj|4:nsubj:xsubj     _
  87 4       fietsen fietsen VERB    WW|inf|vrij|zonder      VerbForm=Inf    2       xcomp   2:xcomp _
  88 ]]></conllu>
  89 </alpino_ds>

Voor het tweede voorbeeld heb ik Alpino de zin Jan komt vandaag en Piet komt morgen laten parsen, en daarna heb ik het tweede woord komt verwijderd. De parse die ontstaat geeft bij enhanced dependencies een ingevoegd woord. Dit gebeurt niet als ik Alpino de zin Jan komt vandaag en Piet morgen laat parsen.

Zie regel 29 waar een ingevoegd woord staat met z'n dependency.
In dit geval is de waarde van het attribuut id niet gelijk aan de waarde van het attribuut end van de node erboven:

   1 <?xml version="1.0" encoding="UTF-8"?>
   2 <alpino_ds version="1.8">
   3   <node begin="0" cat="top" end="6" id="0" rel="top">
   4     <node begin="0" cat="conj" end="6" id="1" rel="--">
   5       <node begin="0" cat="smain" end="3" id="2" rel="cnj">
   6         <node begin="0" end="1" frame="proper_name(sg,'PER')"
   7               genus="zijd" getal="ev" graad="basis" his="normal"
   8               his_1="names_dictionary" id="3" lcat="np" lemma="Jan"
   9               naamval="stan" neclass="PER" ntype="eigen" num="sg"
  10               pos="name" postag="N(eigen,ev,basis,zijd,stan)" pt="n"
  11               rel="su" rnum="sg" root="Jan" sense="Jan" word="Jan">
  12           <ud id="1" head="2" deprel="nsubj" deprel_main="nsubj" upos="PROPN"
  13               Gender="Com" Number="Sing"
  14               xpos="N|eigen|ev|basis|zijd|stan">
  15             <dep id="1" head="2" deprel="nsubj" deprel_main="nsubj" />
  16           </ud>
  17         </node>
  18         <node index="1" begin="1" end="2"
  19               frame="verb(zijn,sg3,intransitive)" his="normal"
  20               his_1="normal" id="4" infl="sg3" lcat="smain"
  21               lemma="komen" pos="verb" postag="WW(pv,tgw,met-t)"
  22               pt="ww" pvagr="met-t" pvtijd="tgw" rel="hd" root="kom"
  23               sc="intransitive" sense="kom" stype="declarative"
  24               tense="present" word="komt" wvorm="pv">
  25           <ud id="2" head="0" deprel="root" deprel_main="root" upos="VERB"
  26               Number="Sing" Tense="Pres" VerbForm="Fin"
  27               xpos="WW|pv|tgw|met-t">
  28             <dep id="2" head="0" deprel="root" deprel_main="root" />
  29             <dep id="5.1" head="2"
  30                  deprel="conj:en" deprel_main="conj" deprel_aux="en"
  31                  elided="true" />
  32           </ud>
  33         </node>
  34         <node begin="2" end="3" frame="tmp_adverb" his="normal"
  35               his_1="normal" id="5" lcat="advp" lemma="vandaag"
  36               pos="adv" postag="BW()" pt="bw" rel="mod" root="vandaag"
  37               sense="vandaag" special="tmp" word="vandaag">
  38           <ud id="3" head="2" deprel="advmod" deprel_main="advmod" upos="ADV"
  39               xpos="BW">
  40             <dep id="3" head="2" deprel="advmod" deprel_main="advmod" />
  41           </ud>
  42         </node>
  43       </node>
  44       <node begin="3" conjtype="neven" end="4" frame="conj(en)"
  45             his="normal" his_1="normal" id="6" lcat="vg" lemma="en"
  46             pos="vg" postag="VG(neven)" pt="vg" rel="crd" root="en"
  47             sense="en" word="en">
  48         <ud id="4" head="5" deprel="cc" deprel_main="cc" upos="CCONJ"
  49             xpos="VG|neven">
  50           <dep id="4" head="5.1" deprel="cc" deprel_main="cc" />
  51         </ud>
  52       </node>
  53       <node begin="4" cat="smain" end="6" id="7" rel="cnj">
  54         <node begin="4" end="5" frame="proper_name(sg,'PER')"
  55               genus="zijd" getal="ev" graad="basis" his="normal"
  56               his_1="names_dictionary" id="8" lcat="np" lemma="Piet"
  57               naamval="stan" neclass="PER" ntype="eigen" num="sg"
  58               pos="name" postag="N(eigen,ev,basis,zijd,stan)" pt="n"
  59               rel="su" rnum="sg" root="Piet" sense="Piet"
  60               word="Piet">
  61           <ud id="5" head="2" deprel="conj" deprel_main="conj" upos="PROPN"
  62               Gender="Com" Number="Sing"
  63               xpos="N|eigen|ev|basis|zijd|stan">
  64             <dep id="5" head="5.1" deprel="nsubj" deprel_main="nsubj" />
  65           </ud>
  66         </node>
  67         <node index="1" begin="2" end="3" id="9" rel="hd"/>
  68         <node begin="5" end="6" frame="tmp_adverb" his="normal"
  69               his_1="normal" id="10" lcat="advp" lemma="morgen"
  70               pos="adv" postag="BW()" pt="bw" rel="mod" root="morgen"
  71               sense="morgen" special="tmp" word="morgen">
  72           <ud id="6" head="5" deprel="orphan" deprel_main="orphan" upos="ADV"
  73               xpos="BW">
  74             <dep id="6" head="5.1" deprel="advmod" deprel_main="advmod" />
  75           </ud>
  76         </node>
  77       </node>
  78     </node>
  79   </node>
  80   <sentence>Jan komt vandaag en Piet morgen</sentence>
  81   <root id="2" form="komt" lemma="komen" upos="VERB"
  82         xpos="WW|pv|tgw|met-t"
  83         Number="Sing" Tense="Pres" VerbForm="Fin"
  84         deprel="root">
  85     <nsubj id="1" form="Jan" lemma="Jan" upos="PROPN"
  86            xpos="N|eigen|ev|basis|zijd|stan"
  87            Gender="Com" Number="Sing"
  88            deprel="nsubj"/>
  89     <advmod id="3" form="vandaag" lemma="vandaag" upos="ADV"
  90             xpos="BW"
  91             deprel="advmod"/>
  92     <conj id="5" form="Piet" lemma="Piet" upos="PROPN"
  93           xpos="N|eigen|ev|basis|zijd|stan"
  94           Gender="Com" Number="Sing"
  95           deprel="conj">
  96       <cc id="4" form="en" lemma="en" upos="CCONJ"
  97           xpos="VG|neven"
  98           deprel="cc"/>
  99       <orphan id="6" form="morgen" lemma="morgen" upos="ADV"
 100               xpos="BW"
 101               deprel="orphan"/>
 102     </conj>
 103   </root>
 104   <conllu status="OK" auto="PQU1.0"><![CDATA[
 105 1       Jan     Jan     PROPN   N|eigen|ev|basis|zijd|stan      Gender=Com|Number=Sing  2       nsubj   2:nsubj _
 106 2       komt    komen   VERB    WW|pv|tgw|met-t Number=Sing|Tense=Pres|VerbForm=Fin     0       root    0:root  _
 107 3       vandaag vandaag ADV     BW      _       2       advmod  2:advmod        _
 108 4       en      en      CCONJ   VG|neven        _       5       cc      5.1:cc  _
 109 5       Piet    Piet    PROPN   N|eigen|ev|basis|zijd|stan      Gender=Com|Number=Sing  2       conj    5.1:nsubj       _
 110 5.1     komt    komen   VERB    WW|pv|tgw|met-t Number=Sing|Tense=Pres|VerbForm=Fin     _       _       2:conj:en       CopiedFrom=2
 111 6       morgen  morgen  ADV     BW      _       5       orphan  5.1:advmod      _
 112 ]]></conllu>
 113 </alpino_ds>


Pagina's:


CategoryCategory