[PetersWerkWiki] [TitleIndex] [WordIndex

Werkoverleg met GvN.

Taken:

  1. EarleyParser

    1. Van de tests van vorige week, test 2 opnieuw uitvoeren (en vergelijken waarmee?):

      • testzinnen uit deel 1
      • grammatica/lexicon uit deel 2 tot n

      • 1000 testzinnen die zonder raden niet geparst worden.
    2. Parsen met categorieën volgens Alpino.

Basistest, 1000 zinnen die zonder raden worden geparst:

   Precision          Recall       Crossing brackets
 Min.   :0.2281   Min.   :0.2000   Min.   :0.00000  
 1st Qu.:0.6095   1st Qu.:0.6471   1st Qu.:0.00000  
 Median :0.7391   Median :0.7642   Median :0.07692  
 Mean   :0.7424   Mean   :0.7561   Mean   :0.09039  
 3rd Qu.:0.8889   3rd Qu.:0.8710   3rd Qu.:0.14815  
 Max.   :1.0000   Max.   :1.0000   Max.   :0.35484  

Bij 1.1: Rekentijd voor 1000 zinnen: 26½ uur (op 9 delen: n = 10).
Met Go 1.1: 9½ uur.
1684 woorden gegokt (compleet onbekende woorden en woorden zonder passende categorie).

   Precision           Recall        Crossing brackets
 Min.   :0.07692   Min.   :0.06667   Min.   :0.00000  
 1st Qu.:0.48360   1st Qu.:0.52120   1st Qu.:0.08696  
 Median :0.59375   Median :0.64286   Median :0.16000  
 Mean   :0.60146   Mean   :0.63888   Mean   :0.15954  
 3rd Qu.:0.71807   3rd Qu.:0.75523   3rd Qu.:0.23077  
 Max.   :1.00000   Max.   :1.00000   Max.   :0.50000  
 
Fail: 10.9%

Bij 1.2: van de 1000 zinnen wordt er slechts 1 met succes geparst.


CategoryParsing