[PetersWerkWiki] [TitleIndex] [WordIndex

Werkoverleg met GvN.

Taken:

  1. Android VR
  2. PaQu

    • ✔ nieuwe macro's
    • ✔ macro-expansie
      • ✔ één stap per keer
      • ✔ inspringen corrigeren
  3. Syntactic profile of Dutch (SPOD)

    • ✔ melding werkt niet goed met Alpino Treebank en Lassy Klein weg

    • ✔ Alle tests met LassyKlein: standaard zoeken, zoeken met geëxpandeerde indexnodes → verschillen in uitkomst? → zie beneden

      • ✔ Details van tests met grote verschillen → zie beneden
  4. Emacs
    • ✘ Edit-modus voor XPath?
      • → Is er niet. Gebruik indent-region in ruby-mode of perl-mode.

  5. FoLIA
    • ❏ programma voor omzetting van CHAT naar FoLiA

--- std.txt     2017-03-15 17:19:32.887961618 +0100
+++ dx.txt      2017-03-15 17:12:10.223077594 +0100
@@ -12 +12 @@
-1078   0.0165          1214    imp     imperatieven
+1077   0.0165          1213    imp     imperatieven
@@ -15,4 +15,4 @@
-9230   0.142           10735   ssub    finiete bijzinnen
-4839   0.0742          5264    ssubdat finiete bijzinnen met "dat"
-436    0.00669         458     ssubof  finiete bijzinnen met "of"
-4756   0.0729          5013    ssubcmp finiete bijzinnen met andere voegwoorden
+9230   0.142           10736   ssub    finiete bijzinnen
+4839   0.0742          5265    ssubdat finiete bijzinnen met "dat"
+436    0.00669         459     ssubof  finiete bijzinnen met "of"
+4754   0.0729          5012    ssubcmp finiete bijzinnen met andere voegwoorden
@@ -25 +25 @@
-62905  0.965           326221  np      np
+62905  0.965           326228  np      np
@@ -30,4 +30,4 @@
-1916   0.0294          1961    vwuit   vaste werkwoordelijke uitdrukkingen
-2761   0.0423          2903    groen   groene werkwoordsvolgorde
-4588   0.0704          5006    rood    rode werkwoordsvolgorde
-11032  0.169           14071   wwclus  werkwoordsclusters
+1917   0.0294          1962    vwuit   vaste werkwoordelijke uitdrukkingen
+2809   0.0431          2961    groen   groene werkwoordsvolgorde
+4596   0.0705          5018    rood    rode werkwoordsvolgorde
+11038  0.169           14103   wwclus  werkwoordsclusters
@@ -36 +36 @@
-438    0.00672         440     nppas   niet-persoonlijke passief -- werk niet met Corpus Gesproken Nederlands
+439    0.00673         444     nppas   niet-persoonlijke passief -- werk niet met Corpus Gesproken Nederlands
@@ -38,5 +38,5 @@
-37902  0.581           45327   inb0    geen inbedding
-18446  0.283           31122   inb1    minstens 1 finiete zinsinbedding
-9487   0.146           11628   inb2    minstens 2 finiete zinsinbeddingen
-1514   0.0232          2048    inb3    minstens 3 finiete zinsinbeddingen
-445    0.00683         532     inb4    minstens 4 finiete zinsinbeddingen
+37761  0.579           45168   inb0    geen inbedding
+18446  0.283           31307   inb1    minstens 1 finiete zinsinbedding
+9487   0.146           11714   inb2    minstens 2 finiete zinsinbeddingen
+1514   0.0232          2057    inb3    minstens 3 finiete zinsinbeddingen
+446    0.00684         538     inb4    minstens 4 finiete zinsinbeddingen
@@ -48,2 +48,2 @@
-30941  0.475           33472   nptsub  np-topic is subject
-1694   0.026           1709    nptnsub np-topic is geen subject
+31179  0.478           33732   nptsub  np-topic is subject
+5999   0.092           6134    nptnsub np-topic is geen subject
@@ -51 +51 @@
-11043  0.169           12456   locext  lokale extractie
+11043  0.169           12449   locext  lokale extractie

Script om verschillen te zien, met bestand macros.txt in huidige directory:

#!/bin/sh
dbxml_match -l -s -m macros.txt /net/corpora/paqu/lassysmallmeta.dact  "$@" | sort > dact.tmp
dbxml_match -l -s -m macros.txt /net/corpora/paqu/lassysmallmeta.dactx "$@" | sort > dactx.tmp
diff -u dact.tmp dactx.tmp | fold -s -w $COLUMNS | less

groen.txt

groene werkwoordsvolgorde

rood.txt

rode werkwoordsvolgorde

wwclus.txt

werkwoordsclusters

inb0.txt

geen inbedding

inb1.txt

minstens 1 finiete zinsinbedding

inb2.txt

minstens 2 finiete zinsinbeddingen

inb3.txt

minstens 3 finiete zinsinbeddingen

inb4.txt

minstens 4 finiete zinsinbeddingen

nptsub.txt

np-topic is subject

nptnsub.txt

np-topic is geen subject

locext.txt

lokale extractie


CategoryPaQu CategorySpod