Werkoverleg met GvN.
Taken:
- Android VR
- ✔ poort open laten zetten op mars1
- → poort 4321
- ✔ nieuwe macro's
- ✔ macro-expansie
- ✔ één stap per keer
- ✔ inspringen corrigeren
Syntactic profile of Dutch (SPOD)
✔ melding werkt niet goed met Alpino Treebank en Lassy Klein weg
✔ Alle tests met LassyKlein: standaard zoeken, zoeken met geëxpandeerde indexnodes → verschillen in uitkomst? → zie beneden
- ✔ Details van tests met grote verschillen → zie beneden
- Emacs
- ✘ Edit-modus voor XPath?
→ Is er niet. Gebruik indent-region in ruby-mode of perl-mode.
- ✘ Edit-modus voor XPath?
- FoLIA
- ❏ programma voor omzetting van CHAT naar FoLiA
--- std.txt 2017-03-15 17:19:32.887961618 +0100 +++ dx.txt 2017-03-15 17:12:10.223077594 +0100 @@ -12 +12 @@ -1078 0.0165 1214 imp imperatieven +1077 0.0165 1213 imp imperatieven @@ -15,4 +15,4 @@ -9230 0.142 10735 ssub finiete bijzinnen -4839 0.0742 5264 ssubdat finiete bijzinnen met "dat" -436 0.00669 458 ssubof finiete bijzinnen met "of" -4756 0.0729 5013 ssubcmp finiete bijzinnen met andere voegwoorden +9230 0.142 10736 ssub finiete bijzinnen +4839 0.0742 5265 ssubdat finiete bijzinnen met "dat" +436 0.00669 459 ssubof finiete bijzinnen met "of" +4754 0.0729 5012 ssubcmp finiete bijzinnen met andere voegwoorden @@ -25 +25 @@ -62905 0.965 326221 np np +62905 0.965 326228 np np @@ -30,4 +30,4 @@ -1916 0.0294 1961 vwuit vaste werkwoordelijke uitdrukkingen -2761 0.0423 2903 groen groene werkwoordsvolgorde -4588 0.0704 5006 rood rode werkwoordsvolgorde -11032 0.169 14071 wwclus werkwoordsclusters +1917 0.0294 1962 vwuit vaste werkwoordelijke uitdrukkingen +2809 0.0431 2961 groen groene werkwoordsvolgorde +4596 0.0705 5018 rood rode werkwoordsvolgorde +11038 0.169 14103 wwclus werkwoordsclusters @@ -36 +36 @@ -438 0.00672 440 nppas niet-persoonlijke passief -- werk niet met Corpus Gesproken Nederlands +439 0.00673 444 nppas niet-persoonlijke passief -- werk niet met Corpus Gesproken Nederlands @@ -38,5 +38,5 @@ -37902 0.581 45327 inb0 geen inbedding -18446 0.283 31122 inb1 minstens 1 finiete zinsinbedding -9487 0.146 11628 inb2 minstens 2 finiete zinsinbeddingen -1514 0.0232 2048 inb3 minstens 3 finiete zinsinbeddingen -445 0.00683 532 inb4 minstens 4 finiete zinsinbeddingen +37761 0.579 45168 inb0 geen inbedding +18446 0.283 31307 inb1 minstens 1 finiete zinsinbedding +9487 0.146 11714 inb2 minstens 2 finiete zinsinbeddingen +1514 0.0232 2057 inb3 minstens 3 finiete zinsinbeddingen +446 0.00684 538 inb4 minstens 4 finiete zinsinbeddingen @@ -48,2 +48,2 @@ -30941 0.475 33472 nptsub np-topic is subject -1694 0.026 1709 nptnsub np-topic is geen subject +31179 0.478 33732 nptsub np-topic is subject +5999 0.092 6134 nptnsub np-topic is geen subject @@ -51 +51 @@ -11043 0.169 12456 locext lokale extractie +11043 0.169 12449 locext lokale extractie
Script om verschillen te zien, met bestand macros.txt in huidige directory:
#!/bin/sh
dbxml_match -l -s -m macros.txt /net/corpora/paqu/lassysmallmeta.dact "$@" | sort > dact.tmp
dbxml_match -l -s -m macros.txt /net/corpora/paqu/lassysmallmeta.dactx "$@" | sort > dactx.tmp
diff -u dact.tmp dactx.tmp | fold -s -w $COLUMNS | less
groene werkwoordsvolgorde |
|
rode werkwoordsvolgorde |
|
werkwoordsclusters |
|
geen inbedding |
|
minstens 1 finiete zinsinbedding |
|
minstens 2 finiete zinsinbeddingen |
|
minstens 3 finiete zinsinbeddingen |
|
minstens 4 finiete zinsinbeddingen |
|
np-topic is subject |
|
np-topic is geen subject |
|
lokale extractie |