Bronnen
/net/corpora/dutchsemcor
- 46.530.362 woorden met betekenis, waarvan 402.085 handmatig toegevoegd, 46.128.277 automatisch
/net/corpora/LassyDevelop/Treebank/*/*.xml
/net/corpora/LassyLarge/SONAR/DACT/*/*.dact
Doelen
Woord-ID's uit 1. invoegen in bestanden uit 2: LassyDevelop
Zie:
→ /net/aistaff/kleiweg/LdevDsc
→ devel.out
→ devel.err
Stats:
- 16.265 zinnen gevonden die matchen tussen beide sets
- 2.765 items gevonden die matchen met ID, maar niet met de zin
9.349 zinnen in LassyDevelop waarvan het ID niet voorkwam in het bijpassende bestand van dutchsemcor
- 32 woorden met betekenis in zinnen waarin dit woord niet gematcht kon worden
48.078 woorden gevonden die in LassyDevelop aanwezig zijn en waarvoor in dutchsemcor een sense is gedefinieerd (vergelijk met oude resultaat: 14.498)
Woord-ID's uit 1. invoegen in bestanden uit 3: LassyLarge
Zie:
→ /net/aistaff/kleiweg/LdevDsc
→ large-*.out
→ large-*.err
Stats:
- 16.794.441 zinnen gematcht, waarvan 13.580.134 met een of meer betekenissen, 3.214.307 zonder.
CategoryLassy CategorySonar CategoryCornetto CategoryCorpora