Werkoverleg met GvN.
Taken:
❏ Wanneer nieuwe schrijfruimte beschikbaar is, tabel lassy_wiki opnieuw opbouwen
- ✻ Beginnend bij 500.000 zinnen, in stappen verdubbelen to 8.000.000 zinnen.
- ✻ Voor elk stap noteren: tijd voor opslaan zinnen en triplets; tijd voor opslaan van paren woord/lemma; schijfruimte
✻ Programma tags opnieuw draaien, en menu in lassy bijwerken.
- ✔ Installeren onder /net/corpora/LassyDsc
- ✔ Documentatie
? Mongo-bestanden ook?
- ✔ Lijst van dact-bestanden waarin veranderingen voorkomen
✔ out2xml: complete alignments
- ✔ In Mongo: database guest met username/password guest
- ✔ Elke nacht leegmaken
- ✔ Installeren onder /net/corpora/LassyDsc
Voorbeeldprogramma voor DutchSemCor
Dit kan alleen op zardoz
# aanpassen van een heel dact-bestand uit LassyLarge: /net/corpora/LassyDsc/tools/dactmod /net/corpora/LassyLarge/SONAR/DACT/WR-P-E-I/WR-P-E-I0000000.dact out.dact # aanpassen van een enkel xml-bestand uit LassyDevelop: /net/corpora/LassyDsc/tools/xmlmod D /net/corpora/LassyDevelop/Treebank/WR-P-E-C-0000000004/WR-P-E-C-0000000004.p.28.s.3.xml