Werkoverleg met GvN.
Taken:
❏ Wanneer nieuwe schrijfruimte beschikbaar is, tabel lassy_wiki opnieuw opbouwen
- ✻ Beginnend bij 500.000 zinnen, in stappen verdubbelen to 8.000.000 zinnen.
- ✻ Voor elk stap noteren: tijd voor opslaan zinnen en triplets; tijd voor opslaan van paren woord/lemma; schijfruimte
✻ Programma tags opnieuw draaien, en menu in lassy bijwerken.
- ✔ Logo + link toevoegen naar Clarin NL
- ✔ Statistiek: link om resultaten op te slaan
✔ Zoeken op root
- ✔ Lassy Klein: corrigeren voor svp + ww
→ zie: /net/aistaff/alfa/lassy/ld_update.out
- ✔ Lassy Groot: uit corpus halen
- ✔ Zoeksyntax: lassy, lassystats, help
- ✔ Lassy Klein: corrigeren voor svp + ww
✔ LassyDevelop gebruiken i.p.v. LassySmall
✔ Bestaande bestanden aanpassen: README.txt wordrel.go index.html lassytree.go
✔ Vanuit cron: als bestanden in LassyDevelop zijn veranderd de database opnieuw aanmaken
- Zardoz
✔ Cronjobs voor alfa op volker verplaatsen naar andere machines
✔ Alle twitterdingen naar zardoz
✔ Functioneel account f109308 laten koppelen aan account alfa op volker
✔ Processen en cronjobs voor kleiweg op volker verplaatsen naar andere machines
✔ Twitter demo's dagtweets en twitteraars in het buitenland overzetten naar zardoz.
✔ dagtweets poort 44557
✔ twitteraars in het buitenland poort 44557
✔ Bestanden in /net/corpora/dutchsemcor koppelen aan bestanden in /net/corpora/LassyDevelop/Treebank
→ zie: /net/aistaff/kleiweg/LdevDsc/
→ ok3.log
→ err3.log
- ✔ Sense:
✔ Ook bij SKIP in Lassy, sense uit DSC toevoegen
✔ Ook alt→sense
- ✔ Markeren: handmatig of automatisch afgeleid
- ✔ Alignments:
- ✔ POS negeren bij zoeken van alignment zelf
- ✔ Bij elk paar, markeren: match van word en/of postag (of geen van beide)
- ✔ Hoeveel woorden met een sense zijn er eigenlijk in DSC?
- → 46.530.362 woorden met betekenis in dutchsemcor, waarvan 402.085 handmatig toegevoegd, 46.128.277 automatisch (tijd nodig om dit te tellen: ruim 11 uur)