[PetersWerkWiki] [TitleIndex] [WordIndex

Werkoverleg met GvN.

Taken:

  1. LassyDemo

    • ❏ Wanneer nieuwe schrijfruimte beschikbaar is, tabel lassy_wiki opnieuw opbouwen

      • ✻ Beginnend bij 500.000 zinnen, in stappen verdubbelen to 8.000.000 zinnen.
      • ✻ Voor elk stap noteren: tijd voor opslaan zinnen en triplets; tijd voor opslaan van paren woord/lemma; schijfruimte
      • ✻ Programma tags opnieuw draaien, en menu in lassy bijwerken.

    • ✔ Logo + link toevoegen naar Clarin NL
    • ✔ Statistiek: link om resultaten op te slaan
    • ✔ Zoeken op root

      • ✔ Lassy Klein: corrigeren voor svp + ww
        • → zie: /net/aistaff/alfa/lassy/ld_update.out

      • ✔ Lassy Groot: uit corpus halen
      • ✔ Zoeksyntax: lassy, lassystats, help
    • ✔ LassyDevelop gebruiken i.p.v. LassySmall

      • ✔ Bestaande bestanden aanpassen: README.txt wordrel.go index.html lassytree.go

      • ✔ Vanuit cron: als bestanden in LassyDevelop zijn veranderd de database opnieuw aanmaken

  2. Zardoz
    • ✔ Cronjobs voor alfa op volker verplaatsen naar andere machines

      • ✔ Alle twitterdingen naar zardoz

        • ✔ Functioneel account f109308 laten koppelen aan account alfa op volker

    • ✔ Processen en cronjobs voor kleiweg op volker verplaatsen naar andere machines

      • ✔ Twitter demo's dagtweets en twitteraars in het buitenland overzetten naar zardoz.

        • dagtweets poort 44557

        • twitteraars in het buitenland poort 44557

  3. DutchSemCor

    • ✔ Bestanden in /net/corpora/dutchsemcor koppelen aan bestanden in /net/corpora/LassyDevelop/Treebank

      • → zie: /net/aistaff/kleiweg/LdevDsc/

        • ok3.log

        • err3.log

      • ✔ Sense:
        • ✔ Ook bij SKIP in Lassy, sense uit DSC toevoegen

        • ✔ Ook altsense

        • ✔ Markeren: handmatig of automatisch afgeleid
      • ✔ Alignments:
        • ✔ POS negeren bij zoeken van alignment zelf
        • ✔ Bij elk paar, markeren: match van word en/of postag (of geen van beide)
    • ✔ Hoeveel woorden met een sense zijn er eigenlijk in DSC?
      • → 46.530.362 woorden met betekenis in dutchsemcor, waarvan 402.085 handmatig toegevoegd, 46.128.277 automatisch (tijd nodig om dit te tellen: ruim 11 uur)


CategoryLassy CategoryZardoz CategoryCornetto