[PetersWerkWiki] [TitleIndex] [WordIndex

Werkoverleg met GvN.

Taken:

  1. LassyDemo

    • ❏ Wanneer nieuwe schrijfruimte beschikbaar is, tabel lassy_wiki opnieuw opbouwen

      • ✻ Beginnend bij 500.000 zinnen, in stappen verdubbelen to 8.000.000 zinnen.
      • ✻ Voor elk stap noteren: tijd voor opslaan zinnen en triplets; tijd voor opslaan van paren woord/lemma; schijfruimte
      • ✻ Programma tags opnieuw draaien, en menu in lassy bijwerken.

  2. DutchSemCor

    • ✔ Installeren onder /net/corpora/LassyDsc
      • ✔ Documentatie
      • ? Mongo-bestanden ook?

    • ✔ Lijst van dact-bestanden waarin veranderingen voorkomen
    • out2xml: complete alignments

    • ✔ In Mongo: database guest met username/password guest
      • ✔ Elke nacht leegmaken

Voorbeeldprogramma voor DutchSemCor

Dit kan alleen op zardoz

# aanpassen van een heel dact-bestand uit LassyLarge:
/net/corpora/LassyDsc/tools/dactmod /net/corpora/LassyLarge/SONAR/DACT/WR-P-E-I/WR-P-E-I0000000.dact out.dact

# aanpassen van een enkel xml-bestand uit LassyDevelop:
/net/corpora/LassyDsc/tools/xmlmod D /net/corpora/LassyDevelop/Treebank/WR-P-E-C-0000000004/WR-P-E-C-0000000004.p.28.s.3.xml


CategoryLassy CategoryCornetto