Werkoverleg met GvN.
Taken:
- Nieuwe computer, specificaties:
- Model
- Bij voorkeur een liggen model. Ik heb weinig ruimte voor een staand model.
- Geheugen
- Oude pc is (bijna) 4 Gb. Nieuwe minimaal het dubbele.
- Hardeschijf
- Een kleine primaire schijf, met een tweede grotere erbij, ik weet niet of dat werkt.
- Bij een upgrade van Debian is er veel vrije ruimte nodig op de primaire hardeschijf. Dus, een grote primaire schijf, minimaal 750 Gb.
- Betrouwbaarheid en levensduur zijn het belangrijkst, snelheid is minder belangrijk.
- CD/DVD-lezer/schrijver
- Toetsenbord
- Bij voorkeur een toetsenbord waarop de toets met "\" en "|" boven de enter-toets zit.
- Windows (?)
- Windows en Office op een partitie van beperkte omvang, niet groter dan na installatie met nog 50 Gb vrij. (Of meer, als dat nodig is voor het draaien van Windows.)
- Een standaard-installatie voor thuisgebruik, niet voor in het netwerk van de RuG.
- Model
- ❏ Invoer metadata
- ❏ Vanuit cgn met cdmi
→ zie: CategoryPaQu
- ❏ Vanuit childes met cdmi
- ❏ Vanuit cgn met cdmi
- ❏ Sentence-ID (bijv uit folia) of label
✻ In metadata. Nadeel: is voor elke zin uniek, dus werken met metadata wordt problematisch
- ✻ Apart element in alpino_ds
- ✻ Apart attribuut op top-node in alpino_ds
✻ Apart attribuut op sentence
- ❏ Word-ID (bijv uit folia)
✻ Apart attribuut in node, invoer voor Alpino, bijvoorbeeld: [@id w1 dit] [@id w2 is] [@id w3 een] [@id w4 voorbeeld]
- ❏ Tutorial over prepareren van eigen corpora op github (wikipagina).
- ✔ Upload meerdere teksten in tar of zip
- ✻ Elk bestand kan een BOM hebben, dus domweg aan elkaar plakken kan niet
- ✔ Bestandnaam gebruiken in label
- ✔ Bestandnaam opnemen in metadata
→ Formaat tekst met metadata, zie: CategoryPaQu
- ❏ Invoer metadata