Werkoverleg met GvN.
Taken:
- Computer
- ❏ Nieuwe machine? Huidige in huis sinds 29 december 2011. (De vorige staat er ook nog.)
- → nummer: 009416
- ❏ Nieuwe machine? Huidige in huis sinds 29 december 2011. (De vorige staat er ook nog.)
- ✔ Logo's clarin-nl en claria naar infopagina, daarop ook werk van Erik T vermelden, en de huidige ontwikkelaars
- ❏ Invoer metadata
- ❏ Vanuit cgn met cdmi
→ zie: CategoryPaQu
- ❏ Vanuit childes met cdmi
- ❏ Vanuit cgn met cdmi
- ❏ Sentence-ID (bijv uit folia) of label
✻ In metadata. Nadeel: is voor elke zin uniek, dus werken met metadata wordt problematisch
- ✻ Apart element in alpino_ds
- ✻ Apart attribuut op top-node in alpino_ds
✻ Apart attribuut op sentence
- ❏ Word-ID (bijv uit folia)
✻ Apart attribuut in node, invoer voor Alpino, bijvoorbeeld: [@id w1 dit] [@id w2 is] [@id w3 een] [@id w4 voorbeeld]
- ❏ Tutorial over prepareren van eigen corpora op github (wikipagina).
- ❏ Upload meerdere teksten in tar of zip
- ✻ Elk bestand kan een BOM hebben, dus domweg aan elkaar plakken kan niet
- ❏ Bestandnaam gebruiken in label
- ❏ Bestandnaam opnemen in metadata