Werkoverleg met GvN.
Taken:
- ✔ Gebruik: zie access.log van apache2
→ op urd, run: /net/aistaff/kleiweg/bin/haw
- dit wordt elke nacht vanuit cron gedaan
- ✔ Gebruik: zie access.log van apache2
- ✔ Naive Bayes classifier
- ✔ Trainen en testen zonder retweets: retweets geven te hoge resultaten voor testdata van zelfde dag als trainingsdata.
- → Lichte daling: F-score gedaald van .983 naar .980
- ✔ Testen op data van Erik: F-score = .959
? Trainen op Afrikaans en Indonesisch?
- ✔ Tool
- ✻ optie: skip eerste woord, voor tweets uit /net/corpora/twitter2/Tweets/Tekst
- → zie: /net/corpora/twitter2/tools/README.txt
- → run: /net/corpora/twitter2/tools/nltweet
- ✔ Libraries
- ✻ demonstreren in MongoDB/Voorbeelden
- ✔ Go
- ✔ Python
- ✔ Trainen en testen zonder retweets: retweets geven te hoge resultaten voor testdata van zelfde dag als trainingsdata.
- ✔ Naive Bayes classifier
Taken:
- CLCG
❏ Beperken toegang tot mensen binnen universiteit: via .htaccess werkt niet vanwege forwarding