Werkoverleg met GvN.
Taken:
- ❏ Alpino-server
- ❏ API (zie beneden)
- ✔ test-server (zie beneden)
❏ pqalpino
- ❏ kijken naar andere corpus-applicaties
- ✻ bijvoorbeeld: INESS
- ❏ andere manieren van corpus bevragen, gegevens aggregeren, visualiseren van resultaten
- ✔ Docker
- ✔ update Alpino
✔ mechanisme om Alpino automatisch te updaten te melden dat update nodig is
- ❏ Alpino-server
- Alpino in docker
- ✔ update van docker image mogelijk maken voor GvN
→ Download Dockerfile en volg de instructies in het bestand
- ✔ uitleg in het Engels
- ❏ op Windows: testen tijdens komend werkoverleg
Alpino: partok
✔ os.Getenv("ALPINO_HOME")
→ nieuwe versie, met meerdere correcties: /net/aps/64/bin/partok.go
- Federated login
❏ welke corpora in suffix arrays mogen buiten rug.nl gebruikt worden?
API Alpino-server
request:
- parse
- job
- up
- limits (to do)
- cancel (to do)
return status:
|
globaal |
per zin |
betekenis |
ok |
+ |
+ |
succes |
fail |
|
+ |
parse van zin mislukt |
again |
+ |
? |
server is overbelast, probeer later opnieuw |
error |
+ |
? |
fout van gebruiker |
internal |
+ |
+ |
fout van programma |
TODO:
- limits
- opvragen en implementeren in server
- max hoeveel data per request
- back-off policy
- aantal gelijktijdige gebruikers beperken
- lines: false (tekst moet nog ingedeeld worden in zinnen)
- tokens: false (tekst moet nog getokeniseerd worden)
Draait op zardoz → zie: /net/aistaff/kleiweg/paqu/tmp/alpserve
Voorbeeld aanroep:
curl -s -d '{"request": "parse", "lines": true, "tokens": true, "labels": true}
weer.p.1.s.1|Vandaag & morgen
weer.p.2.s.1|Kans op onweersbuien
weer.p.3.s.1|De buien boven het noorden van het land trekken spoedig weg , waarna de zon op veel plaatsen doorbreekt en het broeierig aanvoelt .
weer.p.3.s.2|In de loop van vanmiddag en vanavond neemt de kans op stevige onweersbuien van het zuidwesten uit toe .
weer.p.3.s.3|Vooral in het oosten kunnen deze lokaal fors uitpakken met veel regen in korte tijd , wat voor wateroverlast kan zorgen .
weer.p.3.s.4|Ook hagel en ( zware ) windstoten zijn mogelijk .
weer.p.3.s.5|De maximumtemperaturen lopen uiteen van 22 graden op de Wadden tot 30 graden in het zuidoosten van het land .
weer.p.3.s.6|De wind draait naar het zuiden en neemt toe naar matig .
weer.p.3.s.7|In de middag draait de wind in het westen naar noordwest en neemt af naar zwak .
weer.p.4.s.1|Komende nacht is er nog steeds kans op enkele forse onweersbuien .
weer.p.4.s.2|De minimumtemperaturen liggen rond de 20 graden en de wind is zwak uit uiteenlopende richtingen .
weer.p.5.s.1|Morgen overdag is het half tot zwaar bewolkt en kan er in het uiterste oosten nog een enkele bui voorkomen , maar de kans op onweer is klein .
weer.p.5.s.2|De middagtemperatuur loopt uiteen van 19 graden vlak aan zee tot 26 graden in het oosten van het land .
weer.p.5.s.3|De wind wordt geleidelijk westelijk en is zwak tot matig .
weer.p.5.s.4|( Bron : KNMI )' http://127.0.0.1:9456/
Of:
curl -s --data-binary @/net/aistaff/kleiweg/paqu/tmp/alpserve/data http://127.0.0.1:9456/
Voorbeeld antwoord:
{
"status": "ok",
"id": "5577006791947779410",
"lines": 15,
"timeout": 300
}
Je moet resultaten opvragen binnen de gegeven timeout (in seconden), anders wordt de boel weggegooid. Voorbeeld:
curl -s -d '{"request": "job", "id": "5577006791947779410"}' http://127.0.0.1:9456/
Je krijgt dan de verwerking van de zinnen geparst vanaf de vorige aanroep tot nu toe.
Als daarin staat "finished":false dan zijn dit nog niet alle zinnen. Herhaal dan bovenstaand commando opnieuw, weer binnen de timeout, die gereset is bij de vorige aanroep.