⇦⇨⌂
25 maart 2020
Taken:
- PaQu
- omschrijvingen toevoegen aan alle globale corpora
- Cypher
- zie: SPOD in AgensGraph
- optimalisatie van een aantal query’s: tijd en schijfgebruik
- corc: alternatieven?
- van 147G naar 21G
- van 1:09:17 naar 0:01:14
- AlpinoGraph
losse koppeling via extensie in PaQu
login van PaQu gebruiken
- voorlopig alleen met globale corpora
- TODOs
- dact2agens
- waardes van metadata
- text →
text string
- int →
integer number
- float →
float8 number
- date →
text string en/of date number (aantal dagen sinds bepaalde datum)
- datetime →
text string en/of timestamp number (aantal seconden sinds bepaalde datum en tijd)
- één element (:doc) met attributen: alud-versie;
alpino-versie; parse-datum
- waardes voor cats en skips zonodig/zomogelijk uit comment afleiden
- controle op duplicaten van sentence-ID
- door gebruikers ingevoerde query’s
- daarnaast keuze uit voorgedefinieerde query’s die de gebruiker eventueel kan aanpassen
- tutorial/inleiding
- alle query’s uit spod
- zoeken naar paarrelaties
- zoeken naar universal dependencies
- zoeken naar dingen als wat eten/drinken we
- veel documentatie nodig, met afbeeldingen, over agensgraph in het
algemeen, over structuur van Alpino_ds in agensgraph, en
over structuur van hulpattributen
- eigen weergave van bomen, zonder data uit PaQu te gebruiken: reconstructie xml vanuit agensgraph
- inclusief markeringen en UD/EUD-weergave met markeringen
- als resultaat een pad of paden bevat, dan vanuit tabel link (method POST) naar graaf
- Cytoscape.js — Graph theory (network) library for visualisation and analysis
- sigma.js — A JavaScript library dedicated to graph drawing
- zo mogelijk tabel en zinnen, waarbij in browser met één klik van view gewisseld kan worden
- alle(?) globale corpora uit PaQu invoeren
- snellere file-server
- Overleg
- Google Meet gebruiken op tablet (beeld/geluid) en computer (presentatie/schermweergave) tegelijk
- schetsen: Jamboard