Werkoverleg met GvN.
Taken:
- ✻ Ideeën voor zoeken en tellen met metadata
Bijvoorbeeld:
<?xml version="1.0" encoding="UTF-8"?>
<alpino_ds version="1.3">
<metadata>
<meta type="text" name="weer" value="wolken"/>
<meta type="text" name="weer" value="regen" />
<meta type="text" name="weer" value="onweer"/>
<meta type="int" name="wind" value="6" />
<meta type="float" name="temp" value="16.4" />
</metadata>
<node>
</node>
</alpino_ds>
invoeren
???
zoeken
gewoon
???
xpath
In corpus Weerbericht met metadata:
/alpino_ds/metadata/meta[@name="weer" and (@value="zon" or @value="warm")] /ancestor::alpino_ds//node[@cat="np"]
/alpino_ds/metadata/meta[@name="weer" and (@value="zon" or @value="warm")] +|+ //node[@cat="np"]
//node[ @cat="np" and /alpino_ds/metadata/meta[@name="weer" and (@value="zon" or @value="warm")] ]
tellen
Probleem: hoe te tellen als er meerdere waardes zijn bij één zin?
Nu wordt gesorteerd op frequentie. Zou er ook gesorteerd moeten kunnen worden op metadata?
nominale data
- Waardes net zo tellen als attributen
- Als er weinig verschillende waardes zijn kunnen tellingen gegroepeerd worden per waarde
integer data
- Waardes net zo tellen als attributen
- Als er weinig verschillende waardes zijn kunnen tellingen gegroepeerd worden per waarde
- Groepering per interval
float data
- Waardes indelen in intervallen, daarna die intervallen net zo tellen als attributen
- Groepering per interval
datum/tijd data
- ???