[PetersWerkWiki] [TitleIndex] [WordIndex

Werkoverleg met GvN.

Taken:

  1. PaQu

    • ✻ Ideeën voor zoeken en tellen met metadata

Bijvoorbeeld:

<?xml version="1.0" encoding="UTF-8"?>
<alpino_ds version="1.3">
  <metadata>
    <meta type="text"  name="weer" value="wolken"/>
    <meta type="text"  name="weer" value="regen" />
    <meta type="text"  name="weer" value="onweer"/>
    <meta type="int"   name="wind" value="6"     />
    <meta type="float" name="temp" value="16.4"  />
  </metadata>
  <node>
  </node>
</alpino_ds>

invoeren

???


zoeken

gewoon

???

xpath

In corpus Weerbericht met metadata:

/alpino_ds/metadata/meta[@name="weer" and (@value="zon" or @value="warm")]
  /ancestor::alpino_ds//node[@cat="np"]

link

/alpino_ds/metadata/meta[@name="weer" and (@value="zon" or @value="warm")]
  +|+
//node[@cat="np"]

link

//node[
  @cat="np" and
  /alpino_ds/metadata/meta[@name="weer" and (@value="zon" or @value="warm")]
]

link


tellen

Probleem: hoe te tellen als er meerdere waardes zijn bij één zin?

Nu wordt gesorteerd op frequentie. Zou er ook gesorteerd moeten kunnen worden op metadata?

nominale data

integer data

float data

datum/tijd data


CategoryPaQu