29 mei 2024

Actueel…

  1. alto

    • template: %l, analoog aan %w, maar dan met lemma’s
    • template: %p en %P, analoog aan %w, maar dan met pt en postag
    • documentatie: fp://node/@lemma tt:%m: verschil in uitvoer tussen DbXML en libxml2
    • updaten in Alpino in Docker, AppImage, en haytabo
      • moet nog: documentatie over verschil in uitvoer tussen DbXML en libxml2
  2. websites, wensen:

Later…

  1. urd2
    • binnenkort upgrade naar Ubuntu 22.04
  2. migratie naar colossus

Zoeken met alto

Zoeken door DbXML:

» alto cdb.dact 'fp://node[@root="fiets"]/@word' tt:'%f \t%m'
6823.xml        {}word="fietsten"
1361.xml        {}word="fietsen"
697.xml         {}word="fiets"
3609.xml        {}word="fiets"
696.xml         {}word="fietsen"
4878.xml        {}word="gefietst"
269.xml         {}word="fiets"
695.xml         {}word="fiets"

Zoeken door libxml2:

» alto cdb.dact 'fp://node[@root="fiets"]/@word' tt:'%f \t%m' -1
1361.xml        fietsen
269.xml         fiets
3609.xml        fiets
4878.xml        gefietst
6823.xml        fietsten
695.xml         fiets
696.xml         fietsen
697.xml         fiets

Hierboven is de volgorde anders dan bij de andere voorbeelden. Dat heeft niks te betekenen.

Zoeken door XQilla:

» alto cdb.dact 'fp://node[@root="fiets"]' 'fp://node[@root="fiets"]/@word' tt:'%f \t%m' -2
6823.xml        {}word="fietsten"
1361.xml        {}word="fietsen"
697.xml         {}word="fiets"
3609.xml        {}word="fiets"
696.xml         {}word="fietsen"
4878.xml        {}word="gefietst"
269.xml         {}word="fiets"
695.xml         {}word="fiets"

Zoeken door XQilla met string-functie:

» alto cdb.dact 'fp://node[@root="fiets"]' 'fp://node[@root="fiets"]/string(@word)' tt:'%f \t%m' -2
6823.xml        fietsten
1361.xml        fietsen
697.xml         fiets
3609.xml        fiets
696.xml         fietsen
4878.xml        gefietst
269.xml         fiets
695.xml         fiets

Zoeken door DbXML met string-functie:

» alto cdb.dact 'fp://node[@root="fiets"]/string(@word)' tt:'%f \t%m'
UNKNOWN         fietsten
UNKNOWN         fietsen
UNKNOWN         fiets
UNKNOWN         fiets
UNKNOWN         fietsen
UNKNOWN         gefietst
UNKNOWN         fiets
UNKNOWN         fiets

Door de manier waarop DbXml werkt zijn gegevens over het document alleen beschikbaar als de uitvoer van een XPath-expressie een XML-fragment is.

Er zat een bug in alto waardoor de uitvoer van DbXML niet beschikbaar was als het geen XML-fragment was.

alto