[PetersWerkWiki] [TitleIndex] [WordIndex

doel

Script dtxslt in /net/aistaff/vannoord/z/Alpino/bin omzetten naar een voorbeeldscript in Python dat geen stylesheet gebruikt, maar hetzelfde doet met behulp van de Pythonmodule xml.etree.ElementTree.

voorbeeld

export ALPINO_HOME=/net/aistaff/vannoord/z/Alpino
PATH=$PATH:/net/aistaff/vannoord/z/Alpino/bin
cd /net/aistaff/vannoord/z/Alpino/Treebank/Machine/TWNC/COMPACT/A
dtxslt -s /net/aistaff/vannoord/z/Alpino/TreebankTools/stylesheets/dt2sent_with_file_stem.xsl ad20010410.index

uitwerking

Script: dtetree.py

Omdat de library's die dtxslt gebruikt voor Python 2 zijn, en omdat het voorbeeld in Python 3 moet, heb ik geen gebruik gemaakt van die library's.

Nieuwe library hier: AlpinoCorpusPython

Go

Ter vergelijking heb ik ook een versie in Go gemaakt: dtetree.go

Dit is ietsje ingewikkelder omdat Go geen XPath-expressies kent.

attachments

Download alles: DtXslt.tar.gz

  • [get | view] (2012-03-14 17:43:31, 1811.4 KB) [[attachment:ad20010410.data.dz]]
  • [get | view] (2012-03-14 17:43:31, 70.4 KB) [[attachment:ad20010410.index]]
  • [get | view] (2012-03-14 17:43:33, 432.5 KB) [[attachment:ad20010410.txt]]
  • [get | view] (2012-03-14 17:43:33, 1.2 KB) [[attachment:dt2sent_with_file_stem.xsl]]
  • [get | view] (2015-12-04 11:05:47, 1.8 KB) [[attachment:dtetree.go]]
  • [get | view] (2012-03-24 12:43:35, 1.1 KB) [[attachment:dtetree.py]]
 All files | Selected Files: delete move to page copy to page


CategoryCorpora CategoryPython CategoryGo CategoryXml CategoryXslt