doel
Script dtxslt in /net/aistaff/vannoord/z/Alpino/bin omzetten naar een voorbeeldscript in Python dat geen stylesheet gebruikt, maar hetzelfde doet met behulp van de Pythonmodule xml.etree.ElementTree.
voorbeeld
export ALPINO_HOME=/net/aistaff/vannoord/z/Alpino PATH=$PATH:/net/aistaff/vannoord/z/Alpino/bin cd /net/aistaff/vannoord/z/Alpino/Treebank/Machine/TWNC/COMPACT/A dtxslt -s /net/aistaff/vannoord/z/Alpino/TreebankTools/stylesheets/dt2sent_with_file_stem.xsl ad20010410.index
uitwerking
Script: dtetree.py
Omdat de library's die dtxslt gebruikt voor Python 2 zijn, en omdat het voorbeeld in Python 3 moet, heb ik geen gebruik gemaakt van die library's.
Nieuwe library hier: AlpinoCorpusPython
Go
Ter vergelijking heb ik ook een versie in Go gemaakt: dtetree.go
Dit is ietsje ingewikkelder omdat Go geen XPath-expressies kent.
attachments
Download alles: DtXslt.tar.gz
CategoryCorpora CategoryPython CategoryGo CategoryXml CategoryXslt