Actueel…
aludalpinods, niet van alud/etc/Admin/README.txt herzien in overleg met team LWPalto toevoegen
libgraphviz-devlibxml2-devlibxslt1-devbin/*TreebankTools/IndexedCorpus/*Documentation/Treebank/overview.txt bijwerkenLater…
aibrief2.cls
aibrief3.clsSommige XML-bestanden die 1.17 als versie hebben hebben versie 1.18 nodig:
cd /net/corpora/LassyDevelop/Enhanced find . -name '*.xml' | alto -i fp:'//ud[@PronType="Emp" or @PronType="Exc"]' tt:%f
Dutch Web Corpus
Query:
SELECT count(*),`word`,`postag`,`rel`,`hword`,`hpostag` FROM ( SELECT DISTINCT `idd`,`a`.`word`,`a`.`postag`,`a`.`rel`,`a`.`hword`,`a`.`hpostag` FROM `deprel` `a` WHERE `a`.`lemma` IN ("Oud", "jong", "oud") AND `a`.`hlemma` IN ( "uit_fietsen", "door_fietsen", "langs_fietsen", "rond_fietsen", "toe_fietsen", "fiets", "aan_fietsen", "af_fietsen", "fiets", "fietsen", "in_fietsen", "om_fietsen", "op_fietsen") ) `a` GROUP BY `word`,`postag`,`rel`,`hword`,`hpostag` ORDER BY 1 DESC, `word`,`postag`,`rel`,`hword`,`hpostag` LIMIT 100000;
MySQL doet hier de eerste keer 39 seconden over. Een tweede zoekopdracht, met wat variaties duurt minder dan een halve seconde.
SQLite doet er de eerste keer erg lang over (6 minuut 58 op colossus). De
database moet van schijf gelezen worden. Na exit en opnieuw starten
duurt dezelfde query maar 0,44 seconde. Blijkbaar krijgt SQLite de
database uit de cache van het systeem. Wanneer het bestand op /dev/shm
staat is het direct de eerste keer zo snel.
Let op: In SQLite is nog geen rekening gehouden met collation.