/net/more_corpora/net/corpora/paqu die afkomstig zijn uit LassyLarge of LassyLargeExtra
/net/corpora/Childes_dutch* met meer zinnen en met
metadataalpinotreebank — Alpino Treebankbasilex — BasiLex 1.0basiscript — BasiScript 1.0: Opstellencgn — Corpus Gesproken Nederlandschildesdutch — Childes Dutch: extra metadata (LassyLargeExtra/CHILDES)clef — CLEF (LassyLargeExtra/CLEF)dwc — Dutch Web Corpus (LassyLargeExtra/DutchWebCorpus)eindhoven — Eindhoven (LassyLarge/EINDHOVEN)lassyklein — Lassy Kleinnewspapers — Lassy Groot: Kranten (LassyLarge/WR-P-P-G)wablieft — Wablieftwikixvii — NL-wiki 2017 (LassyLargeExtra/wiki2017)is_nachfeld, is_np, is_vorfeld in alpinodsDe software voor crowdsourcing liet tot nu toe elke vrijwilliger in willekeurige volgorde alle vragen beantwoorden. Dat is niet handig als je heel veel vragen hebt, en vrijwilligers maar een deel van de vragen beantwoorden.
Stel, je hebt voor 90% van de vragen ruim voldoende antwoorden, en voor 10% wil je nog meer antwoorden. Als nu een nieuwe vrijwilliger begint aan de vragen dan is die hoofdzakelijk bezig met het beantwoorden van vragen waarvoor je al genoeg antwoorden hebt. Misschien moet je lang wachten tot die laatste 10% voldoende is beantwoord.
Oplossing, keus uit drie algoritmes:
Optie 3 is niet geschikt in situaties waar het zeer waarschijnlijk is dat vrijwilligers verschillende antwoorden geven, bijvoorbeeld als er gevraagd wordt een langere tekst in te voeren.