Script voor omzetten naar Alpinoformaat: cd2alp.py
Script voor het genereren van een lijst van woorden met vreemde tekens: cd2toklist.py
De software voor de Pythonmodule is verplaatst naar AlpinoTokenizerPython.
attachments
Download alles: ChildesDutch.tar.gz
links
Website: Child Language Data Exchange System
Beschrijving van bestandsformaat: The CHAT Transcription Format
Info over de Nederlandse corpora: Germanic Corpora