[PetersWerkWiki] [TitleIndex] [WordIndex

Script voor omzetten naar Alpinoformaat: cd2alp.py

Script voor het genereren van een lijst van woorden met vreemde tekens: cd2toklist.py

De software voor de Pythonmodule is verplaatst naar AlpinoTokenizerPython.

attachments

Download alles: ChildesDutch.tar.gz

  • [get | view] (2012-03-24 13:03:11, 3.1 KB) [[attachment:cd2alp.py]]
  • [get | view] (2012-03-01 12:35:59, 2.4 KB) [[attachment:cd2toklist.py]]
  • [get | view] (2012-03-01 12:37:39, 158.2 KB) [[attachment:toklist.txt]]
 All files | Selected Files: delete move to page copy to page

Website: Child Language Data Exchange System

Beschrijving van bestandsformaat: The CHAT Transcription Format

Info over de Nederlandse corpora: Germanic Corpora


CategoryCorpora