Taalrader

Dit is een is een demonstratie van een taalrader, zoals beschreven in Cavnar, Trenkle, N-Gram-Based Text Categorization. Het is geschreven in Python en Javascript. Na het klikken op het "Invoer" tabblad onderaan kun je een stuk tekst invoeren. Na het drukken op de "Raad" knop, zullen de resultaten in het rechtervenster verschijnen.

Hoe hoger de score is, hoe meer een tekst verschilt van het taalmodel van de bijbehorende taal. Een lagere score staat dus voor meer overeenkomst tussen de tekst en het taalmodel. Het laagstscorende model staat bovenaan, en is de geraden taal.

Je kunt een voorbeeldtekst en de vingerafdruk voor een taal zien door op een taal in de resultatenlijst te dubbelklikken.

Tekst