RuG/L04 is programmatuur voor dialectometrie en cartografie.
En meer.
Simpel gezegd: je hebt op verschillende plaatsen in een gebied de uitspraak of lokale
varianten van een groot aantal woorden verzameld.
Met RuG/L04 kun je die woorden met elkaar vergelijken en
op basis daarvan dialectkaarten maken.
Eerst maak je een afstandstabel. Om precies te zijn: je maakt
een tabel waarin voor elk paar plaatsen met een getal is
aangegeven in welke mate de woorden uit die twee plaatsen van elkaar
verschillen. Voor elk woord worden de varianten uit beide plaatsen met elkaar
vergeleken, en het verschil tussen de twee plaatsen is het gemiddelde
van al die variantverschillen.
Er zijn diverse maten om een verschil tussen twee woorden uit te
drukken in een getal. Een maat is de
Levenshtein distance
(ook wel string edit distance
of kortweg edit distance genoemd).
Een andere maat is de
Gewichteter
Identitätswert of G.I.W.
De tabel met verschillen bewerk je verder. Je maakt een indeling in groepen
door middel van
clustering,
of een ruimtelijke indeling door
middel van
multidimensional scaling.
Met het resultaat daarvan teken je een dialectkaart.
Onderstaand diagram geeft vereenvoudigd een aantal van de voornaamste stappen weer:
RuG/L04 bestaat uit een verzameling losse programma's.
Elk programma neemt een stap van de verwerking voor z'n rekening. Dit betekent
dat je de programma's los van elkaar kunt gebruiken, en ook voor andere
toepassingen. Je zou bijvoorbeeld kaarten van genetische
verschillen kunnen maken als je via een andere weg een tabel met
genetische verschillen tussen plaatsen hebt gemaakt.
In de gerubriceerde index van de handleiding kun je zien welke
programma's allemaal aanwezig zijn.
Naast deze losse programma's is er een library voor R.
R is een krachtig systeem voor statistiek dat gratis beschikbaar is voor elk
computerplatform. Met de library kun je bestanden, zoals die gebruikt worden
door de overige programma's, inlezen in R, analyseren, bewerken, en ook weer
opslaan.