Cophenetic maps with noise

Als je gaat clusteren met ruis en op basis van die clustering een indeling in groepen maakt, en je herhaalt dat heel vaak, wat je dan krijgt is een afstandstabel die voor elk paar elementen aangeeft hoe groot de kans is dat ze in hetzelfde cluster komen.

Je kunt ook de cophenetic distance van een clustering gebruiken. Ook dan krijg je een afstandstabel. Als je wilt corrigeren voor de instabiliteit van clustering, dan kun je weer ruis gebruiken, en de clustering vele malen herhalen.

The cophenetic distance between two observations that have been clustered is defined to be the intergroup dissimilarity at which the two observations are first combined into a single cluster. (from: R manual)

Het resultaat is vergelijkbaar.

Hieronder voorbeelden met Weighted Average.

Clustercompositiekaart (links) en cofenetische kaart (rechts).

Opties gebruikt bij het maken van de cofenetische kaart:

    cluster -wa -c -N 1 -r 50 ...
    mapdiff -c 4 ...

Als je alleen de cofenetische afstanden van de laatstgevormde clusters neemt, dan ligt het resultaat nog dichter in de buurt van de clustercompositiekaart:

Clustercompositiekaart (links) en cofenetische kaart met ruis, maximaal 8 clusters (rechts).

Ter vergelijking, een cofenetische kaart met en zonder ruis:

Cofenetische kaarten. Zonder ruis (links), en met ruis (rechts).

Een cofenetische kaart is dus een kaart van een afstandstabel. Dat een kaart van de originele afstandstabel niet nuttig is kun je hieronder zien (rechts):

Cofenetische kaart met ruis (links), en een kaart van de oorspronkelijk afstandstabel (rechts).