Als je gaat clusteren met ruis en op basis van die clustering een indeling in
groepen maakt, en je herhaalt dat heel vaak, wat je dan krijgt is een
afstandstabel die voor elk paar elementen aangeeft hoe groot de kans is
dat ze in hetzelfde cluster komen.
Je kunt ook de cophenetic distance van een clustering gebruiken. Ook dan
krijg je een afstandstabel. Als je wilt corrigeren voor de
instabiliteit van clustering, dan kun je weer ruis gebruiken, en de
clustering vele malen herhalen.
The cophenetic distance between two observations that have been
clustered is defined to be the intergroup dissimilarity at which
the two observations are first combined into a single cluster.
(from: R manual)
Het resultaat is vergelijkbaar.
Hieronder voorbeelden met Weighted Average.
Opties gebruikt bij het maken van de cofenetische kaart:
cluster -wa -c -N 1 -r 50 ...
mapdiff -c 4 ...
Als je alleen de cofenetische afstanden van de laatstgevormde clusters neemt,
dan ligt het resultaat nog dichter in de buurt van de
clustercompositiekaart:
Ter vergelijking, een cofenetische kaart met en zonder ruis:
Een cofenetische kaart is dus een kaart van een afstandstabel. Dat een kaart
van de originele afstandstabel niet nuttig is kun je hieronder zien (rechts):