Als je gaat clusteren met ruis en op basis van die clustering een indeling
in groepen maakt, en je herhaalt dat heel vaak, wat je dan krijgt is een
afstandstabel die voor elk paar elementen aangeeft hoe groot de kans is
dat ze in hetzelfde cluster komen.
Je kunt ook de cophenetic distance van een clustering
gebruiken. Ook dan krijg je een afstandstabel. Als je wilt corrigeren
voor de instabiliteit van clustering, dan kun je weer ruis gebruiken, en
de clustering vele malen herhalen.
The cophenetic distance between two observations that have been
clustered is defined to be the intergroup dissimilarity at which the two
observations are first combined into a single cluster. (from: R manual)
Het resultaat is vergelijkbaar.
Hieronder voorbeelden met Weighted Average.
Opties gebruikt bij het maken van de cofenetische kaart:
cluster -wa -c -N 1 -r 50 ...
mapdiff -c 4 ...
Als je alleen de cofenetische afstanden van de laatstgevormde clusters
neemt, dan ligt het resultaat nog dichter in de buurt van de
clustercompositiekaart:
Ter vergelijking, een cofenetische kaart met en zonder ruis:
Een cofenetische kaart is dus een kaart van een afstandstabel. Dat een
kaart van de originele afstandstabel niet nuttig is kun je hieronder zien
(rechts):