Probleme und Möglichkeiten bei der Bewertung von Clusteranalyse-Verfahren: II. Ergebnisse einer Monte-Carlo-Studie

On the evaluation of clustering algorithms: A Monte Carlo approach

Probleme et possibilite pour l'evaluation des procedes l'analyse de cluster

Please always quote using this URN: urn:nbn:de:bvb:20-opus-69637
  • Ziel der vorliegenden Untersuchung war es, Aufschluß über die unterschiedliche Qualität hierarchischer und nicht-hierarchischer (partionierender) Clusteranalyseverfahren zu gewinnen. Die Reproduktionsgüte beider Clusteranalyse-Varianten wurde anhand von 200 Monte-Carlo-Datensätzen (multivariat normalverteilte Mixturen) zu überprüfen versucht, wobei jeweils unterschiedliche Proportionen der Daten-Elemente klassifiZiert werden mußten. Es zeigte sich, daß insgesamt gesehen die hierarchischen Algorithmen nach WARD und LANCE-WILUAMS am besten dazuZiel der vorliegenden Untersuchung war es, Aufschluß über die unterschiedliche Qualität hierarchischer und nicht-hierarchischer (partionierender) Clusteranalyseverfahren zu gewinnen. Die Reproduktionsgüte beider Clusteranalyse-Varianten wurde anhand von 200 Monte-Carlo-Datensätzen (multivariat normalverteilte Mixturen) zu überprüfen versucht, wobei jeweils unterschiedliche Proportionen der Daten-Elemente klassifiZiert werden mußten. Es zeigte sich, daß insgesamt gesehen die hierarchischen Algorithmen nach WARD und LANCE-WILUAMS am besten dazu in der Lage waren, die vorgegebenen Datenstrukturen zu reproduzieren, andererseits aber die herangezogenen partitionierenden KMEANS-Verfahren nicht schlechter abschnitten, wenn die Lösung der WARD-Technik als Start-Partition vorgegeben wurde.show moreshow less
  • In this study, a number of hierarchical dustering algorithms and nonhierarchical (i.e. iterative-partitioning) methods were compared with regard to accuracy on the basis of 200 monte carlo data sets. As main results, the two hierarchical procedures by WARD and LANCE-WILUAMS as weil as two nonhierarchicallc-means algorithm using WARDs solution as starting seeds proved tobe most robust. Although some of the remaining algorithms showed acceptabel recovery values when only a certain proportion of the elements had to be classified, it is recommendedIn this study, a number of hierarchical dustering algorithms and nonhierarchical (i.e. iterative-partitioning) methods were compared with regard to accuracy on the basis of 200 monte carlo data sets. As main results, the two hierarchical procedures by WARD and LANCE-WILUAMS as weil as two nonhierarchicallc-means algorithm using WARDs solution as starting seeds proved tobe most robust. Although some of the remaining algorithms showed acceptabel recovery values when only a certain proportion of the elements had to be classified, it is recommended to choose the few methods mentioned above for particular applications.show moreshow less
  • Le but de cette etude est d'obtenir des renseignements sur les differentes qualitees hierarchiques et non-hierarchiques (partionaires) procedes d'analyse de Clusters. Le qualite de reproduction des deux variantes d'analyse de Cluster a ete relevee et controlee a l'aide de 200 groupes de Monte-Cario (multivariation, melange de distribution normale). Pour chacune des proportions differentes, les elements de donnees ont du etre classes. On observe, dans l'ensemble, que l'algorithme hierarchique selon Ward etLance-Williams, est en mesure deLe but de cette etude est d'obtenir des renseignements sur les differentes qualitees hierarchiques et non-hierarchiques (partionaires) procedes d'analyse de Clusters. Le qualite de reproduction des deux variantes d'analyse de Cluster a ete relevee et controlee a l'aide de 200 groupes de Monte-Cario (multivariation, melange de distribution normale). Pour chacune des proportions differentes, les elements de donnees ont du etre classes. On observe, dans l'ensemble, que l'algorithme hierarchique selon Ward etLance-Williams, est en mesure de reproduire, le mieux, les structures de donnees impliquees. D'autre part, les procedes appliques de KMEANS-partionaires ne se detachent pas pour le moins de ces resultats lorsque Ia solution de Ia technique de Ward a été, au prealablement, donnée comme situation de depart.show moreshow less

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar Statistics
Metadaten
Author: Wolfgang Schneider, D. Scheibler
URN:urn:nbn:de:bvb:20-opus-69637
Document Type:Journal article
Faculties:Philosophische Fakultät III (bis Sept. 2007) / Institut für Psychologie (bis Sept. 2007)
Language:German
Year of Completion:1983
Source:In: Psychologische Beiträge, 1983, 25, S. 238-254
Dewey Decimal Classification:1 Philosophie und Psychologie / 15 Psychologie / 150 Psychologie
GND Keyword:Monte-Carlo-Simulation; Cluster-Analyse
Release Date:2014/06/11
Licence (German):License LogoDeutsches Urheberrecht