Probleme und Möglichkeiten bei der Bewertung von Clusteranalyse-Verfahren: II. Ergebnisse einer Monte-Carlo-Studie
On the evaluation of clustering algorithms: A Monte Carlo approach
Probleme et possibilite pour l'evaluation des procedes l'analyse de cluster
Please always quote using this URN: urn:nbn:de:bvb:20-opus-69637
- Ziel der vorliegenden Untersuchung war es, Aufschluß über die unterschiedliche Qualität hierarchischer und nicht-hierarchischer (partionierender) Clusteranalyseverfahren zu gewinnen. Die Reproduktionsgüte beider Clusteranalyse-Varianten wurde anhand von 200 Monte-Carlo-Datensätzen (multivariat normalverteilte Mixturen) zu überprüfen versucht, wobei jeweils unterschiedliche Proportionen der Daten-Elemente klassifiZiert werden mußten. Es zeigte sich, daß insgesamt gesehen die hierarchischen Algorithmen nach WARD und LANCE-WILUAMS am besten dazuZiel der vorliegenden Untersuchung war es, Aufschluß über die unterschiedliche Qualität hierarchischer und nicht-hierarchischer (partionierender) Clusteranalyseverfahren zu gewinnen. Die Reproduktionsgüte beider Clusteranalyse-Varianten wurde anhand von 200 Monte-Carlo-Datensätzen (multivariat normalverteilte Mixturen) zu überprüfen versucht, wobei jeweils unterschiedliche Proportionen der Daten-Elemente klassifiZiert werden mußten. Es zeigte sich, daß insgesamt gesehen die hierarchischen Algorithmen nach WARD und LANCE-WILUAMS am besten dazu in der Lage waren, die vorgegebenen Datenstrukturen zu reproduzieren, andererseits aber die herangezogenen partitionierenden KMEANS-Verfahren nicht schlechter abschnitten, wenn die Lösung der WARD-Technik als Start-Partition vorgegeben wurde.…
- In this study, a number of hierarchical dustering algorithms and nonhierarchical (i.e. iterative-partitioning) methods were compared with regard to accuracy on the basis of 200 monte carlo data sets. As main results, the two hierarchical procedures by WARD and LANCE-WILUAMS as weil as two nonhierarchicallc-means algorithm using WARDs solution as starting seeds proved tobe most robust. Although some of the remaining algorithms showed acceptabel recovery values when only a certain proportion of the elements had to be classified, it is recommendedIn this study, a number of hierarchical dustering algorithms and nonhierarchical (i.e. iterative-partitioning) methods were compared with regard to accuracy on the basis of 200 monte carlo data sets. As main results, the two hierarchical procedures by WARD and LANCE-WILUAMS as weil as two nonhierarchicallc-means algorithm using WARDs solution as starting seeds proved tobe most robust. Although some of the remaining algorithms showed acceptabel recovery values when only a certain proportion of the elements had to be classified, it is recommended to choose the few methods mentioned above for particular applications.…
- Le but de cette etude est d'obtenir des renseignements sur les differentes qualitees hierarchiques et non-hierarchiques (partionaires) procedes d'analyse de Clusters. Le qualite de reproduction des deux variantes d'analyse de Cluster a ete relevee et controlee a l'aide de 200 groupes de Monte-Cario (multivariation, melange de distribution normale). Pour chacune des proportions differentes, les elements de donnees ont du etre classes. On observe, dans l'ensemble, que l'algorithme hierarchique selon Ward etLance-Williams, est en mesure deLe but de cette etude est d'obtenir des renseignements sur les differentes qualitees hierarchiques et non-hierarchiques (partionaires) procedes d'analyse de Clusters. Le qualite de reproduction des deux variantes d'analyse de Cluster a ete relevee et controlee a l'aide de 200 groupes de Monte-Cario (multivariation, melange de distribution normale). Pour chacune des proportions differentes, les elements de donnees ont du etre classes. On observe, dans l'ensemble, que l'algorithme hierarchique selon Ward etLance-Williams, est en mesure de reproduire, le mieux, les structures de donnees impliquees. D'autre part, les procedes appliques de KMEANS-partionaires ne se detachent pas pour le moins de ces resultats lorsque Ia solution de Ia technique de Ward a été, au prealablement, donnée comme situation de depart.…
Author: | Wolfgang Schneider, D. Scheibler |
---|---|
URN: | urn:nbn:de:bvb:20-opus-69637 |
Document Type: | Journal article |
Faculties: | Philosophische Fakultät III (bis Sept. 2007) / Institut für Psychologie (bis Sept. 2007) |
Language: | German |
Year of Completion: | 1983 |
Source: | In: Psychologische Beiträge, 1983, 25, S. 238-254 |
Dewey Decimal Classification: | 1 Philosophie und Psychologie / 15 Psychologie / 150 Psychologie |
GND Keyword: | Monte-Carlo-Simulation; Cluster-Analyse |
Release Date: | 2014/06/11 |
Licence (German): | Deutsches Urheberrecht |