Probleme und Möglichkeiten bei der Bewertung von Clusteranalyse-Verfahren: II. Ergebnisse einer Monte-Carlo-Studie
On the evaluation of clustering algorithms: A Monte Carlo approach
Probleme et possibilite pour l'evaluation des procedes l'analyse de cluster
Zitieren Sie bitte immer diese URN: urn:nbn:de:bvb:20-opus-69637
- Ziel der vorliegenden Untersuchung war es, Aufschluß über die unterschiedliche Qualität hierarchischer und nicht-hierarchischer (partionierender) Clusteranalyseverfahren zu gewinnen. Die Reproduktionsgüte beider Clusteranalyse-Varianten wurde anhand von 200 Monte-Carlo-Datensätzen (multivariat normalverteilte Mixturen) zu überprüfen versucht, wobei jeweils unterschiedliche Proportionen der Daten-Elemente klassifiZiert werden mußten. Es zeigte sich, daß insgesamt gesehen die hierarchischen Algorithmen nach WARD und LANCE-WILUAMS am besten dazuZiel der vorliegenden Untersuchung war es, Aufschluß über die unterschiedliche Qualität hierarchischer und nicht-hierarchischer (partionierender) Clusteranalyseverfahren zu gewinnen. Die Reproduktionsgüte beider Clusteranalyse-Varianten wurde anhand von 200 Monte-Carlo-Datensätzen (multivariat normalverteilte Mixturen) zu überprüfen versucht, wobei jeweils unterschiedliche Proportionen der Daten-Elemente klassifiZiert werden mußten. Es zeigte sich, daß insgesamt gesehen die hierarchischen Algorithmen nach WARD und LANCE-WILUAMS am besten dazu in der Lage waren, die vorgegebenen Datenstrukturen zu reproduzieren, andererseits aber die herangezogenen partitionierenden KMEANS-Verfahren nicht schlechter abschnitten, wenn die Lösung der WARD-Technik als Start-Partition vorgegeben wurde.…
- In this study, a number of hierarchical dustering algorithms and nonhierarchical (i.e. iterative-partitioning) methods were compared with regard to accuracy on the basis of 200 monte carlo data sets. As main results, the two hierarchical procedures by WARD and LANCE-WILUAMS as weil as two nonhierarchicallc-means algorithm using WARDs solution as starting seeds proved tobe most robust. Although some of the remaining algorithms showed acceptabel recovery values when only a certain proportion of the elements had to be classified, it is recommendedIn this study, a number of hierarchical dustering algorithms and nonhierarchical (i.e. iterative-partitioning) methods were compared with regard to accuracy on the basis of 200 monte carlo data sets. As main results, the two hierarchical procedures by WARD and LANCE-WILUAMS as weil as two nonhierarchicallc-means algorithm using WARDs solution as starting seeds proved tobe most robust. Although some of the remaining algorithms showed acceptabel recovery values when only a certain proportion of the elements had to be classified, it is recommended to choose the few methods mentioned above for particular applications.…
- Le but de cette etude est d'obtenir des renseignements sur les differentes qualitees hierarchiques et non-hierarchiques (partionaires) procedes d'analyse de Clusters. Le qualite de reproduction des deux variantes d'analyse de Cluster a ete relevee et controlee a l'aide de 200 groupes de Monte-Cario (multivariation, melange de distribution normale). Pour chacune des proportions differentes, les elements de donnees ont du etre classes. On observe, dans l'ensemble, que l'algorithme hierarchique selon Ward etLance-Williams, est en mesure deLe but de cette etude est d'obtenir des renseignements sur les differentes qualitees hierarchiques et non-hierarchiques (partionaires) procedes d'analyse de Clusters. Le qualite de reproduction des deux variantes d'analyse de Cluster a ete relevee et controlee a l'aide de 200 groupes de Monte-Cario (multivariation, melange de distribution normale). Pour chacune des proportions differentes, les elements de donnees ont du etre classes. On observe, dans l'ensemble, que l'algorithme hierarchique selon Ward etLance-Williams, est en mesure de reproduire, le mieux, les structures de donnees impliquees. D'autre part, les procedes appliques de KMEANS-partionaires ne se detachent pas pour le moins de ces resultats lorsque Ia solution de Ia technique de Ward a été, au prealablement, donnée comme situation de depart.…
Autor(en): | Wolfgang Schneider, D. Scheibler |
---|---|
URN: | urn:nbn:de:bvb:20-opus-69637 |
Dokumentart: | Artikel / Aufsatz in einer Zeitschrift |
Institute der Universität: | Philosophische Fakultät III (bis Sept. 2007) / Institut für Psychologie (bis Sept. 2007) |
Sprache der Veröffentlichung: | Deutsch |
Erscheinungsjahr: | 1983 |
Originalveröffentlichung / Quelle: | In: Psychologische Beiträge, 1983, 25, S. 238-254 |
Allgemeine fachliche Zuordnung (DDC-Klassifikation): | 1 Philosophie und Psychologie / 15 Psychologie / 150 Psychologie |
Normierte Schlagworte (GND): | Monte-Carlo-Simulation; Cluster-Analyse |
Datum der Freischaltung: | 11.06.2014 |
Lizenz (Deutsch): | Deutsches Urheberrecht |