TY - JOUR A1 - Schneider, Wolfgang A1 - Scheibler, D. T1 - Probleme und Möglichkeiten bei der Bewertung von Clusteranalysen: I. Ein Überblick über einschlägige Evaluationsstudien T1 - On the evaluation of dustering algorithms: An integrative review T1 - Procédés de Cluster-analyse N2 - Es wird ein Oberblick über Evaluationsstudien gegeben, die sich mit der Validität von Clusteranalyse-Algorithmen befassen. Im Anschluß an die Diskussion möglicher Bewertungskriterien werden Vergleichsuntersuchungen näher analysiert und danach geordnet, ob sie empirische Datensätze, Plasmaden oder Monte-Carlo-Datensätze als Evaluationsgrundlage benutzen. Die Obersicht über komplexer angelegte Monte-Carlo-Studien zeigt die unterschiedliche Qualität der verfügbaren Clusteranalyse-Algorithmen auf, macht andererseits aber auch deutlich, daß bestimmte hierarchisch-agglomerative Verfahren wie etwa die Methoden nachWARD oder LANCE-WILLIAMS bzw. iterativpartitionierende Prozeduren wie etwa die KMEANS-Algorithmen als relativ robuste Klassifikationsverfahren gelten können. N2 - This paper presents a critical review of research on the evaluation of dustering algorithms. The review includes studies using empirical data sets and studies using so-called "plasmodes" (i. e., empirical data sets with known distributional parameters), but particularly concentrates on investigations using Monte-cario data sets. Although it turns out to be very difficult to come to a valid evaluation of the various clustering algorithms, hierarchical-agglomerative procedures like WARDsand LANCE-WILUAMs methods as well as the KMEANS algorithms appear to be most robust. N2 - L'article suivant pn!sente une revue des etudes d'evaluation qui relevent de validite d'analyse de Cluster-Algorithme. Des experiences de comparaison sont analysees et classees a Ia Suite de la discution de criteres de jugement possible. Ceux-ci suivent un ordre donne par l'utilisation de donnees qui ont ete relevees empiriquement, «Plasmoden>> ou bien de donnees empiriquement accumulees selon Je principe d'evaluation de Monte-Carlo. La revue d'etude complexe Monte-Carlo montre Ia difference qualitative des analyses Cluster algorithme et, d'autre part met clairement en valeur, que des procedes hierarchiques-agglomeratifs, comme la methode de WARD ou LANCE-WILLIAMS, par exemple - c'est-a-dire des procedes «iteratif-partitionierende» {iteratif comme par exemple, les algorithmes KMEANS, qui peuvent etre consideres comme procedes de classification robuste. KW - Cluster-Analyse KW - Methode Y1 - 1983 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-87288 ER - TY - JOUR A1 - Schneider, Wolfgang A1 - Scheibler, D. T1 - Probleme und Möglichkeiten bei der Bewertung von Clusteranalyse-Verfahren: III. Appendix: Kurzbeschreibung der verbreitetsten Clusteranalyse-Algorithmen T1 - On the evaluation of clustering algorithms, III. Appendix: a description of the most popular algorithms T1 - Problemeset cossibilites d'evaluation de procedes des analyses Cluster, III. Appendix: Courte description des Algorithmes analyse Cluster les plus rependues N2 - Es wird eine relativ einfach gehaltene Kurzcharakteristik derjenigen Clusteranalyse-Algorithmen gegeben, die aufgrund eines Literaturüberblicks (SCHNEIDER & SCHEIBLER 1983a) als die in der Fonchung hauptsächlich benutzten Verfahren einzustufen sind. Die Kurzbeschreibung verzichtet im wesentlichen auf statistische Details und verfolgt speziell das Ziel, dem Leser eine Vorstellung von Gemeinsamkeiten und Untenchieden in der Funktionsweise von hierarchischen Clusteranalysen, Optimierungs- bzw. Partitionierungstechniken, Dichteverfahren, "Clumping Techniques" und anderen Prozeduren zu geben. N2 - This paper presents a summary of 18 clustering algorithms most frequently applied in reseuch (cf. SCHNEIDER & SCHEIBLEK 1983a). Only a short description of each procedure is provided which aims at highlighting the basic differences and comrnonalities of hierarchical clustering algorithms, iterative partitioning methods, mode seeking techniques, clumping techniques, and other procedures. N2 - Les Algorithmes analyse Cluster qui sont decritent par (Schneider & Scheibler 1983) comme etant les procedes les plus rependus dans Ia recherche sont relates ici de facon courte. Le description chematique exclue l'ennumeration des details statistiques et a pour but essentiel de transmettre au lecteur, entre autre, une representation des rapports et des differences dans Je mode de fonction des analyses Cluster hierarchiques, des techniques d'optimation, et des procedes de population «Clumping techniques» etc. KW - Cluster-Analyse Y1 - 1983 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-69643 ER - TY - JOUR A1 - Schneider, Wolfgang A1 - Scheibler, D. T1 - Probleme und Möglichkeiten bei der Bewertung von Clusteranalyse-Verfahren: II. Ergebnisse einer Monte-Carlo-Studie T1 - On the evaluation of clustering algorithms: A Monte Carlo approach T1 - Probleme et possibilite pour l'evaluation des procedes l'analyse de cluster N2 - Ziel der vorliegenden Untersuchung war es, Aufschluß über die unterschiedliche Qualität hierarchischer und nicht-hierarchischer (partionierender) Clusteranalyseverfahren zu gewinnen. Die Reproduktionsgüte beider Clusteranalyse-Varianten wurde anhand von 200 Monte-Carlo-Datensätzen (multivariat normalverteilte Mixturen) zu überprüfen versucht, wobei jeweils unterschiedliche Proportionen der Daten-Elemente klassifiZiert werden mußten. Es zeigte sich, daß insgesamt gesehen die hierarchischen Algorithmen nach WARD und LANCE-WILUAMS am besten dazu in der Lage waren, die vorgegebenen Datenstrukturen zu reproduzieren, andererseits aber die herangezogenen partitionierenden KMEANS-Verfahren nicht schlechter abschnitten, wenn die Lösung der WARD-Technik als Start-Partition vorgegeben wurde. N2 - In this study, a number of hierarchical dustering algorithms and nonhierarchical (i.e. iterative-partitioning) methods were compared with regard to accuracy on the basis of 200 monte carlo data sets. As main results, the two hierarchical procedures by WARD and LANCE-WILUAMS as weil as two nonhierarchicallc-means algorithm using WARDs solution as starting seeds proved tobe most robust. Although some of the remaining algorithms showed acceptabel recovery values when only a certain proportion of the elements had to be classified, it is recommended to choose the few methods mentioned above for particular applications. N2 - Le but de cette etude est d'obtenir des renseignements sur les differentes qualitees hierarchiques et non-hierarchiques (partionaires) procedes d'analyse de Clusters. Le qualite de reproduction des deux variantes d'analyse de Cluster a ete relevee et controlee a l'aide de 200 groupes de Monte-Cario (multivariation, melange de distribution normale). Pour chacune des proportions differentes, les elements de donnees ont du etre classes. On observe, dans l'ensemble, que l'algorithme hierarchique selon Ward etLance-Williams, est en mesure de reproduire, le mieux, les structures de donnees impliquees. D'autre part, les procedes appliques de KMEANS-partionaires ne se detachent pas pour le moins de ces resultats lorsque Ia solution de Ia technique de Ward a été, au prealablement, donnée comme situation de depart. KW - Monte-Carlo-Simulation KW - Cluster-Analyse Y1 - 1983 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-69637 ER -