Refine
Has Fulltext
- yes (3)
Is part of the Bibliography
- yes (3) (remove)
Year of publication
- 1983 (3)
Document Type
- Journal article (3)
Language
- German (3) (remove)
Keywords
- Cluster-Analyse (3) (remove)
Institute
Es wird eine relativ einfach gehaltene Kurzcharakteristik derjenigen Clusteranalyse-Algorithmen gegeben, die aufgrund eines Literaturüberblicks (SCHNEIDER & SCHEIBLER 1983a) als die in der Fonchung hauptsächlich benutzten Verfahren einzustufen sind. Die Kurzbeschreibung verzichtet im wesentlichen auf statistische Details und verfolgt speziell das Ziel, dem Leser eine Vorstellung von Gemeinsamkeiten und Untenchieden in der Funktionsweise von hierarchischen Clusteranalysen, Optimierungs- bzw. Partitionierungstechniken, Dichteverfahren, "Clumping Techniques" und anderen Prozeduren zu geben.
Ziel der vorliegenden Untersuchung war es, Aufschluß über die unterschiedliche Qualität hierarchischer und nicht-hierarchischer (partionierender) Clusteranalyseverfahren zu gewinnen. Die Reproduktionsgüte beider Clusteranalyse-Varianten wurde anhand von 200 Monte-Carlo-Datensätzen (multivariat normalverteilte Mixturen) zu überprüfen versucht, wobei jeweils unterschiedliche Proportionen der Daten-Elemente klassifiZiert werden mußten. Es zeigte sich, daß insgesamt gesehen die hierarchischen Algorithmen nach WARD und LANCE-WILUAMS am besten dazu in der Lage waren, die vorgegebenen Datenstrukturen zu reproduzieren, andererseits aber die herangezogenen partitionierenden KMEANS-Verfahren nicht schlechter abschnitten, wenn die Lösung der WARD-Technik als Start-Partition vorgegeben wurde.
Es wird ein Oberblick über Evaluationsstudien gegeben, die sich mit der Validität von Clusteranalyse-Algorithmen befassen. Im Anschluß an die Diskussion möglicher Bewertungskriterien werden Vergleichsuntersuchungen näher analysiert und danach geordnet, ob sie empirische Datensätze, Plasmaden oder Monte-Carlo-Datensätze als Evaluationsgrundlage benutzen. Die Obersicht über komplexer angelegte Monte-Carlo-Studien zeigt die unterschiedliche Qualität der verfügbaren Clusteranalyse-Algorithmen auf, macht andererseits aber auch deutlich, daß bestimmte hierarchisch-agglomerative Verfahren wie etwa die Methoden nachWARD oder LANCE-WILLIAMS bzw. iterativpartitionierende Prozeduren wie etwa die KMEANS-Algorithmen als relativ robuste Klassifikationsverfahren gelten können.