@article{SchneiderScheibler1983, author = {Schneider, Wolfgang and Scheibler, D.}, title = {Probleme und M{\"o}glichkeiten bei der Bewertung von Clusteranalyse-Verfahren: III. Appendix: Kurzbeschreibung der verbreitetsten Clusteranalyse-Algorithmen}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-69643}, year = {1983}, abstract = {Es wird eine relativ einfach gehaltene Kurzcharakteristik derjenigen Clusteranalyse-Algorithmen gegeben, die aufgrund eines Literatur{\"u}berblicks (SCHNEIDER \& SCHEIBLER 1983a) als die in der Fonchung haupts{\"a}chlich benutzten Verfahren einzustufen sind. Die Kurzbeschreibung verzichtet im wesentlichen auf statistische Details und verfolgt speziell das Ziel, dem Leser eine Vorstellung von Gemeinsamkeiten und Untenchieden in der Funktionsweise von hierarchischen Clusteranalysen, Optimierungs- bzw. Partitionierungstechniken, Dichteverfahren, "Clumping Techniques" und anderen Prozeduren zu geben.}, subject = {Cluster-Analyse}, language = {de} } @article{SchneiderScheibler1983, author = {Schneider, Wolfgang and Scheibler, D.}, title = {Probleme und M{\"o}glichkeiten bei der Bewertung von Clusteranalyse-Verfahren: II. Ergebnisse einer Monte-Carlo-Studie}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-69637}, year = {1983}, abstract = {Ziel der vorliegenden Untersuchung war es, Aufschluß {\"u}ber die unterschiedliche Qualit{\"a}t hierarchischer und nicht-hierarchischer (partionierender) Clusteranalyseverfahren zu gewinnen. Die Reproduktionsg{\"u}te beider Clusteranalyse-Varianten wurde anhand von 200 Monte-Carlo-Datens{\"a}tzen (multivariat normalverteilte Mixturen) zu {\"u}berpr{\"u}fen versucht, wobei jeweils unterschiedliche Proportionen der Daten-Elemente klassifiZiert werden mußten. Es zeigte sich, daß insgesamt gesehen die hierarchischen Algorithmen nach WARD und LANCE-WILUAMS am besten dazu in der Lage waren, die vorgegebenen Datenstrukturen zu reproduzieren, andererseits aber die herangezogenen partitionierenden KMEANS-Verfahren nicht schlechter abschnitten, wenn die L{\"o}sung der WARD-Technik als Start-Partition vorgegeben wurde.}, subject = {Monte-Carlo-Simulation}, language = {de} } @article{SchneiderScheibler1983, author = {Schneider, Wolfgang and Scheibler, D.}, title = {Probleme und M{\"o}glichkeiten bei der Bewertung von Clusteranalysen: I. Ein {\"U}berblick {\"u}ber einschl{\"a}gige Evaluationsstudien}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-87288}, year = {1983}, abstract = {Es wird ein Oberblick {\"u}ber Evaluationsstudien gegeben, die sich mit der Validit{\"a}t von Clusteranalyse-Algorithmen befassen. Im Anschluß an die Diskussion m{\"o}glicher Bewertungskriterien werden Vergleichsuntersuchungen n{\"a}her analysiert und danach geordnet, ob sie empirische Datens{\"a}tze, Plasmaden oder Monte-Carlo-Datens{\"a}tze als Evaluationsgrundlage benutzen. Die Obersicht {\"u}ber komplexer angelegte Monte-Carlo-Studien zeigt die unterschiedliche Qualit{\"a}t der verf{\"u}gbaren Clusteranalyse-Algorithmen auf, macht andererseits aber auch deutlich, daß bestimmte hierarchisch-agglomerative Verfahren wie etwa die Methoden nachWARD oder LANCE-WILLIAMS bzw. iterativpartitionierende Prozeduren wie etwa die KMEANS-Algorithmen als relativ robuste Klassifikationsverfahren gelten k{\"o}nnen.}, subject = {Cluster-Analyse}, language = {de} } @phdthesis{Engelmann2008, author = {Engelmann, Julia Cath{\´e}rine}, title = {DNA microarrays: applications and novel approaches for analysis and interpretation}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-29747}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2008}, abstract = {In der vorliegenden Dissertation wird die Entwicklung eines phylogenetischen DNA Microarrays, die Analyse von mehreren Microarray-Genexpressionsdatens{\"a}tzen und neue Ans{\"a}tze f{\"u}r die Datenanalyse und Interpretation der Ergebnisse vorgestellt. Die Entwicklung und Analyse der Daten eines phylogenetischen DNA Microarrays wird in der ersten Publikation dargestellt. Ich konnte zeigen, dass die Spezies-Detektion mit phylogenetischen Microarrays durch die Datenanalyse mit einem linearen Regressionsansatz signifikant verbessert werden kann. Standard-Methoden haben bislang nur Signalintensit{\"a}ten betrachtet und eine Spezies als an- oder abwesend bezeichnet, wenn die Signalintensit{\"a}t ihres Messpunktes oberhalb eines willk{\"u}rlich gesetzten Schwellenwertes lag. Dieses Verfahren ist allerdings aufgrund von Kreuz-Hybridisierungen nicht auf sehr nah verwandte Spezies mit hoher Sequenzidentit{\"a}t anwendbar. Durch die Modellierung des Hybridisierungs und Kreuz-Hybridisierungsverhaltens mit einem linearen Regressionsmodell konnte ich zeigen, dass Spezies mit einer Sequenz{\"a}hnlichkeit von 97\% im Markergen immer noch unterschieden werden k{\"o}nnen. Ein weiterer Vorteil der Modellierung ist, dass auch Mischungen verschiedener Spezies zuverl{\"a}ssig vorhergesagt werden k{\"o}nnen. Theoretisch sind auch quantitative Vorhersagen mit diesem Modell m{\"o}glich. Um die großen Datenmengen, die in {\"o}ffentlichen Microarray-Datenbanken abgelegt sind besser nutzen zu k{\"o}nnen, bieten sich Meta-Analysen an. In der zweiten Publikation wird eine explorative Meta-Analyse auf Arabidopsis thaliana-Datens{\"a}tzen vorgestellt. Mit der Analyse verschiedener Datens{\"a}tze, die den Einfluss von Pflanzenhormonen, Pathogenen oder verschiedenen Mutationen auf die Genexpression untersucht haben, konnten die Datens{\"a}tze anhand ihrer Genexpressionsprofile in drei große Gruppen eingeordnet werden: Experimente mit Indol-3-Essigs{\"a}ure (IAA), mit Pathogenen und andere Experimente. Gene, die charakteristisch f{\"u}r die Gruppe der IAA-Datens{\"a}tze beziehungsweise f{\"u}r die Gruppe der Pathogen-Datens{\"a}tze sind, wurden n{\"a}her betrachtet. Diese Gene hatten Funktionen, die bereits mit Pathogenbefall bzw. dem Einfluss von IAA in Verbindung gebracht wurden. Außerdem wurden Hypothesen {\"u}ber die Funktionen von bislang nicht annotierten Genen aufgestellt. In dieser Arbeit werden auch Prim{\"a}ranalysen von einzelnen Arabidopsis thaliana Genexpressions-Datens{\"a}tzen vorgestellt. In der dritten Publikation wird ein Experiment beschrieben, das durchgef{\"u}hrt wurde um herauszufinden ob Mikrowellen-Strahlung einen Einfluss auf die Genexpression einer Zellkultur hat. Dazu wurden explorative Analysemethoden angewendet. Es wurden geringe aber signifikante Ver{\"a}nderungen in einer sehr kleinen Anzahl von Genen beobachtet, die experimentell best{\"a}tigt werden konnten. Die Funktionen der regulierten Gene und eine Meta-Analyse mit {\"o}ffentlich zug{\"a}nglichen Datens{\"a}tzen einer Datenbank deuten darauf hin, dass die pflanzliche Zellkultur die Strahlung als eine Art Energiequelle {\"a}hnlich dem Licht wahrnimmt. Des weiteren wird in der vierten Publikation die funktionelle Analyse eines Arabidopsis thaliana Genexpressionsdatensatzes beschrieben. Die Analyse der Genexpressions eines pflanzlichen Tumores zeigte, dass er seinen Stoffwechsel von aerob und auxotroph auf anaerob und heterotroph umstellt. Gene der Photosynthese werden im Tumorgewebe reprimiert, Gene des Aminos{\"a}ure- und Fettstoffwechsels, der Zellwand und Transportkan{\"a}le werden so reguliert, dass Wachstum und Entwicklung des Tumors gef{\"o}rdert werden. In der f{\"u}nften Publikation in dieser Arbeit wird GEPAT (Genome Expression Pathway Analysis Tool) beschrieben. Es besteht aus einer Internet- Anwendung und einer Datenbank, die das einfache Hochladen von Datens{\"a}tzen in die Datenbank und viele M{\"o}glichkeiten der Datenanalyse und die Integration anderer Datentypen erlaubt. In den folgenden zwei Publikationen (Publikation 6 und Publikation 7) wird GEPAT auf humane Microarray-Datens{\"a}tze angewendet um Genexpressionsdaten mit weiteren Datentypen zu verkn{\"u}pfen. Genexpressionsdaten und Daten aus vergleichender Genom-Hybridisierung (CGH) von prim{\"a}ren Tumoren von 71 Mantel-Zell-Lymphom (MCL) Patienten erm{\"o}glichte die Ermittlung eines Pr{\"a}diktors, der die Vorhersage der {\"U}berlebensdauer von Patienten gegen{\"u}ber herk{\"o}mmlichen Methoden verbessert. Die Analyse der CGH Daten zeigte, dass auch diese f{\"u}r die Vorhersage der {\"U}berlebensdauer geeignet sind. F{\"u}r den Datensatz von Patienten mit großzellig diffusem B-Zell-Lymphom DLBCL konnte aus den Genexpressionsdaten ebenfalls ein neuer Pr{\"a}diktor vorgeschlagen werden. Mit den zwischen lang und kurz {\"u}berlebenden Patienten differentiell exprimierten Genen der MCL Patienten und mit den Genen, die zwischen den beiden Untergruppen von DLBCL reguliert sind, wurden Interaktionsnetzwerke gebildet. Diese zeigen, dass bei beiden Krebstypen Gene des Zellzyklus und der Proliferation zwischen Patienten mit kurzer und langer {\"U}berlebensdauer unterschiedlich reguliert sind.}, subject = {Microarray}, language = {en} }