@phdthesis{Engelmann2008, author = {Engelmann, Julia Cath{\´e}rine}, title = {DNA microarrays: applications and novel approaches for analysis and interpretation}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-29747}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2008}, abstract = {In der vorliegenden Dissertation wird die Entwicklung eines phylogenetischen DNA Microarrays, die Analyse von mehreren Microarray-Genexpressionsdatens{\"a}tzen und neue Ans{\"a}tze f{\"u}r die Datenanalyse und Interpretation der Ergebnisse vorgestellt. Die Entwicklung und Analyse der Daten eines phylogenetischen DNA Microarrays wird in der ersten Publikation dargestellt. Ich konnte zeigen, dass die Spezies-Detektion mit phylogenetischen Microarrays durch die Datenanalyse mit einem linearen Regressionsansatz signifikant verbessert werden kann. Standard-Methoden haben bislang nur Signalintensit{\"a}ten betrachtet und eine Spezies als an- oder abwesend bezeichnet, wenn die Signalintensit{\"a}t ihres Messpunktes oberhalb eines willk{\"u}rlich gesetzten Schwellenwertes lag. Dieses Verfahren ist allerdings aufgrund von Kreuz-Hybridisierungen nicht auf sehr nah verwandte Spezies mit hoher Sequenzidentit{\"a}t anwendbar. Durch die Modellierung des Hybridisierungs und Kreuz-Hybridisierungsverhaltens mit einem linearen Regressionsmodell konnte ich zeigen, dass Spezies mit einer Sequenz{\"a}hnlichkeit von 97\% im Markergen immer noch unterschieden werden k{\"o}nnen. Ein weiterer Vorteil der Modellierung ist, dass auch Mischungen verschiedener Spezies zuverl{\"a}ssig vorhergesagt werden k{\"o}nnen. Theoretisch sind auch quantitative Vorhersagen mit diesem Modell m{\"o}glich. Um die großen Datenmengen, die in {\"o}ffentlichen Microarray-Datenbanken abgelegt sind besser nutzen zu k{\"o}nnen, bieten sich Meta-Analysen an. In der zweiten Publikation wird eine explorative Meta-Analyse auf Arabidopsis thaliana-Datens{\"a}tzen vorgestellt. Mit der Analyse verschiedener Datens{\"a}tze, die den Einfluss von Pflanzenhormonen, Pathogenen oder verschiedenen Mutationen auf die Genexpression untersucht haben, konnten die Datens{\"a}tze anhand ihrer Genexpressionsprofile in drei große Gruppen eingeordnet werden: Experimente mit Indol-3-Essigs{\"a}ure (IAA), mit Pathogenen und andere Experimente. Gene, die charakteristisch f{\"u}r die Gruppe der IAA-Datens{\"a}tze beziehungsweise f{\"u}r die Gruppe der Pathogen-Datens{\"a}tze sind, wurden n{\"a}her betrachtet. Diese Gene hatten Funktionen, die bereits mit Pathogenbefall bzw. dem Einfluss von IAA in Verbindung gebracht wurden. Außerdem wurden Hypothesen {\"u}ber die Funktionen von bislang nicht annotierten Genen aufgestellt. In dieser Arbeit werden auch Prim{\"a}ranalysen von einzelnen Arabidopsis thaliana Genexpressions-Datens{\"a}tzen vorgestellt. In der dritten Publikation wird ein Experiment beschrieben, das durchgef{\"u}hrt wurde um herauszufinden ob Mikrowellen-Strahlung einen Einfluss auf die Genexpression einer Zellkultur hat. Dazu wurden explorative Analysemethoden angewendet. Es wurden geringe aber signifikante Ver{\"a}nderungen in einer sehr kleinen Anzahl von Genen beobachtet, die experimentell best{\"a}tigt werden konnten. Die Funktionen der regulierten Gene und eine Meta-Analyse mit {\"o}ffentlich zug{\"a}nglichen Datens{\"a}tzen einer Datenbank deuten darauf hin, dass die pflanzliche Zellkultur die Strahlung als eine Art Energiequelle {\"a}hnlich dem Licht wahrnimmt. Des weiteren wird in der vierten Publikation die funktionelle Analyse eines Arabidopsis thaliana Genexpressionsdatensatzes beschrieben. Die Analyse der Genexpressions eines pflanzlichen Tumores zeigte, dass er seinen Stoffwechsel von aerob und auxotroph auf anaerob und heterotroph umstellt. Gene der Photosynthese werden im Tumorgewebe reprimiert, Gene des Aminos{\"a}ure- und Fettstoffwechsels, der Zellwand und Transportkan{\"a}le werden so reguliert, dass Wachstum und Entwicklung des Tumors gef{\"o}rdert werden. In der f{\"u}nften Publikation in dieser Arbeit wird GEPAT (Genome Expression Pathway Analysis Tool) beschrieben. Es besteht aus einer Internet- Anwendung und einer Datenbank, die das einfache Hochladen von Datens{\"a}tzen in die Datenbank und viele M{\"o}glichkeiten der Datenanalyse und die Integration anderer Datentypen erlaubt. In den folgenden zwei Publikationen (Publikation 6 und Publikation 7) wird GEPAT auf humane Microarray-Datens{\"a}tze angewendet um Genexpressionsdaten mit weiteren Datentypen zu verkn{\"u}pfen. Genexpressionsdaten und Daten aus vergleichender Genom-Hybridisierung (CGH) von prim{\"a}ren Tumoren von 71 Mantel-Zell-Lymphom (MCL) Patienten erm{\"o}glichte die Ermittlung eines Pr{\"a}diktors, der die Vorhersage der {\"U}berlebensdauer von Patienten gegen{\"u}ber herk{\"o}mmlichen Methoden verbessert. Die Analyse der CGH Daten zeigte, dass auch diese f{\"u}r die Vorhersage der {\"U}berlebensdauer geeignet sind. F{\"u}r den Datensatz von Patienten mit großzellig diffusem B-Zell-Lymphom DLBCL konnte aus den Genexpressionsdaten ebenfalls ein neuer Pr{\"a}diktor vorgeschlagen werden. Mit den zwischen lang und kurz {\"u}berlebenden Patienten differentiell exprimierten Genen der MCL Patienten und mit den Genen, die zwischen den beiden Untergruppen von DLBCL reguliert sind, wurden Interaktionsnetzwerke gebildet. Diese zeigen, dass bei beiden Krebstypen Gene des Zellzyklus und der Proliferation zwischen Patienten mit kurzer und langer {\"U}berlebensdauer unterschiedlich reguliert sind.}, subject = {Microarray}, language = {en} }