@phdthesis{Busold2006, author = {Busold, Christian}, title = {Facilitating functional interpretation of microarray data by integration of gene annotations in Correspondence Analysis}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-21150}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2006}, abstract = {DNS-Chips ('Microarrays') haben sich zu einer der Standardmethoden zur Erstellung von genomweiten Expressionsstudien entwickelt. Mittlerweile wurden dazu eine Vielzahl von Methoden zur Identifizierung von differentiell regulierten Genen ver{\"o}ffentlicht. Ungeachtet dessen stellt die abschliessende funktionelle Interpretation der Ergebnisse einen der Engp{\"a}sse in der Analyse von Chip-Daten dar. Die Mehrzahl der Analysemethoden stellt die signifikant regulierten Gene in Listen dar, aus denen in einem weiteren Schritt gemeinsame funktionelle Eigenschaften abgeleitet werden m{\"u}ssen. Dies stellt nicht nur eine arbeitsintensive Arbeit dar, die mit steigender Anzahl an experimentellen Konditionen immer weniger praktikabel wird, sondern ist auch fehleranf{\"a}llig, da diese Auswertung im allgemeinen auf dem visuellen Vergleich von Listen beruht. In der vorliegenden Arbeit wurden Methoden f{\"u}r eine rechnergest{\"u}tzte Auswertung von funktionellen Geneigenschaften entwickelt und validiert. Hierzu wurde die 'Gene Ontology' als Quelle f{\"u}r die Annotationsdaten ausgew{\"a}hlt, da hier die Daten in einem Format gespeichert sind, das sowohl eine leichte menschliche Interaktion sowie die statistische Analyse der Annotationen erm{\"o}glicht. Diese Genannotation wurden als Zusatzinformationen in die Korrespondenzanalyse integriert, welches eine simultane Darstellung von Genen, Hybridisierungen und funktionellen Kategorien in einer Grafik erm{\"o}glicht. Aufgrund der st{\"a}ndig wachsenden Anzahl an verf{\"u}gbaren Annotationen und der Tatsache, daß zwischen den meisten experimentellen Bedingungen nur wenige funktionelle Prozesse differentiell reguliert sind, wurden Filter entwickelt, die die Anzahl der dargestellten Annotationen auf eine im gegebenen experimentellen Kontext relevante Gruppe reduzieren. Die Anwendbarkeit der Visualisierung und der Filter wurde auf Datens{\"a}tzen unterschiedlicher Komplexit{\"a}t getestet: beginnend mit dem gut verstandenen Glukosestoffwechsel im Modellorganismus S. cerevisiae, bis hin zum Vergleich unterschiedlicher Tumortypen im Menschen. In beiden F{\"a}llen generierte die Methode gut zu interpretierende Grafiken, in denen die funktionellen Hauptunterschiede durch die dargestellten Annotationen gut beschrieben werden [90]. W{\"a}hrend die Integration von Annotationsdaten wie GO die funktionelle Interpretation vereinfacht, fehlt die M{\"o}glichkeit zur Identifikation einzelner relevanter Schl{\"u}sselgene. Um eine solche Analyse zu erm{\"o}glichen, wurden Daten zum Vorkommen von Transskriptionsfaktorbindestellen in den 5'-Bereichen von Genen integriert. Auch diese Methode wurde an Datens{\"a}tzen von S. cerevisiae und vergleichenden Studien von humanen Krebszelllinien validiert.In beiden F{\"a}llen konnten Transkriptionsfaktoren identifiziert werden, die f{\"u}r die beobachteten transkriptionellen Unterschiede von entscheidender Bedeutung sind [206]. Zusammenfassend, erm{\"o}glicht die Integration von Zusatzinformationen in die Korrespondenzanalyse eine simultane Visualisierung von Genen, Hybridisierungen und Annotationsdaten in einer einzigen, gut zu interpretierenden Grafik. Dies erlaubt auch in komplexen experimentellen Bedingungen eine intuitive Identifizierung von relevanten Annotationen. Der hier vorgestellte Ansatz, ist nicht auf die gezeigten Datenstrukturen beschr{\"a}nkt, sondern kann auf die Mehrzahl der verf{\"u}gbaren Annotationsdaten angewendet werden.}, subject = {Microarray}, language = {en} }