TY - THES A1 - Engelmann, Julia Cathérine T1 - DNA microarrays: applications and novel approaches for analysis and interpretation T1 - DNA Mikroarrays: Anwendungen und neue Ansätze für die Analyse und Interpretation N2 - In der vorliegenden Dissertation wird die Entwicklung eines phylogenetischen DNA Microarrays, die Analyse von mehreren Microarray-Genexpressionsdatensätzen und neue Ansätze für die Datenanalyse und Interpretation der Ergebnisse vorgestellt. Die Entwicklung und Analyse der Daten eines phylogenetischen DNA Microarrays wird in der ersten Publikation dargestellt. Ich konnte zeigen, dass die Spezies-Detektion mit phylogenetischen Microarrays durch die Datenanalyse mit einem linearen Regressionsansatz signifikant verbessert werden kann. Standard-Methoden haben bislang nur Signalintensitäten betrachtet und eine Spezies als an- oder abwesend bezeichnet, wenn die Signalintensität ihres Messpunktes oberhalb eines willkürlich gesetzten Schwellenwertes lag. Dieses Verfahren ist allerdings aufgrund von Kreuz-Hybridisierungen nicht auf sehr nah verwandte Spezies mit hoher Sequenzidentität anwendbar. Durch die Modellierung des Hybridisierungs und Kreuz-Hybridisierungsverhaltens mit einem linearen Regressionsmodell konnte ich zeigen, dass Spezies mit einer Sequenzähnlichkeit von 97% im Markergen immer noch unterschieden werden können. Ein weiterer Vorteil der Modellierung ist, dass auch Mischungen verschiedener Spezies zuverlässig vorhergesagt werden können. Theoretisch sind auch quantitative Vorhersagen mit diesem Modell möglich. Um die großen Datenmengen, die in öffentlichen Microarray-Datenbanken abgelegt sind besser nutzen zu können, bieten sich Meta-Analysen an. In der zweiten Publikation wird eine explorative Meta-Analyse auf Arabidopsis thaliana-Datensätzen vorgestellt. Mit der Analyse verschiedener Datensätze, die den Einfluss von Pflanzenhormonen, Pathogenen oder verschiedenen Mutationen auf die Genexpression untersucht haben, konnten die Datensätze anhand ihrer Genexpressionsprofile in drei große Gruppen eingeordnet werden: Experimente mit Indol-3-Essigsäure (IAA), mit Pathogenen und andere Experimente. Gene, die charakteristisch für die Gruppe der IAA-Datensätze beziehungsweise für die Gruppe der Pathogen-Datensätze sind, wurden näher betrachtet. Diese Gene hatten Funktionen, die bereits mit Pathogenbefall bzw. dem Einfluss von IAA in Verbindung gebracht wurden. Außerdem wurden Hypothesen über die Funktionen von bislang nicht annotierten Genen aufgestellt. In dieser Arbeit werden auch Primäranalysen von einzelnen Arabidopsis thaliana Genexpressions-Datensätzen vorgestellt. In der dritten Publikation wird ein Experiment beschrieben, das durchgeführt wurde um herauszufinden ob Mikrowellen-Strahlung einen Einfluss auf die Genexpression einer Zellkultur hat. Dazu wurden explorative Analysemethoden angewendet. Es wurden geringe aber signifikante Veränderungen in einer sehr kleinen Anzahl von Genen beobachtet, die experimentell bestätigt werden konnten. Die Funktionen der regulierten Gene und eine Meta-Analyse mit öffentlich zugänglichen Datensätzen einer Datenbank deuten darauf hin, dass die pflanzliche Zellkultur die Strahlung als eine Art Energiequelle ähnlich dem Licht wahrnimmt. Des weiteren wird in der vierten Publikation die funktionelle Analyse eines Arabidopsis thaliana Genexpressionsdatensatzes beschrieben. Die Analyse der Genexpressions eines pflanzlichen Tumores zeigte, dass er seinen Stoffwechsel von aerob und auxotroph auf anaerob und heterotroph umstellt. Gene der Photosynthese werden im Tumorgewebe reprimiert, Gene des Aminosäure- und Fettstoffwechsels, der Zellwand und Transportkanäle werden so reguliert, dass Wachstum und Entwicklung des Tumors gefördert werden. In der fünften Publikation in dieser Arbeit wird GEPAT (Genome Expression Pathway Analysis Tool) beschrieben. Es besteht aus einer Internet- Anwendung und einer Datenbank, die das einfache Hochladen von Datensätzen in die Datenbank und viele Möglichkeiten der Datenanalyse und die Integration anderer Datentypen erlaubt. In den folgenden zwei Publikationen (Publikation 6 und Publikation 7) wird GEPAT auf humane Microarray-Datensätze angewendet um Genexpressionsdaten mit weiteren Datentypen zu verknüpfen. Genexpressionsdaten und Daten aus vergleichender Genom-Hybridisierung (CGH) von primären Tumoren von 71 Mantel-Zell-Lymphom (MCL) Patienten ermöglichte die Ermittlung eines Prädiktors, der die Vorhersage der Überlebensdauer von Patienten gegenüber herkömmlichen Methoden verbessert. Die Analyse der CGH Daten zeigte, dass auch diese für die Vorhersage der Überlebensdauer geeignet sind. Für den Datensatz von Patienten mit großzellig diffusem B-Zell-Lymphom DLBCL konnte aus den Genexpressionsdaten ebenfalls ein neuer Prädiktor vorgeschlagen werden. Mit den zwischen lang und kurz überlebenden Patienten differentiell exprimierten Genen der MCL Patienten und mit den Genen, die zwischen den beiden Untergruppen von DLBCL reguliert sind, wurden Interaktionsnetzwerke gebildet. Diese zeigen, dass bei beiden Krebstypen Gene des Zellzyklus und der Proliferation zwischen Patienten mit kurzer und langer Überlebensdauer unterschiedlich reguliert sind. N2 - In this thesis, the development of a phylogenetic DNA microarray, the analysis of several gene expression microarray datasets and new approaches for improved data analysis and interpretation are described. In the first publication, the development and analysis of a phylogenetic microarray is presented. I could show that species detection with phylogenetic DNA microarrays can be significantly improved when the microarray data is analyzed with a linear regression modeling approach. Standard methods have so far relied on pure signal intensities of the array spots and a simple cutoff criterion was applied to call a species present or absent. This procedure is not applicable to very closely related species with high sequence similarity because cross-hybridization of non-target DNA renders species detection impossible based on signal intensities alone. By modeling hybridization and cross-hybridization with linear regression, as I have presented in this thesis, even species with a sequence similarity of 97% in the marker gene can be detected and distinguished from related species. Another advantage of the modeling approach over existing methods is that the model also performs well on mixtures of different species. In principle, also quantitative predictions can be made. To make better use of the large amounts of microarray data stored in public databases, meta-analysis approaches need to be developed. In the second publication, an explorative meta-analysis exemplified on Arabidopsis thaliana gene expression datasets is presented. Integrating datasets studying effects such as the influence of plant hormones, pathogens and different mutations on gene expression levels, clusters of similarly treated datasets could be found. From the clusters of pathogen-treated and indole-3-acetic acid (IAA) treated datasets, representative genes were selected which pointed to functions which had been associated with pathogen attack or IAA effects previously. Additionally, hypotheses about the functions of so far uncharacterized genes could be set up. Thus, this kind of meta-analysis could be used to propose gene functions and their regulation under different conditions. In this work, also primary data analysis of Arabidopsis thaliana datasets is presented. In the third publication, an experiment which was conducted to find out if microwave irradiation has an effect on the gene expression of a plant cell culture is described. During the first steps, the data analysis was carried out blinded and exploratory analysis methods were applied to find out if the irradiation had an effect on gene expression of plant cells. Small but statistically significant changes in a few genes were found and could be experimentally confirmed. From the functions of the regulated genes and a meta-analysis with publicly available microarray data, it could be suspected that the plant cell culture somehow perceived the irradiation as energy, similar to perceiving light rays. The fourth publication describes the functional analysis of another Arabidopsis thaliana gene expression dataset. The gene expression data of the plant tumor dataset pointed to a switch from a mainly aerobic, auxotrophic to an anaerobic and heterotrophic metabolism in the plant tumor. Genes involved in photosynthesis were found to be repressed in tumors; genes of amino acid and lipid metabolism, cell wall and solute transporters were regulated in a way that sustains tumor growth and development. Furthermore, in the fifth publication, GEPAT (Genome Expression Pathway Analysis Tool), a tool for the analysis and integration of microarray data with other data types, is described. It consists of a web application and database which allows comfortable data upload and data analysis. In later chapters of this thesis (publication 6 and publication 7), GEPAT is used to analyze human microarray datasets and to integrate results from gene expression analysis with other datatypes. Gene expression and comparative genomic hybridization data from 71 Mantle Cell Lymphoma (MCL) patients was analyzed and allowed proposing a seven gene predictor which facilitates survival predictions for patients compared to existing predictors. In this study, it was shown that CGH data can be used for survival predictions. For the dataset of Diffuse Large B-cell lymphoma (DLBCL) patients, an improved survival predictor could be found based on the gene expression data. From the genes differentially expressed between long and short surviving MCL patients as well as for regulated genes of DLBCL patients, interaction networks could be set up. They point to differences in regulation for cell cycle and proliferation genes between patients with good and bad prognosis. KW - Microarray KW - Differentielle Genexpression KW - Genexpression KW - Statistische Analyse KW - Cluster-Analyse KW - Datenanalyse KW - Explorative Datenanalyse KW - Non-Hodgkin-Lymphom KW - B-Zell-Lymphom KW - Metabolom KW - Tumorklassifikation KW - Tumor KW - Krebs KW - Schmalwa KW - phylogenetische Arrays KW - Interaktionsnetzwerke KW - lineare Regression KW - DNA microarray KW - gene expression KW - statistical analysis KW - clustering KW - classification KW - interaction networks Y1 - 2008 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-29747 ER - TY - THES A1 - Stoll, Sascha T1 - Funktionelle Analyse von Blochmannia floridanus, dem primären Endosymbionten der Rossameise Camponotus floridanus T1 - Functional analysis of Blochmannia floridanus, the primary endosymbiont of the carpenter ant Camponotus floridanus N2 - Ameisen der Gattung Camponotus beherbergen bakterielle Symbionten der Gattung Blochmannia in spezialisierten Zellen des Mitteldarms (Blochmann, 1882; Buchner, 1965; Sauer, 2000; Schröder et al., 1996). Die Genomsequenzierung dieser Symbionten zeigte, dass Blochmannia, ähnlich den Symbionten von Blattläusen, hauptsächlich Gene der Aminosäurebiosynthese beibehalten hat (Degnan et al., 2005; Gil et al., 2003). Die Relevanz dieser nahrungsaufwertenden Funktion konnte experimentell bestätigt werden (Feldhaar et al., 2007). Ein Schwerpunkt der vorliegenden Arbeit war die Aufklärung der dynamischen Interaktion der beiden Partner während des komplexen Lebenszyklus des holometabolen Wirtes. Frühere Studien deuteten darauf hin, dass die Symbiose vor allem während der Larven- und Puppenphasen von Bedeutung sein könnte (Feldhaar et al., 2007; Wolschin et al., 2004; Zientz et al., 2006). Mit fluoreszenter in situ Hybridisierung (FISH) und konfokaler Laserscanning Mikroskopie konnte in der vorliegenden Arbeit die Lokalisierung von B. floridanus während der wichtigsten Entwicklungsstadien aufgeklärt werden. Hierbei konnte gezeigt werden, dass die Symbionten schon im ersten Larvenstadium in spezialisierten Zellen um den Darm angeordnet sind, aber in späteren Stadien nicht, wie bisher angenommen, auf diese Bakteriozyten beschränkt sind, sondern bis zum Schlupf der jungen Arbeiterinnen massiv andere Darmzellen infizieren. Übereinstimmend mit Bestimmungen der Zellzahl in den verschiedenen Wirtsstadien ist die Anzahl der Symbionten gegen Ende der Metamorphose am höchsten. Die Symbiose degeneriert in sehr alten Arbeiterinnen, gut gefüllte Bakteriozyten werden jedoch noch monatelang beibehalten. Mit Macroarray- und qRT- PCR- basierten Transkriptomanalysen wurde die Expression der bakteriellen Gene in charakteristischen Entwicklungsstadien des Wirtes untersucht. Allgemein zeigen vor allem Gene für molekulare Chaperons und bestimmte bakterielle Grundfunktionen eine hohe Expression. Aber auch viele Gene, die möglicherweise wichtige Funktionen in der Symbiose besitzen, wie die Biosynthese essentieller Aminosäuren und das Recycling von Stickstoffverbindungen, zeigen ein hohes absolutes Transkriptlevel. Zudem besteht eine positive Korrelation zwischen dem Expressionsniveau und dem GC- Gehalt der Gene, die in dem höheren Selektionsdruck und damit einer geringeren Mutationsrate der essentiellen Gene begründet liegt (Schaber et al., 2005). Durch Proteinanalysen konnte bestätigt werden, dass die Faktoren mit der höchsten absoluten Transkription die dominanten Proteine der Symbionten darstellen. In den unterschiedlichen Entwicklungsstadien zeigen viele Gene eine deutliche Dynamik, deren Ausmaß aber, verglichen mit freilebenden Bakterien, gering ist. Aus den Expressionsprofilen aufeinanderfolgender Gene lassen sich mögliche Transkriptionseinheiten ableiten, die teilweise auch experimentell bestätigt wurden. Oftmals zeigen auch Gene, die nicht in Transkriptionseinheiten angeordnet sind, aber verwandten Stoffwechselwegen angehören, ähnliche Muster. Dies deutet auf das Vorhandensein grundlegender Genregulations-mechanismen hin, obwohl im Genom von B. floridanus nur noch sehr wenige Transkriptionsfaktoren codiert sind (Gil et al., 2003). Auf übergeordneter Ebene zeigt sich, dass bei Symbionten aus späten Puppenstadien viele symbioserelevante Gene im Vergleich zu Genen des Grundmetabolismus eine erhöhte Expression zeigen. Dies betrifft besonders die Biosynthese aromatischer und verzweigter Aminosäuren, die in diesen Stadien vom Wirt in hoher Menge benötigt werden, während die internen Reserven gleichzeitig zur Neige gehen. Dies äußert sich auch im deutlichen Abfallen der Speicherproteinmenge des Wirts gegen Ende der Puppenphase. Die festgestellte Veränderung der Symbiontenzahl übertrifft das geringe Ausmaß der Genregulation um ein Vielfaches. Die Bakterien liegen in jedem Stadium polyploid mit bis zu 100 Genomkopien vor, dieser Polyploidiegrad bleibt jedoch während der gesamten Wirtsentwicklung weitestgehend konstant. Somit scheint die Kontrolle des Wirts über die bakterielle Vermehrung der entscheidende Faktor dieser Symbiose zu sein. Die verbleibenden regulatorischen Fähigkeiten der Bakterien stellen möglicherweise eine Feinjustierung von optimierten Produktionseinheiten dar, deren Anzahl nach den Bedürfnissen des Wirtes verändert wird. Insgesamt konnten in der vorliegenden Arbeit neue Einblicke in das komplexe Zusammenleben von Blochmannia und Camponotus gewonnen werden, die zu einem besseren Verständnis der biologischen Funktion und der grundlegenden Mechanismen dieser Symbiose führen. Eine der wichtigsten Fragestellungen nach dem Sinn einer nahrungsaufwertenden Symbiose für einen Nahrungsgeneralisten konnte mit starken Hinweisen auf eine stadienabhängige Relevanz der Symbiose beantwortet werden, die den enormen evolutionären Erfolg dieser Ameisengattung erklären könnte.  N2 - Ants of the genus Camponotus harbor bacterial endosymbionts of the genus Blochmannia in specialized cells of their midgut (Blochmann, 1882; Buchner, 1965; Sauer, 2000; Schröder et al., 1996). The complete sequencing of the symbiont’s genome revealed, that Blochmannia, comparable to the symbionts of aphids, mainly retained genes involved in the biosynthesis of essential amino acids (Degnan et al., 2005; Gil et al., 2003). The biological relevance of a nutritional upgrading by Blochmannia could be confirmed experimentally (Feldhaar et al., 2007). One focus of this thesis was the elucidation of the dynamic interactions between the two partners during the complex life cycle of the holometabolic host animal. Previous studies pointed towards a temporal relevance of this symbiosis especially during larval and pupal development (Feldhaar et al., 2007; Wolschin et al., 2004; Zientz et al., 2006). In this thesis the localization of B. floridanus could be documented throughout all life stages of the host by fluorescent in situ hybridization (FISH) and confocal laser scanning microscopy. A layer of densely filled bacteriocytes surrounding the gut could already be identified in first instar larvae. In contrast to previous assumptions, the bacteria are not restricted to these cells in later stages, as until the eclosion of the young adult workers bacteria massively infect other midgut cells. Concordant with previous findings, bacterial load is highest at the end of metamorphosis and symbiont numbers decrease in older workers, yet densely filled bacteriocytes are still visible after several months. The expression of the bacterial genes during characteristic life stages of the C. floridanus was assessed by macroarray and qRT- PCR- based experiments. In general, especially molecular chaperones, central basic metabolism and may putative symbiosis related factors like pathways leading to essential amino acids or nitrogen recycling show highest absolute expression levels. A positive correlation between expression level and GC- content of the genes can be observed, which is caused by a higher selection pressure and lower mutation rate of these essential factors (Schaber et al., 2005). Protein analyses confirmed the correlation between gene expression and translation of the most abundant factors. Many B. floridanus genes exhibit a dynamic expression during the different host stages but the extent of this gene regulation is modest as compared to free living bacteria. Expression profiles of genes located next to each other on the genome allow proposal of local transcription units, which were confirmed experimentally in several cases. Often genes that are not clustered locally but belong to related metabolic functions also exhibit similar expression patterns. This indicates the existence of basic mechanisms of gene regulation despite the low number of transcription factors annotated in the B. floridanus genome (Gil et al., 2003). In late pupal stages symbiosis related genes often show a higher expression compared to basic metabolic functions. This especially includes biosynthetic pathways for aromatic and branched amino acids, which are needed by the host at this stage in increased amounts, while internal storages are depleted. This could be demonstrated by the significant decrease in storage proteins of the host at the end of the pupal phase. The observed change in bacterial numbers per host exceeds the extent of bacterial gene regulation by far. The symbionts are polyploid in each host stage with up to 100 genome copies per cell. The degree of polyploidy is largely constant during host development. Thus the control over bacterial reproduction seems to be the decisive factor in this symbiosis. The residual regulatory capacities of the symbionts might represent a mechanism of fine tuning of a production unit that has been streamlined by evolution and whose numbers are adjusted according to the host’s needs. In conclusion, this thesis delivers new insights into the complex symbiosis of Blochmannia and Camponotus leading to a better understanding of its biological function and the underlying mechanisms. One of the central mysteries concerning the need of a symbiont for nutritional upgrading for an omnivorous host could be explained by a temporal, stage- dependent relevance of this symbiosis, possibly being the reason for the enormous evolutionary success of this ant genus. KW - Intrazelluläre Symbiose KW - Symbiose KW - Ameisen KW - Mikrobiologie KW - Gram-negative Bakterien KW - Bakterien KW - Differentielle Genexpression KW - Genexpression KW - Entwicklung KW - Blochmannia KW - Camponotus KW - symbiosis KW - endosymbiosis KW - ants KW - bacteria KW - gene expression Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-37238 ER -