TY - THES A1 - Friedrich, Torben T1 - New statistical Methods of Genome-Scale Data Analysis in Life Science - Applications to enterobacterial Diagnostics, Meta-Analysis of Arabidopsis thaliana Gene Expression and functional Sequence Annotation T1 - Neue statistische Methoden für genomweite Datenanalysen in den Biowissenschaften - Anwendungen in der Enterobakteriendiagnostik, Meta-Analyse von Arabidopsis thaliana Genexpression und funktionsbezogenen Sequenzannotation N2 - Recent progresses and developments in molecular biology provide a wealth of new but insufficiently characterised data. This fund comprises amongst others biological data of genomic DNA, protein sequences, 3-dimensional protein structures as well as profiles of gene expression. In the present work, this information is used to develop new methods for the characterisation and classification of organisms and whole groups of organisms as well as to enhance the automated gain and transfer of information. The first two presented approaches (chapters 4 und 5) focus on the medically and scientifically important enterobacteria. Its impact in medicine and molecular biology is founded in versatile mechanisms of infection, their fundamental function as a commensal inhabitant of the intestinal tract and their use as model organisms as they are easy to cultivate. Despite many studies on single pathogroups with clinical distinguishable pathologies, the genotypic factors that contribute to their diversity are still partially unknown. The comprehensive genome comparison described in Chapter 4 was conducted with numerous enterobacterial strains, which cover nearly the whole range of clinically relevant diversity. The genome comparison constitutes the basis of a characterisation of the enterobacterial gene pool, of a reconstruction of evolutionary processes and of comprehensive analysis of specific protein families in enterobacterial subgroups. Correspondence analysis, which is applied for the first time in this context, yields qualitative statements to bacterial subgroups and the respective, exclusively present protein families. Specific protein families were identified for the three major subgroups of enterobacteria namely the genera Yersinia and Salmonella as well as to the group of Shigella and E. coli by applying statistical tests. In conclusion, the genome comparison-based methods provide new starting points to infer specific genotypic traits of bacterial groups from the transfer of functional annotation. Due to the high medical importance of enterobacterial isolates their classification according to pathogenicity has been in focus of many studies. The microarray technology offers a fast, reproducible and standardisable means of bacterial typing and has been proved in bacterial diagnostics, risk assessment and surveillance. The design of the diagnostic microarray of enterobacteria described in chapter 5 is based on the availability of numerous enterobacterial genome sequences. A novel probe selection strategy based on the highly efficient algorithm of string search, which considers both coding and non-coding regions of genomic DNA, enhances pathogroup detection. This principle reduces the risk of incorrect typing due to restrictions to virulence-associated capture probes. Additional capture probes extend the spectrum of applications of the microarray to simultaneous diagnostic or surveillance of antimicrobial resistance. Comprehensive test hybridisations largely confirm the reliability of the selected capture probes and its ability to robustly classify enterobacterial strains according to pathogenicity. Moreover, the tests constitute the basis of the training of a regression model for the classification of pathogroups and hybridised amounts of DNA. The regression model features a continuous learning capacity leading to an enhancement of the prediction accuracy in the process of its application. A fraction of the capture probes represents intergenic DNA and hence confirms the relevance of the underlying strategy. Interestingly, a large part of the capture probes represents poorly annotated genes suggesting the existence of yet unconsidered factors with importance to the formation of respective virulence phenotypes. Another major field of microarray applications is gene expression analysis. The size of gene expression databases rapidly increased in recent years. Although they provide a wealth of expression data, it remains challenging to integrate results from different studies. In chapter 6 the methodology of an unsupervised meta-analysis of genome-wide A. thaliana gene expression data sets is presented, which yields novel insights in function and regulation of genes. The application of kernel-based principal component analysis in combination with hierarchical clustering identified three major groups of contrasts each sharing overlapping expression profiles. Genes associated with two groups are known to play important roles in Indol-3 acetic acid (IAA) mediated plant growth and development as well as in pathogen defence. Yet uncharacterised serine-threonine kinases could be assigned to novel functions in pathogen defence by meta-analysis. In general, hidden interrelation between genes regulated under different conditions could be unravelled by the described approach. HMMs are applied to the functional characterisation of proteins or the detection of genes in genome sequences. Although HMMs are technically mature and widely applied in computational biology, I demonstrate the methodical optimisation with respect to the modelling accuracy on biological data with various distributions of sequence lengths. The subunits of these models, the states, are associated with a certain holding time being the link to length distributions of represented sequences. An adaptation of simple HMM topologies to bell-shaped length distributions described in chapter 7 was achieved by serial chain-linking of single states, while residing in the class of conventional HMMs. The impact of an optimisation of HMM topologies was underlined by performance evaluations with differently adjusted HMM topologies. In summary, a general methodology was introduced to improve the modelling behaviour of HMMs by topological optimisation with maximum likelihood and a fast and easily implementable moment estimator. Chapter 8 describes the application of HMMs to the prediction of interaction sites in protein domains. As previously demonstrated, these sites are not trivial to predict because of varying degree in conservation of their location and type within the domain family. The prediction of interaction sites in protein domains is achieved by a newly defined HMM topology, which incorporates both sequence and structure information. Posterior decoding is applied to the prediction of interaction sites providing additional information of the probability of an interaction for all sequence positions. The implementation of interaction profile HMMs (ipHMMs) is based on the well established profile HMMs and inherits its known efficiency and sensitivity. The large-scale prediction of interaction sites by ipHMMs explained protein dysfunctions caused by mutations that are associated to inheritable diseases like different types of cancer or muscular dystrophy. As already demonstrated by profile HMMs, the ipHMMs are suitable for large-scale applications. Overall, the HMM-based method enhances the prediction quality of interaction sites and improves the understanding of the molecular background of inheritable diseases. With respect to current and future requirements I provide large-scale solutions for the characterisation of biological data in this work. All described methods feature a highly portable character, which allows for the transfer to related topics or organisms, respectively. Special emphasis was put on the knowledge transfer facilitated by a steadily increasing wealth of biological information. The applied and developed statistical methods largely provide learning capacities and hence benefit from the gain of knowledge resulting in increased prediction accuracies and reliability. N2 - Die aktuellen Fortschritte und Entwicklungen in der Molekularbiologie stellen eine Fülle neuer, bisher kaum analysierter Daten bereit. Dieser Fundus umfasst unter Anderem biologische Daten zu genomischer DNA, zu Proteinsequenzen, zu dreidimensionalen Proteinstrukturen sowie zu Genexpressionsprofilen. In der vorliegenden Arbeit werden diese Informationen genutzt, um neue Methoden der Charakterisierung und Klassifizierung von Organismen bzw. Organismengruppen zu entwickeln und einen automatisierten Informationsgewinn sowie eine Informationsübertragung zu ermöglichen. Die ersten beiden vorgestellten Ansätze (Kapitel 4 und 5) konzentrieren sich auf die medizinisch und wissenschaftlich bedeutsame Gruppe der Enterobakterien. Deren Bedeutung für Medizin und Mikrobiologie geht auf ihre Funktion als kommensale Bewohner des Darmtraktes, ihre Nutzung als leicht kultivierbare Modellorganismen und auf die vielseitigen Infektionsmechanismen zurück. Obwohl bereits viele Studien über einzelne Pathogruppen mit klinisch unterscheidbaren Symptomen existieren, sind die genotypischen Faktoren, die für diese Unterschiedlichkeit verantwortlich zeichnen, teilweise noch nicht bekannt. Der in Kapitel 4 beschriebene umfassende Genomvergleich wurde anhand einer Vielzahl von Enterobakterien durchgeführt, die nahezu die gesamte Bandbreite klinisch relevanter Diversität darstellen. Dieser Genomvergleich bildet die Basis für eine Charakterisierung des enterobakteriellen Genpools, für eine Rekonstruktion evolutionärer Prozesse und Einflüsse und für eine umfassende Untersuchung spezifischer Proteinfamilien in enterobakteriellen Untergruppen. Die in diesem Kontext vorher noch nicht angewandte Korrespondenzanalyse liefert qualitative Aussagen zu bakteriellen Untergruppen und den ausschließlich in ihnen vorkommenden Proteinfamilien. In drei Hauptuntergruppen der Enterobakterien, die den Gattungen Yersinia und Salmonella sowie der Gruppe aus Shigella und E. coli entsprechen, wurden die jeweils spezifischen Proteinfamilien mit Hilfe statistischer Tests identifiziert. Zusammenfassend bilden die auf Genomvergleichen aufbauenden Methoden neue Ansatzpunkte, um aus der Übertragung der bekannten Funktionalität einzelner Proteine auf spezifische, genotypische Besonderheiten bakterieller Gruppen zu schließen. Aufgrund ihrer hohen medizinischen Relevanz war die Typisierung enterobakterieller Isolate entsprechend ihrer Pathogenität Ziel zahlreicher Studien. Die Microarray-Technologie bietet ein schnelles, reproduzierbares und standardisierbares Hilfsmittel für bakterielle Typisierung und hat sich in der Bakteriendiagnostik, Risikobewertung und Überwachung bewährt. Das in Kapitel 5 beschriebene Design eines diagnostischen Microarray beruht auf einer großen Anzahl verfügbarer Genomsequenzen von Enterobakterien. Ein hocheffizienter String-Matching-Algorithmus ist die Grundlage einer neuartigen Strategie der Sondenauswahl, die sowohl kodierende als auch nicht-kodierende Bereiche genomischer DNA berücksichtigt. Im Vergleich zu Diagnostika, die ausschließlich auf Virulenz-assoziierten Sonden beruhen, verringert dieses Prinzip das Risiko einer inkorrekten Typisierung. Zusätzliche Sonden erweitern das Anwendungsspektrum auf eine simultane Diagnostik der Antibiotikaresistenz bzw. eine Überwachung der Resistenzausbreitung. Umfangreiche Testhybridisierungen belegen eine überwiegende Zuverlässigkeit der Sonden und vor allem eine robuste Klassifizierung enterobakterieller Stämme entsprechend der Pathogruppen. Die Tests bilden zudem die Grundlage für das Training eines Regressionsmodells zur Klassifizierung der Pathogruppe und zur Vorhersage der Menge hybridisierter DNA. Das Regressionsmodell zeichnet sich durch kontinuierliche Lernfähigkeit und damit durch eine Verbesserung der Vorhersagequalität im Prozess der Anwendung aus. Ein Teil der Sonden repräsentiert intergenische DNA und bestätigt infolgedessen die Relevanz der zugrunde liegenden Strategie. Die Tatsache, dass ein großer Teil der von den Sonden repräsentierten Gene noch nicht annotiert ist, legt die Existenz bisher unentdeckter Faktoren mit Bedeutung für die Ausbildung entsprechender Virulenz-Phänotypen nahe. Ein weiteres Haupteinsatzgebiet von Microarrays ist die Genexpressionsanalyse. Die Größe von Genexpressionsdatenbanken ist in den vergangenen Jahren stark gewachsen. Obwohl sie eine Fülle von Expressionsdaten bieten, sind Ergebnisse aus unterschiedlichen Studien weiterhin schwer in einen übergreifenden Zusammenhang zu bringen. In Kapitel 6 wird die Methodik einer ausschließlich datenbasierten Meta-Analyse für genomweite A. thaliana Genexpressionsdatensätze dargestellt, die neue Erkenntnisse über Funktion und Regulation von Genen verspricht. Die Anwendung von Kernel-basierter Hauptkomponentenanalyse in Kombination mit hierarchischem Clustering identifizierte drei Hauptgruppen von Kontrastexperimenten mit jeweils überlappenden Expressionsmustern. In zwei Gruppen konnten deregulierte Gene wichtigen Funktionen bei Indol-3-Essigsäure (IAA) vermitteltem Pflanzenwachstum und -entwicklung sowie pflanzlicher Pathogenabwehr zugeordnet werden. Bisher funktionell nicht näher charakterisierte Serin-Threonin-Kinasen wurden über die Meta-Analyse mit der Pathogenabwehr assoziiert. Grundsätzlich kann dieser Ansatz versteckte Wechselbeziehungen zwischen Genen aufdecken, die unter verschiedenen Bedingungen reguliert werden. Bei der funktionellen Charakterisierung von Proteinen oder der Vorhersage von Genen in Genomsequenzen werden Hidden-Markov-Modelle (HMMs) eingesetzt. HMMs sind technisch ausgereift und in der computergestützten Biologie vielfach eingesetzt worden. Trotzdem birgt die Methodik das Potential zur Optimierung bezüglich der Modellierung biologischer Daten, die hinsichtlich der Längenverteilung ihrer Sequenzen variieren. Untereinheiten dieser Modelle, die Zustände, repräsentieren über ihre individuelle Verweildauer zugrunde liegende Verteilungen von Sequenzlängen. Kapitel 7 stellt eine Methode zur Anpassung einfacher HMM-Topologien an biologische Daten, die glockenkurvenartige Längenverteilungen zeigen, vor. Die Modellierung solcher Verteilungen wird dabei durch eine serielle Verkettung vervielfältigter Zustände gewährleistet, ohne dass die Klasse herkömmlicher HMMs verlassen wird. Auswertungen der Modellierungsleistung bei unterschiedlich stark optimierten HMM-Topologien unterstreichen die Bedeutung der entwickelten Topologieoptimierung. Zusammenfassend wird hier eine generelle Methodik beschrieben, die die Modelleigenschaften von HMMs über Topologieoptimierungen verbessert. Die Parameter dieser Optimierung werden mit Hilfe von Maximum-Likelihood und einem leicht einzubindenden Momentschätzer bestimmt. In Kapitel 8 wird die Anwendung von HMMs zur Vorhersage von Interaktionsstellen in Proteindomänen beschrieben. Wie bereits gezeigt wurde, sind solche Stellen aufgrund einer variablen Konserviertheit ihrer Position und ihres Typs schwer zu bestimmen. Eine Vorhersage von Interaktionstellen in Proteindomänen wird über die Definition einer neuen HMM-Topologie erreicht, die sowohl Sequenz- als auch Strukturdaten einbindet. Interaktionsstellen werden mit einem Posterior-Decoding-Algorithmus vorhergesagt, der zusätzliche Informationen über die Wahrscheinlichkeit einer Interaktion für alle Sequenzpositionen bereitstellt. Die Implementierung der Interaktionsprofil-HMMs (ipHMMs) basiert auf den etablierten Profil-HMMs und erbt deren Effizienz und Sensitivität. Eine groß angelegte Vorhersage von Interaktionsstellen mit ipHMMs konnte mutationsbedingte Fehlfunktionen in Proteinen erklären, die mit vererbbaren Krankheiten wie unterschiedlichen Tumortypen oder Muskeldystrophie assoziiert sind. Wie Profile-HMMs sind auch ipHMMs für groß angelegte Anwendungen geeignet. Insgesamt verbessert die HMM-gestützte Methode sowohl die Vorhersagequalität für Interaktionsstellen als auch das Verständnis molekularer Hintergründe bei vererbbaren Krankheiten. Im Hinblick auf aktuelle und zukünftige Anforderungen stelle ich in dieser Arbeit Lösungsansätze für eine umfassende Charakterisierung großer Mengen biologischer Daten vor. Alle beschriebenen Methoden zeichnen sich durch gute Übertragbarkeit auf verwandte Probleme aus. Besonderes Augenmerk wurde dabei auf den Wissenstransfer gelegt, der durch einen stetig wachsenden Fundus biologischer Information ermöglicht wird. Die angewandten und entwickelten statistischen Methoden sind lernfähig und profitieren von diesem Wissenszuwachs, Vorhersagequalität und Zuverlässigkeit der Ergebnisse verbessern sich. KW - Genomik KW - Hidden-Markov-Modell KW - Enterobacteriaceae KW - Genexpression KW - Microarray KW - Sequenzanalyse KW - diagnostischer Microarray KW - Sequence Analysis KW - diagnostic Microarray Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-39858 ER - TY - THES A1 - Stoll, Sascha T1 - Funktionelle Analyse von Blochmannia floridanus, dem primären Endosymbionten der Rossameise Camponotus floridanus T1 - Functional analysis of Blochmannia floridanus, the primary endosymbiont of the carpenter ant Camponotus floridanus N2 - Ameisen der Gattung Camponotus beherbergen bakterielle Symbionten der Gattung Blochmannia in spezialisierten Zellen des Mitteldarms (Blochmann, 1882; Buchner, 1965; Sauer, 2000; Schröder et al., 1996). Die Genomsequenzierung dieser Symbionten zeigte, dass Blochmannia, ähnlich den Symbionten von Blattläusen, hauptsächlich Gene der Aminosäurebiosynthese beibehalten hat (Degnan et al., 2005; Gil et al., 2003). Die Relevanz dieser nahrungsaufwertenden Funktion konnte experimentell bestätigt werden (Feldhaar et al., 2007). Ein Schwerpunkt der vorliegenden Arbeit war die Aufklärung der dynamischen Interaktion der beiden Partner während des komplexen Lebenszyklus des holometabolen Wirtes. Frühere Studien deuteten darauf hin, dass die Symbiose vor allem während der Larven- und Puppenphasen von Bedeutung sein könnte (Feldhaar et al., 2007; Wolschin et al., 2004; Zientz et al., 2006). Mit fluoreszenter in situ Hybridisierung (FISH) und konfokaler Laserscanning Mikroskopie konnte in der vorliegenden Arbeit die Lokalisierung von B. floridanus während der wichtigsten Entwicklungsstadien aufgeklärt werden. Hierbei konnte gezeigt werden, dass die Symbionten schon im ersten Larvenstadium in spezialisierten Zellen um den Darm angeordnet sind, aber in späteren Stadien nicht, wie bisher angenommen, auf diese Bakteriozyten beschränkt sind, sondern bis zum Schlupf der jungen Arbeiterinnen massiv andere Darmzellen infizieren. Übereinstimmend mit Bestimmungen der Zellzahl in den verschiedenen Wirtsstadien ist die Anzahl der Symbionten gegen Ende der Metamorphose am höchsten. Die Symbiose degeneriert in sehr alten Arbeiterinnen, gut gefüllte Bakteriozyten werden jedoch noch monatelang beibehalten. Mit Macroarray- und qRT- PCR- basierten Transkriptomanalysen wurde die Expression der bakteriellen Gene in charakteristischen Entwicklungsstadien des Wirtes untersucht. Allgemein zeigen vor allem Gene für molekulare Chaperons und bestimmte bakterielle Grundfunktionen eine hohe Expression. Aber auch viele Gene, die möglicherweise wichtige Funktionen in der Symbiose besitzen, wie die Biosynthese essentieller Aminosäuren und das Recycling von Stickstoffverbindungen, zeigen ein hohes absolutes Transkriptlevel. Zudem besteht eine positive Korrelation zwischen dem Expressionsniveau und dem GC- Gehalt der Gene, die in dem höheren Selektionsdruck und damit einer geringeren Mutationsrate der essentiellen Gene begründet liegt (Schaber et al., 2005). Durch Proteinanalysen konnte bestätigt werden, dass die Faktoren mit der höchsten absoluten Transkription die dominanten Proteine der Symbionten darstellen. In den unterschiedlichen Entwicklungsstadien zeigen viele Gene eine deutliche Dynamik, deren Ausmaß aber, verglichen mit freilebenden Bakterien, gering ist. Aus den Expressionsprofilen aufeinanderfolgender Gene lassen sich mögliche Transkriptionseinheiten ableiten, die teilweise auch experimentell bestätigt wurden. Oftmals zeigen auch Gene, die nicht in Transkriptionseinheiten angeordnet sind, aber verwandten Stoffwechselwegen angehören, ähnliche Muster. Dies deutet auf das Vorhandensein grundlegender Genregulations-mechanismen hin, obwohl im Genom von B. floridanus nur noch sehr wenige Transkriptionsfaktoren codiert sind (Gil et al., 2003). Auf übergeordneter Ebene zeigt sich, dass bei Symbionten aus späten Puppenstadien viele symbioserelevante Gene im Vergleich zu Genen des Grundmetabolismus eine erhöhte Expression zeigen. Dies betrifft besonders die Biosynthese aromatischer und verzweigter Aminosäuren, die in diesen Stadien vom Wirt in hoher Menge benötigt werden, während die internen Reserven gleichzeitig zur Neige gehen. Dies äußert sich auch im deutlichen Abfallen der Speicherproteinmenge des Wirts gegen Ende der Puppenphase. Die festgestellte Veränderung der Symbiontenzahl übertrifft das geringe Ausmaß der Genregulation um ein Vielfaches. Die Bakterien liegen in jedem Stadium polyploid mit bis zu 100 Genomkopien vor, dieser Polyploidiegrad bleibt jedoch während der gesamten Wirtsentwicklung weitestgehend konstant. Somit scheint die Kontrolle des Wirts über die bakterielle Vermehrung der entscheidende Faktor dieser Symbiose zu sein. Die verbleibenden regulatorischen Fähigkeiten der Bakterien stellen möglicherweise eine Feinjustierung von optimierten Produktionseinheiten dar, deren Anzahl nach den Bedürfnissen des Wirtes verändert wird. Insgesamt konnten in der vorliegenden Arbeit neue Einblicke in das komplexe Zusammenleben von Blochmannia und Camponotus gewonnen werden, die zu einem besseren Verständnis der biologischen Funktion und der grundlegenden Mechanismen dieser Symbiose führen. Eine der wichtigsten Fragestellungen nach dem Sinn einer nahrungsaufwertenden Symbiose für einen Nahrungsgeneralisten konnte mit starken Hinweisen auf eine stadienabhängige Relevanz der Symbiose beantwortet werden, die den enormen evolutionären Erfolg dieser Ameisengattung erklären könnte.  N2 - Ants of the genus Camponotus harbor bacterial endosymbionts of the genus Blochmannia in specialized cells of their midgut (Blochmann, 1882; Buchner, 1965; Sauer, 2000; Schröder et al., 1996). The complete sequencing of the symbiont’s genome revealed, that Blochmannia, comparable to the symbionts of aphids, mainly retained genes involved in the biosynthesis of essential amino acids (Degnan et al., 2005; Gil et al., 2003). The biological relevance of a nutritional upgrading by Blochmannia could be confirmed experimentally (Feldhaar et al., 2007). One focus of this thesis was the elucidation of the dynamic interactions between the two partners during the complex life cycle of the holometabolic host animal. Previous studies pointed towards a temporal relevance of this symbiosis especially during larval and pupal development (Feldhaar et al., 2007; Wolschin et al., 2004; Zientz et al., 2006). In this thesis the localization of B. floridanus could be documented throughout all life stages of the host by fluorescent in situ hybridization (FISH) and confocal laser scanning microscopy. A layer of densely filled bacteriocytes surrounding the gut could already be identified in first instar larvae. In contrast to previous assumptions, the bacteria are not restricted to these cells in later stages, as until the eclosion of the young adult workers bacteria massively infect other midgut cells. Concordant with previous findings, bacterial load is highest at the end of metamorphosis and symbiont numbers decrease in older workers, yet densely filled bacteriocytes are still visible after several months. The expression of the bacterial genes during characteristic life stages of the C. floridanus was assessed by macroarray and qRT- PCR- based experiments. In general, especially molecular chaperones, central basic metabolism and may putative symbiosis related factors like pathways leading to essential amino acids or nitrogen recycling show highest absolute expression levels. A positive correlation between expression level and GC- content of the genes can be observed, which is caused by a higher selection pressure and lower mutation rate of these essential factors (Schaber et al., 2005). Protein analyses confirmed the correlation between gene expression and translation of the most abundant factors. Many B. floridanus genes exhibit a dynamic expression during the different host stages but the extent of this gene regulation is modest as compared to free living bacteria. Expression profiles of genes located next to each other on the genome allow proposal of local transcription units, which were confirmed experimentally in several cases. Often genes that are not clustered locally but belong to related metabolic functions also exhibit similar expression patterns. This indicates the existence of basic mechanisms of gene regulation despite the low number of transcription factors annotated in the B. floridanus genome (Gil et al., 2003). In late pupal stages symbiosis related genes often show a higher expression compared to basic metabolic functions. This especially includes biosynthetic pathways for aromatic and branched amino acids, which are needed by the host at this stage in increased amounts, while internal storages are depleted. This could be demonstrated by the significant decrease in storage proteins of the host at the end of the pupal phase. The observed change in bacterial numbers per host exceeds the extent of bacterial gene regulation by far. The symbionts are polyploid in each host stage with up to 100 genome copies per cell. The degree of polyploidy is largely constant during host development. Thus the control over bacterial reproduction seems to be the decisive factor in this symbiosis. The residual regulatory capacities of the symbionts might represent a mechanism of fine tuning of a production unit that has been streamlined by evolution and whose numbers are adjusted according to the host’s needs. In conclusion, this thesis delivers new insights into the complex symbiosis of Blochmannia and Camponotus leading to a better understanding of its biological function and the underlying mechanisms. One of the central mysteries concerning the need of a symbiont for nutritional upgrading for an omnivorous host could be explained by a temporal, stage- dependent relevance of this symbiosis, possibly being the reason for the enormous evolutionary success of this ant genus. KW - Intrazelluläre Symbiose KW - Symbiose KW - Ameisen KW - Mikrobiologie KW - Gram-negative Bakterien KW - Bakterien KW - Differentielle Genexpression KW - Genexpression KW - Entwicklung KW - Blochmannia KW - Camponotus KW - symbiosis KW - endosymbiosis KW - ants KW - bacteria KW - gene expression Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-37238 ER - TY - THES A1 - Li, Naixin T1 - Dorso-ventral Differentiation and Specification of the Mesencephalon in Early Chick Embryos T1 - Die dorsoventrale Differenzierung und Spezifikation des frühen embryonalen Hühnermittelhirn N2 - The chick midbrain is subdivided into functionally distinct ventral and dorsal domains, tegmentum and optic tectum. In the mature tectum, neurons are organized in layers, while they form discrete nuclei in the tegmentum. An interesting characteristic of the embryonic brain is the development of a large optic tectum, of which the growth becomes obvious at embryonic day 3 (E3). Dorsoventral (DV) specification of the early midbrain should thus play a crucial role for the organization of the neuronal circuitry in optic tectum and tegmentum. In the first part of my thesis, I investigated regional commitment and establishment of cellular differences along the midbrain DV axis. I examined the commitment of gene expression patterns in isolated ventral and dorsal tissue in vivo and in vitro, and studied their cell mixing properties. Explant cultures, and grafting of dorsal midbrain into a ventral environment or vice versa, revealed a gradual increase in the autonomy of region-specific gene regulation between, which was accompanied by a gradual increase in differential adhesive properties from E2 to E3, once the DV axis polarity was fixed. These events happened at a time-point when the majority of midbrain cells are not yet differentiated. Long-term transplantation (6 - 9 days) using quail cells from ventral midbrain as grafts showed the same result. Hence, the results suggest that progressive specification of the midbrain DV axis is accompanied by progressively reduced cell mixing between dorsal and ventral precursors, leading to a partial regionalization of midbrain tissue into autonomous units of precursor cell populations. In the second part I investigated the genes that might be involved in regulating the growth of the tectum. In particular, I focused on the role of Pax7 transcription factor, a paired domain protein. The results suggested that Pax7 was involved in regulating the medial-lateral extension of the tectum. Over expression of Pax7 in dorsal midbrain led to an enlarged tectum accompanied by a raise in cell division, while Pax7 knockdown by shrank caused a reduction in tectum. The overall pattern of neuronal differentiation was not disturbed by an up or down regulation of Pax7. Pax7 also positively regulated Pax3, another pair-ruled gene expressed dorsally. These results suggest that Pax7 very likely together with Pax3 could facilitate or maintain neural cell proliferation in the midbrain at early stages and that a regulation of the size in that region does not influence the neuronal patterning of the developmental field. I further checked the expression and function of a GFPase Rab 23, that was suggested to be involved in the DV patterning in mouse neural tube as a negative regulator of Shh signaling. Overexpression of Rab23 indicated that it facilitated the expression of Pax7 and Pax3 in the neural tube and suppressed ventral genes like Nkx6.1 cell autonomously, however, it did not disturb neuronal patterning. Interestingly, a thorough expression study of Rab 23 during chick early development revealed that Rab23 is already expressed very early and asymmetrically during gastrulation, suggesting a possible role of Rab23 on the left-right determination of Hensen’s node. In combination with the result that Rab23 is expressed in the notochord early in development, I assume that both Rab23 and Shh exist in all neural progenitor cells initially, and when their expression patterns separate gradually the neural cells adopt a ventral or dorsal fate according to their location along the dorsoventral axis. The avian embryo is a classic system used widely to investigate questions of vertebrate development. The easy and cheap accessibility of the embryo for in ovo or ex ovo experiments all around the year make it an ideal animal model to work with. The only recently developed method of over expressing genes in specific cells or regions in the chick embryo by electroporation enabled me to study different ways of gene suppression using this way of gene transfection. Thus, I compared the effect of long-hairpin and short hairpin dsRNA in different vectors and antisense morpholino oligonucleotides. The results revealed that all hairpin dsRNA constructs did reduce gene and protein expression often accompanied by morphological changes. Most efficiently were shRNAi constructs cloned into a siRNA-specific vector – pSilencer 1.0-U6. Gene silencing was already well observed 36 hours after transfection. In comparison antisense morpholino oligonucleotides did not show such big gene reduction as the shRNA in pSilencer. Taken together, this methodical research proposes that the shRNA in the pSilencer vector was a good and effective tool to reduce gene and protein expression locally. N2 - Das Mittelhirn des Huhns wird in funktionel unterschiedliche, ventrale und dorsale Regionen eingeteilt, nämlich das Tegmentum ventral und das optisches Tectum dorsal. Im vollentwickelten Tectum bilden Nervenzellen Schichten, während das Tegmentum aus unterschiedlichen Nuclei besteht. Ein charakteristisches Merkmal des embryonalen Gehirns ist die Entwicklung eines großen optischen Techtums, die am dritten embryonalen Tag (E3) sehr deutlich zu beobachten ist. Diese unterschiedliche funktionelle und morphologische Entwicklung des Mittelhirns deutet daraufhin, das die dorsoventrale Spezifikation des frühen Mittelhirns für der Organisation neuronaler Netzwerke im optischen Tectum und Tegmentum eine kritische Rolle spielt. Im ersten Teil dieser Doktorarbeit wurde die regionale Bestimmung und Bildung zellulärer Unterschiede entlang der DV Achse des Mittelhirns untersucht. Dafür bestimmte ich den Zeitpunkt, an dem spezifische ventrale und dorsale Genexpressionsmuster festgelegt werden in isoliertem ventralen und dorsalen Gewebe in vivo and in vitro. Desweiteren untersuchte ich die Entwicklung unterschiedlicher adhäsiver Eigenschaften von ventralen und dorsalen Zellen in vitro. Explantatkulturen und Transplantationen von dorsalem Mittelhirn in eine ventrale Umgebung oder vice versa liessen eine schrittweise Zunahme der Autonomie der region-spezifischen Genregulation erkennen. Dies wurde von einer schrittweisen Zunahme des differentialen Adhäsionsverhaltens von ventralen und dorsalen Mittelhirnzellen von E2 zu E3 begleitet, der Zeitspanne, in der die Polarität der DV Achse festgelegt wurde. Diese Entwicklungsprozesse fanden u einem Zeitpunkt statt, an dem die meisten Zellen des Mittelhirns noch nicht differenziert hatten. Transplantationen,. von ventralen Mittelhirnzellen der Wachtel ins dorsale Hühnertecctum, die erst nach mehreren Tagen (6 - 9 Tage) untersucht wurden, zeigten das gleiche Ergebnis. Diese Ergebnisse lassen schliessen, dass eine partielle Regionalisierung des Mittelhirns in autonome Einheiten von Vorläuferzellen der dorsoventralen Achse stattfindet. Dies erlaubt den Zellen eine Positionsidentität zu bewahren – unhabhängig von der wachsenden Distanz zu Signalzentren. Im zweiten Teil meiner Arbeit untersuchte ich Gene, die das Wachstum und die spezifische Entwicklung des Tectums regulieren könnten. Die Arbeit konzentrierte sich speziell auf die Rolle von Pax7, ein Mitglied der sogenannten ‚pair-ruled’ Familie von Transkriptionsfaktoren, und auf die Rolle von Rab23, einer GTPase, die den Shh-Signalweg im dorsalen Neuralrohr inhibiert. Dieser Versuch zeigte, dass Pax7 an der Regulation der medio-lateral Ausdehnung des Tectums beteiligt ist. Überexpression von Pax7 im dorsalen Mittelhirn führte zu einer Vergrößerung des Tectums, die von einer Zunahme der Zellteilung begleitet wurde, während Knockdown von Pax7 eine Größereduktion des Tectums verursachte. Das neuronale Differenzierungsmuster im generellen wurde nicht von der Überexpression oder Repression von Pax7 gestört. Pax7 induzierte ausserdem Pax3, ein Mitglied derselben Familie, das ebenfalls dorsal exprimiert wird und unterdrückte ventrale Gene wie Nkx6.1. Diese Ergebnisse lassen vermuten, dass Pax7, sehr wahrscheinlich zusammen mit Pax3, die neural Zellproliferation im Mittelhirn in frühen Entwicklungsstadien fördert oder auf einem konstanten Level hält und dass die Muster der neuronalen Entwicklung nicht durch der Regulation der Größe dieser Region beeinflusst wird. Außerdem förderte Rab 23, das sehr wahrscheinlich ein negativer Regulator von Shh ist, die Expression von Pax7 und Pax3 im ventralen Mittelhirn und unterdrückte ventrale Gene wie Nkx6.1. Die Überexpression von Rab 23 beeinflusste auch nicht das neuronale Differenzierungsmusterung. Interessanterweise zeigte eine genaue Analyse der Expression von Rab 23 während der frühen Entwicklungsstadien des Huhns, dass Rab 23 bereits sehr früh und asymmetrisch während der Gastrulation exprimiert wurde. Dies deutet auf eine mögliche Rolle von Rab 23 für die links-rechts Determination des Hensen´s node an. Betrachtet man diese Ergebnisse zusammen, dann könnte man zu fogender Schlussfolgerung kommen, nämlich, dass sowohl Rab 23 als auch Shh früh in allen neural Progenitorzellen existieren, und dass die neuralen Zellen jeweils nach ihrer Lage entlang der dorsoventral Achse ein ventrales oder dorsales Schicksal annehmen, wenn das sich die Expressionsmuster von Rab 23 und Shh allmänlich trennen. Der Vogelembryo ist ein klassisches und häufig benutztes System, um die Entwicklung der Vertebraten zu untersuchen. Die einfache und preiswerte Zugänglichkeit des Embryos für in ovo oder ex ovo Experiment das ganze Jahr über machen ihn zu einem idealen Tiermodell. Die in den letzten Jahren entwickelte Methode der Elektroporation eines Embryos zum Gentransfer in die Zellen, ermöglichte es mir unterschiedliche Weisen der Genunterdrückung in embryonalem Gewebe zu testen und zu vergleichen.Ich verglich in dieser Untersuchung die Wirkung von langen und kurzen Haarnadel-RNAs (hairpin RNA) in verschieden Vektoren mit der Wirkung von Antisense-morpholino-Oligonucleotiden verglichen. Die Ergebnisse zeigten, dass alle Haarnadel-dsRNA-Konstruktionen die Gen- und Proteinexpression reduzierten, wobei es häufig zu einer morphologischen Veränderung kam. Die kurze shRNAi-Konstruktionen, die in einen siRNA-spezifischen Vektor – pSilencer 1.0-U6 - geklont wurden war, zeigte sich dabei am effizientesten.. Die Herunterregulierung der Gene wurde bereits 36 Stunden nach der Transfektion beobachtet. Im Gegensatz dazu, zeigten die Antisense-Morpholino-Oligonucleotiden keine solche starke Reduktion wie das shRNA in pSilencer. Zusammenfassend zeigt diese methodische Untersuchung, dass die shRNA im pSilencer-Vektor ein gutes und effektives Werkzeug ist, um Gen- und Proteinexpression örtlich zu reduzieren. KW - Differenzierung KW - Embryo KW - Genexpression KW - Mittelhirn KW - Spezifikation KW - Dorso-ventral Patterning KW - Mesencephalon KW - Morpholino KW - Neuronal Proliferation KW - Pax3 KW - Pax7 KW - Rab23 KW - Shh KW - siRNA KW - Transplantation Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-32950 ER - TY - THES A1 - Breher, Stephanie T1 - Die kardiale Funktion von Popdc1 in der Maus: Vom Gen zum Phän T1 - The cardiac function of Popdc1 in mouse: From gene to phene N2 - Die Popeye domain containing (Popdc)-Gene bilden eine evolutionär stark konservierte Genfamilie mit präferenzieller Expression im Herzen und in der Skelettmuskulatur. In dieser Arbeit konnte gezeigt werden, dass Popdc1 in kardialen Myozyten in Glanzstreifen, lateralen Membranen und im T-Tubuli-System exprimiert wird und mit Ionenkanälen und anderen myozytären Membranproteinen wie Cav1.2, Caveolin 3 und NCX1 kolokalisiert ist. Im ventrikulären Reizleitungssystem ist die Expression von Popdc1 gegenüber dem ventrikulären Arbeitsmyokard erhöht, während Atrium und Sinusknoten nahezu äquivalente Expressionsdomänen aufweisen. Mithilfe von elektrophysiologischen Untersuchungen konnte bei den Popdc1-Nullmutanten eine stressinduzierte Sinusbradykardie festgestellt werden, die altersabhängig auftritt und auf Sinuspausen zurückzuführen ist. Histologische Untersuchungen, unter Zuhilfenahme des Sinusknotenmarkers HCN4, zeigten einen Zellverlust im inferioren Teil des Sinusknotens. Popdc1 ist ein Transmembranprotein, das eine 150 Aminosäure umfassende, stark konservierte Popeye-Domäne aufweist. Für diese Domäne konnte auf struktureller Ebene eine Homologie zu zyklischen Nukleotid-Bindungsdomänen vorhergesagt und eine Bindung an cAMP und cGMP experimentell demonstriert werden. Es handelt sich bei den Popdc-Proteinen um einen neuen Zweig der Bindungsproteine für zyklische Nukleotidmonophosphate (cNMP). Die Bindungssequenz weist signifikante Unterschiede zu anderen bereits identifizierten cNMP-Bindungsproteinen auf. Weiterhin wurde die Interaktion von Popdc1 mit TREK1, einem Mitglied der Tandemporenkanäle untersucht. Es zeigte sich, dass Popdc1 nach Koexpression in Froschoozyten, den TREK1-Strom erhöht und dass die β-adrenerge Inhibition des TREK1 Kanals durch Popdc1 verstärkt wird. Im Arbeitsmyokard, im kardialen Reizleitungssystem und in kotransfizierten Cos7-Zellen werden beide Proteine überlappend exprimiert. Diese Daten zeigen, dass Popdc1 eine wichtige Funktion bei der Regulation der Schrittmacheraktivität, der Aufrechterhaltung der Sinusknotenmorphologie und der Modulation von Ionenkanälen aufweist. Interessanterweise wurden von unserer Arbeitsgruppe bereits die gleichen Phänotypen für die Popdc2 Maus beschrieben, sodass die Popdc Genfamilie überlappende und redundante Funktionen aufweist. N2 - The Popeye domain containing (Popdc) family is a highly evolutionary conserved gene family, which shows no homology to other genes. This family shows a preferential expression in the heart and skeletal muscle. In the present study it is shown that Popdc1 protein in the heart was predominantly localized to the intercalated disc, lateral membranes and T-tubularsystem, where it was co-localized with other cardiac membrane proteins such as Cav1.2, Caveolin 3 and NCX1. The expression of Popdc1-LacZ transgene as well as Popdc1 protein was elevated in the ventricular conduction system compared to the ventricular working myocardium. In contrast, expression in atrial tissue was equivalent to the expression in the sinus node. Electrophysiological measurements in Popdc1 null mutants revealed a stressinduced and age-dependent sinus bradycardia, which was due to an increase in sinus pauses and independent of the nature of stress. Histological examinations with the help of the sinus node marker HCN4 revealed structural alterations in the inferior part of the sinus node in 8 months old Popdc1-mice. Biochemical examinations of Popdc1 showed that Popdc1 is a transmembrane protein. The N-terminus is extracellular and glycosylated, while the Cterminus is intracellular and harbours a highly conserved 150 amino acid-long Popeye domain. For this domain, a predicted homology to cyclic nucleotide binding domains was observed. Binding of cAMP and cGMP was experimentally demonstrated and thus, the Popdc proteins constitute a novel branch of the cyclic nucleotide binding protein family. Furthermore interaction of Popdc1 with the tandem pore channel TREK1 was examined. After co-injection of Popdc1 the TREK1 current was increased in Xenopus oocytes. Furthermore, β-adrenergic inhibition of TREK1 current was enhanced in the presence of Popdc1. In working myocardium, conduction tissue as well as in co-transfected Cos7 cells the two proteins showed a similar distribution. In conclusion, Popdc1 is involved in cardiac pacemaker activity, maintaining sinus node morphology and modulating ion channels that contribute to the setting of the membrane potential in cardiac myocytes. Interestingly, a highly similar phenotype was observed for the Popdc2 mouse mutant and therefore the Popdc gene family displays overlapping and redundant functions. KW - Sinusknoten KW - Genexpression KW - Elektrophysiologie KW - Popdc1 KW - Transmembranprotein KW - Sinusknotenbradykardie KW - cAMP-Bindung KW - Popdc1 KW - transmembrane protein KW - sinus bradycardia KW - cAMP binding Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-37283 ER -