TY - THES A1 - Carstensen, Anne Carola T1 - Identification of novel N-MYC interacting proteins reveals N-MYC interaction with TFIIIC T1 - Identifizierung von neuen N-MYC interagierenden Proteinen offenbart N-MYC's Interaktion mit TFIIIC N2 - N-MYC is a member of the human MYC proto-oncogene family, which comprises three transcription factors (C-, N- and L-MYC) that function in multiple biological processes. Deregulated expression of MYC proteins is linked to tumour initiation, maintenance and progression. For example, a large fraction of neuroblastoma displays high N-MYC levels due to an amplification of the N-MYC encoding gene. MYCN-amplified neuroblastoma depend on high N-MYC protein levels, which are maintained by Aurora-A kinase. Aurora-A interaction with N-MYC interferes with degradation of N-MYC via the E3 ubiquitin ligase SCFFBXW7. However, the underlying mechanism of Aurora-A-mediated stabilisation of N-MYC remains to be elucidated. To identify novel N-MYC interacting proteins, which could be involved in N-MYC stabilisation by Aurora-A, a proteomic analysis of purified N-MYC protein complexes was conducted. Since two alanine mutations in MBI of N-MYC, T58A and S62A (N-MYC mut), disable Aurora-A-mediated stabilisation of N-MYC, N-MYC protein complexes from cells expressing either N-MYC wt or mut were analysed. Proteomic analysis revealed that N-MYC interacts with two deubiquitinating enzymes, USP7 and USP11, which catalyse the removal of ubiquitin chains from target proteins, preventing recognition by the proteasome and subsequent degradation. Although N-MYC interaction with USP7 and USP11 was confirmed in subsequent immunoprecipitation experiments, neither USP7, nor USP11 was shown to be involved in the regulation of N-MYC stability. Besides USP7/11, proteomic analyses identified numerous additional N-MYC interacting proteins that were not described to interact with MYC transcription factors previously. Interestingly, many of the identified N-MYC interaction partners displayed a preference for the interaction with N-MYC wt, suggesting a MBI-dependent interaction. Among these were several proteins, which are involved in three-dimensional organisation of chromatin domains and transcriptional elongation by POL II. Not only the interaction of N-MYC with proteins functioning in elongation, such as the DSIF component SPT5 and the PAF1C components CDC73 and CTR9, was validated in immunoprecipitation experiments, but also with the POL III transcription factor TFIIIC and topoisomerases TOP2A/B. ChIP-sequencing analysis of N-MYC and TFIIIC subunit 5 (TFIIIC5) revealed a large number of joint binding sites in POL II promoters and intergenic regions, which are characterised by the presence of a specific motif that is highly similar to the CTCF motif. Additionally, N-MYC was shown to interact with the ring-shaped cohesin complex that is known to bind to CTCF motifs and to assist the insulator protein CTCF. Importantly, individual ChIP experiments demonstrated that N-MYC, TFIIIC5 and cohesin subunit RAD21 occupy joint binding sites comprising a CTCF motif. Collectively, the results indicate that N-MYC functions in two biological processes that have not been linked to MYC biology previously. Furthermore, the identification of joint binding sites of N-MYC, TFIIIC and cohesin and the confirmation of their interaction with each other suggests a novel function of MYC transcription factors in three-dimensional organisation of chromatin. N2 - N-MYC ist ein Mitglied der humanen MYC proto-Onkogen Familie, welche drei Transkriptionsfaktoren umfasst (C-,N- und L-MYC), die in zahlreichen biologischen Prozessen fun-gieren. Deregulierte Expression der MYC Proteine ist mit Tumorinitiierung, -erhalt und -progression verbunden. Zum Beispiel zeigt ein großer Anteil an Neuroblastomen aufgrund einer Amplifizierung des N-MYC kodierenden Gens hohe N-MYC Level. MYCN-amplifizierte Neuroblastome hängen von den hohen N-MYC Protein Leveln ab, die durch die Aurora-A Kinase erhalten werden. Die Interaktion von Aurora-A mit N-MYC behindert den Abbau von N-MYC durch die E3 Ubiquitin Ligase SCFFBXW7. Allerdings muss der zugrunde liegende Mechanismus der Aurora-A vermittelten Stabilisierung von N-MYC noch aufgedeckt werden. Um neue N-MYC interagierende Proteine zu identifizieren, welche in der N-MYC Stabilisierung durch Aurora-A involviert sind, wurde eine Proteom Analyse der aufgereinigten N-MYC Proteinkomplexe durchgeführt. Da zwei Alanin-Mutationen in MBI von N-MYC, T58A und S62A (N-MYC mut), die Aurora-A vermittelte Stabilisierung von N-MYC verhindern, wurden N-MYC Protein-Komplexe von Zellen, die entweder N-MYC wt oder mut exprimieren analysiert. Die Proteom Analyse offenbarte, dass N-MYC mit zwei Deubiquitinierenden Enzymen, USP7 und USP11, interagiert, welche das Entfernen von Ubiquitinketten von Zielproteinen katalysieren und dadurch die Erkennung durch das Proteasom und den darauf folgenden Abbau verhindern. Obwohl die Interaktion von N-MYC mit USP7 und USP11 in darauf folgenden Immunpräzipitationsexperimenten bestätigt wurde, konnnte weder für USP7, noch für USP11 gezeigt werden, dass es in die Regulierung der Stabilität von N-MYC involviert ist. Neben USP7/11 wurden in der Proteom Analyse zusätzlich zahlreiche mit N-MYC interagierende Proteine identifiziert, die zuvor noch nicht beschrieben wurden mit MYC Transkriptionsfaktoren zu interagieren. Interessanterweise zeigten viele der identifizierten N-MYC Interaktionspartner eine Präferenz für die Interaktion mit N-MYC wt, was eine MBI-abhängige Interaktion suggeriert. Unter diesen waren einige Proteine, die in die drei-dimensionale Organisation von Chromatindomänen und transkriptioneller Elongation durch POL II involviert sind. Nicht nur die Interaktion von N-MYC mit Proteinen, die in der Elongation agieren, wie die DSIF Komponente SPT5 und die PAF1C Komponenten CDC73 und CTR9, wurden in Immunpräzipitationsexperimenten bestätigt, sondern auch mit dem POL III Transkriptionsfaktor TFIIIC und den Topoisomerasen TOP2A/B. Analyse von ChIP-Sequenzierungsexperimenten für N-MYC und TFIIIC Untereinheit 5 (TFIIIC5) offenbarte eine große Anzahl von gemeinsamen Bindungsstellen in POL II Promotoren und intergenen Regionen, welche durch das Vorkommen eines speziellen Motivs gekennzeichent waren, das dem CTCF Motiv sehr ähnlich ist. Zusätzlich wurde gezeigt, dass N-MYC mit dem ringförmigen Cohesin Komplex interagiert, der dafür bekannt ist an CTCF Motive zu binden und dem Insulator Protein CTCF zu assistieren. Entscheidender Weise zeigten individuelle ChIP Experimente, dass N-MYC, TFIIIC5 und die Cohesin Untereinheit RAD21 gemeinsame Bindungstellen haben, die ein CTCF Motiv enthalten. Zusammenfassend weisen die Ergebnisse darauf hin, dass N-MYC in zwei biologischen Prozessen fungiert, die zuvor nicht mit der Biologie von MYC verbunden wurden. Zudem suggeriert die Identifizierung von gemeinsamen Bindungstellen von N-MYC, TFIIIC und Cohesin und die Bestätigung der Interaktion untereinander eine neue Funktion von MYC Transkriptionsfaktoren in der drei-dimensionalen Organisation von Chromatin. KW - Biologie KW - Transkriptionsfaktor KW - Onkogen KW - N-MYC KW - neuroblastoma KW - TFIIIC KW - Aurora-A KW - mass spectrometry KW - cohesin Y1 - 2018 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-143658 ER - TY - THES A1 - Ankenbrand, Markus Johannes T1 - Squeezing more information out of biological data - development and application of bioinformatic tools for ecology, evolution and genomics T1 - Mehr aus biologischen Daten herausholen - Entwicklung und Anwendung bioinformatischer Programme für Ökologie, Evolution und Genomik N2 - New experimental methods have drastically accelerated the pace and quantity at which biological data is generated. High-throughput DNA sequencing is one of the pivotal new technologies. It offers a number of novel applications in various fields of biology, including ecology, evolution, and genomics. However, together with those opportunities many new challenges arise. Specialized algorithms and software are required to cope with the amount of data, often requiring substantial training in bioinformatic methods. Another way to make those data accessible to non-bioinformaticians is the development of programs with intuitive user interfaces. In my thesis I developed analyses and programs to tackle current problems with high-throughput data in biology. In the field of ecology this covers the establishment of the bioinformatic workflow for pollen DNA meta-barcoding. Furthermore, I developed an application that facilitates the analysis of ecological communities in the context of their traits. Information from multiple public databases have been aggregated and can now be mapped automatically to existing community tables for interactive inspection. In evolution the new data are used to reconstruct phylogenetic trees from multiple genes. I developed the tool bcgTree to automate this process for bacteria. Many plant genomes have been sequenced in current years. Sequencing reads of those projects also contain data from the chloroplasts. The tool chloroExtractor supports the targeted extraction and analysis of the chloroplast genome. To compare the structure of multiple genomes specialized software is required for calculation and visualization of the relationships. I developed AliTV to address this. In contrast to existing programs for this task it allows interactive adjustments of produced graphics. Thus, facilitating the discovery of biologically relevant information. Another application I developed helps to analyze transcriptomes even if no reference genome is present. This is achieved by aggregating the different pieces of information, like functional annotation and expression level, for each transcript in a web platform. Scientists can then search, filter, subset, and visualize the transcriptome. Together the methods and tools expedite insights into biological systems that were not possible before. N2 - Neue experimentelle Methoden haben die Geschwindigkeit und Masse, in der biologische Daten generiert werden, in den letzten Jahren enorm gesteigert. Eine zentrale neue Technologie ist die Hochdurchsatzsequenzierung von DNA. Diese Technik eröffnet eine ganze Reihe Anwendungsmöglichkeiten in vielen Bereichen der Biologie, einschließlich der Ökologie, Evolution und Genomik. Neben den neuen Möglichkeiten treten jedoch auch neue Herausforderungen auf. So bedarf es spezialisierter Algorithmen und Computerprogramme, um mit der Masse an Daten umgehen zu können. Diese erfordern in der Regel ein fundiertes Training in bioinformatischen Methoden. Ein Weg, die Daten auch Wissenschaftlern ohne diesen Hintergrund zugänglich zu machen ist die Entwicklung von Programmen, die sich intuitiv bedienen lassen. In meiner Doktorarbeit habe ich Analysen und Programme entwickelt, um einige aktuelle Probleme mit Hochdurchsatzdaten in der Biologie zu lösen. Im Bereich der Ökologie umfasst das die Etablierung der bioinformatischen Methode, um Pollen DNA Metabarcoding durchzuführen. Darüberhinaus habe ich eine Anwendung entwickelt, die es ermöglicht Artgemeinschaften im Kontext ihrer Eigenschaften zu erforschen. Dazu wurden Informationen aus diversen öffentlichen Datenbanken zusammen getragen. Diese können nun automatisch auf bestehende Projekte übertragen und interaktiv analysiert werden. Im Bereich der Evolution ermöglichen die neuen Daten phylogenetische Berechnungen mit multiplen Genen durchzuführen. Um dies für Bakterien zu automatisieren habe ich das Programm bcgTree entwickelt. In den letzten Jahren wurden viele pflanzliche Genome sequenziert. Die Sequenzdaten des pflanzlichen Genoms enthalten auch die des Chloroplasten. Das Programm chloroExtractor unterstützt die gezielte Analyse des Chloroplasten Genoms. Um jedoch die Struktur mehrerer Genome miteinander vergleichen zu können, wird spezielle Software benötigt, die den Vergleich berechnen und visuell darstellen kann. Daher habe ich das Programm AliTV entwickelt. Im Gegensatz zu bestehenden Programmen erlaubt AliTV interaktive Anpassungen der erzeugten Grafik. Das erleichtert es die relevanten Informationen zu finden. Ein weiteres von mir entwickeltes Programm hilft dabei Transkriptom Daten zu analysieren, auch wenn kein Referenzgenom vorliegt. Dazu werden Informationen zu jedem Transkript, z.B. Funktion und Expressionslevel, in einer Webanwendung aggregiert. Forscher können diese durchsuchen, filtern und graphisch darstellen. Zusammen eröffnen die entwickelten Methoden und Programme die Möglichkeit, Erkenntnisse über biologische Systeme zu erlangen, die bislang nicht möglich waren. KW - bioinformatics KW - research software KW - ecology KW - evolution KW - genomics Y1 - 2018 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-156344 ER - TY - THES A1 - Gupta, Shishir Kumar T1 - Re-annotation of Camponotus floridanus Genome and Characterization of Innate Immunity Transcriptome Responses to Bacterial Infections T1 - Re-Annotation des Camponotus floridanus Genoms und Charakterisieren der unspezifischen Immun-Transkriptom-Antwort auf bakterielle Infektionen N2 - The sequencing of several ant genomes within the last six years open new research avenues for understanding not only the genetic basis of social species but also the complex systems such as immune responses in general. Similar to other social insects, ants live in cooperative colonies, often in high densities and with genetically identical or closely related individuals. The contact behaviours and crowd living conditions allow the disease to spread rapidly through colonies. Nevertheless, ants can efficiently combat infections by using diverse and effective immune mechanisms. However, the components of the immune system of carpenter ant Camponotus floridanus and also the factors in bacteria that facilitate infection are not well understood. To form a better view of the immune repository and study the C. floridanus immune responses against the bacteria, experimental data from Illumina sequencing and mass-spectrometry (MS) data of haemolymph in normal and infectious conditions were analysed and integrated with the several bioinformatics approaches. Briefly, the tasks were accomplished in three levels. First, the C. floridanus genome was re-annotated for the improvement of the existing annotation using the computational methods and transcriptomics data. Using the homology based methods, the extensive survey of literature, and mRNA expression profiles, the immune repository of C. floridanus were established. Second, large-scale protein-protein interactions (PPIs) and signalling network of C. floridanus were reconstructed and analysed and further the infection induced functional modules in the networks were detected by mapping of the expression data over the networks. In addition, the interactions of the immune components with the bacteria were identified by reconstructing inter-species PPIs networks and the interactions were validated by literature. Third, the stage-specific MS data of larvae and worker ants were analysed and the differences in the immune response were reported. Concisely, all the three omics levels resulted to multiple findings, for instance, re-annotation and transcriptome profiling resulted in the overall improvement of structural and functional annotation and detection of alternative splicing events, network analysis revealed the differentially expressed topologically important proteins and the active functional modules, MS data analysis revealed the stage specific differences in C. floridanus immune responses against bacterial pathogens. Taken together, starting from re-annotation of C. floridanus genome, this thesis provides a transcriptome and proteome level characterization of ant C. floridanus, particularly focusing on the immune system responses to pathogenic bacteria from a biological and a bioinformatics point of view. This work can serve as a model for the integration of omics data focusing on the immuno-transcriptome of insects. N2 - Das Sequenzieren mehrerer Ameisen Genome innerhalb der letzten 6 Jahre eröffnete neue Forschungswege, um nicht nur die genetische Grundlade sozialer Arten, sondern auch komplexere Systeme wie generelle Immunantworten zu untersuchen. Ähnlich zu anderen sozialen Insekten leben Ameisen in Kolonien, oft mit einer sehr hohen Dichte mit genetisch übereinstimmenden oder nah verwandten Individuen. Das Sozialverhalten und die engen Lebensumstände führen dazu, dass sich Krankheiten in Kolonien schnell ausbreiten können. Dennoch können Ameisen mit der Nutzung ihrer komplexen Immunsystemmechanismen Infektionen effektiv abwehren. Die Zusammensetzung des Immunsystems der Rossameise Camponotus floridanus (C. floridanus) und die Faktoren der Bakterien, welche die Infektionen verursachen sind noch nicht gut untersucht. Um einen besseren Überblick über die verschiedenen Gruppen der Immun- Gene zu bekommen und um die Immunantworten von C. floridanus gegen Bakterien zu untersuchen haben wir experimentelle Daten der Illumina Sequenzierung und der Massenspektrometrie (MS) aus der Hämolymphe unter normalen und unter infizierten Bedingungen analysiert und über verschiedene bioinformatische Ansätzen zusammengefasst. Die Aufgabe wurde in drei Ebenen unterteilt. Zuerst wurde das Genom von C. floridanus neu annotiert, die Verbesserung der existierenden Annotation wurde rechnerisch und mit Transkriptom- Daten erreicht. Mit der Nutzung der auf Homologie- basierenden Methoden, der umfassenden Überprüfung der Literatur und der Nutzung von mRNA Genexpressionsanalysen wurde für C. floridanus dieser Überblick erstellt. Anschließend wurden größere Protein- Protein- Interaktionen (PPI) und Signalnetzwerke von C. floridanus rekonstruiert und analysiert und daraufhin wurden die Infektions-induzierten funktionalen Module im Netzwerk entdeckt und die Expressionsdaten über Netzwerke abgebildet. Zusätzlich wurden die Anteile der Immunantwort bei der Interaktion mit Bakterien mittels der Rekonstruktion von zwischenartlichen PPI Netzwerken identifiziert und diese Interaktionen wurden mit Literaturwerten validiert. In der dritten und letzten Phase wurden Daten der Stadium- spezifischen Massenspektrometrie (MS) von Larven- und Arbeiterameisen analysiert und die Unterschiede in den Immunantworten aufgezeichnet. Zusammengefasst lieferten alle drei Omiks- Ebenen jeweils viele Ergebnisse, zum Beispiel führte die neue Annotation und das Transkription- Profil zu einer generellen Verbesserung der strukturellen und funktionalen Annotation und dem Aufspüren von alternativen Splicing- Ereignissen. Die Netzwerkanalyse deckte die unterschiedlich exprimierten topologisch wichtigen Proteine und die aktiven funktionalen Module auf, die Analyse der MS- Daten erbrachte Ergebnisse über die Stadium- spezifischen Unterschiede in der Immunantwort von C. floridanus gegen bakterielle Pathogene. Rundum, beginnend mit der neuen Annotation des Genoms von C. floridanus stellt diese Arbeit eine Transkriptom- und Protein Charakterisierung der Ameise C. floridanus dar. Besonders lag der Fokus auf die Antworten des Immunsystems auf Pathogene Bakterien aus biologischer- und bioinformatischer Sicht. Diese Arbeit kann als Vorlage für die Integration von Omiks Daten dienen, welche sich auf die Immun- Transkriptome von Insekten fokussieren. KW - Camponotus floridanus KW - Genom KW - Camponotus floridanus KW - Innate immunity KW - Transcriptome KW - Interactome KW - Host-pathogen interactions KW - Host-endosymbiont interactions KW - Re-annotation KW - Gene-prediction KW - Ants KW - Comparative genomics KW - Transkription KW - Immunreaktion KW - Re-Annotation KW - Immun-Transkriptom Y1 - 2018 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-140168 ER -