TY - THES A1 - Ankenbrand, Markus Johannes T1 - Squeezing more information out of biological data - development and application of bioinformatic tools for ecology, evolution and genomics T1 - Mehr aus biologischen Daten herausholen - Entwicklung und Anwendung bioinformatischer Programme für Ökologie, Evolution und Genomik N2 - New experimental methods have drastically accelerated the pace and quantity at which biological data is generated. High-throughput DNA sequencing is one of the pivotal new technologies. It offers a number of novel applications in various fields of biology, including ecology, evolution, and genomics. However, together with those opportunities many new challenges arise. Specialized algorithms and software are required to cope with the amount of data, often requiring substantial training in bioinformatic methods. Another way to make those data accessible to non-bioinformaticians is the development of programs with intuitive user interfaces. In my thesis I developed analyses and programs to tackle current problems with high-throughput data in biology. In the field of ecology this covers the establishment of the bioinformatic workflow for pollen DNA meta-barcoding. Furthermore, I developed an application that facilitates the analysis of ecological communities in the context of their traits. Information from multiple public databases have been aggregated and can now be mapped automatically to existing community tables for interactive inspection. In evolution the new data are used to reconstruct phylogenetic trees from multiple genes. I developed the tool bcgTree to automate this process for bacteria. Many plant genomes have been sequenced in current years. Sequencing reads of those projects also contain data from the chloroplasts. The tool chloroExtractor supports the targeted extraction and analysis of the chloroplast genome. To compare the structure of multiple genomes specialized software is required for calculation and visualization of the relationships. I developed AliTV to address this. In contrast to existing programs for this task it allows interactive adjustments of produced graphics. Thus, facilitating the discovery of biologically relevant information. Another application I developed helps to analyze transcriptomes even if no reference genome is present. This is achieved by aggregating the different pieces of information, like functional annotation and expression level, for each transcript in a web platform. Scientists can then search, filter, subset, and visualize the transcriptome. Together the methods and tools expedite insights into biological systems that were not possible before. N2 - Neue experimentelle Methoden haben die Geschwindigkeit und Masse, in der biologische Daten generiert werden, in den letzten Jahren enorm gesteigert. Eine zentrale neue Technologie ist die Hochdurchsatzsequenzierung von DNA. Diese Technik eröffnet eine ganze Reihe Anwendungsmöglichkeiten in vielen Bereichen der Biologie, einschließlich der Ökologie, Evolution und Genomik. Neben den neuen Möglichkeiten treten jedoch auch neue Herausforderungen auf. So bedarf es spezialisierter Algorithmen und Computerprogramme, um mit der Masse an Daten umgehen zu können. Diese erfordern in der Regel ein fundiertes Training in bioinformatischen Methoden. Ein Weg, die Daten auch Wissenschaftlern ohne diesen Hintergrund zugänglich zu machen ist die Entwicklung von Programmen, die sich intuitiv bedienen lassen. In meiner Doktorarbeit habe ich Analysen und Programme entwickelt, um einige aktuelle Probleme mit Hochdurchsatzdaten in der Biologie zu lösen. Im Bereich der Ökologie umfasst das die Etablierung der bioinformatischen Methode, um Pollen DNA Metabarcoding durchzuführen. Darüberhinaus habe ich eine Anwendung entwickelt, die es ermöglicht Artgemeinschaften im Kontext ihrer Eigenschaften zu erforschen. Dazu wurden Informationen aus diversen öffentlichen Datenbanken zusammen getragen. Diese können nun automatisch auf bestehende Projekte übertragen und interaktiv analysiert werden. Im Bereich der Evolution ermöglichen die neuen Daten phylogenetische Berechnungen mit multiplen Genen durchzuführen. Um dies für Bakterien zu automatisieren habe ich das Programm bcgTree entwickelt. In den letzten Jahren wurden viele pflanzliche Genome sequenziert. Die Sequenzdaten des pflanzlichen Genoms enthalten auch die des Chloroplasten. Das Programm chloroExtractor unterstützt die gezielte Analyse des Chloroplasten Genoms. Um jedoch die Struktur mehrerer Genome miteinander vergleichen zu können, wird spezielle Software benötigt, die den Vergleich berechnen und visuell darstellen kann. Daher habe ich das Programm AliTV entwickelt. Im Gegensatz zu bestehenden Programmen erlaubt AliTV interaktive Anpassungen der erzeugten Grafik. Das erleichtert es die relevanten Informationen zu finden. Ein weiteres von mir entwickeltes Programm hilft dabei Transkriptom Daten zu analysieren, auch wenn kein Referenzgenom vorliegt. Dazu werden Informationen zu jedem Transkript, z.B. Funktion und Expressionslevel, in einer Webanwendung aggregiert. Forscher können diese durchsuchen, filtern und graphisch darstellen. Zusammen eröffnen die entwickelten Methoden und Programme die Möglichkeit, Erkenntnisse über biologische Systeme zu erlangen, die bislang nicht möglich waren. KW - bioinformatics KW - research software KW - ecology KW - evolution KW - genomics Y1 - 2018 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-156344 ER - TY - THES A1 - Gupta, Shishir Kumar T1 - Re-annotation of Camponotus floridanus Genome and Characterization of Innate Immunity Transcriptome Responses to Bacterial Infections T1 - Re-Annotation des Camponotus floridanus Genoms und Charakterisieren der unspezifischen Immun-Transkriptom-Antwort auf bakterielle Infektionen N2 - The sequencing of several ant genomes within the last six years open new research avenues for understanding not only the genetic basis of social species but also the complex systems such as immune responses in general. Similar to other social insects, ants live in cooperative colonies, often in high densities and with genetically identical or closely related individuals. The contact behaviours and crowd living conditions allow the disease to spread rapidly through colonies. Nevertheless, ants can efficiently combat infections by using diverse and effective immune mechanisms. However, the components of the immune system of carpenter ant Camponotus floridanus and also the factors in bacteria that facilitate infection are not well understood. To form a better view of the immune repository and study the C. floridanus immune responses against the bacteria, experimental data from Illumina sequencing and mass-spectrometry (MS) data of haemolymph in normal and infectious conditions were analysed and integrated with the several bioinformatics approaches. Briefly, the tasks were accomplished in three levels. First, the C. floridanus genome was re-annotated for the improvement of the existing annotation using the computational methods and transcriptomics data. Using the homology based methods, the extensive survey of literature, and mRNA expression profiles, the immune repository of C. floridanus were established. Second, large-scale protein-protein interactions (PPIs) and signalling network of C. floridanus were reconstructed and analysed and further the infection induced functional modules in the networks were detected by mapping of the expression data over the networks. In addition, the interactions of the immune components with the bacteria were identified by reconstructing inter-species PPIs networks and the interactions were validated by literature. Third, the stage-specific MS data of larvae and worker ants were analysed and the differences in the immune response were reported. Concisely, all the three omics levels resulted to multiple findings, for instance, re-annotation and transcriptome profiling resulted in the overall improvement of structural and functional annotation and detection of alternative splicing events, network analysis revealed the differentially expressed topologically important proteins and the active functional modules, MS data analysis revealed the stage specific differences in C. floridanus immune responses against bacterial pathogens. Taken together, starting from re-annotation of C. floridanus genome, this thesis provides a transcriptome and proteome level characterization of ant C. floridanus, particularly focusing on the immune system responses to pathogenic bacteria from a biological and a bioinformatics point of view. This work can serve as a model for the integration of omics data focusing on the immuno-transcriptome of insects. N2 - Das Sequenzieren mehrerer Ameisen Genome innerhalb der letzten 6 Jahre eröffnete neue Forschungswege, um nicht nur die genetische Grundlade sozialer Arten, sondern auch komplexere Systeme wie generelle Immunantworten zu untersuchen. Ähnlich zu anderen sozialen Insekten leben Ameisen in Kolonien, oft mit einer sehr hohen Dichte mit genetisch übereinstimmenden oder nah verwandten Individuen. Das Sozialverhalten und die engen Lebensumstände führen dazu, dass sich Krankheiten in Kolonien schnell ausbreiten können. Dennoch können Ameisen mit der Nutzung ihrer komplexen Immunsystemmechanismen Infektionen effektiv abwehren. Die Zusammensetzung des Immunsystems der Rossameise Camponotus floridanus (C. floridanus) und die Faktoren der Bakterien, welche die Infektionen verursachen sind noch nicht gut untersucht. Um einen besseren Überblick über die verschiedenen Gruppen der Immun- Gene zu bekommen und um die Immunantworten von C. floridanus gegen Bakterien zu untersuchen haben wir experimentelle Daten der Illumina Sequenzierung und der Massenspektrometrie (MS) aus der Hämolymphe unter normalen und unter infizierten Bedingungen analysiert und über verschiedene bioinformatische Ansätzen zusammengefasst. Die Aufgabe wurde in drei Ebenen unterteilt. Zuerst wurde das Genom von C. floridanus neu annotiert, die Verbesserung der existierenden Annotation wurde rechnerisch und mit Transkriptom- Daten erreicht. Mit der Nutzung der auf Homologie- basierenden Methoden, der umfassenden Überprüfung der Literatur und der Nutzung von mRNA Genexpressionsanalysen wurde für C. floridanus dieser Überblick erstellt. Anschließend wurden größere Protein- Protein- Interaktionen (PPI) und Signalnetzwerke von C. floridanus rekonstruiert und analysiert und daraufhin wurden die Infektions-induzierten funktionalen Module im Netzwerk entdeckt und die Expressionsdaten über Netzwerke abgebildet. Zusätzlich wurden die Anteile der Immunantwort bei der Interaktion mit Bakterien mittels der Rekonstruktion von zwischenartlichen PPI Netzwerken identifiziert und diese Interaktionen wurden mit Literaturwerten validiert. In der dritten und letzten Phase wurden Daten der Stadium- spezifischen Massenspektrometrie (MS) von Larven- und Arbeiterameisen analysiert und die Unterschiede in den Immunantworten aufgezeichnet. Zusammengefasst lieferten alle drei Omiks- Ebenen jeweils viele Ergebnisse, zum Beispiel führte die neue Annotation und das Transkription- Profil zu einer generellen Verbesserung der strukturellen und funktionalen Annotation und dem Aufspüren von alternativen Splicing- Ereignissen. Die Netzwerkanalyse deckte die unterschiedlich exprimierten topologisch wichtigen Proteine und die aktiven funktionalen Module auf, die Analyse der MS- Daten erbrachte Ergebnisse über die Stadium- spezifischen Unterschiede in der Immunantwort von C. floridanus gegen bakterielle Pathogene. Rundum, beginnend mit der neuen Annotation des Genoms von C. floridanus stellt diese Arbeit eine Transkriptom- und Protein Charakterisierung der Ameise C. floridanus dar. Besonders lag der Fokus auf die Antworten des Immunsystems auf Pathogene Bakterien aus biologischer- und bioinformatischer Sicht. Diese Arbeit kann als Vorlage für die Integration von Omiks Daten dienen, welche sich auf die Immun- Transkriptome von Insekten fokussieren. KW - Camponotus floridanus KW - Genom KW - Camponotus floridanus KW - Innate immunity KW - Transcriptome KW - Interactome KW - Host-pathogen interactions KW - Host-endosymbiont interactions KW - Re-annotation KW - Gene-prediction KW - Ants KW - Comparative genomics KW - Transkription KW - Immunreaktion KW - Re-Annotation KW - Immun-Transkriptom Y1 - 2018 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-140168 ER -