TY - THES A1 - Fasemore, Akinyemi Mandela T1 - Genomic and internet based analysis of \(Coxiella\) \(burnetii\) T1 - Genomische und Internet-basierte Analyse von \(Coxiella\) \(burnetii\) N2 - Coxiella burnetii, a Gram negative obligate intracellular bacterium, is the causative agent of Q fever. It has a world wide distribution and has been documented to be capable of causing infections in several domestic animals, livestock species, and human beings. Outbreaks of Q fever are still being observed in livestock across animal farms in Europe, and primary transmission to humans still oc- curs especially in animal handlers. Public health authorities in some countries like Germany are required by law to report human acute cases denoting the significance of the challenge posed by C. burnetii to public health. In this thesis, I have developed a platform alongside methods to address the challenges of genomic analyses of C. burnetii for typing purposes. Identification of C. burnetii isolates is an important task in the laboratory as well as in the clinics and genotyping is a reliable method to identify and characterize known and novel isolates. Therefore, I designed and implemented several methods to facilitate the genotyping analyses of C. burnetii genomes in silico via a web platform. As genotyping is a data intensive process, I also included additional features such as visualization methods and databases for interpretation and storage of obtained results. I also developed a method to profile the resistome of C. burnetii isolates using a machine learning approach. Data about antibiotic resistance in C. burnetii are scarce majorly due to its lifestyle and the difficulty of cultivation in laboratory media. Alternative methods that rely on homology identification of resistance genes are also inefficient in C. burnetii, hence, I opted for a novel approach that has been shown to be promising in other bacteria species. The applied method relied on an artificial neural network as well as amino acid composition of position specific scoring matrix profile for feature extraction. The resulting model achieved an accuracy of ≈ 0.96 on test data and the overall performance was significantly higher in comparison to existing models. Finally, I analyzed two new C. burnetii isolates obtained from an outbreak in Germany, I compared the genome to the RSA 493 reference isolate and found extensive deletions across the genome landscape. This work has provided a new digital infrastructure to analyze and character- ize C. burnetii genomes that was not in existence before and it has also made a significant contribution to the existing information about antibiotic resistance genes in C. burnetii. N2 - Coxiella burnetii, ein Gram-negatives, obligat intrazelluläres Bakterium, ist der Erreger des Q-Fiebers. Er hat eine weltweite Verbreitung und ist nachweis- lich in der Lage, Infektionen bei verschiedenen Haustieren, Nutztieren und Menschen zu verursachen. Ausbrüche von Q-Fieber werden immer noch in Tierbeständen in Europa beobachtet, und die Primärübertragung auf den Men- schen erfolgt nach wie vor allem durch Kontakt mit entsprechenden Tieren und ihren Ausscheidungen. Das öffentliche Gesundheitssystem in einigen Ländern wie Deutschland hat eine Meldepflicht für akute Fälle beim Menschen festge- legt, was die Bedeutung des Erregers bzw. seiner ausgelösten Erkrankung für die öffentliche Gesundheit verdeutlicht. In dieser Doktorarbeit habe ich eine Plattform neben weiteren Methoden entwickelt, um die Herausforderungen der Genomanalyse von C. burnetii für Genotypisierungsverfahren zu adressieren. Die Identifizierung von C. burnetii-Isolaten erfüllt eine wichtige Funktion im La- bor sowie in den Krankenhäusern, und die Genotypisierung ist eine verlässliche Methode, um bekannte und neue Isolate zu identifizieren und zu charakte- risieren. Daher habe ich mehrere Methoden konzipiert und implementiert, um die Analyse zur Genotypisierung von C. burnetii-Genomen in silico über eine Web-Plattform zu erleichtern. Da die Genotypisierung ein datenintensiver Prozess ist, habe ich ebenfalls zusätzliche Features wie Visualisierungsme- thoden und Datenbanken zur Interpretation und Speicherung der erhaltenen Ergebnisse mitaufgenommen. Ferner habe ich eine Methode zur Erstellung des Resistomprofils von C. burnetii-Isolaten unter Verwendung eines Ansat- zes des maschinellen Lernens entwickelt. Daten über Resistenzfaktoren bei C. burnetii sind rar, was hauptsächlich auf die obligat intrazelluläre Lebensweise der Coxiellen und die Schwierigkeiten bei der Kultivierung in Labormedien zurückzuführen ist. Alternative Methoden, die auf der Identifizierung der Ho- mologie von Resistenzgenen basieren, sind bei C. burnetii ebenfalls ineffizient. Aus diesem Grund entschied ich mich für einen neuen Ansatz, der sich bereits bei anderen Bakterienspezies als vielversprechend erwiesen hat. Die verwen- dete Methode basiert auf einem artifiziellen neuronalen Netzwerk sowie auf der Aminosäurezusammensetzung des positionsspezifischen Matrixprofils zur Extraktion von Features. Das daraus resultierende Modell erzielte eine Genauig- keit von ≈ 0,96 bei den Testdaten und die Gesamtleistung war signifikant höher im Vergleich zu den bereits vorhandenen Methoden. Schließlich analysierte ich zwei neue C. burnetii-Isolate, die von einem Q-Fieberausbruch in Deutschland stammten. Ich verglich das Genom mit dem RSA 493 Referenz Isolat und fand extensive Deletionen über das Genom sequenz. Mit dieser Arbeit wird eine neue digitale Infrastruktur zu Analyse von C. burnetii- Genomen bereitgestellt, die es vorher noch nicht gab. Zudem liefert diese Arbeit einen wichtigen Beitrag zu den bereits vorhandenen Informationen über Antibiotikaresistenzgene bei in C. burnetii. KW - Bioinformatics KW - Coxiella burnetii KW - Genotyping KW - Web services KW - Genomics Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-296639 ER - TY - THES A1 - Horn, Hannes T1 - Analysis and interpretation of (meta-)genomic data from host-associated microorganisms T1 - Analyse und Interpretation von (meta-)genomischen Daten aus Wirt-assoziierten Mikroorganismen N2 - Host–microbe interactions are the key to understand why and how microbes inhabit specific environments. With the scientific fields of microbial genomics and metagenomics, evolving on an unprecedented scale, one is able to gain insights in these interactions on a molecular and ecological level. The goal of this PhD thesis was to make (meta–)genomic data accessible, integrate it in a comparative manner and to gain comprehensive taxonomic and functional insights into bacterial strains and communities derived from two different environments: the phyllosphere of Arabidopsis thaliana and the mesohyl interior of marine sponges. This thesis focused first on the de novo assembly of bacterial genomes. A 5–step protocol was developed, each step including a quality control. The examination of different assembly software in a comparative way identified SPAdes as most suitable. The protocol enables the user to chose the best tailored assembly. Contamination issues were solved by an initial filtering of the data and methods normally used for the binning of metagenomic datasets. This step is missed in many published assembly pipelines. The described protocol offers assemblies of high quality ready for downstream analysis. Subsequently, assemblies generated with the developed protocol were annotated and explored in terms of their function. In a first study, the genome of a phyllosphere bacterium, Williamsia sp. ARP1, was analyzed, offering many adaptions to the leaf habitat: it can deal with temperature shifts, react to oxygen species, produces mycosporins as protection against UV–light, and is able to uptake photosynthates. Further, its taxonomic position within the Actinomycetales was infered from 16S rRNA and comparative genomics showing the close relation between the genera Williamsia and Gordonia. In a second study, six sponge–derived actinomycete genomes were investigated for secondary metabolism. By use of state–of–the–art software, these strains exhibited numerous gene clusters, mostly linked to polykethide synthases, non–ribosomal peptide synthesis, terpenes, fatty acids and saccharides. Subsequent predictions on these clusters offered a great variety of possible produced compounds with antibiotic, antifungal or anti–cancer activity. These analysis highlight the potential for the synthesis of natural products and the use of genomic data as screening toolkit. In a last study, three sponge–derived and one seawater metagenomes were functionally compared. Different signatures regarding the microbial composition and GC–distribution were observed between the two environments. With a focus on bacerial defense systems, the data indicates a pronounced repertoire of sponge associated bacteria for bacterial defense systems, in particular, Clustered Regularly Interspaced Short Palindromic Repeats, restriction modification system, DNA phosphorothioation and phage growth limitation. In addition, characterizing genes for secondary metabolite cluster differed between sponge and seawater microbiomes. Moreover, a variety of Type I polyketide synthases were only found within the sponge microbiomes. With that, metagenomics are shown to be a useful tool for the screening of secondary metabolite genes. Furthermore, enriched defense systems are highlighted as feature of sponge-associated microbes and marks them as a selective trait. N2 - Mikroben–Wirt Interaktionen sind der Schlüssel, um zu verstehen “Wie?” und “Warum?” Mikroben in bestimmten Umgebungen vorkommen. Mithilfe von Genomik und Metagenomik lassen sich Einblicke auf dem molekularen sowie ökolgischen Level gewinnen. Ziel dieser Arbeit war es, diese Daten zugänglich zu machen und zu vergleichen, um Erkenntnisse auf taxonomischer und funktionaler Ebene in bakterielle Isolate und bakterielle Konsortien zu erhalten. Dabei wurden Daten aus zwei verschiedenen Umgebungen erhoben: der Phyllosphäre von Arabidopsis thaliana und aus der Mesohyl–Matrix mariner Schwämme. Das Ziel war zunächst, bakterieller Genome denovo zu assemblieren. Dazu wurde ein Protokoll, bestehend aus 5 Schritten, entwickelt. Durch Verwendung verschiedener Soft- ware zum Assemblieren konnte SPAdes als am besten geeignet für die gegebenen Daten herausgearbeitet werden. Durch anfängliches Filtern der Daten konnte erste Kontamina- tion entfernt werden. Durch das Anwenden weiterer Methoden, welche ursprünglich für metagenomische Datensätze entwickelt wurden, konnten weitere Kontaminationen erkannt und von den “echten” Daten getrennt werden. Ein Schritt, welcher in den meisten pub- lizierten Assembly–Pipelines fehlt. Das Protokoll ermöglicht das Erstellen hochqualitativer Assemblies, welche zur weiteren Analyse nicht weiter aufbereitet werden müssen. Nachfolgend wurden die generierten Assemblies annotiert. Das Genom von William- sia sp. ARP1 wurde untersucht und durch dessen Interpretation konnten viele Anpassungen an die Existenz in der Phyllosphäre gezeigt werden: Anpassung an Termperaturveränderun- gen, Produktion von Mycosporinen als Schutz vor UV–Strahlung und die Möglichkeit, von der Pflanze durch Photosynthese hergestellte Substanzen aufzunehmen. Seine taxonomische Position wurde aufgrund von 16S rRNA sowie vergleichende Genomik bestimmt. Dadurch konnte eine nahe Verwandtschaft zwischen den Gattungen Williamsia und Gordonia gezeigt werden. In einer weiteren Studie wurden sechs Actinomyceten–Genome, isoliert aus Schwämmen, hinsichtlich ihres Sekundärmetabolismus untersucht. Mihilfe moderner Software konnten in zahlreiche Gen–Cluster identifiziert werden. Zumeist zeigten diese eine Zugehörigkeit zu Polyketidsynthasen, Nichtribosomalen Peptidsynthasen, Terpenen, Fettsäuren oder Sac- chariden. Durch eine tiefere Analyse konnten die Cluster mit chemischen Verbindungen assoziiert werden, welche antibakterielle oder fungizide Eigenschaften besitzen. In der letzten Untersuchung wurden Metagenome von drei Schwämmen sowie Meerwasser auf funktioneller Ebene verglichen. Beobachtet wurden Unterschiede in deren mikrobiellen Konsortien und GC–Gehalt. Schwamm–assoziierte Bakterien zeigten ein ausgeprägtes Inventar an Verteidigungsmechanismen gegenüber deren Vertretern aus dem Meerwasser. Dies beinhaltete vor allem: Clustered Regularly Interspaced Short Palindromic Repeats, das Restriktions-Modifikationssystem, DNA Phosphorothioation, oder Gene, welche das Wachstum von Phagen hemmen können. Gene für Sekundärmetabolite waren zwischen Schwamm– und Meerwasser–Metagenomen unterschiedlich stark ausgeprägt. So konnten Typ I Polyketidsynthasen ausschließlich in den Schwamm–Metagenomen gefunden werden. Dies zeigt, dass metagenomische Daten ebenso wie genomische Daten zur Untersuchung des Sekundärmetabolismus genutzt werden können. Des Weiteren zeigt die Anhäufung an Verteidigungsmechanismen eine Anpassung von Schwamm–assoziierten Mikroben an ihre Umgebung und ist ein Hinweis auf deren mögliche selektive Eigenschaft. KW - Bakterien KW - Meeresschwämme KW - Metagenom KW - Phyllosphäre KW - Ackerschmalwand KW - Metagenomics KW - Genomics KW - Phyllosphere KW - Sponges KW - Bacteria KW - Deep sequencing KW - Arabidopsis thaliana KW - Bioinformatics Y1 - 2017 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-152035 ER -