TY  - THES
A1  - Fasemore, Akinyemi Mandela
T1  - Genomic and internet based analysis of \(Coxiella\) \(burnetii\)
T1  - Genomische und Internet-basierte Analyse von \(Coxiella\) \(burnetii\)
N2  - Coxiella burnetii, a Gram negative obligate intracellular bacterium, is the causative
agent of Q fever. It has a world wide distribution and has been documented to
be capable of causing infections in several domestic animals, livestock species,
and human beings. Outbreaks of Q fever are still being observed in livestock
across animal farms in Europe, and primary transmission to humans still oc-
curs especially in animal handlers. Public health authorities in some countries
like Germany are required by law to report human acute cases denoting the
significance of the challenge posed by C. burnetii to public health.
In this thesis, I have developed a platform alongside methods to address the
challenges of genomic analyses of C. burnetii for typing purposes. Identification
of C. burnetii isolates is an important task in the laboratory as well as in the
clinics and genotyping is a reliable method to identify and characterize known
and novel isolates. Therefore, I designed and implemented several methods
to facilitate the genotyping analyses of C. burnetii genomes in silico via a web
platform. As genotyping is a data intensive process, I also included additional
features such as visualization methods and databases for interpretation and
storage of obtained results. I also developed a method to profile the resistome
of C. burnetii isolates using a machine learning approach. Data about antibiotic
resistance in C. burnetii are scarce majorly due to its lifestyle and the difficulty
of cultivation in laboratory media. Alternative methods that rely on homology
identification of resistance genes are also inefficient in C. burnetii, hence, I
opted for a novel approach that has been shown to be promising in other
bacteria species. The applied method relied on an artificial neural network as
well as amino acid composition of position specific scoring matrix profile for
feature extraction. The resulting model achieved an accuracy of ≈ 0.96 on test
data and the overall performance was significantly higher in comparison to
existing models. Finally, I analyzed two new C. burnetii isolates obtained from
an outbreak in Germany, I compared the genome to the RSA 493 reference
isolate and found extensive deletions across the genome landscape.
This work has provided a new digital infrastructure to analyze and character-
ize C. burnetii genomes that was not in existence before and it has also made a
significant contribution to the existing information about antibiotic resistance
genes in C. burnetii.
N2  - Coxiella burnetii, ein Gram-negatives, obligat intrazelluläres Bakterium, ist der
Erreger des Q-Fiebers. Er hat eine weltweite Verbreitung und ist nachweis-
lich in der Lage, Infektionen bei verschiedenen Haustieren, Nutztieren und
Menschen zu verursachen. Ausbrüche von Q-Fieber werden immer noch in
Tierbeständen in Europa beobachtet, und die Primärübertragung auf den Men-
schen erfolgt nach wie vor allem durch Kontakt mit entsprechenden Tieren und
ihren Ausscheidungen. Das öffentliche Gesundheitssystem in einigen Ländern
wie Deutschland hat eine Meldepflicht für akute Fälle beim Menschen festge-
legt, was die Bedeutung des Erregers bzw. seiner ausgelösten Erkrankung für
die öffentliche Gesundheit verdeutlicht. In dieser Doktorarbeit habe ich eine
Plattform neben weiteren Methoden entwickelt, um die Herausforderungen der
Genomanalyse von C. burnetii für Genotypisierungsverfahren zu adressieren.
Die Identifizierung von C. burnetii-Isolaten erfüllt eine wichtige Funktion im La-
bor sowie in den Krankenhäusern, und die Genotypisierung ist eine verlässliche
Methode, um bekannte und neue Isolate zu identifizieren und zu charakte-
risieren. Daher habe ich mehrere Methoden konzipiert und implementiert,
um die Analyse zur Genotypisierung von C. burnetii-Genomen in silico über
eine Web-Plattform zu erleichtern. Da die Genotypisierung ein datenintensiver
Prozess ist, habe ich ebenfalls zusätzliche Features wie Visualisierungsme-
thoden und Datenbanken zur Interpretation und Speicherung der erhaltenen
Ergebnisse mitaufgenommen. Ferner habe ich eine Methode zur Erstellung
des Resistomprofils von C. burnetii-Isolaten unter Verwendung eines Ansat-
zes des maschinellen Lernens entwickelt. Daten über Resistenzfaktoren bei C.
burnetii sind rar, was hauptsächlich auf die obligat intrazelluläre Lebensweise
der Coxiellen und die Schwierigkeiten bei der Kultivierung in Labormedien
zurückzuführen ist. Alternative Methoden, die auf der Identifizierung der Ho-
mologie von Resistenzgenen basieren, sind bei C. burnetii ebenfalls ineffizient.
Aus diesem Grund entschied ich mich für einen neuen Ansatz, der sich bereits
bei anderen Bakterienspezies als vielversprechend erwiesen hat. Die verwen-
dete Methode basiert auf einem artifiziellen neuronalen Netzwerk sowie auf
der Aminosäurezusammensetzung des positionsspezifischen Matrixprofils zur
Extraktion von Features. Das daraus resultierende Modell erzielte eine Genauig-
keit von ≈ 0,96 bei den Testdaten und die Gesamtleistung war signifikant höher
im Vergleich zu den bereits vorhandenen Methoden. Schließlich analysierte ich
zwei neue C. burnetii-Isolate, die von einem Q-Fieberausbruch in Deutschland
stammten. Ich verglich das Genom mit dem RSA 493 Referenz Isolat und fand
extensive Deletionen über das Genom sequenz. Mit dieser Arbeit wird eine
neue digitale Infrastruktur zu Analyse von C. burnetii- Genomen bereitgestellt,
die es vorher noch nicht gab. Zudem liefert diese Arbeit einen wichtigen Beitrag
zu den bereits vorhandenen Informationen über Antibiotikaresistenzgene bei
in C. burnetii.
KW  - Bioinformatics
KW  - Coxiella burnetii
KW  - Genotyping
KW  - Web services
KW  - Genomics
Y1  - 2023
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-296639
ER  - 
TY  - THES
A1  - Horn, Hannes
T1  - Analysis and interpretation of (meta-)genomic data from host-associated microorganisms
T1  - Analyse und Interpretation von (meta-)genomischen Daten aus Wirt-assoziierten Mikroorganismen
N2  - Host–microbe interactions are the key to understand why and how microbes inhabit specific environments. With the scientific fields of microbial genomics and metagenomics, evolving on an unprecedented scale, one is able to gain insights in these interactions on a molecular and ecological level. The goal of this PhD thesis was to make (meta–)genomic data accessible, integrate it in a comparative manner and to gain comprehensive taxonomic and functional insights into bacterial strains and communities derived from two different environments: the phyllosphere of Arabidopsis thaliana and the mesohyl interior of marine sponges.

This thesis focused first on the de novo assembly of bacterial genomes. A 5–step protocol was developed, each step including a quality control. The examination of different assembly software in a comparative way identified SPAdes as most suitable. The protocol enables the user to chose the best tailored assembly. Contamination issues were solved by an initial filtering of the data and methods normally used for the binning of metagenomic datasets. This step is missed in many published assembly pipelines. The described protocol offers assemblies of high quality ready for downstream analysis.

Subsequently, assemblies generated with the developed protocol were annotated and explored
in terms of their function. In a first study, the genome of a phyllosphere bacterium, Williamsia sp. ARP1, was analyzed, offering many adaptions to the leaf habitat: it can deal with temperature shifts, react to oxygen species, produces mycosporins as protection against UV–light, and is able to uptake photosynthates. Further, its taxonomic position within the Actinomycetales was infered from 16S rRNA and comparative genomics showing the close relation between the genera Williamsia and Gordonia.

In a second study, six sponge–derived actinomycete genomes were investigated for secondary metabolism. By use of state–of–the–art software, these strains exhibited numerous gene clusters, mostly linked to polykethide synthases, non–ribosomal peptide synthesis, terpenes, fatty acids and saccharides. Subsequent predictions on these clusters offered a great variety of possible produced compounds with antibiotic, antifungal or anti–cancer activity. These analysis highlight the potential for the synthesis of natural products and the use of genomic data as screening toolkit.

In a last study, three sponge–derived and one seawater metagenomes were functionally compared. Different signatures regarding the microbial composition and GC–distribution were observed between the two environments. With a focus on bacerial defense systems, the data indicates a pronounced repertoire of sponge associated bacteria for bacterial defense systems, in particular, Clustered Regularly Interspaced Short Palindromic Repeats, restriction modification system, DNA phosphorothioation and phage growth limitation. In addition, characterizing genes for secondary metabolite cluster differed between sponge and seawater microbiomes. Moreover, a variety of Type I polyketide synthases were only found within the sponge microbiomes. With that, metagenomics are shown to be a useful tool for the screening of secondary metabolite genes. Furthermore, enriched defense systems are highlighted as feature of sponge-associated microbes and marks them as a selective trait.
N2  - Mikroben–Wirt Interaktionen sind der Schlüssel, um zu verstehen “Wie?” und “Warum?” Mikroben in bestimmten Umgebungen vorkommen. Mithilfe von Genomik und Metagenomik lassen sich Einblicke auf dem molekularen sowie ökolgischen Level gewinnen. Ziel dieser Arbeit war es, diese Daten zugänglich zu machen und zu vergleichen, um Erkenntnisse auf taxonomischer und funktionaler Ebene in bakterielle Isolate und bakterielle Konsortien zu erhalten. Dabei wurden Daten aus zwei verschiedenen Umgebungen erhoben: der Phyllosphäre von Arabidopsis thaliana und aus der Mesohyl–Matrix mariner Schwämme.

Das Ziel war zunächst, bakterieller Genome denovo zu assemblieren. Dazu wurde ein Protokoll, bestehend aus 5 Schritten, entwickelt. Durch Verwendung verschiedener Soft- ware zum Assemblieren konnte SPAdes als am besten geeignet für die gegebenen Daten herausgearbeitet werden. Durch anfängliches Filtern der Daten konnte erste Kontamina- tion entfernt werden. Durch das Anwenden weiterer Methoden, welche ursprünglich für metagenomische Datensätze entwickelt wurden, konnten weitere Kontaminationen erkannt und von den “echten” Daten getrennt werden. Ein Schritt, welcher in den meisten pub- lizierten Assembly–Pipelines fehlt. Das Protokoll ermöglicht das Erstellen hochqualitativer Assemblies, welche zur weiteren Analyse nicht weiter aufbereitet werden müssen.
Nachfolgend wurden die generierten Assemblies annotiert. Das Genom von William- sia sp. ARP1 wurde untersucht und durch dessen Interpretation konnten viele Anpassungen an die Existenz in der Phyllosphäre gezeigt werden: Anpassung an Termperaturveränderun- gen, Produktion von Mycosporinen als Schutz vor UV–Strahlung und die Möglichkeit, von der Pflanze durch Photosynthese hergestellte Substanzen aufzunehmen. Seine taxonomische Position wurde aufgrund von 16S rRNA sowie vergleichende Genomik bestimmt. Dadurch konnte eine nahe Verwandtschaft zwischen den Gattungen Williamsia und Gordonia gezeigt werden.

In einer weiteren Studie wurden sechs Actinomyceten–Genome, isoliert aus Schwämmen, hinsichtlich ihres Sekundärmetabolismus untersucht. Mihilfe moderner Software konnten in zahlreiche Gen–Cluster identifiziert werden. Zumeist zeigten diese eine Zugehörigkeit zu Polyketidsynthasen, Nichtribosomalen Peptidsynthasen, Terpenen, Fettsäuren oder Sac- chariden. Durch eine tiefere Analyse konnten die Cluster mit chemischen Verbindungen assoziiert werden, welche antibakterielle oder fungizide Eigenschaften besitzen.

In der letzten Untersuchung wurden Metagenome von drei Schwämmen sowie Meerwasser auf funktioneller Ebene verglichen. Beobachtet wurden Unterschiede in deren mikrobiellen Konsortien und GC–Gehalt. Schwamm–assoziierte Bakterien zeigten ein ausgeprägtes Inventar an Verteidigungsmechanismen gegenüber deren Vertretern aus dem Meerwasser. Dies beinhaltete vor allem: Clustered Regularly Interspaced Short Palindromic Repeats, das Restriktions-Modifikationssystem, DNA Phosphorothioation, oder Gene, welche das Wachstum von Phagen hemmen können. Gene für Sekundärmetabolite waren zwischen Schwamm– und Meerwasser–Metagenomen unterschiedlich stark ausgeprägt. So konnten Typ I Polyketidsynthasen ausschließlich in den Schwamm–Metagenomen gefunden werden. Dies zeigt, dass metagenomische Daten ebenso wie genomische Daten zur Untersuchung des Sekundärmetabolismus genutzt werden können. Des Weiteren zeigt die Anhäufung an Verteidigungsmechanismen eine Anpassung von Schwamm–assoziierten Mikroben an ihre Umgebung und ist ein Hinweis auf deren mögliche selektive Eigenschaft.
KW  - Bakterien
KW  - Meeresschwämme
KW  - Metagenom
KW  - Phyllosphäre
KW  - Ackerschmalwand
KW  - Metagenomics
KW  - Genomics
KW  - Phyllosphere
KW  - Sponges
KW  - Bacteria
KW  - Deep sequencing
KW  - Arabidopsis thaliana
KW  - Bioinformatics
Y1  - 2017
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-152035
ER  -