TY - THES A1 - Leimbach, Andreas T1 - Genomics of pathogenic and commensal \(Escherichia\) \(coli\) T1 - Genomik pathogener und kommensaler \(Escherichia\) \(coli\) N2 - High-throughput sequencing (HTS) has revolutionized bacterial genomics. Its unparalleled sensitivity has opened the door to analyzing bacterial evolution and population genomics, dispersion of mobile genetic elements (MGEs), and within-host adaptation of pathogens, such as Escherichia coli. One of the defining characteristics of intestinal pathogenic E. coli (IPEC) pathotypes is a specific repertoire of virulence factors (VFs). Many of these IPEC VFs are used as typing markers in public health laboratories to monitor outbreaks and guide treatment options. Instead, extraintestinal pathogenic E. coli (ExPEC) isolates are genotypically diverse and harbor a varied set of VFs -- the majority of which also function as fitness factors (FFs) for gastrointestinal colonization. The aim of this thesis was the genomic characterization of pathogenic and commensal E. coli with respect to their virulence- and antibiotic resistance-associated gene content as well as phylogenetic background. In order to conduct the comparative analyses, I created a database of E. coli VFs, ecoli_VF_collection, with a focus on ExPEC virulence-associated proteins (Leimbach, 2016b). Furthermore, I wrote a suite of scripts and pipelines, bac-genomics-scripts, that are useful for bacterial genomics (Leimbach, 2016a). This compilation includes tools for assembly and annotation as well as comparative genomics analyses, like multi-locus sequence typing (MLST), assignment of Clusters of Orthologous Groups (COG) categories, searching for protein homologs, detection of genomic regions of difference (RODs), and calculating pan-genome-wide association statistics. Using these tools we were able to determine the prevalence of 18 autotransporters (ATs) in a large, phylogenetically heterogeneous strain panel and demonstrate that many AT proteins are not associated with E. coli pathotypes. According to multivariate analyses and statistics the distribution of AT variants is instead significantly dependent on phylogenetic lineages. As a consequence, ATs are not suitable to serve as pathotype markers (Zude et al., 2014). During the German Shiga toxin-producing E. coli (STEC) outbreak in 2011, the largest to date, we were one of the teams capable of analyzing the genomic features of two isolates. Based on MLST and detection of orthologous proteins to known E. coli reference genomes the close phylogenetic relationship and overall genome similarity to enteroaggregative E. coli (EAEC) 55989 was revealed. In particular, we identified VFs of both STEC and EAEC pathotypes, most importantly the prophage-encoded Shiga toxin (Stx) and the pAA-type plasmid harboring aggregative adherence fimbriae. As a result, we could show that the epidemic was caused by an unusual hybrid pathotype of the O104:H4 serotype. Moreover, we detected the basis of the antibiotic multi-resistant phenotype on an extended-spectrum beta-lactamase (ESBL) plasmid through comparisons to reference plasmids. With this information we proposed an evolutionary horizontal gene transfer (HGT) model for the possible emergence of the pathogen (Brzuszkiewicz et al., 2011). Similarly to ExPEC, E. coli isolates of bovine mastitis are genotypically and phenotypically highly diverse and many studies struggled to determine a positive association of putative VFs. Instead the general E. coli pathogen-associated molecular pattern (PAMP), lipopolysaccharide (LPS), is implicated as a deciding factor for intramammary inflammation. Nevertheless, a mammary pathogenic E. coli (MPEC) pathotype was proposed presumably encompassing strains more adapted to elicit bovine mastitis with virulence traits differentiating them from commensals. We sequenced eight E. coli isolates from udder serous exudate and six fecal commensals (Leimbach et al., 2016). Two mastitis isolate genomes were closed to a finished-grade quality (Leimbach et al., 2015). The genomic sequence of mastitis-associated E. coli (MAEC) strain 1303 was used to elucidate the biosynthesis gene cluster of its O70 LPS O-antigen. We analyzed the phylogenetic genealogy of our strain panel plus eleven bovine-associated E. coli reference strains and found that commensal or MAEC could not be unambiguously allocated to specific phylogroups within a core genome tree of reference E. coli. A thorough gene content analysis could not identify functional convergence of either commensal or MAEC, instead both have only very few gene families enriched in either pathotype. Most importantly, gene content and ecoli_VF_collection analyses showed that no virulence determinants are significantly associated with MAEC in comparison to bovine fecal commensals, disproving the MPEC hypothesis. The genetic repertoire of bovine-associated E. coli, again, is dominated by phylogenetic background. This is also mostly the case for large virulence-associated E. coli gene cluster previously associated with mastitis. Correspondingly, MAEC are facultative and opportunistic pathogens recruited from the bovine commensal gastrointestinal microbiota (Leimbach et al., 2017). Thus, E. coli mastitis should be prevented rather than treated, as antibiotics and vaccines have not proven effective. Although traditional E. coli pathotypes serve a purpose for diagnostics and treatment, it is clear that the current typing system is an oversimplification of E. coli's genomic plasticity. Whole genome sequencing (WGS) revealed many nuances of pathogenic E. coli, including emerging hybrid or heteropathogenic pathotypes. Diagnostic and public health microbiology need to embrace the future by implementing HTS techniques to target patient care and infection control more efficiently. N2 - Eines der definierenden Charakteristika intestinal pathogener E. coli (IPEC) Pathotypen ist ein spezifisches Repertoire an Virulenzfaktoren (VFs). Viele dieser IPEC VFs werden als Typisierungsmarker benutzt. Stattdessen sind Isolate extraintestinal pathogener E. coli (ExPEC) genotypisch vielfältig und beherbergen verschiedenartige VF Sets, welche in der Mehrheit auch als Fitnessfaktoren (FFs) für die gastrointestinale Kolonialisierung fungieren. Das Ziel dieser Dissertation war die genomische Charakterisierung pathogener und kommensaler E. coli in Bezug auf ihren Virulenz- und Antibiotikaresistenz-assoziierten Gengehalt sowie ihre phylogenetische Abstammung. Als Voraussetzung für die vergleichenden Analysen erstellte ich eine E. coli VF-Datenbank, ecoli_VF_collection, mit Fokus auf Virulenz-assoziierte Proteine von ExPEC (Leimbach, 2016b). Darüber hinaus programmierte ich mehrere Skripte und Pipelines zur Anwendung in der bakteriellen Genomik, bac-genomics-scripts (Leimbach, 2016a). Diese Sammlung beinhaltet Tools zur Unterstützung von Assemblierung und Annotation sowie komparativer Genomanalysen, wie Multilokus-Sequenztypisierung (MLST), Zuweisung von Clusters of Orthologous Groups (COG) Kategorien, Suche nach homologen Proteinen, Identifizierung von genomisch unterschiedlichen Regionen (RODs) und Berechnung Pan-genomweiter Assoziationsstatistiken. Mithilfe dieser Tools konnten wir die Prävalenz von 18 Autotransportern (ATs) in einer großen, phylogenetisch heterogenen Stammsammlung bestimmen und nachweisen, dass viele AT-Proteine nicht mit E. coli Pathotypen assoziiert sind. Multivariate Analysen und Statistik legten offen, dass die Verteilung von AT-Varianten vielmehr signifikant von phylogenetischen Abstammungslinien abhängt. Deshalb sind ATs nicht als Marker für Pathotypen geeignet (Zude et al., 2014). Während des bislang größten Ausbruchs von Shiga-Toxin-produzierenden E. coli (STEC) im Jahre 2011 in Deutschland waren wir eines der Teams, welches die genomischen Eigenschaften zweier Isolate analysieren konnte. Basierend auf MLST und Detektion orthologer Proteine zu bekannten E. coli Referenzgenomen konnte ihre enge phylogenetische Verwandschaft und Ähnlichkeit des gesamten Genoms zum enteroaggregativen E. coli (EAEC) 55989 aufgedeckt werden. Im Detail identifizierten wir VFs von STEC und EAEC Pathotypen, vor allem das Prophagen-kodierte Shiga-Toxin (Stx) und ein Plasmid des pAA-Typs kodierend für aggregative Adhärenz-Fimbrien. Die Epidemie wurde demnach durch einen ungewöhnlichen Hybrid-Pathotyp vom O104:H4 Serotyp verursacht. Zusätzlich identifizierten wir die Grundlage für den multiresistenten Phänotyp dieser Ausbruchsstämme auf einem Extended-Spektrum-beta-Laktamase (ESBL) Plasmid über Vergleiche mit Referenzplasmiden. Mit diesen Informationen konnten wir ein horizontales Gentransfer-Modell (HGT) zum Auftreten dieses Pathogenen vorschlagen (Brzuszkiewicz et al., 2011). Ähnlich zu ExPEC sind E. coli Isolate boviner Mastitiden genotypisch und phänotypisch sehr divers, und viele Studien scheiterten am Versuch eine positive Assoziation vermeintlicher VFs nachzuweisen. Stattdessen gilt Lipopolysaccharid (LPS) als entscheidender Faktor zur intramammären Entzündung. Gleichwohl wurde ein mammärer pathogener E. coli (MPEC) Pathotyp vorgeschlagen, der mutmaßlich Stämme umfasst, welche eher geeignet sind eine bovine Mastitis auszulösen und über Virulenz-Merkmale von Kommensalen abgegrenzt werden können. Wir sequenzierten acht E. coli Isolate aus serösem Eutersekret und sechs fäkale Kommensale (Leimbach et al., 2016). Bei zwei Mastitisisolaten wurden die Genome vollständig geschlossen (Leimbach et al., 2015). Anhand der genomischen Sequenz des Mastitis-assoziierten E. coli (MAEC) Stamms 1303 wurde das Gencluster zur Biosynthese seines O70 LPS O-Antigens aufgeklärt. Wir analysierten die phylogenetische Abstammung unserer Stammsammlung plus elf bovin-assoziierter E. coli Referenzstämme, aber konnten weder MAEC noch Kommensale bestimmten Phylogruppen innerhalb eines Core-Genom Stammbaums aus Referenz-E. coli eindeutig zuordnen. Eine ausführliche Gengehalt-Analyse konnte keine funktionelle Konvergenz innerhalb von Kommensalen oder MAEC identifizieren. Stattdessen besitzen beide nur sehr wenige Genfamilien, die bevorzugt in einer der beiden Pathotypen vorkommen. Weder eine Gengehalt- noch eine ecoli_VF_collection-Analyse konnte zeigen, dass eine signifikante Assoziation von bestimmten Virulenzfaktoren mit MAEC, im Vergleich zu bovinen fäkalen Kommensalen, besteht. Damit wurde die MPEC Hypothese widerlegt. Auch das genetische Repertoire von Rinder-assoziierten E. coli wird durch die phylogenetische Abstammung bestimmt. Dies ist überwiegend auch bei großen Virulenz-assoziierten Genclustern der Fall, die bisher mit Mastitis in Verbindung gebracht wurden. Dementsprechend sind MAEC fakultative und opportunistische Pathogene, die ihren Ursprung als Kommensale in der bovinen gastrointestinalen Mikrobiota haben (Leimbach et al., 2017). Obwohl traditionelle E. coli Pathotypen in der Diagnostik und Behandlung einen Zweck erfüllen, ist es offensichtlich, dass das derzeitige Typisierungs-System die genomische Plastizität von E. coli zu sehr vereinfacht. Die Gesamtgenom-Sequenzierung (WGS) deckte viele Nuancen pathogener E. coli auf, einschließlich entstehender hybrider oder heteropathogener Pathotypen. Diagnostische und medizinische Mikrobiologie müssen einen Schritt in Richtung Zukunft gehen und HTS-Technologien anwenden, um Patientenversorgung und Infektionskontrolle effizienter zu unterstützen. KW - Escherichia coli KW - Autotransporter KW - STEC KW - Bovine Mastitis KW - high-throughput sequencing KW - virulence factors KW - pathotypes KW - phylogeny KW - ecoli_VF_collection KW - bac-genomics-scripts KW - autotransporter KW - entero-aggregative-haemorrhagic Escherichia coli (EAHEC) KW - mastitis-associated Escherichia coli (MAEC) Y1 - 2017 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-154539 ER - TY - THES A1 - Oesterreich, Babett T1 - Preclinical development of an immunotherapy against antibiotic-resistant Staphylococcus aureus T1 - Präklinische Entwicklung einer Immuntherapie zur Behandlung Antibiotika-resistenter Staphylococcus aureus N2 - The Gram-positive bacterium Staphylococcus aureus is the leading cause of nosocomial infections. In particular, diseases caused by methicillin-resistant S. aureus (MRSA) are associated with higher morbidity, mortality and medical costs due to showing resistance to several classes of established antibiotics and their ability to develop resistance mechanisms against new antibiotics rapidly. Therefore, strategies based on immunotherapy approaches have the potential to close the gap for an efficient treatment of MRSA. In this thesis, a humanized antibody specific for the immunodominant staphylococcal antigen A (IsaA) was generated and thoroughly characterized as potential candidate for an antibody based therapy. A murine monoclonal antibody was selected for humanization based on its binding characteristics and the ability of efficient staphylococcal killing in mouse infection models. The murine antibody was humanized by CDR grafting and mouse and humanized scFv as well as scFv-Fc fragments were constructed for comparative binding studies to analyse the successful humanization. After these studies, the full antibody with the complete Fc region was constructed as isotype IgG1, IgG2 and IgG4, respectively to assess effector functions, including antibody-dependent killing of S. aureus. The biological activity of the humanized antibody designated hUK-66 was analysed in vitro with purified human PMNs and whole blood samples taken from healthy donors and patients at high risk of S. aureus infections, such as those with diabetes, end-stage renal disease, or artery occlusive disease (AOD). Results of the in vitro studies show, that hUK-66 was effective in antibody-dependent killing of S. aureus in blood from both healthy controls and patients vulnerable to S. aureus infections. Moreover, the biological activity of hUK-66 and hUK-66 combined with a humanized anti-alpha-toxin antibody (hUK-tox) was investigated in vivo using a mouse pneumonia model. The in vivo results revealed the therapeutic efficacy of hUK-66 and the antibody combination of hUK-66 and hUK-tox to prevent staphylococcal induced pneumonia in a prophylactic set up. Based on the experimental data, hUK-66 represents a promising candidate for an antibody-based therapy against antibiotic resistant MRSA. N2 - Staphylococcus aureus ist ein bedeutender nosokomialer Erreger, der eine Vielzahl von Infektionen im Menschen verursacht. Besonders Krankheiten, die durch Methicillin resistente S. aureus (MRSA) verursacht werden, sind mit einer erhöhten Morbidität, einer höheren Sterblichkeitsrate und hohen medizinischen Kosten verbunden. Seine besondere medizinische Bedeutung erlangte S. aureus durch die Ausbildung von Resistenzen gegen eine Vielzahl von Antibiotika und seiner Fähigkeit auch gegen neu entwickelte Antibiotika schnell Resistenzmechanismen auszubilden. Aus diesem Grund, ist die Entwicklung von neuen Therapieansätzen von besonderer Bedeutung, um die entstandene Lücke für eine effektive MRSA-Therapie zu schließen. In dieser Arbeit wurde ein humanisierter monoklonaler Antikörper entwickelt und charakterisiert, der spezifisch an das „immunodominant staphylococcal antigen A“ (IsaA) bindet. Dieser Antiköper wurde auf Grund seiner Eigenschaft, in einem Mausmodell effektiv S. aureus abzutöten, als vielversprechender Kandidat für eine Antikörper-Therapie ausgewählt. Der murine Vorläuferantikörper wurde mittels „CDR grafting“ humanisiert und durch die Generierung von humanisierten und murinen scFv und scFv-Fc Fragmenten, die in vergleichenden Bindungsstudien getestet wurden, konnte der Erfolg der Humanisierung beurteilt werden. Im Anschluss wurde der vollständige Antikörper mit vollständig funktionaler Fc-Region in den Isotypen IgG1, IgG2 und IgG4 hergestellt. Die Funktionalität des humanisierten Antikörpers wurde in vitro mittels aufgereinigter PMNs und Blutproben von gesunden Spendern und Patienten bestimmt, die ein hohes Risiko für S. aureus Infektionen besitzen wie Diabetiker, Dialyse-Patienten und Patienten mit arterieller Verschlusskrankheit. Die Ergebnisse der in vitro-Studien zeigen, dass der anti-IsaA-Antikörper hUK-66 nicht nur S. aureus effektiv in Blutproben von gesunden Spendern abtötet, sondern auch in Blutproben von Patienten mit erhöhter Anfälligkeit für S. aureus Infektionen. Darüber hinaus wurde die biologische Aktivität des humanisierten Antikörpers gegen IsaA als Monotherapie und in Kombination mit einem humanisierten anti-alpha-Toxin-Antikörper (hUK-tox) in vivo in einem Maus Pneumonie Modell untersucht. Hierbei konnte gezeigt werden, dass die prophylaktische Verabreichung von hUK-66 sowie die Kombination von hUK-66 und hUK-tox, die Bildung einer Staphylokokken-induzierten Pneumonie mit Todesfolge signifikant senkt. KW - Staphylococcus KW - Immunotherapy Y1 - 2017 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-123237 ER - TY - THES A1 - Sharan, Malvika T1 - Bio-computational identification and characterization of RNA-binding proteins in bacteria T1 - Bioinformatische Identifikation und Charakterisierung von RNA-bindenden Proteinen in Bakterien N2 - RNA-binding proteins (RBPs) have been extensively studied in eukaryotes, where they post-transcriptionally regulate many cellular events including RNA transport, translation, and stability. Experimental techniques, such as cross-linking and co-purification followed by either mass spectrometry or RNA sequencing has enabled the identification and characterization of RBPs, their conserved RNA-binding domains (RBDs), and the regulatory roles of these proteins on a genome-wide scale. These developments in quantitative, high-resolution, and high-throughput screening techniques have greatly expanded our understanding of RBPs in human and yeast cells. In contrast, our knowledge of number and potential diversity of RBPs in bacteria is comparatively poor, in part due to the technical challenges associated with existing global screening approaches developed in eukaryotes. Genome- and proteome-wide screening approaches performed in silico may circumvent these technical issues to obtain a broad picture of the RNA interactome of bacteria and identify strong RBP candidates for more detailed experimental study. Here, I report APRICOT (“Analyzing Protein RNA Interaction by Combined Output Technique”), a computational pipeline for the sequence-based identification and characterization of candidate RNA-binding proteins encoded in the genomes of all domains of life using RBDs known from experimental studies. The pipeline identifies functional motifs in protein sequences of an input proteome using position-specific scoring matrices and hidden Markov models of all conserved domains available in the databases and then statistically score them based on a series of sequence-based features. Subsequently, APRICOT identifies putative RBPs and characterizes them according to functionally relevant structural properties. APRICOT performed better than other existing tools for the sequence-based prediction on the known RBP data sets. The applications and adaptability of the software was demonstrated on several large bacterial RBP data sets including the complete proteome of Salmonella Typhimurium strain SL1344. APRICOT reported 1068 Salmonella proteins as RBP candidates, which were subsequently categorized using the RBDs that have been reported in both eukaryotic and bacterial proteins. A set of 131 strong RBP candidates was selected for experimental confirmation and characterization of RNA-binding activity using RNA co-immunoprecipitation followed by high-throughput sequencing (RIP-Seq) experiments. Based on the relative abundance of transcripts across the RIP-Seq libraries, a catalogue of enriched genes was established for each candidate, which shows the RNA-binding potential of 90% of these proteins. Furthermore, the direct targets of few of these putative RBPs were validated by means of cross-linking and co-immunoprecipitation (CLIP) experiments. This thesis presents the computational pipeline APRICOT for the global screening of protein primary sequences for potential RBPs in bacteria using RBD information from all kingdoms of life. Furthermore, it provides the first bio-computational resource of putative RBPs in Salmonella, which could now be further studied for their biological and regulatory roles. The command line tool and its documentation are available at https://malvikasharan.github.io/APRICOT/. N2 - RNA-bindende Proteine (RBPs) wurden umfangreich in Eukaryoten erforscht, in denen sie viele Prozesse wie RNA-Transport, -Translation und -Stabilität post-transkriptionell regulieren. Experimentelle Methoden wie Cross-linking and Koimmunpräzipitation mit nachfolgedener Massenspektromentrie / RNA-Sequenzierung ermöglichten eine weitreichende Charakterisierung von RBPs, RNA-bindenden Domänen (RBDs) und deren regulatorischen Rollen in eukaryotischen Spezies wie Mensch und Hefe. Weitere Entwicklungen im Bereich der hochdurchsatzbasierten Screeningverfahren konnten das Verständnis von RBPs in Eukaryoten enorm erweitern. Im Gegensatz dazu ist das Wissen über die Anzahl und die potenzielle Vielfalt von RBPs in Bakterien dürftig. In der vorliegenden Arbeit präsentiere ich APRICOT, eine bioinformatische Pipeline zur sequenzbasierten Identifikation und Charakterisierung von Proteinen aller Domänen des Lebens, die auf RBD-Informationen aus experimentellen Studien aufbaut. Die Pipeline nutzt Position Specific Scoring Matrices und Hidden-MarkovModelle konservierter Domänen, um funktionelle Motive in Proteinsequenzen zu identifizieren und diese anhand von sequenzbasierter Eigenschaften statistisch zu bewerten. Anschließend identifiziert APRICOT mögliche RBPs und charakterisiert auf Basis ihrer biologischeren Eigenschaften. In Vergleichen mit ähnlichen Werkzeugen übertraf APRICOT andere Programme zur sequenzbasierten Vorhersage von RBPs. Die Anwendungsöglichkeiten und die Flexibilität der Software wird am Beispiel einiger großer RBP-Kollektionen, die auch das komplette Proteom von Salmonella Typhimurium SL1344 beinhalten, dargelegt. APRICOT identifiziert 1068 Proteine von Salmonella als RBP-Kandidaten, die anschließend unter Nutzung der bereits bekannten bakteriellen und eukaryotischen RBDs klassifiziert wurden. 131 der RBP-Kandidaten wurden zur Charakterisierung durch RNA co-immunoprecipitation followed by high-throughput sequencing (RIP-seq) ausgewählt. Basierend auf der relativen Menge an Transkripten in den RIP-seq-Bibliotheken wurde ein Katalog von angereicherten Genen erstellt, der auf eine potentielle RNA-bindende Funktion in 90% dieser Proteine hindeutet. Weiterhin wurden die Bindungstellen einiger dieser möglichen RBPs mit Cross-linking and Co-immunoprecipitation (CLIP) bestimmt. Diese Doktorarbeit beschreibt die bioinformatische Pipeline APRICOT, die ein globales Screening von RBPs in Bakterien anhand von Informationen bekannter RBDs ermöglicht. Zudem enthält sie eine Zusammenstellung aller potentieller RPS in Salmonella, die nun auf ihre biologsche Funktion hin untersucht werden können. Das Kommondozeilen-Programm und seine Dokumentation sind auf https://malvikasharan.github.io/APRICOT/ verfügbar. KW - Bioinformatics Y1 - 2017 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-153573 ER -