TY - THES A1 - Somody, Joseph Christian Campbell T1 - Leveraging deep learning for identification and structural determination of novel protein complexes from \(in\) \(situ\) electron cryotomography of \(Mycoplasma\) \(pneumoniae\) T1 - Tiefenlernen als Werkzeug zur Identifizierung und Strukturbestimmung neuer Proteinkomplexe aus der \(in\)-\(situ\)-Elektronenkryotomographie von \(Mycoplasma\) \(pneumoniae\) N2 - The holy grail of structural biology is to study a protein in situ, and this goal has been fast approaching since the resolution revolution and the achievement of atomic resolution. A cell's interior is not a dilute environment, and proteins have evolved to fold and function as needed in that environment; as such, an investigation of a cellular component should ideally include the full complexity of the cellular environment. Imaging whole cells in three dimensions using electron cryotomography is the best method to accomplish this goal, but it comes with a limitation on sample thickness and produces noisy data unamenable to direct analysis. This thesis establishes a novel workflow to systematically analyse whole-cell electron cryotomography data in three dimensions and to find and identify instances of protein complexes in the data to set up a determination of their structure and identity for success. Mycoplasma pneumoniae is a very small parasitic bacterium with fewer than 700 protein-coding genes, is thin enough and small enough to be imaged in large quantities by electron cryotomography, and can grow directly on the grids used for imaging, making it ideal for exploratory studies in structural proteomics. As part of the workflow, a methodology for training deep-learning-based particle-picking models is established. As a proof of principle, a dataset of whole-cell Mycoplasma pneumoniae tomograms is used with this workflow to characterize a novel membrane-associated complex observed in the data. Ultimately, 25431 such particles are picked from 353 tomograms and refined to a density map with a resolution of 11 Å. Making good use of orthogonal datasets to filter search space and verify results, structures were predicted for candidate proteins and checked for suitable fit in the density map. In the end, with this approach, nine proteins were found to be part of the complex, which appears to be associated with chaperone activity and interact with translocon machinery. Visual proteomics refers to the ultimate potential of in situ electron cryotomography: the comprehensive interpretation of tomograms. The workflow presented here is demonstrated to help in reaching that potential. N2 - Der heilige Gral der Strukturbiologie ist die Untersuchung eines Proteins in situ, und dieses Ziel ist seit der Auflösungsrevolution und dem Erreichen der atomaren Auflösung in greifbare Nähe gerückt. Das Innere einer Zelle ist keine verdünnte Umgebung, und Proteine haben sich so entwickelt, dass sie sich falten und so funktionieren, wie es in dieser Umgebung erforderlich ist; daher sollte die Untersuchung einer zellulären Komponente idealerweise die gesamte Komplexität der zellulären Umgebung umfassen. Die Abbildung ganzer Zellen in drei Dimensionen mit Hilfe der Elektronenkryotomographie ist die beste Methode, um dieses Ziel zu erreichen, aber sie ist mit einer Beschränkung der Probendicke verbunden und erzeugt verrauschte Daten, die sich nicht für eine direkte Analyse eignen. In dieser Dissertation wird ein neuartiger Workflow zur systematischen dreidimensionalen Analyse von Ganzzell-Elektronenkryotomographiedaten und zur Auffindung und Identifizierung von Proteinkomplexen in diesen Daten entwickelt, um eine erfolgreiche Bestimmung ihrer Struktur und Identität zu ermöglichen. Mycoplasma pneumoniae ist ein sehr kleines parasitäres Bakterium mit weniger als 700 proteinkodierenden Genen. Es ist dünn und klein genug, um in grossen Mengen durch Elektronenkryotomographie abgebildet zu werden, und kann direkt auf den für die Abbildung verwendeten Gittern wachsen, was es ideal für Sondierungsstudien in der strukturellen Proteomik macht. Als Teil des Workflows wird eine Methodik für das Training von Deep-Learning-basierten Partikelpicken-Modellen entwickelt. Als Proof-of-Principle wird ein Dataset von Ganzzell-Tomogrammen von Mycoplasma pneumoniae mit diesem Workflow verwendet, um einen neuartigen membranassoziierten Komplex zu charakterisieren, der in den Daten beobachtet wurde. Insgesamt wurden 25431 solcher Partikel aus 353 Tomogrammen gepickt und zu einer Dichtekarte mit einer Auflösung von 11 Å verfeinert. Unter Verwendung orthogonaler Datensätze zur Filterung des Suchraums und zur Überprüfung der Ergebnisse wurden Strukturen für Protein-Kandidaten vorhergesagt und auf ihre Eignung für die Dichtekarte überprüft. Letztendlich wurden mit diesem Ansatz neun Proteine als Bestandteile des Komplexes gefunden, der offenbar mit der Chaperonaktivität in Verbindung steht und mit der Translocon-Maschinerie interagiert. Das ultimative Potenzial der In-situ-Elektronenkryotomographie – die umfassende Interpretation von Tomogrammen – wird als visuelle Proteomik bezeichnet. Der hier vorgestellte Workflow soll dabei helfen, dieses Potenzial auszuschöpfen. KW - Kryoelektronenmikroskopie KW - Tomografie KW - Mycoplasma pneumoniae KW - Deep learning KW - cryo-EM KW - cryo-ET KW - tomography KW - mycoplasma KW - pneumoniae KW - deep learning KW - particle picking KW - membrane protein KW - visual proteomics Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-313447 ER - TY - THES A1 - Ferretti, Pamela T1 - \(Clostridioides\) \(difficile\) beyond the disease-centred perspective: Beneficial properties in healthy infants and over-diagnosis in diseased adults identified by species- and SNV-based metagenomic analysis T1 - \(Clostridioides\) \(difficile\) jenseits der krankheitszentrierten Perspektive: Vorteilhafte Eigenschaften bei gesunden Säuglingen und Überdiagnose bei erkrankten Erwachsenen, identifiziert durch spezies- und SNV-basierte metagenomische Analyse N2 - Clostridioides difficile is a bacterial species well known for its ability to cause C. difficile infection (also known as CDI). The investigation of the role of this species in the human gut has been so far dominated by a disease-centred perspective, focused on studying C. difficile in relation to its associated disease. In this context, the first aim of this thesis was to combine publicly available metagenomic data to analyse the microbial composition of stool samples from patients diagnosed with CDI, with a particular focus on identifying a CDI-specific microbial signature. However, similarly to many other bacterial species inhabiting the human gut, C. difficile association with disease is not valid in absolute terms, as C. difficile can be found also among healthy subjects. Further aims of this thesis were to 1) identify potential C. difficile reservoirs by screening a wide range of habitats, hosts, body sites and age groups, and characterize the biotic context associated with C. difficile presence, and 2) investigate C. difficile within-species diversity and its toxigenic potential across different age groups. The first part of the thesis starts with the description of the concepts and definitions used to identify bacterial species and within-species diversity, and then proceeds to provide an overview of the bacterial species at the centre of my investigation, C. difficile. The first Chapter includes a detailed description of the discovery, biology and physiology of this clinically relevant species, followed by an overview of the diagnostic protocols used in the clinical setting to diagnose CDI. The second part of the thesis describes the methodology used to investigate the questions mentioned above, while the third part presents the results of such investigative effort. I first show that C. difficile could be found in only a fraction of the CDI samples and that simultaneous colonization of multiple enteropathogenic species able to cause CDI-like clinical manifestations is more common than previously thought, raising concerns about CDI overdiagnosis. I then show that the CDIassociated gut microbiome is characterized by a specific microbial signature, distinguishable from the community composition associated with non-CDI diarrhea. Beyond the nosocomial and CDI context, I show that while rarely found in adults, C. difficile is a common member of the infant gut microbiome, where its presence is associated with multiple indicators typical of a desirable healthy microbiome development. In addition, I describe C. difficile extensive carriage among asymptomatic subjects, of all age groups and a potentially novel clade of C. difficile identified exclusively among infants. Finally, I discuss the limitations, challenges and future perspectives of my investigation. N2 - Clostridioides difficile ist eine Bakterienart, die für ihre Fähigkeit bekannt ist, eine C. difficile-Infektion (auch bekannt als CDI) zu verursachen. Die Untersuchung der Rolle dieser Spezies im menschlichen Darm wurde bisher von einer krankheitszentrierten Perspektive dominiert, die sich auf die Untersuchung von C. difficile in Bezug auf die damit verbundene Erkrankung konzentrierte. In diesem Zusammenhang war das erste Ziel dieser Arbeit, öffentlich verfügbare metagenomische Daten zu kombinieren, um die mikrobielle Zusammensetzung von Stuhlproben von Patienten mit diagnostizierter CDI zu analysieren, mit besonderem Fokus auf der Identifizierung einer CDI-spezifischen mikrobiellen Signatur. Wie bei vielen anderen Bakterienarten, die den menschlichen Darm bewohnen, ist jedoch die Assoziation von C. difficile mit einer Krankheit nicht absolut gültig, da C. difficile auch bei gesunden Probanden gefunden werden kann. Weitere Ziele dieser Arbeit waren 1) die Identifizierung potenzieller C. difficile-Reservoirs durch das Screening einer Vielzahl von Habitaten, Wirten, Körperstellen und Altersgruppen und die Charakterisierung des mit der Präsenz von C. difficile verbundenen biotischen Kontexts und 2) Untersuchung von C. difficile innerhalb der Artenvielfalt und ihr toxigenes Potenzial über verschiedene Altersgruppen hinweg. Der erste Teil der Dissertation beginnt mit der Beschreibung der Konzepte und Definitionen, die verwendet werden, um Bakterienarten und innerhalb der Artenvielfalt zu identifizieren, und fährt dann fort, einen Überblick über die Bakterienarten zu geben, die im Zentrum meiner Untersuchung, C. difficile, stehen. Das erste Kapitel enthält eine detaillierte Beschreibung der Entdeckung, Biologie und Physiologie dieser klinisch relevanten Spezies, gefolgt von einem Überblick über die diagnostischen Protokolle, die im klinischen Umfeld zur Diagnose von CDI verwendet werden. Der zweite Teil der Arbeit beschreibt die Methodik zur Untersuchung der oben genannten Fragen, während der dritte Teil die Ergebnisse dieser Untersuchungsarbeit präsentiert. Ich zeige zunächst, dass C. difficile nur in einem Bruchteil der CDI-Proben gefunden werden konnte und dass die gleichzeitige Besiedlung mehrerer enteropathogener Spezies, die CDI-ähnliche klinische Manifestationen verursachen können, häufiger vorkommt als bisher angenommen, was Bedenken hinsichtlich einer CDI-Überdiagnose aufkommen lässt. Ich zeige dann, dass das CDI-assoziierte Darmmikrobiom durch eine spezifische mikrobielle Signatur gekennzeichnet ist, die sich von der Gemeinschaftszusammensetzung unterscheidet, die mit Nicht-CDI- Diarrhoe verbunden ist. Über den nosokomialen und CDI-Kontext hinaus zeige ich, dass C. difficile, obwohl es bei Erwachsenen selten vorkommt, ein häufiges Mitglied des Darmmikrobioms von Säuglingen ist, wo seine Anwesenheit mit mehreren Indikatoren verbunden ist, die typisch für eine wünschenswerte gesunde Mikrobiomentwicklung sind. Darüber hinaus beschreibe ich die ausgedehnte Beförderung von C. difficile bei asymptomatischen Patienten aller Altersgruppen und eine potenziell neue Gruppe von C. difficile, die ausschließlich bei Säuglingen identifiziert wurde. Abschließend diskutiere ich die Grenzen, Herausforderungen und Zukunftsperspektiven meiner Untersuchung. KW - microbiome KW - infant KW - C. difficile KW - CDI Y1 - 2022 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-254170 ER -