TY - THES A1 - Yu, Sung-Huan T1 - Development and application of computational tools for RNA-Seq based transcriptome annotations T1 - Entwicklung und Anwendung bioinformatischer Werkzeuge für RNA-Seq-basierte Transkriptom-Annotationen N2 - In order to understand the regulation of gene expression in organisms, precise genome annotation is essential. In recent years, RNA-Seq has become a potent method for generating and improving genome annotations. However, this Approach is time consuming and often inconsistently performed when done manually. In particular, the discovery of non-coding RNAs benefits strongly from the application of RNA-Seq data but requires significant amounts of expert knowledge and is labor-intensive. As a part of my doctoral study, I developed a modular tool called ANNOgesic that can detect numerous transcribed genomic features, including non-coding RNAs, based on RNA-Seq data in a precise and automatic fashion with a focus on bacterial and achaeal species. The software performs numerous analyses and generates several visualizations. It can generate annotations of high-Resolution that are hard to produce using traditional annotation tools that are based only on genome sequences. ANNOgesic can detect numerous novel genomic Features like UTR-derived small non-coding RNAs for which no other tool has been developed before. ANNOgesic is available under an open source license (ISCL) at https://github.com/Sung-Huan/ANNOgesic. My doctoral work not only includes the development of ANNOgesic but also its application to annotate the transcriptome of Staphylococcus aureus HG003 - a strain which has been a insightful model in infection biology. Despite its potential as a model, a complete genome sequence and annotations have been lacking for HG003. In order to fill this gap, the annotations of this strain, including sRNAs and their functions, were generated using ANNOgesic by analyzing differential RNA-Seq data from 14 different samples (two media conditions with seven time points), as well as RNA-Seq data generated after transcript fragmentation. ANNOgesic was also applied to annotate several bacterial and archaeal genomes, and as part of this its high performance was demonstrated. In summary, ANNOgesic is a powerful computational tool for RNA-Seq based annotations and has been successfully applied to several species. N2 - Exakte Genomannotationen sind essentiell für das Verständnis Genexpressionsregulation in verschiedenen Organismen. In den letzten Jahren entwickelte sich RNA-Seq zu einer äußerst wirksamen Methode, um solche Genomannotationen zu erstellen und zu verbessern. Allerdings ist das Erstellen von Genomannotationen bei manueller Durchführung noch immer ein zeitaufwändiger und inkonsistenter Prozess. Die Verwendung von RNA-Seq-Daten begünstigt besonders die Identifizierung von nichtkodierenden RNAs, was allerdings arbeitsintensiv ist und fundiertes Expertenwissen erfordert. Ein Teil meiner Promotion bestand aus der Entwicklung eines modularen Tools namens ANNOgesic, das basierend auf RNA-Seq-Daten in der Lage ist, eine Vielzahl von Genombestandteilen, einschließlich nicht-kodierender RNAs, automatisch und präzise zu ermitteln. Das Hauptaugenmerk lag dabei auf der Anwendbarkeit für bakterielle und archaeale Genome. Die Software führt eine Vielzahl von Analysen durch und stellt die verschiedenen Ergebnisse grafisch dar. Sie generiert hochpräzise Annotationen, die nicht unter Verwendung herkömmlicher Annotations-Tools auf Basis von Genomsequenzen erzeugt werden könnten. Es kann eine Vielzahl neuer Genombestandteile, wie kleine nicht-kodierende RNAs in UTRs, ermitteln, welche von bisherigen Programme nicht vorhergesagt werden können. ANNOgesic ist unter einer Open-Source-Lizenz (ISCL) auf https://github.com/Sung-Huan/ANNOgesic verfügbar. Meine Forschungsarbeit beinhaltet nicht nur die Entwicklung von ANNOgesic, sondern auch dessen Anwendung um das Transkriptom des Staphylococcus aureus-Stamms HG003 zu annotieren. Dieser ist einem Derivat von S. aureus NCTC8325 - ein Stamm, Dear ein bedeutendes Modell in der Infektionsbiologie darstellt. Zum Beispiel wurde er für die Untersuchung von Antibiotikaresistenzen genutzt, da er anfällig für alle bekannten Antibiotika ist. Der Elternstamm NCTC8325 besitzt zwei Mutationen im regulatorischen Genen (rsbU und tcaR), die Veränderungen der Virulenz zur Folge haben und die in Stamm HG003 auf die Wildtypsequenz zurückmutiert wurden. Dadurch besitzt S. aureus HG003 das vollständige, ursprüngliche Regulationsnetzwerk und stellt deshalb ein besseres Modell zur Untersuchung von sowohl Virulenz als auch Antibiotikaresistenz dar. Trotz seines Modellcharakters fehlten für HG003 bisher eine vollständige Genomsequenz und deren Annotationen. Um diese Lücke zu schließen habe ich als Teil meiner Promotion mit Hilfe von ANNOgesic Annotationen für diesen Stamm, einschließlich sRNAs und ihrer Funktionen, generiert. Dafür habe ich Differential RNA-Seq-Daten von 14 verschiedenen Proben (zwei Mediumsbedingungen mit sieben Zeitpunkten) sowie RNA-Seq-Daten, die von fragmentierten Transkripten generiert wurden, analysiert. Neben S. aureus HG003 wurde ANNOgesic auf eine Vielzahl von Bakterien- und Archaeengenome angewendet und dabei wurde eine hohe Performanz demonstriert. Zusammenfassend kann gesagt werden, dass ANNOgesic ein mächtiges bioinformatisches Werkzeug für die RNA-Seq-basierte Annotationen ist und für verschiedene Spezies erfolgreich angewandt wurde. KW - RNA-Seq KW - Genome Annotation KW - small RNA KW - Genom KW - Annotation KW - Small RNA KW - Bioinformatik Y1 - 2019 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-176468 ER - TY - THES A1 - Santos, Sara F. C. T1 - Expanding the targetome of Salmonella small RNA PinT using MS2 affinity purification and RNA-Seq (MAPS) T1 - Erweiterung des Targetoms der kleinen RNA PinT von Salmonella mittels MS2-Affinitätsaufreinigung und RNA-seq (MAPS) N2 - Bacterial small RNAs are key mediators of post-transcriptional gene regulation. An increasing number of sRNAs have been implicated in the regulation of virulence programs of pathogenic bacteria. Recently, in the enteric pathogen Salmonella Typhimurium, the PinT sRNA has gained increased importance as it is the most upregulated sRNA as Salmonella infects mammalian host cells (Westermann et al., 2016). PinT acts as a temporal regulator of Salmonella‘s two major pathogenicity islands, SPI-1 and SPI-2 (Kim et al., 2019; Westermann et al., 2016). However, the complete set of PinT targets, its role in Salmonella infection and host response is not yet fully understood. Building on the MS2 affinity purification and RNA- seq (MAPS) method (Lalaouna et al., 2015), we here set out to globally identify direct RNA ligands of PinT, relevant to Salmonella infection. We transferred the classical MAPS technique, based on sRNA-bait overexpression, to more physiological conditions, using endogenous levels of the sRNA. Making the henceforth identified targets, less likely to represent artefacts of the overexpression. More importantly, we progressed the MAPS technique to in vivo settings and by doing so, we were able pull-down bacterial RNA transcripts bound by PinT during macrophage infection. While we validate previously known PinT targets, our integrated data revealed novel virulence relevant target. These included mRNAs for the SPI-2 effector SteC, the PhoQ activator UgtL and the 30S ribosomal protein S22 RpsV. Next, we follow up on SteC, the best characterized virulence relevant PinT target. Using genetic and biochemical assays, we demonstrate that PinT represses steC mRNA by direct base-pairing and translational interference. PinT-mediated regulation of SteC leads to alterations in the host response to Salmonella infection. This regulation impacts the cytokine response of infected macrophages, by altering IL10 production, and possibly driving the macrophages to an anti-inflammatory state, more permise to infection. SteC is responsible for F-actin meshwork rearrangements around the SCV (Poh et al., 2008). Here we demonstrate that PinT-mediated regulation of SteC, impacts the formation of this actin meshwork in infected cells. Our results demonstrate that SteC expression is very tightly regulated by PinT in two layers; indirectly, by repressing ssrB and crp; and directly by binding to steC 5’UTR. PinT contributes to post-transcriptional cross-talk between invasion and intracellular replication programs of Salmonella, by controlling the expression of both SPI-1 and SPI-2 genes (directly and indirectly). Together, our collective data makes PinT the first sRNA in Gram-negatives with a pervasive role in virulence, at the center of Salmonella virulence programs and provide molecular input that could help explain the attenuation of pinT-deficient Salmonella strains in whole animal models of infection. N2 - Kleine RNAs sind zentrale Stellschrauben der posttranskriptionellen Genregulation in Bakterien. Eine zunehmende Anzahl von sRNAs ist an der Regulation von Virulenzprogrammen pathogener Bakterien beteiligt. In jüngster Zeit hat beim enterischen Erreger Salmonella Typhimurium die PinT-sRNA an Bedeutung gewonnen, da sie die am stärksten hochregulierte sRNA während der Infektion von Säugetierwirtszellen ist (Westermann et al., 2016). PinT fungiert als zeitlicher Regulator der beiden wichtigsten Pathogenitätsinseln von Salmonella, SPI-1 und SPI-2 (Kim et al., 2019a; Westermann et al., 2016). Die vollständige Liste der Targets von PinT und die Rolle von PinT bei der Salmonella-Infektion sowie der Wirstantwort sind jedoch noch nicht vollständig aufgeklärt. Mit Hilfe der MS2 affinity purification and RNA-seq (MAPS)-Methode (Lalaouna et al., 2015) möchten wir hier direkte RNA-Liganden von PinT identifizieren, die für die Salmonella-Infektion relevant sind. Wir übertragen die klassische MAPS-Technik, die auf der Überexpression von sRNA-Baits basiert, auf physiologischere Bedingungen unter Verwendung endogener Mengen der sRNA. Dadurch wird die Wahrschienlichkeit, dass die identifizierten Targets Artefakte sind, verringert. Darüber hinaus sind wir in der Lage, die MAPS-Technik unter in vivo-Bedingungen durchzuführen. Auf diese Weise konnten wie bakterielle Transkripte, die während einer Makrophageninfektion an PinT gebunden wurden, isolieren. Während wir bereits bekannte PinT-Ziele validieren, identifizieren unsere integrierten Daten ein neues Target, das für Virulenz relevant ist. Dazu gehörten mRNAs für den SPI-2-Effektor SteC, den PhoQ-Aktivator UgtL und das ribosomale 30S-Protein S22 RpsV. Zunächst untersuchen wir SteC, das am besten charakterisierte virulenzrelevante PinT-Ziel. Anhand genetischer und biochemischer Assays zeigen wir, dass PinT die steC-mRNA durch direkte Basenpaarung und Translationsrepression reguliert. Die PinT-vermittelte Regulation von SteC führt zu einer veränderten Wirtsreaktion auf eine Salmonella-Infektion. Diese Regulation beeinflusst die Zytokinreaktion infizierter Makrophagen, indem sie die IL10-Produktion verändert und die Makrophagen möglicherweise in einen entzündungshemmenden Zustand versetzt, der sie anfälliger für eine Infektion macht. SteC ist verantwortlich für die Umlagerung von F-Actin-Netzen um die SCV (Poh et al., 2008). Hier zeigen wir, dass die PinT-vermittelte Regulation von SteC die Bildung dieses Aktin-Netzwerks in infizierten Zellen beeinflusst. Unsere Ergebnisse zeigen, dass die Regulation der SteC-Expression durch PinT auf zwei Ebenden stattfindet: indirekt durch Unterdrückung von ssrB und crp; und direkt durch Bindung an steC 5’UTR. PinT trägt zum posttranskriptionellen Crosstalk zwischen Invasions- und intrazellulären Replikationsprogrammen von Salmonella bei, indem die Expression von SPI-1- und SPI-2-Genen (direkt und indirekt) gesteuert wird. Insgesamt macht unterstreichen unsere Daten die zentrale Rolle von PinT in Virulenzprogrammen von Salmonella. PinT ist die erste sRNA in Gram-Negativen mit einer derart durchdringenden Rolle bei der Virulenz. Zudem liefern unsere Ergebnisse Einblick auf molekularer Ebene, die die Attenuation von PinT-defizienten Salmonella-Stämmen in Tiermodellen erklären könnte. KW - Salmonella KW - small RNA KW - PinT KW - MS2-affinity purification and RNA-seq KW - effector protein KW - SteC Y1 - 2021 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-204926 ER -