TY - THES A1 - Dugar, Gaurav T1 - Comparative transcriptomics and post-transcriptional regulation in \(Campylobacter\) \(jejuni\) T1 - Vergleichende Transkriptomanalysen und posttranskriptionelle Regulierung in \(Campylobacter\) \(jejuni\) N2 - The transcriptome is defined as the set of all RNA molecules transcribed in a cell. These include protein-coding messenger RNAs (mRNAs) as well as non-coding RNAs, such as ribosomal RNAs (rRNAs), transfer RNAs (tRNAs), and small non-coding RNAs (sRNAs). sRNAs are known to play an important role in regulating gene expression and virulence in pathogens. In this thesis, the transcriptome of the food-borne pathogen Campylobacter jejuni was characterized at single nucleotide resolution by use of next-generation sequencing approaches. The first genome of a C. jejuni strain was published in the year 2000. However, its transcriptome remained uncharacterized at large. C. jejuni can survive in a variety of ecological niches and hosts. However, how strain-specific transcriptional changes contribute to such adaptation is not known. In this study, the global transcriptome maps of four closely related C. jejuni strains were defined using a differential RNA-seq (dRNA-seq) approach. This analysis also included a novel automated method to annotate the transcriptional start sites (TSS) at a genome-wide scale. Next, the transcriptomes of four strains were simultaneously mapped and compared by the use of a common coordinate system derived from whole-genome alignment, termed as SuperGenome. This approach helped to refine the promoter maps by comparison of TSS within strains. Most of the TSS were found to be conserved among all four strains, but some single-nucleotide-polymorphisms (SNPs) around promoter regions led to strain-specific transcriptional output. Most of these SNPs altered transcription only slightly, but some others led to a complete abrogation of transcription leading to differential molecular phenotypes. These in turn might help the strains to adapt to their specific host or microniche. The transcriptome also unveiled a plethora of sRNAs, some of which were conserved among the four strains while others were strain specific. Furthermore, a Cas9-dependent minimal type-II CRISPR-Cas system with only three Cas genes and multiple promoters to drive the transcription of the CRISPR locus was also characterized in C. jejuni using the dRNA-seq dataset. Apart from sRNAs, the role of global RNA binding proteins (RBPs) is also unclear in C. jejuni. Aided by the global transcriptome data, the role of RBPs in post-transcriptional regulation of C. jejuni was studied at a global scale. Two of the most widely studied RNA binding proteins in bacteria are Hfq and CsrA. The RNA interactome of the translational regulator CsrA was defined using another global deep-sequencing technique that combines co-immunoprecipitation (coIP) with RNA sequencing (RIP-seq). Using this interactome dataset, the direct targets of this widespread global post-transcriptional regulator were defined, revealing a significant enrichment for mRNAs encoding genes involved in flagella biosynthesis. Unlike Gammaproteobacteria, where sRNAs such as CsrB/C, antagonize CsrA activity, no sRNAs were enriched in the CsrA-coIP in C. jejuni, indicating absence of any sRNA antagonists and novel modes of CsrA activity regulation. Instead, the CsrA regulatory pathway revealed flaA mRNA, encoding the major flagellin, as a dual-function mRNA. flaA mRNA was the main target of CsrA but it also served to antagonize CsrA activity along with the protein antagonist FliW previously identified in the Gram-positive bacterium Bacillus subtilis. Furthermore, this regulatory mRNA was also shown in this thesis to localize to the poles of elongating C. jejuni cells in a translation-dependent manner. It was also shown that this localization is dependent on the CsrA-FliW regulon, which controls the translation of flaA mRNA. The role and mechanism of flaA mRNA localization or mRNA localization in general is not yet clear in bacteria when compared to their eukaryotic counterparts. Overall, this study provides first insights into riboregulation of the bacterial pathogen C. jejuni. The work presented in this thesis unveils several novel modes of riboregulation in C. jejuni, which could be applicable more generally. Moreover, this study also lays out several unsolved intriguing questions, which may pave the way for interesting studies to come. N2 - Das Transkriptom ist definiert als die Summe aller RNA-Moleküle, die in einer Zelle transkribiert werden. Hierzu gehören sowohl protein-kodierende Boten-RNAs (mRNAs für „messenger RNAs“), als auch nicht-kodierende RNAs, wie ribosomale RNAs (rRNAs), transfer RNAs (tRNAs) und kleine nicht-kodierende RNAs (sRNAs für „small RNAs“). Diese sRNAs spielen eine wichtige Rolle in der Regulierung von Genexpression und Virulenz von Pathogenen. In der vorliegenden Arbeit wurde das Transkriptom des Lebensmittelkeims Campylobacter jejuni mit Hilfe von Next-Generation-Sequencing-Methoden charakterisiert, welche eine Auflösung des Transkriptoms auf Einzelnukleotid-Ebene ermöglichen. Obwohl eine erste Genomsequenz für C. jejuni bereits im Jahr 2000 veröffentlicht wurde, war das Transkriptom bisher größtenteils uncharakterisiert. C. jejuni besitzt die Fähigkeit in vielen ökologischen Nischen und Wirten überleben zu können. Es ist jedoch bislang unbekannt, wie stammspezifische Veränderungen des Transkriptoms zu dieser Adaption beitragen. Mittels eines differenziellen RNA-Sequenzierungsansatzes wurden in dieser Arbeit globale Transkriptomkarten von vier nahverwandten C. jejuni Stämmen erstellt. Diese Analyse beinhaltet auch eine neue automatisierte Methode zur genomweiten Identifizierung von Transkriptionsstartstellen (TSS). Anschließend wurde aus den Genomsequenzen der vier Campylobacter Stämme ein SuperGenom erstellt. Dieses wiederum diente als Referenz, anhand dessen die Transkriptome kartiert und miteinander verglichen werden konnten. Dieser Ansatz ermöglichte eine verfeinerte Kartierung der Promotoren mittels des Vergleichs verschiedener Stämme. Die meisten TSS waren innerhalb der vier Stämme konserviert. Allerdings kam es durch SNPs („single-nucleotide polymorphisms“) in den Promoterregionen zu stammspezifischem Transkriptoutput. Die meisten dieser SNPs hatten nur geringe Veränderungen der Transkription zur Folge. Manche jedoch führten zu einem kompletten Verlust der Transkription und damit zu verschiedenen molekularen Phänotypen. Diese wiederum könnten es den verschiedenen Stämmen ermöglichen, sich an ihre spezifische Wirts- oder Mikronische anzupassen. Das Transkriptom wies auch eine Fülle von sRNAs auf, von denen manche in allen vier Stämmen konserviert, andere jedoch stammspezifisch waren. Zudem wurde mittels des C. jejuni-dRNA-seq-Datensatzes ein minimales Cas9-abhängiges CRISPR-Cas-System des Typs II entdeckt. Dieses beinhaltet lediglich drei Cas-Gene, jedoch mehrere Promotoren, die die Expression des CRISPR-Lokus antreiben. Neben der Funktion von sRNAs ist auch die Rolle globaler RNA-Bindeproteine (RBPs) in C. jejuni weitestgehend unklar. Mithilfe der Transkriptomdaten wurde die Rolle von RBPs in der posttranskriptionellen Regulierung in C. jejuni untersucht. Zwei der am besten untersuchten RNA-Bindeproteine in Bakterien sind Hfq und CsrA. Das RNA-Interaktom des Translationsregulators CsrA wurde mittels eines weiteren globalen Deep-Squencing-Ansatzes definiert. Bei dieser Methode werden Coimmunopräzipitation (coIP) und RNA-Sequenzierung zum so genannten RIP-seq kombiniert. Mithilfe dieses Interaktionsdatensatzes wurden die Zielgene dieses weitverbreiteten, globalen posttranskriptionellen Regulators definiert. Hierbei wurde eine signifikante Anreicherung von mRNAs, die in die Biosynthese von Flagellen involviert sind, erkennbar. Anders als in Gammaproteobakterien, in denen sRNAs wie CsrB und CsrC die CsrA-Aktivität antagonisieren, wurden in C. jejuni keine sRNAs in der CsrA-CoIP angereichert. Dies deutet auf das Fehlen jeglicher sRNA-Antagonisten, und damit auf eine neue Art der CsrA-Aktivitätskontrolle hin. Anstelle der sRNAs wurde die flaA mRNA, welche für das Hauptflagellin kodiert, als mRNA mit dualer Funktion identifiziert. Sie ist zum einen das Hauptzielgen von CsrA, fungiert aber gleichzeitig, zusammen mit dem Protein FliW, als Antagonist von CsrA. FliW wurde bereits zuvor in dem Grampositiven Bakterium Bacillus subtilis identifiziert. In dieser Arbeit konnte zudem gezeigt werden, dass die regulatorische flaA mRNA translationsabhängig an den Polen der wachsenden C. jejuni-Zellen lokalisiert ist. Außerdem war zu erkennen, dass diese Lokalisierung abhängig von dem CsrA-FliW-Regulon stattfindet, welches die Translation der flaA-mRNA kontrolliert. Im Gegensatz zu Eukaryoten ist die Rolle, die die Lokalisation der flaA-mRNA, oder bakterieller mRNA im Allgemeinen, spielt, sowie der Mechanismus, der zu dieser Lokalisierung führt, bisher noch unklar. Zusammenfassend ermöglicht diese Arbeit einen ersten Einblick in die Riboregulierung des bakteriellen Pathogens C. jejuni. Es konnten einige neue Mechanismen dieser Art der Regulierung aufgedeckt werden, welche auch allgemeine Gültigkeit finden könnten. Zudem werden in dieser Arbeit neue, faszinierende Fragen aufgeworfen, die den Weg für weitere interessante Studien bereiten. KW - Post-transcriptional regulation KW - Transcriptome KW - SNPs KW - CsrA KW - Campylobacter jejuni KW - Transkriptom KW - Posttranskriptionelle Regulation Y1 - 2016 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-146180 ER - TY - THES A1 - Vasquez Ospina, Juan Jose T1 - Development of tools for the study of gene regulation in Trypanosoma brucei T1 - Entwicklung neuer Methoden zur Untersuchung der Genregulation in Trypanosoma brucei N2 - The protozoan parasite Trypanosoma brucei is the causal agent of sleeping sickness and besides its epidemiological importance it has been used as model organism for the study of many aspects of cellular and molecular biology especially the post-transcriptional control of gene expression. Several studies in the last 30 years have shown the importance of mRNA processing and stability for gene regulation. In T. brucei genes are unusually arranged in polycistronic transcription units (PTUs) and a coupled process of trans-splicing and polyadenylation produces the mature mRNAs. Both processes, mRNA processing and stability, cannot completely explain the control of gene expression in the different life cycle stages analyzed in T. brucei so far. In recent years, the relevance of expression regulation at the level of translation has become evident in other eukaryotes. Therefore, in the first part of my thesis I studied the impact of translational regulation by means of a genome-wide ribosome profiling approach. My data suggest that translational efficiencies vary between life cycle stages of the parasite as well as between genes within one life cycle stage. Furthermore, using ribosome profiling I was able to identify many new putative un-annotated coding sequences and to evaluate the coding potential of upstream open reading frames (uORF). Comparing my results with previously published proteomic and RNA interference (RNAi) target sequencing (RIT-seq) datasets allowed me to validate some of the new coding sequences and to evaluate their relevance for the fitness of the parasite. In the second part of my thesis I used the transcriptomic and translatomic profiles obtained from the ribosome profiling analysis for the identification of putative non-coding RNAs (ncRNAs). These results led to the analysis of the coding potential in the regions upstream and downstream of the expressed variant surface glycoprotein (VSG), which is outlined in the third part of the results section. The region upstream of the VSG, the co-transposed region (CTR), has been implicated in an increase of the in situ switching rate upon its deletion. The ribosome profiling results indicated moderate transcription but not translation in this region. These results raised the possibility that the CTR may be transcribed into ncRNA. Therefore, in the third part of my thesis, I performed a primary characterization of the CTR-derived transcripts based on northern blotting and RACE. The results suggested the presence of a unique transcript species of about 1,200 nucleotides (nt) and polyadenylated at the 3’-end of the sequence. The deletion of the CTR sequence promoting and increase of the in situ switching rates was performed around 20 years ago by means of inserting reporter genes. With the recent development of endonuclease-based tools for genome editing, it is now possible to delete sequences in a marker-free way. In the fourth part of my thesis, I show the results on the implementation of the highly efficient genome-editing CRISPR-Cas9 system in T. brucei using episomes. As a proof of principle, I inserted the sequence coding for the enhanced green fluorescent protein (eGFP) at the end of the SCD6 coding sequence (CDS). Fluorescent cells were observed as early as two days after transfection. Therefore, after the successful set up of the CRISPR-Cas9 system it will be possible to modify genomic regions with more relevance for the biology of the parasite, such as the substitution of codons present in gene tandem arrays. The implementation of ribosome profiling in T. brucei opens the opportunity for the study of translational regulation in a genome-wide scale, the re-annotation of the currently available genome, the search for new putative coding sequences, the detection of putative ncRNAs, the evaluation of the coding potential in uORFs and the role of unstranslated regions (UTRs) in the regulation of translation. In turn, the implementation of the CRISPR-Cas9 system offers the possibility to manipulate the genome of the parasite at a nucleotide resolution and without the need of including resistant makers. The CRISPR-Cas9 system is a powerful tool for editing ncRNAs, UTRs, multicopy gene families and CDSs keeping their endogenous UTRs. Moreover, the system can be used for the modification of both alleles after just one round of transfection and of codons coding for amino acids carrying post-translational modifications (PTMs) among other possibilities.     N2 - Trypanosoma brucei ist nicht nur als Erreger der Schlafkrankheit von großer epidemiologischer Bedeutung, sondern dient auch der Zell-­‐ und Molekularbiologie – insbesondere zur Erforschung der Genregulation auf posttranskriptionaler Ebene – als wichtiger Modellorganismus. In den vergangenen 30 Jahren konnten mehrere Forschungsarbeiten zeigen, dass mRNA-­‐Stabilität und –Prozessierung maßgeblich zur Regulation der Genexpression beitragen. Anders als in den meisten Eukaryoten sind die Gene in T. brucei in polycistronischen Transkriptionseinheiten (PTUs) angeordnet. Die reife mRNA entsteht aus dem polycistronischen Transkript in einem gekoppelten Prozess aus Trans-­‐splicing und paralleler Polyadenylierung. Beide Vorgänge allein, mRNA-­‐Stabilität und –Prozessierung, reichen nicht aus, um die Regulation der Genexpression in T. brucei vollständing zu erklären und zusätzliche Mechanismen müssen wirksam sein. Daher habe ich im ersten Teil meiner hier vorliegenden Doktorarbeit die Genregulation auf Ebene der Translation mittels genomweitem Ribosome Profiling untersucht. Die dabei gewonnen Daten deuten darauf hin, dass die Translationseffizienzen nicht nur zwischen prozyklischen-­‐ und Blutstromformen des Parasiten differieren, sondern auch die Gene innerhalb eines Stadiums verschieden effizient translatiert werden. Zudem war es mir mit diesem Ansatz möglich, neue, noch nicht annotierte kodierende Sequenzen zu identifizieren und das Kodierungspotenzial der jeweils vorgelagerten offenen Leseraster (ORFs) zu evaluieren. Mithilfe bereits veröffentlichter Proteom-­‐ und RNA Interferenz-­‐ Studien (RIT-­‐seq) konnte ich einige der neu identifizierten kodierenden Sequenzen validieren und deren Bedeutung für die Fitness des Parasiten bestimmen. Im zweiten Teil der Arbeit wurden die ermittelten Translations-­‐ und Transkriptionsprofile miteinander verglichen, um auf diese Weise mögliche nicht-­‐kodierende RNAs (ncRNAs) zu identifizieren. Dies führte zu einer eingehenderen Betrachtung der Kodierungspotenziale der dem exprimierten variablen Oberflächenproteins (VSG) vor-­‐ und nachgeschalteten Regionen. In früheren Arbeiten wurde bereits beschrieben, dass eine Deletion der dem VSG vorgelagerten, sogenannten co-­‐transposed region (CTR), vermehrt zu einer Aktivierung einer alternativen VSG Expressionsseite (in situ switches) führt. Ribosome Profiling zeigte, dass eben jede Regionen zwar moderat transkribiert, jedoch nicht translatiert werden. Da diese Ergebnisse vermuten ließen, dass die CTR für eine ncRNA kodiert, hab ich im dritten Teil meiner Arbeit die CTR Transkripte mittels Northern Blot und RACE weiter charakterisiert. Auf diese Weise konnte ich spezifische, 1200 Nukleotide (nt) lange und am 3`-­‐Ende polyadenylierte Transkripte nachweisen. Die bereits erwähnte Deletion der CTR verbunden mit einer erhöhten Rate an in situ switches wurde vor etwa 20 Jahren durch Insertion von Reportergenen durchgeführt. Heute ist es möglich mithilfe von Endonukleasen Genome ohne solche Marker zu editieren. So beschreibt der vierte Teil der Arbeit die Konstruktion von Episomen zur Etablierung und Anwendung des CRISPR-­‐ Cas9 Systems in T. brucei. Als Machbarkeitsnachweis wurde die kodierende Sequenz des grün fluoreszierenden Proteins (eGFP) am Ende des SCD6 Gens als Fusionsprotein inseriert. Grün fluoreszierende Zellen konnten bereits zwei Tage nach der Transfektion nachgewiesen werden. Nachdem CRISPR-­‐Cas9 erfolgreich in T. brucei etabliert werden konnte, werde ich im Folgenden weitere relevante Regionen im Genom modifizieren und beispielsweise die Deletion zweier Histonvarianten durchführen. Die Ribosome Profiling Studie in T. brucei erlaubt es uns, genomweit Genregulation auf Ebene der Translation zu analysieren, das uns zurzeit vorliegende Genom zu re-­‐annotieren, neue kodierende Sequenzen wie auch ncRNAs zu identifizieren und den Einfluss nicht-­‐kodierender Sequenzen auf die Translation zu untersuchen. Gleichzeitig ermöglicht die Etablierung des CRISPR-­‐ Cas9 Systems in T. brucei eine hochpräzise Manipulation des Genoms ohne den Einsatz von Resistenzmarkern. Auf diese Weise ist es möglich, Gene zu modifizieren und dabei die zugehörigen untranslatierten Bereiche (UTRs) zu erhalten, aber auch ncRNAs, UTRs und mehrfache Kopien eines Gens (gleichzeitig) zu editieren. Ebenso können einzelne Kodons in der Sequenz und somit posttranslational modifizierte Aminosäuren im Genprodukt verändert werden, was uns weitere Möglichkeiten zur Erforschung der Genregulation eröffnet. KW - Trypanosoma brucei KW - Ribosom KW - Posttranskriptionelle Regulation KW - Trypanosoma brucei KW - Gene expression regulation KW - Ribosome profiling KW - CRISPR Cas9 KW - CRISPR Cas9 system Y1 - 2016 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-133996 ER -