@phdthesis{Altrock2002, author = {Altrock, Stefanie}, title = {Genetische Organisation und Transkription eines Virulenz-assoziierten, instabilen Chromosomenabschnitts von Listeria ivanovii}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-3303}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2002}, abstract = {Unter den sechs Arten der Gattung Listeria finden sich nur zwei pathogene Spezies. L. monocytogenes ist pathogen f{\"u}r Mensch und Tier, L. ivanovii nur tierpathogen. Beide Arten besitzen ein Virulenzgencluster, das auch als Pathogenit{\"a}tsinsel LIPI-1 bezeichnet wird. Pathogenit{\"a}tsinseln (PAIs) sind bei gram-negativen Bakterien weit verbreitet, wurden bei gram-positiven Pathogenen bisher jedoch nur selten beschrieben. In L. ivanovii wurde nun ein weiterer Virulenz-assoziierter, instabiler Chromosomenabschnitt entdeckt, der in einem Teilbereich Eigenschaften einer Pathogenit{\"a}tsinsel besitzt. Ausgehend von einem spontanen, aber reproduzierbaren Deletionsereignis eines großen Genomabschnitts, der einige schon bekannte Virulenz-assoziierte Gene umfasst (i-inlE, i-inlF, smcL), wurden in Zusammenarbeit mit den Kooperationspartnern an der "Universidad Complutense de Madrid", insbesondere mit G. Dom{\´i}nguez-Bernal die komplette deletierte Region sowie flankierende Genombereiche genauer analysiert. Im Rahmen dieser Arbeit konnten rechts von dem bereits charakterisierten Gen smcL 13 neue Open Reading Frames (ORFs) bzw. Gene (ydeI, rnaH, norA) von L. ivanovii identifiziert werden, die gr{\"o}ßtenteils in der Deletionsmutante L. ivanovii GD-3 deletiert waren. F{\"u}r die meisten Open Reading Frames konnten Homologien zu ORFs in den Genomsequenzen von L. monocytogenes und der apathogenen Art L. innocua gefunden werden. Eigene experimentelle Analysen zeigten zudem, dass diese ORFs in {\"a}hnlicher Anordnung auch in den apathogenen Arten L. seeligeri und L. welshimeri vorhanden sind, was wahrscheinlich macht, dass sie nicht an der Virulenz von Listerien beteiligt sind. G. Dom{\´i}nguez-Bernal fand im links von smcL liegenden Bereich eine Reihe neuer Internalingene, die alle spezifisch f{\"u}r L. ivanovii sind. F{\"u}r die Gene i-inlE, i-inlF und smcL ist bereits bekannt, dass diese Virulenz-assoziiert sind. Dies f{\"u}hrte zur Definition einer neuen, LIPI-2 genannten Pathogenit{\"a}tsinsel in L. ivanovii, die außer smcL und i-inlFE alle neu gefundenen Internalingene umfasst. In dieser Arbeit durchgef{\"u}hrte Untersuchungen der LIPI-2 flankierenden Bereiche zeigten, dass diese in L. monocytogenes und auch den apathogenen Arten L. innocua, L. seeligeri und L. welshimeri bemerkenswert konserviert sind. Durch Transkriptionsuntersuchungen mittels RT-PCR wurde die Expression der neu identifizierten Gene analysiert. Hierbei wurden verschiedene Kulturbedingungen untersucht sowie die Transkription nach Infektion mehrerer Zelllinien bestimmt. Bei der Sequenzanalyse wurde f{\"u}r fast alle Internalingene eine PrfA-Box identifiziert und es best{\"a}tigte sich in dieser Arbeit, dass die meisten der Internalingene PrfA-abh{\"a}ngig exprimiert werden. Allerdings wiesen die einzelnen Gene kein einheitliches Transkriptionsprofil unter verschiedenen in vitro-Bedingungen auf. Eine Analyse der Genexpression nach Infektion verschiedener Zelllinien zeigte schließlich, dass die Internalingene w{\"a}hrend einer Infektion differentiell transkribiert werden und m{\"o}glicherweise am Infektionsgeschehen beteiligt sind. Das Expressionsmuster der zu LIPI-2 benachbarten Open Reading Frames best{\"a}tigte, dass diese Gene PrfA-unabh{\"a}ngig und unter verschiedenen Bedingungen konstitutiv exprimiert werden. Das Expressionsmuster dieser Gene l{\"a}ßt den Schluss zu, dass sie vermutlich nicht zur Virulenz von L. ivanovii beitragen. Die Untersuchung der Virulenzclustergene in LIPI-1 schließlich zeigte eine deutliche PrfA-Abh{\"a}ngigkeit der Genexpression. Es konnte best{\"a}tigt werden, dass deren Transkription unter PrfA-induzierenden Bedingungen verst{\"a}rkt wird. Zudem fand sich auch nach Infektion eine deutliche Expression dieser Gene.}, subject = {Listeria ivanovii}, language = {de} } @phdthesis{BakariSoale2024, author = {Bakari Soale, Majeed}, title = {Regulation of the Variant Surface Glycoprotein (VSG) Expression and Characterisation of the Nucleolar DExD/H box Protein Hel66 in \(Trypanosoma\) \(brucei\)}, doi = {10.25972/OPUS-25809}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-258090}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2024}, abstract = {The variant surface glycoprotein (VSG) of African trypanosomes plays an essential role in protecting the parasites from host immune factors. These trypanosomes undergo antigenic variation resulting in the expression of a single VSG isoform out of a repertoire of around 2000 genes. The molecular mechanism central to the expression and regulation of the VSG is however not fully understood. Gene expression in trypanosomes is unusual due to the absence of typical RNA polymerase II promoters and the polycistronic transcription of genes. The regulation of gene expression is therefore mainly post-transcriptional. Regulatory sequences, mostly present in the 3´ UTRs, often serve as key elements in the modulation of the levels of individual mRNAs. In T. brucei VSG genes, a 100 \% conserved 16mer motif within the 3´ UTR has been shown to modulate the stability of VSG transcripts and hence their expression. As a stability-associated sequence element, the absence of nucleotide substitutions in the motif is however unusual. It was therefore hypothesised that the motif is involved in other essential roles/processes besides stability of the VSG transcripts. In this study, it was demonstrated that the 100 \% conservation of the 16mer motif is not essential for cell viability or for the maintenance of functional VSG protein levels. It was further shown that the intact motif in the active VSG 3´ UTR is neither required to promote VSG silencing during switching nor is it needed during differentiation from bloodstream forms to procyclic forms. Crosstalk between the VSG and procyclin genes during differentiation to the insect vector stage is also unaffected in cells with a mutated 16mer motif. Ectopic overexpression of a second VSG however requires the intact motif to trigger silencing and exchange of the active VSG, suggesting a role for the motif in transcriptional VSG switching. The 16mer motif therefore plays a dual role in VSG in situ switching and stability of VSG transcripts. The additional role of the 16mer in the essential process of antigenic variation appears to be the driving force for the 100 \% conservation of this RNA motif. A screen aimed at identifying candidate RNA-binding proteins interacting with the 16mer motif, led to the identification of a DExD/H box protein, Hel66. Although the protein did not appear to have a direct link to the 16mer regulation of VSG expression, the DExD/H family of proteins are important players in the process of ribosome biogenesis. This process is relatively understudied in trypanosomes and so this candidate was singled out for detailed characterisation, given that the 16mer story had reached a natural end point. Ribosome biogenesis is a major cellular process in eukaryotes involving ribosomal RNA, ribosomal proteins and several non-ribosomal trans-acting protein factors. The DExD/H box proteins are the most important trans-acting protein factors involved in the biosynthesis of ribosomes. Several DExD/H box proteins have been directly implicated in this process in yeast. In trypanosomes, very few of this family of proteins have been characterised and therefore little is known about the specific roles they play in RNA metabolism. Here, it was shown that Hel66 is involved in rRNA processing during ribosome biogenesis. Hel66 localises to the nucleolus and depleting the protein led to a severe growth defect. Loss of the protein also resulted in a reduced rate of global translation and accumulation of rRNA processing intermediates of both the small and large ribosomal subunits. Hel66 is therefore an essential nucleolar DExD/H protein involved in rRNA processing during ribosome biogenesis. As very few protein factors involved in the processing of rRNAs have been described in trypanosomes, this finding represents an important platform for future investigation of this topic.}, subject = {Trypanosoma brucei}, language = {en} } @phdthesis{Blenk2007, author = {Blenk, Steffen}, title = {Bioinformatical analysis of B-cell lymphomas}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-27421}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2007}, abstract = {Background: The frequency of the most observed cancer, Non Hodgkin Lymphoma (NHL), is further rising. Diffuse large B-cell lymphoma (DLBCL) is the most common of the NHLs. There are two subgroups of DLBCL with different gene expression patterns: ABC ("Activated B-like DLBCL") and GCB ("Germinal Center B-like DLBCL"). Without therapy the patients often die within a few months, the ABC type exhibits the more aggressive behaviour. A further B-cell lymphoma is the Mantle cell lymphoma (MCL). It is rare and shows very poor prognosis. There is no cure yet. Methods: In this project these B-cell lymphomas were examined with methods from bioinformatics, to find new characteristics or undiscovered events on the molecular level. This would improve understanding and therapy of lymphomas. For this purpose we used survival, gene expression and comparative genomic hybridization (CGH) data. In some clinical studies, you get large data sets, from which one can reveal yet unknown trends. Results (MCL): The published proliferation signature correlates directly with survival. Exploratory analyses of gene expression and CGH data of MCL samples (n=71) revealed a valid grouping according to the median of the proliferation signature values. The second axis of correspondence analysis distinguishes between good and bad prognosis. Statistical testing (moderate t-test, Wilcoxon rank-sum test) showed differences in the cell cycle and delivered a network of kinases, which are responsible for the difference between good and bad prognosis. A set of seven genes (CENPE, CDC20, HPRT1, CDC2, BIRC5, ASPM, IGF2BP3) predicted, similarly well, survival patterns as proliferation signature with 20 genes. Furthermore, some bands could be associated with prognosis in the explorative analysis (chromosome 9: 9p24, 9p23, 9p22, 9p21, 9q33 and 9q34). Results (DLBCL): New normalization of gene expression data of DLBCL patients revealed better separation of risk groups by the 2002 published signature based predictor. We could achieve, similarly well, a separation with six genes. Exploratory analysis of gene expression data could confirm the subgroups ABC and GCB. We recognized a clear difference in early and late cell cycle stages of cell cycle genes, which can separate ABC and GCB. Classical lymphoma and best separating genes form a network, which can classify and explain the ABC and GCB groups. Together with gene sets which identify ABC and GCB we get a network, which can classify and explain the ABC and GCB groups (ASB13, BCL2, BCL6, BCL7A, CCND2, COL3A1, CTGF, FN1, FOXP1, IGHM, IRF4, LMO2, LRMP, MAPK10, MME, MYBL1, NEIL1 and SH3BP5; Altogether these findings are useful for diagnosis, prognosis and therapy (cytostatic drugs).}, subject = {Bioinformatik}, language = {en} } @phdthesis{Brambrink2002, author = {Brambrink, Tobias}, title = {Entwicklung und Evaluierung eines Verfahrens zur Genexpressionsanalyse bei individuellen pr{\"a}implantatorischen S{\"a}ugerembryonen {\"u}ber die cDNA-Array-Technologie}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-1787}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2002}, abstract = {Untersuchungen der Transkriptionsebene individueller pr{\"a}implantatorischer Embryonalstadien k{\"o}nnen wertvolle Informationen {\"u}ber den physiologischen Status der betrachteten Embryonen, die z.B. zur Verbesserung der Systeme zur In vitro-Produktion von Embryonen genutzt werden k{\"o}nnen, liefern. Bisher fehlte es jedoch an einer geeigneten Technologie, um eine große Anzahl von Transkripten in einzelnen Embryonen zu erfassen. Zielsetzung der vorliegenden Arbeit war es, ein Verfahren zur globalen Amplifikation embryonaler mRNA-Pr{\"a}parationen zu entwickeln, das die Analyse der Transkriptionsebene einzelner pr{\"a}implantatorischer Embryonalstadien {\"u}ber die cDNA-Array-Technologie erm{\"o}glicht. Dazu wurde die Strategie gew{\"a}hlt, zwei bereits etablierte Amplifikationsverfahren, Polymerasekettenreaktion und In vitro-Transkription, zu kombinieren, um so synergistische Effekte beider Verfahren zu nutzen. Die Evaluierung des entwickelten Verfahrens zeigte eine hohe Reproduzierbarkeit der erhaltenen Genexpressionsdaten und belegte, dass die relativen Mengenverh{\"a}ltnisse einzelner mRNA-Spezies zueinander w{\"a}hrend der globalen mRNA-Amplifikation nur unwesentlich ver{\"a}ndert wurden. Die entwickelte Methodik ist somit geeignet, komplexe Genexpressionsprofile einzelner Blastozysten zu erstellen und Unterschiede in der Expressionsst{\"a}rke einzelner Transkripte zu detektieren. Es konnte weiterhin gezeigt werden, dass es m{\"o}glich ist, {\"u}ber heterologe Hybridisierung Genexpressionsprofile boviner Blastozysten mit cDNA-Arrays, die murine Probensequenzen enthalten, reproduzierbar darzustellen. Neben der Detektion individueller Unterschiede in den Genexpressionsprofilen diverser muriner Embryonalstadien und boviner Blastozysten lag ein Schwerpunkt dieser Arbeit in der Untersuchung der Auswirkungen verschiedener in vitro-Produktionssysteme auf die embryonale Genexpression. Die erhaltenen cDNA-Array Expressionsdaten muriner Oozyten, Zweizeller und Blastozysten befanden sich dabei in {\"U}bereinstimmung mit Daten fr{\"u}herer Publikationen anderer Arbeitsgruppen. Genexpressionsprofile in vitro fertilisierter boviner Blastozysten ließen eine Beurteilung der Auswirkungen unterschiedlicher Proteinsupplemente des Kulturmediums auf die embryonale Genexpression zu. Im Rahmen dieser Arbeit wurden zum ersten Mal Genexpressionsprofile einzelner pr{\"a}implantatorischer S{\"a}ugerembryonen {\"u}ber cDNA-Array-Analyse erstellt. Die entwickelte Technologie erm{\"o}glicht es -bei Verwendung entsprechender cDNA-Array-Systeme-, eine theoretisch unbegrenzte Zahl von Transkripten in individuellen S{\"a}ugerembryonen semiquantitativ zu erfassen. Dies ist ein wichtiger Schritt hin zu einem besseren Verst{\"a}ndnis komplexer Regulationsabl{\"a}ufe w{\"a}hrend der fr{\"u}hen Embryonalentwicklung und einer besseren Beurteilung der Lebensf{\"a}higkeit und Entwicklungskompetenz in vitro produzierter Embryonen, was f{\"u}r die Verbesserung von In vitro-Produktionssystemen f{\"u}r Embryonen sowohl bei Tieren als auch beim Menschen unerl{\"a}sslich ist.}, subject = {Embryo}, language = {de} } @phdthesis{Breher2009, author = {Breher, Stephanie}, title = {Die kardiale Funktion von Popdc1 in der Maus: Vom Gen zum Ph{\"a}n}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-37283}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2009}, abstract = {Die Popeye domain containing (Popdc)-Gene bilden eine evolution{\"a}r stark konservierte Genfamilie mit pr{\"a}ferenzieller Expression im Herzen und in der Skelettmuskulatur. In dieser Arbeit konnte gezeigt werden, dass Popdc1 in kardialen Myozyten in Glanzstreifen, lateralen Membranen und im T-Tubuli-System exprimiert wird und mit Ionenkan{\"a}len und anderen myozyt{\"a}ren Membranproteinen wie Cav1.2, Caveolin 3 und NCX1 kolokalisiert ist. Im ventrikul{\"a}ren Reizleitungssystem ist die Expression von Popdc1 gegen{\"u}ber dem ventrikul{\"a}ren Arbeitsmyokard erh{\"o}ht, w{\"a}hrend Atrium und Sinusknoten nahezu {\"a}quivalente Expressionsdom{\"a}nen aufweisen. Mithilfe von elektrophysiologischen Untersuchungen konnte bei den Popdc1-Nullmutanten eine stressinduzierte Sinusbradykardie festgestellt werden, die altersabh{\"a}ngig auftritt und auf Sinuspausen zur{\"u}ckzuf{\"u}hren ist. Histologische Untersuchungen, unter Zuhilfenahme des Sinusknotenmarkers HCN4, zeigten einen Zellverlust im inferioren Teil des Sinusknotens. Popdc1 ist ein Transmembranprotein, das eine 150 Aminos{\"a}ure umfassende, stark konservierte Popeye-Dom{\"a}ne aufweist. F{\"u}r diese Dom{\"a}ne konnte auf struktureller Ebene eine Homologie zu zyklischen Nukleotid-Bindungsdom{\"a}nen vorhergesagt und eine Bindung an cAMP und cGMP experimentell demonstriert werden. Es handelt sich bei den Popdc-Proteinen um einen neuen Zweig der Bindungsproteine f{\"u}r zyklische Nukleotidmonophosphate (cNMP). Die Bindungssequenz weist signifikante Unterschiede zu anderen bereits identifizierten cNMP-Bindungsproteinen auf. Weiterhin wurde die Interaktion von Popdc1 mit TREK1, einem Mitglied der Tandemporenkan{\"a}le untersucht. Es zeigte sich, dass Popdc1 nach Koexpression in Froschoozyten, den TREK1-Strom erh{\"o}ht und dass die \&\#946;-adrenerge Inhibition des TREK1 Kanals durch Popdc1 verst{\"a}rkt wird. Im Arbeitsmyokard, im kardialen Reizleitungssystem und in kotransfizierten Cos7-Zellen werden beide Proteine {\"u}berlappend exprimiert. Diese Daten zeigen, dass Popdc1 eine wichtige Funktion bei der Regulation der Schrittmacheraktivit{\"a}t, der Aufrechterhaltung der Sinusknotenmorphologie und der Modulation von Ionenkan{\"a}len aufweist. Interessanterweise wurden von unserer Arbeitsgruppe bereits die gleichen Ph{\"a}notypen f{\"u}r die Popdc2 Maus beschrieben, sodass die Popdc Genfamilie {\"u}berlappende und redundante Funktionen aufweist.}, subject = {Sinusknoten}, language = {de} } @phdthesis{Busold2006, author = {Busold, Christian}, title = {Facilitating functional interpretation of microarray data by integration of gene annotations in Correspondence Analysis}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-21150}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2006}, abstract = {DNS-Chips ('Microarrays') haben sich zu einer der Standardmethoden zur Erstellung von genomweiten Expressionsstudien entwickelt. Mittlerweile wurden dazu eine Vielzahl von Methoden zur Identifizierung von differentiell regulierten Genen ver{\"o}ffentlicht. Ungeachtet dessen stellt die abschliessende funktionelle Interpretation der Ergebnisse einen der Engp{\"a}sse in der Analyse von Chip-Daten dar. Die Mehrzahl der Analysemethoden stellt die signifikant regulierten Gene in Listen dar, aus denen in einem weiteren Schritt gemeinsame funktionelle Eigenschaften abgeleitet werden m{\"u}ssen. Dies stellt nicht nur eine arbeitsintensive Arbeit dar, die mit steigender Anzahl an experimentellen Konditionen immer weniger praktikabel wird, sondern ist auch fehleranf{\"a}llig, da diese Auswertung im allgemeinen auf dem visuellen Vergleich von Listen beruht. In der vorliegenden Arbeit wurden Methoden f{\"u}r eine rechnergest{\"u}tzte Auswertung von funktionellen Geneigenschaften entwickelt und validiert. Hierzu wurde die 'Gene Ontology' als Quelle f{\"u}r die Annotationsdaten ausgew{\"a}hlt, da hier die Daten in einem Format gespeichert sind, das sowohl eine leichte menschliche Interaktion sowie die statistische Analyse der Annotationen erm{\"o}glicht. Diese Genannotation wurden als Zusatzinformationen in die Korrespondenzanalyse integriert, welches eine simultane Darstellung von Genen, Hybridisierungen und funktionellen Kategorien in einer Grafik erm{\"o}glicht. Aufgrund der st{\"a}ndig wachsenden Anzahl an verf{\"u}gbaren Annotationen und der Tatsache, daß zwischen den meisten experimentellen Bedingungen nur wenige funktionelle Prozesse differentiell reguliert sind, wurden Filter entwickelt, die die Anzahl der dargestellten Annotationen auf eine im gegebenen experimentellen Kontext relevante Gruppe reduzieren. Die Anwendbarkeit der Visualisierung und der Filter wurde auf Datens{\"a}tzen unterschiedlicher Komplexit{\"a}t getestet: beginnend mit dem gut verstandenen Glukosestoffwechsel im Modellorganismus S. cerevisiae, bis hin zum Vergleich unterschiedlicher Tumortypen im Menschen. In beiden F{\"a}llen generierte die Methode gut zu interpretierende Grafiken, in denen die funktionellen Hauptunterschiede durch die dargestellten Annotationen gut beschrieben werden [90]. W{\"a}hrend die Integration von Annotationsdaten wie GO die funktionelle Interpretation vereinfacht, fehlt die M{\"o}glichkeit zur Identifikation einzelner relevanter Schl{\"u}sselgene. Um eine solche Analyse zu erm{\"o}glichen, wurden Daten zum Vorkommen von Transskriptionsfaktorbindestellen in den 5'-Bereichen von Genen integriert. Auch diese Methode wurde an Datens{\"a}tzen von S. cerevisiae und vergleichenden Studien von humanen Krebszelllinien validiert.In beiden F{\"a}llen konnten Transkriptionsfaktoren identifiziert werden, die f{\"u}r die beobachteten transkriptionellen Unterschiede von entscheidender Bedeutung sind [206]. Zusammenfassend, erm{\"o}glicht die Integration von Zusatzinformationen in die Korrespondenzanalyse eine simultane Visualisierung von Genen, Hybridisierungen und Annotationsdaten in einer einzigen, gut zu interpretierenden Grafik. Dies erlaubt auch in komplexen experimentellen Bedingungen eine intuitive Identifizierung von relevanten Annotationen. Der hier vorgestellte Ansatz, ist nicht auf die gezeigten Datenstrukturen beschr{\"a}nkt, sondern kann auf die Mehrzahl der verf{\"u}gbaren Annotationsdaten angewendet werden.}, subject = {Microarray}, language = {en} } @phdthesis{Engelmann2008, author = {Engelmann, Julia Cath{\´e}rine}, title = {DNA microarrays: applications and novel approaches for analysis and interpretation}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-29747}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2008}, abstract = {In der vorliegenden Dissertation wird die Entwicklung eines phylogenetischen DNA Microarrays, die Analyse von mehreren Microarray-Genexpressionsdatens{\"a}tzen und neue Ans{\"a}tze f{\"u}r die Datenanalyse und Interpretation der Ergebnisse vorgestellt. Die Entwicklung und Analyse der Daten eines phylogenetischen DNA Microarrays wird in der ersten Publikation dargestellt. Ich konnte zeigen, dass die Spezies-Detektion mit phylogenetischen Microarrays durch die Datenanalyse mit einem linearen Regressionsansatz signifikant verbessert werden kann. Standard-Methoden haben bislang nur Signalintensit{\"a}ten betrachtet und eine Spezies als an- oder abwesend bezeichnet, wenn die Signalintensit{\"a}t ihres Messpunktes oberhalb eines willk{\"u}rlich gesetzten Schwellenwertes lag. Dieses Verfahren ist allerdings aufgrund von Kreuz-Hybridisierungen nicht auf sehr nah verwandte Spezies mit hoher Sequenzidentit{\"a}t anwendbar. Durch die Modellierung des Hybridisierungs und Kreuz-Hybridisierungsverhaltens mit einem linearen Regressionsmodell konnte ich zeigen, dass Spezies mit einer Sequenz{\"a}hnlichkeit von 97\% im Markergen immer noch unterschieden werden k{\"o}nnen. Ein weiterer Vorteil der Modellierung ist, dass auch Mischungen verschiedener Spezies zuverl{\"a}ssig vorhergesagt werden k{\"o}nnen. Theoretisch sind auch quantitative Vorhersagen mit diesem Modell m{\"o}glich. Um die großen Datenmengen, die in {\"o}ffentlichen Microarray-Datenbanken abgelegt sind besser nutzen zu k{\"o}nnen, bieten sich Meta-Analysen an. In der zweiten Publikation wird eine explorative Meta-Analyse auf Arabidopsis thaliana-Datens{\"a}tzen vorgestellt. Mit der Analyse verschiedener Datens{\"a}tze, die den Einfluss von Pflanzenhormonen, Pathogenen oder verschiedenen Mutationen auf die Genexpression untersucht haben, konnten die Datens{\"a}tze anhand ihrer Genexpressionsprofile in drei große Gruppen eingeordnet werden: Experimente mit Indol-3-Essigs{\"a}ure (IAA), mit Pathogenen und andere Experimente. Gene, die charakteristisch f{\"u}r die Gruppe der IAA-Datens{\"a}tze beziehungsweise f{\"u}r die Gruppe der Pathogen-Datens{\"a}tze sind, wurden n{\"a}her betrachtet. Diese Gene hatten Funktionen, die bereits mit Pathogenbefall bzw. dem Einfluss von IAA in Verbindung gebracht wurden. Außerdem wurden Hypothesen {\"u}ber die Funktionen von bislang nicht annotierten Genen aufgestellt. In dieser Arbeit werden auch Prim{\"a}ranalysen von einzelnen Arabidopsis thaliana Genexpressions-Datens{\"a}tzen vorgestellt. In der dritten Publikation wird ein Experiment beschrieben, das durchgef{\"u}hrt wurde um herauszufinden ob Mikrowellen-Strahlung einen Einfluss auf die Genexpression einer Zellkultur hat. Dazu wurden explorative Analysemethoden angewendet. Es wurden geringe aber signifikante Ver{\"a}nderungen in einer sehr kleinen Anzahl von Genen beobachtet, die experimentell best{\"a}tigt werden konnten. Die Funktionen der regulierten Gene und eine Meta-Analyse mit {\"o}ffentlich zug{\"a}nglichen Datens{\"a}tzen einer Datenbank deuten darauf hin, dass die pflanzliche Zellkultur die Strahlung als eine Art Energiequelle {\"a}hnlich dem Licht wahrnimmt. Des weiteren wird in der vierten Publikation die funktionelle Analyse eines Arabidopsis thaliana Genexpressionsdatensatzes beschrieben. Die Analyse der Genexpressions eines pflanzlichen Tumores zeigte, dass er seinen Stoffwechsel von aerob und auxotroph auf anaerob und heterotroph umstellt. Gene der Photosynthese werden im Tumorgewebe reprimiert, Gene des Aminos{\"a}ure- und Fettstoffwechsels, der Zellwand und Transportkan{\"a}le werden so reguliert, dass Wachstum und Entwicklung des Tumors gef{\"o}rdert werden. In der f{\"u}nften Publikation in dieser Arbeit wird GEPAT (Genome Expression Pathway Analysis Tool) beschrieben. Es besteht aus einer Internet- Anwendung und einer Datenbank, die das einfache Hochladen von Datens{\"a}tzen in die Datenbank und viele M{\"o}glichkeiten der Datenanalyse und die Integration anderer Datentypen erlaubt. In den folgenden zwei Publikationen (Publikation 6 und Publikation 7) wird GEPAT auf humane Microarray-Datens{\"a}tze angewendet um Genexpressionsdaten mit weiteren Datentypen zu verkn{\"u}pfen. Genexpressionsdaten und Daten aus vergleichender Genom-Hybridisierung (CGH) von prim{\"a}ren Tumoren von 71 Mantel-Zell-Lymphom (MCL) Patienten erm{\"o}glichte die Ermittlung eines Pr{\"a}diktors, der die Vorhersage der {\"U}berlebensdauer von Patienten gegen{\"u}ber herk{\"o}mmlichen Methoden verbessert. Die Analyse der CGH Daten zeigte, dass auch diese f{\"u}r die Vorhersage der {\"U}berlebensdauer geeignet sind. F{\"u}r den Datensatz von Patienten mit großzellig diffusem B-Zell-Lymphom DLBCL konnte aus den Genexpressionsdaten ebenfalls ein neuer Pr{\"a}diktor vorgeschlagen werden. Mit den zwischen lang und kurz {\"u}berlebenden Patienten differentiell exprimierten Genen der MCL Patienten und mit den Genen, die zwischen den beiden Untergruppen von DLBCL reguliert sind, wurden Interaktionsnetzwerke gebildet. Diese zeigen, dass bei beiden Krebstypen Gene des Zellzyklus und der Proliferation zwischen Patienten mit kurzer und langer {\"U}berlebensdauer unterschiedlich reguliert sind.}, subject = {Microarray}, language = {en} } @phdthesis{FetivaMora2023, author = {Fetiva Mora, Maria Camila}, title = {Changes in chromatin accessibility by oncogenic YAP and its relevance for regulation of cell cycle gene expression and cell migration}, doi = {10.25972/OPUS-30291}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-302910}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2023}, abstract = {Various types of cancer involve aberrant cell cycle regulation. Among the pathways responsible for tumor growth, the YAP oncogene, a key downstream effector of the Hippo pathway, is responsible for oncogenic processes including cell proliferation, and metastasis by controlling the expression of cell cycle genes. In turn, the MMB multiprotein complex (which is formed when B-MYB binds to the MuvB core) is a master regulator of mitotic gene expression, which has also been associated with cancer. Previously, our laboratory identified a novel crosstalk between the MMB-complex and YAP. By binding to enhancers of MMB target genes and promoting B-MYB binding to promoters, YAP and MMB co-regulate a set of mitotic and cytokinetic target genes which promote cell proliferation. This doctoral thesis addresses the mechanisms of YAP and MMB mediated transcription, and it characterizes the role of YAP regulated enhancers in transcription of cell cycle genes. The results reported in this thesis indicate that expression of constitutively active, oncogenic YAP5SA leads to widespread changes in chromatin accessibility in untransformed human MCF10A cells. ATAC-seq identified that newly accessible and active regions include YAP-bound enhancers, while the MMB-bound promoters were found to be already accessible and remain open during YAP induction. By means of CRISPR-interference (CRISPRi) and chromatin immuniprecipitation (ChIP), we identified a role of YAP-bound enhancers in recruitment of CDK7 to MMB-regulated promoters and in RNA Pol II driven transcriptional initiation and elongation of G2/M genes. Moreover, by interfering with the YAP-B-MYB protein interaction, we can show that binding of YAP to B-MYB is also critical for the initiation of transcription at MMB-regulated genes. Unexpectedly, overexpression of YAP5SA also leads to less accessible chromatin regions or chromatin closing. Motif analysis revealed that the newly closed regions contain binding motifs for the p53 family of transcription factors. Interestingly, chromatin closing by YAP is linked to the reduced expression and loss of chromatin-binding of the p53 family member Np63. Furthermore, I demonstrate that downregulation of Np63 following expression of YAP is a key step in driving cellular migration. Together, the findings of this thesis provide insights into the role of YAP in the chromatin changes that contribute to the oncogenic activities of YAP. The overexpression of YAP5SA not only leads to the opening of chromatin at YAP-bound enhancers which together with the MMB complex stimulate the expression of G2/M genes, but also promotes the closing of chromatin at ∆Np63 -bound regions in order to lead to cell migration.}, subject = {Chromatin}, language = {en} } @phdthesis{Friedrich2009, author = {Friedrich, Torben}, title = {New statistical Methods of Genome-Scale Data Analysis in Life Science - Applications to enterobacterial Diagnostics, Meta-Analysis of Arabidopsis thaliana Gene Expression and functional Sequence Annotation}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-39858}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2009}, abstract = {Recent progresses and developments in molecular biology provide a wealth of new but insufficiently characterised data. This fund comprises amongst others biological data of genomic DNA, protein sequences, 3-dimensional protein structures as well as profiles of gene expression. In the present work, this information is used to develop new methods for the characterisation and classification of organisms and whole groups of organisms as well as to enhance the automated gain and transfer of information. The first two presented approaches (chapters 4 und 5) focus on the medically and scientifically important enterobacteria. Its impact in medicine and molecular biology is founded in versatile mechanisms of infection, their fundamental function as a commensal inhabitant of the intestinal tract and their use as model organisms as they are easy to cultivate. Despite many studies on single pathogroups with clinical distinguishable pathologies, the genotypic factors that contribute to their diversity are still partially unknown. The comprehensive genome comparison described in Chapter 4 was conducted with numerous enterobacterial strains, which cover nearly the whole range of clinically relevant diversity. The genome comparison constitutes the basis of a characterisation of the enterobacterial gene pool, of a reconstruction of evolutionary processes and of comprehensive analysis of specific protein families in enterobacterial subgroups. Correspondence analysis, which is applied for the first time in this context, yields qualitative statements to bacterial subgroups and the respective, exclusively present protein families. Specific protein families were identified for the three major subgroups of enterobacteria namely the genera Yersinia and Salmonella as well as to the group of Shigella and E. coli by applying statistical tests. In conclusion, the genome comparison-based methods provide new starting points to infer specific genotypic traits of bacterial groups from the transfer of functional annotation. Due to the high medical importance of enterobacterial isolates their classification according to pathogenicity has been in focus of many studies. The microarray technology offers a fast, reproducible and standardisable means of bacterial typing and has been proved in bacterial diagnostics, risk assessment and surveillance. The design of the diagnostic microarray of enterobacteria described in chapter 5 is based on the availability of numerous enterobacterial genome sequences. A novel probe selection strategy based on the highly efficient algorithm of string search, which considers both coding and non-coding regions of genomic DNA, enhances pathogroup detection. This principle reduces the risk of incorrect typing due to restrictions to virulence-associated capture probes. Additional capture probes extend the spectrum of applications of the microarray to simultaneous diagnostic or surveillance of antimicrobial resistance. Comprehensive test hybridisations largely confirm the reliability of the selected capture probes and its ability to robustly classify enterobacterial strains according to pathogenicity. Moreover, the tests constitute the basis of the training of a regression model for the classification of pathogroups and hybridised amounts of DNA. The regression model features a continuous learning capacity leading to an enhancement of the prediction accuracy in the process of its application. A fraction of the capture probes represents intergenic DNA and hence confirms the relevance of the underlying strategy. Interestingly, a large part of the capture probes represents poorly annotated genes suggesting the existence of yet unconsidered factors with importance to the formation of respective virulence phenotypes. Another major field of microarray applications is gene expression analysis. The size of gene expression databases rapidly increased in recent years. Although they provide a wealth of expression data, it remains challenging to integrate results from different studies. In chapter 6 the methodology of an unsupervised meta-analysis of genome-wide A. thaliana gene expression data sets is presented, which yields novel insights in function and regulation of genes. The application of kernel-based principal component analysis in combination with hierarchical clustering identified three major groups of contrasts each sharing overlapping expression profiles. Genes associated with two groups are known to play important roles in Indol-3 acetic acid (IAA) mediated plant growth and development as well as in pathogen defence. Yet uncharacterised serine-threonine kinases could be assigned to novel functions in pathogen defence by meta-analysis. In general, hidden interrelation between genes regulated under different conditions could be unravelled by the described approach. HMMs are applied to the functional characterisation of proteins or the detection of genes in genome sequences. Although HMMs are technically mature and widely applied in computational biology, I demonstrate the methodical optimisation with respect to the modelling accuracy on biological data with various distributions of sequence lengths. The subunits of these models, the states, are associated with a certain holding time being the link to length distributions of represented sequences. An adaptation of simple HMM topologies to bell-shaped length distributions described in chapter 7 was achieved by serial chain-linking of single states, while residing in the class of conventional HMMs. The impact of an optimisation of HMM topologies was underlined by performance evaluations with differently adjusted HMM topologies. In summary, a general methodology was introduced to improve the modelling behaviour of HMMs by topological optimisation with maximum likelihood and a fast and easily implementable moment estimator. Chapter 8 describes the application of HMMs to the prediction of interaction sites in protein domains. As previously demonstrated, these sites are not trivial to predict because of varying degree in conservation of their location and type within the domain family. The prediction of interaction sites in protein domains is achieved by a newly defined HMM topology, which incorporates both sequence and structure information. Posterior decoding is applied to the prediction of interaction sites providing additional information of the probability of an interaction for all sequence positions. The implementation of interaction profile HMMs (ipHMMs) is based on the well established profile HMMs and inherits its known efficiency and sensitivity. The large-scale prediction of interaction sites by ipHMMs explained protein dysfunctions caused by mutations that are associated to inheritable diseases like different types of cancer or muscular dystrophy. As already demonstrated by profile HMMs, the ipHMMs are suitable for large-scale applications. Overall, the HMM-based method enhances the prediction quality of interaction sites and improves the understanding of the molecular background of inheritable diseases. With respect to current and future requirements I provide large-scale solutions for the characterisation of biological data in this work. All described methods feature a highly portable character, which allows for the transfer to related topics or organisms, respectively. Special emphasis was put on the knowledge transfer facilitated by a steadily increasing wealth of biological information. The applied and developed statistical methods largely provide learning capacities and hence benefit from the gain of knowledge resulting in increased prediction accuracies and reliability.}, subject = {Genomik}, language = {en} } @phdthesis{Gareiss2006, author = {Gareiß, Barbara}, title = {Einfluss niedermolekularer Protein-Tyrosin-Phosphatasen von Listeria monocytogenes auf die listerielle Genexpression und Virulenz}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-19853}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2006}, abstract = {Im Genom von Listeria monocytogenes konnten zwei Gene identifiziert werden, die mutmaßlich f{\"u}r niedermolekulare Protein-Tyrosin Phosphatasen (LMW-PTPs) kodieren, Lmo0938/Ptp-1 und Lmo2540/Ptp-2, beide {\"a}hneln LMW-PTPs von B. subtilis. Einzel- und Doppeldeletionen der ptp-Gene beeinflussten die Transkription zahlreicher Gene, wie anhand von Gesamtgenom-DNA-Microarray-Analysen und quantitativer RT-PCR gezeigt werden konnten. Insbesondere waren die Gene f{\"u}r i) die Internaline A und B, ii) den Osmoprotektanten-Transporter OpuC, iii) MCP, notwendig zur Flagellen-Bewegung und iv) eine Anzahl von den Proteinen, die in die N{\"a}hrstoffaufnahme sowie den intrazellul{\"a}ren Metabolismus involviert sind, in vitro herunterreguliert. Die PrfA-regulierten Virulenzgene wurden in den Mutanten verst{\"a}rkt exprimiert. Im Wesentlichen konnte das gleiche Transkriptionsmuster in infizierten Caco-2-Enterocyten beobachtet werden. Die verringerte Invasivit{\"a}t (abh{\"a}ngig von InlA) und die Unbeweglichkeit der Mutanten passt zu den Transkriptionsergebnissen. Jedoch wurden weder die intrazellul{\"a}re Replikation innerhalb eukaryontischer Wirtszellen noch die Resistenz gegen Stressbedingungen durch die Deletion beeintr{\"a}chtigt. Die Proteome des Wildtyps und der ptp-Mutanten wurden durch 2-dimensionale Gelelektrophorese verglichen und es zeigte sich, dass die Transkriptionsergebnisse nicht vollst{\"a}ndig im Proteom reflektiert wurden. Die Ergebnisse zeigen, dass die Ptps in die Regulationsnetzwerke des alternativen Stress-Sigmafaktor SigB und von PrfA eingreifen. Der {\"a}hnliche Effekt beider Ptps auf die Transkription oder auf den Proteinlevel deutet eine Interaktion oder Kooperation der beiden Enzyme an.}, subject = {Listeria monocytogenes}, language = {de} }