TY - THES A1 - Weniger, Markus T1 - Genome Expression Pathway Analysis Tool - Analyse und Visualisierung von Microarray Genexpressionsdaten unter genomischen, proteomischen und metabolischen Gesichtspunkten T1 - Genom Expression Pathway Analysis Tool - Analysis and visualization of microarray gene expression data under genomic, proteomic and metabolic context N2 - Die Messung der Genexpression ist für viele Bereiche der Biologie und Medizin wichtig geworden und unterstützt Studien über Behandlung, Krankheiten und Entwicklungsstadien. Microarrays können verwendet werden, um die Expression von tausenden mRNA-Molekülen gleichzeitig zu messen und ermöglichen so einen Einblick und einen Vergleich der verschiedenen zellulären Bedingungen. Die Daten, die durch Microarray-Experimente gewonnen werden, sind hochdimensional und verrauscht, eine Interpretation der Daten ist deswegen nicht einfach. Obwohl Programme für die statistische Auswertung von Microarraydaten existieren, fehlt vielen eine Integration der Analyseergebnisse mit einer automatischen Interpretationsmöglichkeit. In dieser Arbeit wurde GEPAT, Genome Expression Pathway Analysis Tool, entwickelt, das eine Analyse der Genexpression unter dem Gesichtspunkten der Genomik, Proteomik und Metabolik ermöglicht. GEPAT integriert statistische Methoden zum Datenimport und -analyse mit biologischer Interpretation für Genmengen oder einzelne Gene, die auf dem Microarray gemessen werden. Verschiedene Typen von Oligonukleotid- und cDNAMicroarrays können importiert werden, unterschiedliche Normalisierungsmethoden können auf diese Daten angewandt werden, anschließend wird eine Datenannotation durchgeführt. Nach dem Import können mit GEPAT verschiedene statische Datenanalysemethoden wie hierarchisches, k-means und PCA-Clustern, ein auf einem linearen Modell basierender t-Test, oder ein Vergleich chromosomaler Profile durchgeführt werden. Die Ergebnisse der Analysen können auf Häufungen biologischer Begriffe und Vorkommen in Stoffwechselwegen oder Interaktionsnetzwerken untersucht werden. Verschiedene biologische Datenbanken wurden integriert, um zu jeder Gensonde auf dem Array Informationen zur Verfügung stellen zu können. GEPAT bietet keinen linearen Arbeitsablauf, sondern erlaubt die Benutzung von beliebigen Teilmengen von Genen oder biologischen Proben als Startpunkt einer neuen Analyse oder Interpretation. Dabei verlässt es sich auf bewährte Datenanalyse-Pakete, bietet einen modularen Ansatz zur einfachen Erweiterung und kann auf einem verteilten Computernetzwerk installiert werden, um eine große Zahl an Benutzern zu unterstützen. Es ist unter der LGPL Open-Source Lizenz frei verfügbar und kann unter http://gepat.sourceforge.net heruntergeladen werden. N2 - The measurement of gene expression data is relevant to many areas of biology and medicine, in the study of treatments, diseases, and developmental stages. Microarrays can be used to measure the expression level of thousands of mRNAs at the same time, allowing insight into or comparison of different cellular conditions. The data derived out of microarray experiments is highly dimensional and noisy, and interpretation of the results can get tricky. Although programs for the statistical analysis of microarray data exist, most of them lack an integration of analysis results and biological interpretation. In this work GEPAT, Genome Expression Pathway Analysis Tool, was developed, offering an analysis of gene expression data under genomic, proteomic and metabolic context. GEPAT integrates statistical methods for data import and data analysis together with an biological interpretation for subset of genes or single genes measured on the chip. GEPAT imports various types of oligonucleotide and cDNA array data formats. Different normalization methods can be applied to the data, afterwards data annotation is performed. After import, GEPAT offers various statistical data analysis methods, as hierarchical, k-means and PCA clustering, a linear model based t-Test or chromosomal profile comparison. The results of the analysis can be interpreted by enrichment of biological terms, pathway analysis or interaction networks. Different biological databases are included, to give various informations for each probe on the chip. GEPAT offers no linear work flow, but allows the usage of any subset of probes and samples as start for a new data analysis or interpretation. GEPAT relies on established data analysis packages, offers a modular approach for an easy extension, and can be run on a computer grid to allow a large number of users. It is freely available under the LGPL open source license for academic and commercial users at http://gepat.sourceforge.net. KW - Microarray KW - Genexpression KW - Datenanalyse KW - Explorative Datenanalyse KW - microarray KW - gene expression KW - data analysis KW - explorative data analysis Y1 - 2007 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-25392 ER - TY - JOUR A1 - Vainshtein, Yevhen A1 - Sanchez, Mayka A1 - Brazma, Alvis A1 - Hentze, Matthias W. A1 - Dandekar, Thomas A1 - Muckenthaler, Martina U. T1 - The IronChip evaluation package: a package of perl modules for robust analysis of custom microarrays N2 - Background: Gene expression studies greatly contribute to our understanding of complex relationships in gene regulatory networks. However, the complexity of array design, production and manipulations are limiting factors, affecting data quality. The use of customized DNA microarrays improves overall data quality in many situations, however, only if for these specifically designed microarrays analysis tools are available. Results: The IronChip Evaluation Package (ICEP) is a collection of Perl utilities and an easy to use data evaluation pipeline for the analysis of microarray data with a focus on data quality of custom-designed microarrays. The package has been developed for the statistical and bioinformatical analysis of the custom cDNA microarray IronChip but can be easily adapted for other cDNA or oligonucleotide-based designed microarray platforms. ICEP uses decision tree-based algorithms to assign quality flags and performs robust analysis based on chip design properties regarding multiple repetitions, ratio cut-off, background and negative controls. Conclusions: ICEP is a stand-alone Windows application to obtain optimal data quality from custom-designed microarrays and is freely available here (see “Additional Files” section) and at: http://www.alice-dsl.net/evgeniy. vainshtein/ICEP/ KW - Microarray KW - ICEP KW - IronChip Evaluation Package Y1 - 2010 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-67869 ER - TY - THES A1 - Vainshtein, Yevhen T1 - Applying microarray‐based techniques to study gene expression patterns: a bio‐computational approach T1 - Anwendung von Mikroarrayanalysen um Genexpressionsmuster zu untersuchen: Ein bioinformatischer Ansatz N2 - The regulation and maintenance of iron homeostasis is critical to human health. As a constituent of hemoglobin, iron is essential for oxygen transport and significant iron deficiency leads to anemia. Eukaryotic cells require iron for survival and proliferation. Iron is part of hemoproteins, iron-sulfur (Fe-S) proteins, and other proteins with functional groups that require iron as a cofactor. At the cellular level, iron uptake, utilization, storage, and export are regulated at different molecular levels (transcriptional, mRNA stability, translational, and posttranslational). Iron regulatory proteins (IRPs) 1 and 2 post-transcriptionally control mammalian iron homeostasis by binding to iron-responsive elements (IREs), conserved RNA stem-loop structures located in the 5’- or 3‘- untranslated regions of genes involved in iron metabolism (e.g. FTH1, FTL, and TFRC). To identify novel IRE-containing mRNAs, we integrated biochemical, biocomputational, and microarray-based experimental approaches. Gene expression studies greatly contribute to our understanding of complex relationships in gene regulatory networks. However, the complexity of array design, production and manipulations are limiting factors, affecting data quality. The use of customized DNA microarrays improves overall data quality in many situations, however, only if for these specifically designed microarrays analysis tools are available. Methods In this project response to the iron treatment was examined under different conditions using bioinformatical methods. This would improve our understanding of an iron regulatory network. For these purposes we used microarray gene expression data. To identify novel IRE-containing mRNAs biochemical, biocomputational, and microarray-based experimental approaches were integrated. IRP/IRE messenger ribonucleoproteins were immunoselected and their mRNA composition was analysed using an IronChip microarray enriched for genes predicted computationally to contain IRE-like motifs. Analysis of IronChip microarray data requires specialized tool which can use all advantages of a customized microarray platform. Novel decision-tree based algorithm was implemented using Perl in IronChip Evaluation Package (ICEP). Results IRE-like motifs were identified from genomic nucleic acid databases by an algorithm combining primary nucleic acid sequence and RNA structural criteria. Depending on the choice of constraining criteria, such computational screens tend to generate a large number of false positives. To refine the search and reduce the number of false positive hits, additional constraints were introduced. The refined screen yielded 15 IRE-like motifs. A second approach made use of a reported list of 230 IRE-like sequences obtained from screening UTR databases. We selected 6 out of these 230 entries based on the ability of the lower IRE stem to form at least 6 out of 7 bp. Corresponding ESTs were spotted onto the human or mouse versions of the IronChip and the results were analysed using ICEP. Our data show that the immunoselection/microarray strategy is a feasible approach for screening bioinformatically predicted IRE genes and the detection of novel IRE-containing mRNAs. In addition, we identified a novel IRE-containing gene CDC14A (Sanchez M, et al. 2006). The IronChip Evaluation Package (ICEP) is a collection of Perl utilities and an easy to use data evaluation pipeline for the analysis of microarray data with a focus on data quality of custom-designed microarrays. The package has been developed for the statistical and bioinformatical analysis of the custom cDNA microarray IronChip, but can be easily adapted for other cDNA or oligonucleotide-based designed microarray platforms. ICEP uses decision tree-based algorithms to assign quality flags and performs robust analysis based on chip design properties regarding multiple repetitions, ratio cut-off, background and negative controls (Vainshtein Y, et al., 2010). N2 - Die Regulierung und Aufrechterhaltung der Eisen-Homeostase ist bedeutend für die menschliche Gesundheit. Als Bestandteil des Hämoglobins ist es wichtig für den Transport von Sauerstoff, ein Mangel führt zu Blutarmut. Eukaryotische Zellen benötigen Eisen zum Überleben und zum Proliferieren. Eisen ist am Aufbau von Hämo- und Eisenschwefelproteinen (Fe-S) beteiligt und kann als Kofaktor dienen. Die Aufnahme, Nutzung, Speicherung und der Export von Eisen ist zellulär auf verschiedenen molekularen Ebenen reguliert (Transkription, mRNA-Level, Translation, Protein-Level). Die iron regulatory proteins (IRPs) 1 und 2 kontrollieren die Eisen-Homeostase in Säugetieren posttranslational durch die Bindung an Iron-responsive elements (IREs). IREs sind konservierte RNA stem-loop Strukturen in den 5' oder 3' untranslatierten Bereichen von Genen, die im Eisenmetabolismus involviert sind (z.B. FTH1, FTL und TFRC). In dieser Arbeit wurden biochemische und bioinformatische Methoden mit Microarray-Experimenten kombiniert, um neue mRNAs mit IREs zu identifizieren. Genexpressionsstudien verbessern unser Verständnis über die komplexen Zusammenhänge in genregulatorischen Netzwerken. Das komplexe Design von Microarrays, deren Produktion und Manipulation sind dabei die limitierenden Faktoren bezüglich der Datenqualität. Die Verwendung von angepassten DNA Microarrays verbessert häufig die Datenqualität, falls entsprechende Analysemöglichkeiten für diese Arrays existieren. Methoden Um unser Verständnis von eisenregulierten Netzwerken zu verbessern, wurde im Rahmen dieses Projektes die Auswirkung einer Behandlung mit Eisen bzw. von Knockout Mutation unter verschiedenen Bedingungen mittels bioinformatischer Methoden untersucht. Hierfür nutzen wir Expressionsdaten aus Microarray-Experimenten. Durch die Verknüpfung von biochemischen, bioinformatischen und Microarray Ansätzen können neue Proteine mit IREs identifiziert werden. IRP/IRE messenger Ribonucleoproteine wurden immunpräzipitiert. Die Zusammensetzung der enthaltenen mRNAs wurde mittels einem IronChip Microarray analysiert: Für diesen Chip wurden bioinformatisch Gene vorhergesagt, die IRE-like Motive aufweisen. Der Chip wurde mit solchen Oligonucleotiden beschichtet und durch Hybridisierung überprüft, ob die präzipitierten mRNA sich hieran binden. Die Analyse der erhaltenen Daten erfordert ein spezialisiertes Werkzeug um von allen Vorteilen der angepassten Microarrays zu profitieren. Ein neuer Entscheidungsbaum-basierter Algorithmus wurde in Perl im IronChip Evaluation Package (ICEP) implementiert. Ergebnisse Aus großen Sequenz-Datenbanken wurden IRE-like Motive identifiziert. Dazu kombiniert der Algorithmus, insbesondere RNA-Primärsequenz und RNA-Strukturdaten. Solche Datenbankanalysen tendieren dazu, eine große Anzahl falsch positiver Treffer zu generieren. Daher wurden zusätzliche Bedingungen formuliert, um die Suche zu verfeinern und die Anzahl an falsch positiven Treffer zu reduzieren. Die angepassten Suchkriterien ergaben 15 IRE-like Motive. In einem weiteren Ansatz verwendeten wir eine Liste von 230 IRE-like Sequenzen aus UTR-Datenbanken. Daraus wurden 6 Sequenzen ausgewählt, die auch im unteren Teil stabil sind (untere Helix über 6 bp stabil). Die korrespondierenden Expressed Sequence Tags (ESTs) wurden auf die humane oder murine Version des IronChips aufgetragen. Die Microarray Ergebnisse wurden mit dem ICEP Programm ausgewertet. Unsere Ergebnisse zeigen, dass die Immunpräzipitation mit anschließender Microarrayanalyse ein nützlicher Ansatz ist, um bioinformatisch vorhergesagte IRE-Gene zu identifizieren. Darüber hinaus ermöglicht uns dieser Ansatz die Detektion neuer mRNAs, die IREs enthalten, wie das von uns gefundene Gen CDC14A (Sanchez et al., 2006). ICEP ist ein optimiertes Programmpaket aus Perl Programmen (Vainshtein et al., BMC Bioinformatics, 2010). Es ermöglicht die einfache Auswertung von Microarray Daten mit dem Fokus auf selbst entwickelten Microarray Designs. ICEP diente für die statistische und bioinformatische Analyse von selbst entwickelten IronChips, kann aber auch leicht an die Analyse von oligonucleotidbasierten oder cDNA Microarrays adaptiert werden. ICEP nutzt einen Entscheidungsbaum-basierten Algorithmus um die Qualität zu bewerten und führt eine robuste Analyse basierend auf Chipeigenschaften, wie mehrfachen Wiederholungen, Signal/Rausch Verhältnis, Hintergrund und Negativkontrollen durch. KW - Microarray KW - Genexpression KW - Bioinformatik KW - geneexpression KW - microarrays KW - IronChip KW - ICEP Y1 - 2010 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-51967 ER - TY - THES A1 - Teutschbein, Janka T1 - Identifizierung und Charakterisierung von Genen und Proteinen in der Xmrk-induzierten Entwicklung von Melanomen T1 - Identification and characterization of genes and proteins in Xmrk-induced melanomagenesis N2 - Melanome stellen die gefährlichste Form von Hautkrebs mit der höchsten Mortalitätsrate dar. Der Transformation normaler Melanozyten zu malignen Melanomen liegen komplexe molekulare und biochemische Veränderungen zu Grunde. Im Xiphophorus-Melanom-Modell ist die onkogene Rezeptortyrosinkinase "Xiphophorus melanoma receptor kinase" (Xmrk) der alleinige Auslöser der Melanominitiation und -progression. Die Aufklärung der Xmrk-vermittelten Signaltransduktion kann zum besseren Verständnis von Ereignissen, die auch bei der humanen Melanomentwicklung eine Rolle spielen, beitragen. In der vorliegenden Arbeit wurde mit Hilfe der Microarray-Technologie die Regulation der Genexpression durch Xmrk analysiert. Zu den nach Rezeptoraktivierung am stärksten herabregulierten Genen gehörten "son of sevenless homolog 1" (Sos1) und "ubiquitin-conjugating enzyme E2I" (Ube2i); stark hochreguliert waren "early growth response 1" (Egr1), "cysteine-rich protein 61" (Cyr61), "dual-specificity phosphatase 4" (Dusp4), "fos-like antigen 1" (Fosl1), "epithelial membrane protein" (Emp1), Osteopontin (Opn), "insulin-like growth factor binding protein 3" (Igfbp3) und "tumor-associated antigen L6" (Taal6). Die für die Regulation dieser Gene verantwortlichen Signalwege wurden durch die Anwendung von niedermolekularen Inhibitoren und siRNA identifiziert, wobei für die SRC-Kinase FYN eine zentrale Bedeutung bei der Xmrk-abhängigen Regulation der Genexpression festgestellt wurde. Darüber hinaus wurde die Expression der Gene in humanen Melanomzelllinien im Vergleich zu normalen humanen Melanozyten untersucht. Als besonders vielversprechende Kandidaten stellten sich dabei DUSP4 und TAAL6 heraus, deren Rolle in der humanen Melanominduktion und -progression Gegenstand zukünftiger Studien sein wird. In einem anderen Ansatz zur Aufklärung des Signalnetzwerkes sollten Zielproteine von Xmrk durch Protein-Protein-Interaktionsstudien mit Hilfe des Split-Ubiquitin-Systems ermittelt werden. Aufgrund ungünstiger Expressions- oder Faltungseigenschaften von Xmrk in diesem System war es aber nicht möglich, den Rezeptor als Köderprotein einzusetzen. Das für die Xmrk-vermittelte Melanomentstehung zentrale Protein FYN konnte jedoch als Köder etabliert und seine Wechselwirkung mit der Tyrosinkinase FAK analysiert werden. Es wurde gezeigt, dass der phosphorylierte Tyrosinrest an Position 397 von FAK für die Interaktion einer N-terminal trunkierten FAK-Variante mit FYN notwendig ist und dass diese Phosphorylierung in Hefe gewährleistet zu sein scheint. Die Suche nach neuen Interaktionspartnern von FYN mittels der Split-Ubiquitin-Technologie könnte Einblicke in weitere FYN-abhängige Ereignisse bieten, die zur Aufklärung seiner zentralen Rolle bei der Tumorentstehung dienen könnte. N2 - Melanoma is the most aggressive type of skin cancer with the highest mortality rate. The transformation of melanocytes to malignant melanoma is based on complex molecular and biochemical alterations. In the Xiphophorus melanoma model, the oncogenic receptor tyrosine kinase Xiphophorus melanoma receptor kinase (Xmrk) is the sole trigger of melanoma initiation and progression. Elucidating Xmrk-dependent signaling pathways may contribute to a better understanding of processes that play a role in human melanomagenesis, too. Here, the regulation of gene expression by Xmrk was analyzed using a microarray approach. The genes with the strongest down-regulation in response to receptor activation included son of sevenless homolog 1 (Sos1) and ubiquitin-conjugating enzyme E2I (Ube2i), whereas early growth response 1 (Egr1), cysteine-rich protein 61 (Cyr61), dual-specificity phosphatase 4 (Dusp4), fos-like antigen 1 (Fosl1), epithelial membrane protein (Emp1), Osteopontin (Opn), insulin-like growth factor binding protein 3 (Igfbp3), and tumor-associated antigen L6 (Taal6) were strongly up-regulated. The pathways regulating expression of these genes were identified by applying small molecule inhibitors and siRNA. Interestingly, the SRC-family kinase FYN was found to be a key-player in Xmrk-dependent gene regulation. Furthermore, expression of the genes in human melanoma cell lines compared to normal human melanocytes was investigated. The most promising candidates, which might be important for melanoma induction and progression, were DUSP4 and TAAL6. Their potential suitability as diagnostic and prognostic melanoma markers will be addressed in future studies. In addition to gene expression analysis, protein-protein interactions were to be assayed by the split-ubiquitin-system in order to identify novel Xmrk targets. Unfortunately, inappropriate expression or folding of the receptor in this system precluded it from working as bait. However, the FYN protein, which has a central role in Xmrk-mediated signaling, was established as bait and its association with FAK was analyzed in more detail. A phosphorylated tyrosine residue at position 397 of FAK was demonstrated to be necessary for the interaction of an N-terminally truncated FAK variant with FYN, and this phosphorylation event seems to be feasible in yeast. In future, a split-ubiquitin based screen for novel interaction partners of FYN might provide insights into FYN-dependent processes and help to understand its central role in tumor development. KW - Melanom KW - Schwertkärpfling KW - Microarray KW - Onkogen KW - Epidermaler Wachstumsfaktor-Rezeptor KW - Yeast-Two-Hybrid-System KW - Xiphophorus KW - Rezeptortyrosinkinase KW - Xmrk KW - Protein-Protein-Interaktion KW - Split-Ubiquitin-System KW - Microarray KW - EGFR KW - oncogene KW - melanoma KW - protein-protein interaction Y1 - 2008 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-27516 ER - TY - THES A1 - Schmitt, Karin T1 - Charakterisierung des BvgAS1,2-Regulons von Bordetella petrii T1 - Characterization of the BvgAS1,2 regulon of Bordetella petrii N2 - Die Gattung Bordetella, die phylogenetisch in die Gruppe der β-Proteobakterien eingeordnet und zur Familie der Alcaligenaceae gezählt wird, umfasst nach heutigem Wissenstand neun Gram-negative Arten. Die klassischen Bordetella-Arten B. pertussis, B. parapertussis und B. bronchiseptica werden im sogenannten B. bronchiseptica-Cluster zusammengefasst. Der strikt humanpathogene Erreger B. pertussis stellt als Verursacher des Keuchhustens das wohl bedeutendste Mitglied der Gattung dar. B. parapertussis ist der Verursacher von respiratorischen Erkrankungen in Menschen und Schafen, während B. bronchiseptica für Atemwegserkrankungen in verschiedenen Säugetieren verantwortlich gemacht wird. Zudem kann B. bronchiseptica für einen längeren Zeitraum in der Umwelt überleben. Die in den letzte Jahren identifizierten „neuen“ Bordetella-Arten, B. avium, B. hinzii, B. holmesii, B. trematum und B. ansorpii, wurden alle human- oder tierassoziiert isoliert und besitzen unterschiedliches pathogenes Potential, das zum Teil noch näher untersucht werden muss. Eine Ausnahme stellt der aus einer anaeroben dechlorinierten Flusssediment-Anreicherungskultur isolierte Keim B. petrii dar. Dieser ist bis zum heutigen Zeitpunkt der einzige Umweltkeim der Gattung Bordetella (von Wintzingerode, Schattke et al. 2001). In evolutionärer Hinsicht ist B. petrii besonders interessant, da er sowohl für orthologe Gene einiger Virulenzfaktoren der pathogenen Bordetellen kodiert, als auch die typischen Eigenschaften eines Umweltkeims aufweist und somit als Bindeglied zu fungieren scheint. Ein solcher Virulenzfaktor ist das BvgAS-System, das in den pathogenen Bordetellen den Hauptregulator der Virulenzgenexpression darstellt, aber in B. petrii strukturell komplexer aufgebaut ist. Neben dem auf Aminosäureebene hoch konservierten Response Regulator bvgA, finden sich in B. petrii Gene für zwei Histidinkinasen, bvgS1 und bvgS2, sowie eine unabhängige hpt-Domäne. Eine periplasmatische Sensordomäne fehlt in beiden Kinasen, und nur in BvgS1 konnte eine PAS-Domäne identifiziert werden. In den letzten Jahren wurden zunehmend B. petrii-Isolate aus den verschiedensten Habitaten isoliert, wie z.B. das Schwammisolate R521 (Sfanos, Harmody et al. 2005) und das klinisches Isolat aus einem Patienten mit mandibulärer Osteomyelitis (Fry, Duncan et al. 2005). Im Rahmen dieser Arbeit wurde über einen PCR-Ansatz versucht, mit aus der Wildtypsequenz abgeleiteten Oligonukleotiden das BvgAS1,2-System der Isolate zu sequenzieren, aber nur im klinischen Isolat konnte ein orthologes Genfragment zum Response Regulator bvgA identifiziert werden. Ein Nachweis der Histidinkinasen sowie der hpt-Domäne schlug in allen untersuchten Isolaten fehl. Die vergleichenden Genomanalysen mittels DNA-Microarrays konnten aufgrund fehlender Hybridisierungen keine weiteren Gemeinsamkeiten und Unterschiede auf DNA-Ebene zwischen den Isolaten und B. petrii DSM 12804 aufzeigen. B. petrii ist ein hoch variabler Umweltkeim, der sich an verschiedene Lebensbedingungen anpassen kann. Dies konnte auch durch die Isolation dreier phänotypisch unterscheidbare Varianten während eines Langzeitwachstumsversuches gezeigt werden (Lechner 2008). Durch die Genomsequenzierung von B. petrii DSM 12804 konnten wenigsten sieben genomischen Inseln beschrieben werden (Gross, Guzman et al. 2008), die durch unterschiedliche Exzision für die Entstehung der Varianten und daraus resultierend für die Variabilität in B. petrii verantwortlich sind. Im Rahmen dieser Arbeit konnte die Größe der einzelnen genomischen Inseln im Genom von B. petrii durch vergleichende Genomanalysen mittels DNA-Microarrays, mit Ausnahme von GI1, GI5 und GI6, im Vergleich zu den bioinformatischen Vorhersagen bestätigt werden. Diese Inseln zeigten in den Microarray-Analysen eine Vergrößerung bzw. Verkleinerung im Vergleich zu den zuvor beschrieben putativen Grenzen. Die große Instabilität des Genoms von B. petrii DSM 12804 konnte in dieser Arbeit auch durch Microarray-Analysen einzelner Klone aufgezeigt werden, die unterschiedliche Variationen im Bereich der genomischen Inseln aufwiesen. In den Analysen von B. petrii 12804 ΔbvgA bzw. ΔbvgAS konnten zusätzlich zu den gezielten Manipulation im BvgAS1,2-Lokus weitere Deletionen im Bereich von bpet0196-0200, bpet4219-4235 und bpet4176 detektiert werden. Die Re-Integration dieser Genbereiche nach Klonierung einer BvgA-Komplementationsmutante deutet auf eine extrachromosomale plasmid-ähnliche Struktur dieser Bereiche hin. Dies konnte im Rahmen dieser Arbeit nicht abschließend bestätigt werden und bleibt weiter zu untersuchen. Im Verlauf der evolutionären Entwicklung der Bordetellen wurde das BvgAS-System, das ursprünglich für die Adaption an Umweltbedingungen mit verschiedenen Sauerstoff-konzentrationen und/oder Temperaturen zuständig war, mit der Regulation der Expression der Virulenzgene verknüpft (von Wintzingerode, Gerlach et al. 2002). In den Transkriptomanalysen zur Untersuchung der Funktionalität des BvgAS1,2-Systems in B. petrii konnte aufgezeigt werden, dass die Temperatur ein wichtiger Signalgeber für die Expression des Flagellen- und Chemotaxisoperons ist. In B. bronchiseptica wird die Motilität, bei Temperaturen unter 25°C, negativ durch das BvgAS-System reguliert. Auch in B. petrii konnte in den Untersuchungen eine negative Regulation der Flagellen- und Chemotaxisgene durch das BvgAS1,2-System unter diesen Bedingungen detektiert werden. Ob aber in B. petrii die gleiche hierarchische Struktur zur Regulation der Motilität besteht wie in B. bronchiseptica, bleibt zu untersuchen. Im Verlauf der Untersuchungen konnte dem BvgAS-Zwei-Komponentensystem in B. petrii auch eine Funktion im Energiestoffwechsel eingeräumt werden, um auf wechselnde Sauerstoffbedingungen reagieren zu können. Die Messung des Sauerstoffgehaltes der Umgebung und damit eine Regulation der aeroben bzw. anaeroben Atmung erfolgt in B. petrii wahrscheinlich ebenfalls über das BvgAS1,2-System. Die in der Histidinkinase BvgS1 vorhergesagte PAS-Domäne scheint laut den Analysen für diesen Vorgang von großer Bedeutung zu sein. Desweiteren scheint das System auch die Zusammensetzung der Cytochromoxidase zur optimalen Anpassung an aerobe, mikroaerophile und anaerobe Bedingungen zu regulieren. N2 - The genus Bordetella phylogenetically grouped within the beta-subclass of Proteobacteria and belonging to the family of the Alcaligenaceae comprises to date nine gram negative species. The classical Bordetella species B. pertussis, B. parapertussis and B. bronchiseptica are integrated in the so called B. bronchiseptica-cluster. The obligate human pathogen B. pertussis, as the agent of whooping cough, is the most important member of the genus. B. parapertussis is the agent of respiratory diseases in humans and sheep, whereas B. bronchiseptica causes respiratory diseases in various mammalian species. In addition, B. bronchiseptica has the ability to survive in the environment for a certain period of time. The in recent years identified “new” Bordetella species, B. avium, B. hinzii, B. holmesii, B. trematum and B. ansorpii, have all been isolated in association with humans and animals and exhibit different pathogenic potential, which partly have to be examined further. An exception is the species B. petrii, which was isolated from an anaerobic dechlorinating bioreactor culture enriched by river sediment. Up to date B. petrii represents the first environmental isolate of the genus Bordetella (von Wintzingerode, Schattke et al. 2001). B. petrii encodes both for several orthologous genes to virulence factors of the pathogenic Bordetellae and also shows the typical features of environmental bacteria, it might represent some sort of evolutionary missing link. A putative virulence factor is the BvgAS-systems, which demonstrates to be the master regulator for virulence gene expression in the pathogenic Bordetellae, but in B. petrii this system built-on in a much more complex way. In B. petrii could be identified a response regulator bvgA, which is conserved on amino acid level, two histidine kinase genes, bvgS1 and bvgS2, and a separate gene for the hpt-domain. A periplasmatic sensing domain is missing in both kinases and a PAS-domain could only identified in BvgS1. In the recent years an increasing number of B. petrii isolates could be isolated from various habitats, for example the sponge isolate R521 (Sfanos, Harmody et al. 2005) and the clinical isolate from a patient with mandibular osteomyelitis (Fry, Duncan et al. 2005). In this work a PCR approach, with oligonucleotides derived from the B. petrii wildtyp sequence, was used to sequence the BvgAS1,2-system of the isolates but only in the clinical isolate an orthologous gene fragment of the Response Regulator bvgA could be identified. A detection of the histidine kinases or the hpt-domain failed in all investigated isolates. The comparative genome analysis with DNA-microarrays showed no further similarities and differences between the isolates and B. petrii DSM 12804 because of missing hybridization. B. petrii is a highly variable environmental bacterium capable of adapting to different living conditions. This could be demonstrated by isolation of three phenotypically distinguishable variants during a long-term growth experiment (Lechner 2008). By genome sequencing of B. petrii DSM 12804, at least seven genomic islands could be described (Gross, Guzman et al. 2008), which are responsible for the development of variants and therefore for the variability of B. petrii by different excision. During this study, the size of each genomic island of B. petrii could be confirmed by comparative genome analysis with DNA-microarrays with the exception of GI1, GI5 und GI6 compared to bioinformatic predictions. These islands showed an extension and reduction in the microarray analysis, respectively. The high instability of the genome of B. petrii DSM 12804 could also be demonstrated by microarray analysis of individual clones in this doctorate, which show variations in the area of the genomic island. The analysis of B. petrii 12804 ΔbvgA and ΔbvgAS, respectively, illustrate the specific manipulations in the BvgAS1,2 locus and additional deletions in the area of bpet0196-0200, bpet4219-4235 and bpet4176. The re-integration of these genes into genome after cloning of a BvgA complement thereupon points to that these areas build a plasmid structure. During this work this could not be confirmed and needs to be investigated exhaustively. In progress of the evolutionary development of the Bordetellae, the BvgAS-system, originally envolved in adaption to environmental conditions with different concentrations of oxygen and/or temperatures, was connected with the regulation of the virulence gene expression (von Wintzingerode, Gerlach et al. 2002). In the transcriptomic analysis to evaluate the functionality of the BvgAS1,2-system of B. petrii it could be proofed that the temperature is an important factor for the expression of the flagella and chemotaxis operon. In B. bronchiseptica, the motility is negatively regulated by the BvgAS-system by temperatures below 25°C. Also, a negative regulation of the flagella and chemotaxis genes was detected in the investigation of B. petrii under these conditions. If there is the same hierarchic structure of the regulation of the motility in B. petrii like in B. bronchiseptica may be investigated. During the investigations the BvgAS two-component-system of B. petrii could admit a function in the respiratory control to respond to changing oxygen conditions. The sensing of the environment´s oxygen content and a regulation of the aerobic and anaerobic respiration, respectively, can be awarded to the BvgAS1,2-system in B. petrii. The predicted PAS-domain in the histidine kinase BvgS1 are obviously important during this process according to the analysis. In addition, the system seems to regulate the composition of the cytochrome oxidase well for optimal adaption to aerobic, microaerophilic and anaerobic environmental conditions. KW - Bordetella KW - Bordetella bronchiseptica KW - Microarray KW - Nitratatmung KW - Motilität KW - Genregulation KW - Bordetella petrii KW - BvgAS-System KW - Microarray KW - B. petrii-Isolate KW - B. petrii-Varianten KW - Bordetella petrii KW - BvgAS system KW - microarray KW - isolates of B. petrii KW - variants of B. petrii Y1 - 2010 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-53603 ER - TY - THES A1 - Reinboth, Jennifer T1 - Cellular Factors Contributing to Host Cell Permissiveness in Support of Oncolytic Vaccinia Virus Replication T1 - Beteiligung zellulärer Faktoren an der Permissivität von Wirtszellen in Unterstützung der onkolytischen Vaccinia Virus Replikation N2 - In initial experiments, the well characterized VACV strain GLV-1h68 and three wild-type LIVP isolates were utilized to analyze gene expression in a pair of autologous human melanoma cell lines (888-MEL and 1936 MEL) after infection. Microarray analyses, followed by sequential statistical approaches, characterized human genes whose transcription is affected specifically by VACV infection. In accordance with the literature, those genes were involved in broad cellular functions, such as cell death, protein synthesis and folding, as well as DNA replication, recombination, and repair. In parallel to host gene expression, viral gene expression was evaluated with help of customized VACV array platforms to get better insight over the interplay between VACV and its host. Our main focus was to compare host and viral early events, since virus genome replication occurs early after infection. We observed that viral transcripts segregated in a characteristic time-specific pattern, consistent with the three temporal expression classes of VACV genes, including a group of genes which could be classified as early-stage genes. In this work, comparison of VACV early replication and respective early gene transcription led to the identification of seven viral genes whose expression correlated strictly with replication. We considered the early expression of those seven genes to be representative for VACV replication and we therefore referred to them as viral replication indicators (VRIs). To explore the relationship between host cell transcription and viral replication, we correlated viral (VRI) and human early gene expression. Correlation analysis revealed a subset of 114 human transcripts whose early expression tightly correlated with early VRI expression and thus early viral replication. These 114 human molecules represented an involvement in broad cellular functions. We found at least six out of 114 correlates to be involved in protein ubiquitination or proteasomal function. Another molecule of interest was the serine-threonine protein kinase WNK lysine-deficient protein kinase 1 (WNK1). We discovered that WNK1 features differences on several molecular biological levels associated with permissiveness to VACV infection. In addition to that, a set of human genes was identified with possible predictive value for viral replication in an independent dataset. A further objective of this work was to explore baseline molecular biological variances associated with permissiveness which could help identifying cellular components that contribute to the formation of a permissive phenotype. Therefore, in a subsequent approach, we screened a set of 15 melanoma cell lines (15-MEL) regarding their permissiveness to GLV-1h68, evaluated by GFP expression levels, and classified the top four and lowest four cell lines into high and low permissive group, respectively. Baseline gene transcriptional data, comparing low and highly permissive group, suggest that differences between the two groups are at least in part due to variances in global cellular functions, such as cell cycle, cell growth and proliferation, as well as cell death and survival. We also observed differences in the ubiquitination pathway, which is consistent with our previous results and underlines the importance of this pathway in VACV replication and permissiveness. Moreover, baseline microRNA (miRNA) expression between low and highly permissive group was considered to provide valuable information regarding virus-host co-existence. In our data set, we identified six miRNAs that featured varying baseline expression between low and highly permissive group. Finally, copy number variations (CNVs) between low and highly permissive group were evaluated. In this study, when investigating differences in the chromosomal aberration patterns between low and highly permissive group, we observed frequent segmental amplifications within the low permissive group, whereas the same regions were mostly unchanged in the high group. Taken together, our results highlight a probable correlation between viral replication, early gene expression, and the respective host response and thus a possible involvement of human host factors in viral early replication. Furthermore, we revealed the importance of cellular baseline composition for permissiveness to VACV infection on different molecular biological levels, including mRNA expression, miRNA expression, as well as copy number variations. The characterization of human target genes that influence viral replication could help answering the question of host cell response to oncolytic virotherapy and provide important information for the development of novel recombinant vaccinia viruses with improved features to enhance replication rate and hence trigger therapeutic outcome. N2 - Die Replikationseffizienz von VACVs spielt eine maßgebliche Rolle für deren antitumorale Wirkung und onkolytische Effizienz. Ferner hängt die Permissivität einer Wirtszelle gegenüber der Behandlung mit onkolytischen VACVs maßgeblich von einer erfolgreichen viralen Replikation und Vermehrung ab. Darauf basierend, war der Fokus der vorliegenden Arbeit, zelluläre Eigenschaften zu erforschen, welche die VACV-Replikation beeinflussen und die Wirtszell-Permissivität gegenüber einer Behandlung mit VACV prognostizieren können. Für initiale Genexpressionsanalysen wurden zwei autologe, humane Melanom-Zelllinien (888-MEL und 1936 MEL), sowie der ausgiebig charakterisierte VACV-Stamm GLV-1h68 und drei wildtypische LIVP Isolate verwendet. Mit Hilfe von Microarray Analysen und einem sequenziellen statistischen Ansatz konnten humane Gene charakterisiert werden, deren Transkription eigens durch VACV-Infektion beeinflusst wird. Erwartungsgemäß zeigten diese Gene eine Anreicherung in globalen zellulären Signalwegen und Funktionen. Die frühe virale Gentranskription kann als repräsentative Bestimmungsgröße für virale Replikation betrachtet werden. Darauf basierend resultierte der Vergleich von früher VACV Replikation und entsprechender früher Gentranskription in der Identifikation von sieben viralen Genen, deren Expression und Replikation stark korrelierten. Aus diesem Grund wurde die frühe Expression der sieben VACV-Gene als kennzeichnend für virale Replikation angesehen und diese Gene als virale Replikations-Indikatoren (VRIs) definiert. Zur Aufklärung von Zusammenhängen zwischen Wirts-Transkription und viraler Replikation wurde die frühe virale VRI-Expression mit der frühen humanen Genexpression in Beziehung gesetzt. Mit Hilfe von Vergleichsanalysen wurden 114 humane Transkripte identifiziert, deren frühes Expressionsmuster eng mit demjenigen der VRIs korrelierte und dementsprechend ebenso mit der viralen Replikation. Von den 114 Korrelaten spielen mindestens sechs eine Rolle in der Protein-Ubiquitinierung oder in der proteasomalen Signalgebung. Ein weiteres Molekül, welches besonderes Interesse weckte, war die Serin-Threonin Proteinkinase WNK Lysin-defizientes Protein 1 (WNK1). Für WNK1 wurden Unterschiede, die mit der VACV-Infektions-Permissivität zusammenhängen, auf verschiedenen molekularbiologischen Ebenen nachgewiesen. Desweiten wurde in dieser Arbeit eine Anzahl humaner Gene identifiziert, welche virale Replikation in einem unabhängigen Datensatz prognostizieren konnten. Eine weitere Zielsetzung dieser Arbeit war es, molekularbiologische Unterschiede, welche mit Infektions-Permissivität von Zellen assoziiert sind, auf Basisebene zu ergründen. Diese könnten dabei helfen, zelluläre Komponenten zu identifizieren, welche einen so genannten permissiven Phänotyp kennzeichnen. Aus diesem Grund wurden in einem weiteren Versuchsansatz 15 Melanom-Zelllinien (15-MEL) bezüglich ihrer Permissivität gegenüber GLV-1h68 anhand von GFP Expression untersucht. Die vier Zelllinien mit der höchsten und diejenigen vier mit der niedrigsten Permissivität wurden je einer Gruppe zugeordnet (hochpermissive und niedrigpermissive Gruppe). Die Gruppen hoher und niedriger Permissivität wurden bezüglich ihrer Basislevel-Transkription verglichen. Unterschiedlich exprimierte Gene waren, zumindest zum Teil, in globale zelluläre Prozesse involviert. Darüber hinaus wurde microRNA (miRNA) Basislevel-Expression von hoch- und niedrigpermissiver Gruppe untersucht. In dieser Arbeit wurden sechs miRNAs identifiziert, deren Basislevel-Expression zwischen niedrig und hochpermissiver Gruppe differiert. Abschließend wurden Veränderungen der Kopienzahl von Genen (copy number variations, CNVs) im Vergleich zwischen niedrig- und hochpermissiver Gruppe untersucht. Betrachtung chromosomaler Veränderungen zeigte eine Anreicherung von Segment-Amplifikationen in der niedrigpermissiven Gruppe, während gleiche Abschnitte der hochpermissiven Gruppe größtenteils keine Veränderungen aufwiesen. Zusammenfassend konnte in dieser Arbeit eine mutmaßliche Korrelation zwischen viraler Replikation, früher Genexpression und der entsprechenden Wirtsantwort gezeigt werden und somit eine mögliche Beteiligung humaner Wirtsfaktoren an der viralen Replikation. Zusätzlich wurden wichtige Aspekte der Basiskomposition von Zellen für die Permissivität gegenüber VACV-Infektion auf verschiedenen molekularbiologischen Ebenen aufgedeckt, einschließlich mRNA-Expression, miRNA-Expression sowie Kopienzahl-Variationen. Die Charakterisierung humaner Zielgene, welche die virale Replikation beeinflussen, könnte dabei helfen, die Wirtszellantwort auf onkolytische Virotherapie aufzuklären und wichtige Informationen zu liefern für die Entwicklung neuartiger rekombinanter Vaccinia-Viren mit verbesserten Eigenschaften und verbesserter Replikationseffizienz und somit einem gesteigerten Therapieerfolg. KW - Vaccinia-Virus KW - Microarray KW - Melanom KW - onkolytische Virotherapie KW - Vaccinia Virus Replikation KW - vaccinia virus KW - microarray KW - malignant melanoma KW - oncolytic virotherapy KW - vaccinia virus replication KW - Onkolyse Y1 - 2012 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-85392 ER - TY - THES A1 - Osterloh, Lisa T1 - Identifizierung und Charakterisierung LIN-9 regulierter Gene im humanen System - Die Rolle von LIN-9 in der Regulation des Zellzyklus T1 - Identification and characterization of LIN-9 regulated genes in the human system - The role of LIN-9 in the regulation of the cell cycle N2 - Das humane LIN-9 wurde zuerst als pRB-interagierendes Protein beschrieben und spielt eine Rolle als Tumorsuppressor im Kontext des pRB-Signalweges. Über die molekulare Funktion von LIN-9 ist jedoch wenig bekannt. Die Homologe von LIN-9 in D. melanogaster und in C. elegans, sind an der transkriptionellen Regulation verschiedener Genen beteiligt. Dies und die Tatsache, dass LIN-9 mit pRB in der Aktivierung differenzierungspezifischer Gene kooperiert, ließ vermuten, dass humanes LIN-9 einen bedeutenden Einfluss auf die transkriptionelle Regulation von Genen haben könnte. Primäres Ziel dieser Arbeit war daher die Identifizierung LIN-9 regulierter Gene. Dazu sollte mit Hilfe von cDNA-Microarray Analysen, das Genexpressionsprofil LIN-9 depletierter primärer humaner Fibroblasten (BJ ET Zellen) im Vergleich zu Kontrollzellen untersucht werden. Hierfür wurde zunächst ein RNAi-basierendes System etabliert, um die posttranskriptionelle Expression von LIN-9 in BJ-ET Zellen effizient zu reprimieren. Auf dem Ergebnis der cDNA-Microarray Analysen aufbauende Untersuchungen sollten Aufschluss über die molekularbiologische Funktion von LIN-9 geben. In dieser Arbeit konnte erstmals gezeigt werden, dass der Verlust von LIN-9 zu einer verminderten Expression einer Gruppe G2/M-spezifischer Gene führt, deren Produkte für den Eintritt in die Mitose benötigt werden. Bekannt war, dass ein Teil dieser Gene durch den Transkriptionsfaktor B-MYB koreguliert wird. Zudem konnten Untersuchungen in unserem Labor eine Interaktion von LIN-9 und B-MYB auf Proteinebene, sowie die Bindung beider Proteine an die Promotoren der LIN-9 regulierten G2/M-Gene nachweisen. Dies lässt vermuten, dass LIN-9 und B-MYB gemeinsam die Expression der G2/M-Gene kontrollieren. Die verminderte Expression von G2/M-Genen in LIN-9 bzw. B-MYB depletierten Zellen geht mit einer Reihe phänotypischer Veränderungen einher, wie einer deutlich verlangsamten Proliferation und einer Akkumulation der Zellen in der G2/M-Phase. Mit Hilfe eines Durchflusszytometers erstellte Zellzykluskinetiken ergaben, dass die Progression LIN-9 bzw. B-MYB depletierter Fibroblasten von der S-Phase durch die G2/M-Phase und in die nächste G1-Phase deutlich verzögert ist. Es konnte weder ein Arrest dieser Zellen in der Mitose noch eine veränderte Länge der S-Phase nach LIN-9 oder B-MYB Depletion festgestellt werden. Daher ist die verlangsamte Zellzyklusprogression nach LIN-9 bzw. B-MYB Verlust höchstwahrscheinlich auf einen Defekt in der späten G2-Phase zurückzuführen, welcher in einem verzögerten Eintritt in die Mitose resultiert. In D. melanogaster und in C. elegans sind die Homologe von LIN-9 und B-MYB zusammen, als Bestandteile hoch konservierter RB/E2F-Komplexe, an der Regulation von Genen entscheidend beteiligt. Daher liegt es nahe, dass im humanen System LIN-9 und B MYB ebenfalls Bestandteile eines ähnlichen Komplexes sind und dadurch die Aktivierung der LIN 9 abhängigen G2/M-Gene vermitteln. Die Tatsache, dass LIN-9 sowohl als Tumorsuppressor, als auch als positiver Regulator des Zellzyklus fungiert, lässt vermuten, dass LIN-9 zu einer stetig größer werdenden Gruppe von Proteinen gehört, welche in Abhängigkeit vom zellulären und genetischen Kontext sowohl tumorsuppressive als auch onkogene Funktionen besitzen. N2 - The human LIN-9 Protein was first identified as a novel pRB-interacting Protein which acts as a tumorsuppressor in context of the pRB-pathway. But the molecular function of LIN-9 is poorly unterstood. The homologs of LIN-9 in D. melanogaster and C. elegans are required for the transcriptional regulation of different genes. This and the fact, that LIN 9 cooperates with pRB in the activation of differentiation specific genes let to the hypothesis, that human LIN-9 could play an important role in the transcriptional regulation of genes. Thus, the primary goal of this thesis was to identify genes which are regulated by LIN-9. For that purpose, the genexpression profiles of LIN-9 depelted primary human fibroblasts (BJ ET cells) in comparison to control cells should be analyzed by a cDNA-microarray approach. Therefor an RNAi-based system was established, that efficiently represses the posttranscriptional expression of LIN-9 in BJ-ET cells. Based on the outcome of the cDNA microarray analysis, further studies should provide more informations about the molecular function of LIN-9. It was possible to show, that the loss of LIN-9 leads to a reduced expression of a cluster of G2/M-specific genes, whose products are required for timely entry into mitosis. It was known, that some of these genes are coregulated by the transcriptionfactor B-MYB. Moreover, studies in our lab account for the interaction of LIN-9 and B-MYB on protein level and the binding of both proteins to the promotors of LIN-9 regulated G2/M-genes. The reduced expression of these genes is accompanied by phenotypically changes, such as strongly impaired proliferation and an accumulation of these cells in the G2/M-Phase. Cell cycle kinetics generated by flowcytometry revealed that the progression of LIN-9 or B MYB depleted cells from S-phase to G2/M-phase and into the next G1-Phase is significantly delayed. Depletion of LIN-9 or B-MYB results neither in an arrest in mitosis nor in a significantly changed S-phase length of these cells. This indicates that the slowed progression is most likely due to a defect in the late G2-phase, which results in a delayed entry into mitosis. The homologs of LIN-9 and B-MYB in D. melanogaster and C. elegans act together as subunits of highly conserved RB/E2F-complexes in the regulation of genes. This let to the suggestion, that LIN-9 and B-MYB are also components of a similar complex in humans and thereby mediate the activation of LIN-9 regulated G2/M-genes. Because LIN-9 acts as a tumorsuppressor in the pRB-pathway as well as an positive regulator of the cell cycle, it seems that LIN-9 belongs to an increasing group of proteins, which function as context dependent tumorsuppressors and oncogenes. KW - Zellzyklus KW - Mitose KW - Genregulation KW - Microarray KW - G2/M-Übergang KW - LIN-9 KW - B-MYB KW - E2F KW - Transkription KW - G2/M-transition KW - LIN-9 KW - B-MYB KW - E2F KW - transcription Y1 - 2007 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-24360 ER - TY - THES A1 - Mezger, Markus T1 - Interaktion zwischen dem humanen Cytomegalievirus, Aspergillus fumigatus, dendritischen Zellen und neutrophilen Granulozyten T1 - Interaction of the human cytomegalovirus, Aspergillus fumigatus, dendritic cells and polymorphonuclear neutrophils N2 - Immunsupprimierte Patienten besitzen ein erhöhtes Risiko für opportunistische Infektionen, die hauptsächlich durch das humane Cytomegalievirus (HCMV) und den Schimmelpilz Aspergillus fumigatus verursacht werden. Aufgrund ihrer Lokalisation in den Geweben unterhalb von Lungenepithelien und des Gastrointestinaltraktes werden dendritische Zellen (DCs) als diejenigen Zellen betrachtet, die während der frühen Phase einer Infektion in Kontakt mit HCMV und A. fumigatus kommen und eine Aktivierung von angeborenen und adaptiven Abwehrmechanismen vermitteln. Im Rahmen der vorliegenden Dissertation wurde die Bedeutung von humanen DCs bei der Bekämpfung von HCMV und A. fumigatus näher untersucht. Um mit dem klinisch relevanten HCMV Stamm TB40E arbeiten zu können, musste zuerst ein geeignetes Zellkultursystem zur Anzucht von HCMV etabliert werden. Die aus Fibroblasten aufgereinigten Viren eigneten sich zur erfolgreichen Infektion von DCs, was durch verschiedene Färbemethoden nachgewiesen werden konnte. Aus diesem Grund war es möglich, in Abhängigkeit der Zeit ein Expressionsprofil von Klasse I Interferonen (IFN-alpha, IFN-beta), ausgesuchten Cytokinen (CXCL10, CXCL11, Rantes) und den wichtigen Immunrezeptoren Toll-like Rezeptor 3 (TLR3) und dendritic cell-specific ICAM3-grabbing nonintegrin (DC-SIGN) zu erstellen. Nachdem ein RNA Interferenz (RNAi) System zur erfolgreichen Transfektion von DCs mit small interfering RNA (siRNA) etabliert werden konnte, gelang es die Expression von TLR3 signifikant herunterzuregulieren. Stimulationsexperimente mit dem synthetisch hergestellten Polymer poly I:C identifizierten TLR3 als den Rezeptor, der die Expression von IFN-beta vermittelt. Ferner konnte nachgewiesen werden, dass TLR9 bei ex vivo generierten DCs keine Funktion besitzt. Eine direkte Aktivierung von TLR3 durch HCMV konnte mittels siRNA nicht nachgewiesen werden. Durch den Einsatz von genomweiten Microarray-Analysen konnten eine Vielzahl an Genen gefunden werden, die nach Co-Kultivierung von DCs und lebenden A. fumigatus Keimschläuchen (KS) differentiell exprimiert waren. Dabei wurde ein breites Spektrum an Cytokinen (TNF-alpha, IL-6, IL-10, IL-12), Chemokinen (IL-8, CCL20, CXCL10), Co-stimulatorischen Molekülen (CD40, CD80, CD83, CD86), Prostaglandin Synthese Genen (PTGS2) und Immunrezeptoren (PTX-3, TLR2, TLR4) gefunden, deren zeitabhängiges Expressionsprofil mittels qRT-PCR eindeutig bestätigt wurde. Als Wachen des Immunsystems müssen DCs Krankheitserreger zu einem frühen Zeitpunkt der Infektion erkennen. Die Erkennung von Pilzen wird durch die unterschiedlichen Rezeptoren vermittelt, die TLRs, C-Typ Lektine und Pentraxine umfassen, wobei ihre Bedeutung für humane DCs bisher nur unzureichend geklärt ist. Durch den Einsatz von siRNA konnte die Expression von TLR2, TLR4, myeloid differentiation primary response gene 88 (MyD88), DC-SIGN, Pentraxin-3 (PTX-3) und caspase recruitment domain family member 9 (Card-9) signifikant verringert werden. Für TLR2, TLR4, PTX-3 und DC-SIGN konnte durch den Einsatz der RNAi aufgezeigt werden, dass diese Rezeptoren nicht an der Induktion einer pro-inflammatorischen Immunantwort von DCs nach Infektion mit A. fumigatus beteiligt sind. Sowohl die Stimulierung mit den TLR Liganden Zymosan und LPS, als auch mit A. fumigatus, führte zu einer erhöhten Expression von TNF-alpha und IL-12 (Light Cycler), die sich in einer vermehrten Cytokinfreisetzung (ELISA) bemerkbar machte. Im Gegensatz zur TLR4 siRNA Transfektion und LPS-Stimulation war keine Reduktion der Expression von TNF-alpha und IL-12 nach TLR2 und TLR4 siRNA Transfektion und anschließender Pilzinfektion zu beobachten. Auch der Einsatz von gegen TLRs gerichteten Antikörpern konnte eine mögliche Signaltransduktion bei DCs nicht unterbinden. Anstelle von TLR2 und TLR4 wurde Dectin-1 als DC-Immunrezeptor für A. fumigatus KS identifiziert. Mit Hilfe eines spezifischen Antikörpers gegen Dectin-1 war es möglich, die Freisetzung von TNF-alpha und IL-12 nach Pilzinfektion zu blockieren. In einem unabhängigen Experiment mit siRNA wurde Dectin-1 als Rezeptor für A. fumigatus bestätigt. Wie fortführende Experimente mit Candida albicans KS und Zymosan gezeigt haben, handelt es sich bei Dectin-1 auf humanen DCs um einen generellen Rezeptor für Pilze. Die durchgeführten SNP-Analysen (single nucleotide polymorphism) zur Ermittlung eines Zusammenhanges mit einem erhöhten Virus- und Pilzinfektionsrisiko für Patienten nach Stammzelltransplantation erbrachten die Erkenntnis darüber, dass zwei Marker (rs735240, rs2287886) in DC-SIGN mit einer erhöhten Empfänglichkeit für HCMV, und drei Marker (rs1554013, rs3921, rs4257674) in CXCL10 mit einem vergrößerten Riskio für eine invasive Aspergillose assoziiert waren. Ein Screening von Patienten auf das Vorhandensein dieser definierten SNPs könnte helfen, die individuelle Gefahr für HCMV und A. fumigatus nach nach allogener Stammzelltransplantation abzuschätzen. N2 - Patients after allogenic stem cell transplantation (alloSCT) have an increased risk to suffer from viral and fungal infections, which are mainly caused by the human cytomegalovirus (HCMV) and the mold Aspergillus fumigatus. Due to their localization in tissues under lung epithelia and the gastrointestinal tract, dendritic cells (DCs) are considered to be the first cells coming into close contact with HCMV and A. fumigatus for the activation of innate and adaptive immune mechanisms. Within the scope of this dissertation, the role of human monocyte-derived DCs in the abatement of HCMV and A. fumgatus was analyzed. In order to work with HCMV, a cell culture system for effective culturing of the clinical relevant HCMV strain TB40E had to be established first. The viral particles up-cleaned from lung fibroblasts were used for infection of DCs and successful infection was approved by different staining methods. For this reason, it was possible to determine a time-dependent expression profile of class I interferons (IFN-alpha, IFN-beta), selected cytokines (CXCL10, CXCL11, Rantes) and immunoreceptors (TLR3, DC-SIGN). A RNA interference (RNAi) system for human DCs was established to significantly knock-down expression of TLR3 without the induction of an unwanted pro-inflammatory cytokine response. Stimulation experiments with the synthetic polymer poly I:C (which resembles dsRNA of infectious viruses) identified TLR3 as a receptor for triggering expression of IFN-beta. However, whether there is a direct activation of TLR3 through dsRNA intermediates, possibly emerging during replication of HCMV, can not be answered to date definitively, because TLR3 small interfering RNA (siRNA) transfection prior to HCMV infection did not result in minor expression of IFN-beta. Gene expression pattern of DCs after co-cultivation with living A. fumigatus germ tubes was studied by whole genome microarray analysis and real-time PCR, demonstrating an upregulation of a broad spectrum of cytokines (TNF-alpha, IL-6, IL-10, IL-12), chemokines (IL-8, CCL20, CXCL10), co-stimulatory molecules (CD40, CD80, CD83, CD86), prostaglandin synthesis genes (PTGS2), as well as genes involved in fungal recognition (PTX-3, TLR2, TLR4) and cytoskeleton organization / phagocytosis. As the sentries of the immune system, DCs must recognize fungi at an early step of infection. Pathogen detection is mediated by different receptors comprising TLRs, C-type lectins and Pentraxines (PTX), but only little is known about their relevance for DCs. Using specific siRNAs, expression of TLR2, TLR4, myeloid differentiation primary response gene 88 (MyD88), dendritic cell-specific ICAM3-grabbing nonintegrin (DC-SIGN), Pentraxin-3 (PTX-3) and caspase recruitment domain family member 9 (Card-9) was significantly diminished, respectively. In contrast to control experiments with TLR4 siRNA and LPS stimulation, A. fumigatus induced expression of pro-inflammatory cytokines (TNF-alpha, IL-12) was not reduced when TLR2 and TLR4 expression was knocked-down by specific siRNAs prior to infection. However, using siRNAs directed against Dectin-1 allowed demonstration of an interaction between Dectin-1 and A. fumigatus germlings, Candida albicans germ tubes and Zymosan. In an independent approach, cytokine secretion could be blocked by anti-Dectin-1 antibody treatement prior to fungal exposure. In conclusion, Dectin-1 was identified as an important fungal receptor on DCs whereas TLR2 and TLR4 seemed to play a negligible role. Single nucleotide polymorphisms (SNPs) in various cellular receptor genes are associated with the susceptibility to and severity of infectious diseases. In this study, genetic polymorphisms in genes encoding for virus entry receptors have been analyzed for their association to HCMV reactivation and disease in patients after allogeneic stem cell transplantation. A comparison of different genotyping methods highlighted the advantages of the Light Cycler system, the cycle-suequencing and the matrix-assisted laser desorption ionization mass spectrometry (MALDI-MS) when using small quantities of patients’ DNA. Two markers (rs735240, rs2287886) in the promoter region of DC-SIGN were found to be significantly associated with an increased susceptibility to HCMV. In addition, three SNPs (rs1554013, rs3921, rs4257674) in CXCL10 elevated the risk for the development of invasive aspergillosis. Screening of patients after alloSCT for the presence of these defined genetic polymorphisms may help to predict the individual risk to suffer from HCMV and A. fumigatus after alloSCT. KW - Aspergillus fumigatus KW - Cytomegalie-Virus KW - Dendritische Zelle KW - Granulozyt KW - SNP KW - Microarray KW - Toll-like-Rezeptoren KW - RNS-Interferenz KW - Aspergillus fumigatus KW - human cytomegalovirus KW - dendritic cell KW - polymorphonuclear neutrophil KW - SNP KW - Microarray KW - Toll-like Receptor KW - RNA interference Y1 - 2007 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-27254 ER - TY - THES A1 - Kusnezow, Wlad T1 - Entwicklung von Antikörper-Mikroarray : von Biophysik der Mikrospot-Reaktion bis zur Hochdurchsatzanalyse der Proteine T1 - Development of antibody microarray: from biophysics of microspot reaction to high throughput analysis of proteins N2 - Obwohl Protein-Mikroarrays ursprünglich aus dem gut entwickelten und fest etablierten DNA-Pendant entstanden sind, repräsentierte jedoch die Umstellung der Mikroarray-Technik von der DNA- auf die Proteinanalyse aufgrund der enormen physikalisch-chemischen Variabilität der Proteine, deren relativ niedrigen Stabilität und der komplexen Mikrospot-Kinetik eine große technologische Herausforderung. Deshalb setzt das Vorhaben, die Technik der Antikörper–Mikroarrays von ihrem konzeptuellen Zustand ausgehend zu einem robusten, real funktionierenden Werkzeug zu etablieren, nicht nur eine Vielzahl an technologischen Lösungen, sondern auch eine systematische und physikalisch begründete Herangehensweise in dieser technologischen Entwicklung voraus. Das waren im Wesentlichen die zwei wichtigsten, der eigentlichen Entwicklung der Antikörper-Mikroarrays untergeordneten Ziele der Arbeit. Mit dem Ziel, Antikörper-Mikroarrays prinzipiell zu etablieren und eine optimale Immobilisierungschemie für deren Herstellung zu finden, wurden im ersten Teil dieser Arbeit mehrere chemische Beschichtungen von Glasslides optimiert, unterschiedliche Spotting-Bedingungen von Antikörpern für verschiedene Oberflächen getestet und verschiedene Blockierungsverfahren und Strategien zur Aufbewahrung von Slides analysiert. Anschließend wurde eine Reihe von kommerziellen und selbst hergestellten chemisch beschichteten Slides unter den optimierten Bedingungen miteinander verglichen. Als Hauptergebnis dieser Untersuchung wurde die Herstellung der Antikörper-Microarrays etabliert. Unter anderem konnte im Zuge dieser systematischen Analyse gezeigt werden, dass Epoxysilan-modifizierte Oberflächen am besten geeignet sind. Diese Oberfläche ist heutzutage auf dem Gebiet der Protein-Microarrays am weitesten verbreitet und wurde für alle weiteren Studien innerhalb dieser Dissertation verwendet. Die Entwicklung der Antikörper-Mikroarrays in den letzten Jahren demonstrierte erhebliche Schwierigkeiten im Erreichen der nötigen Sensitivität und Reproduzierbarkeit. Um dieser Problematik auf den Grund zu gehen, und die Mikrospot-Kinetik experimentell untersuchen zu können, wurde im Rahmen dieser Arbeit eine modifizierte und für den Fall der Mikrorrays angepasste Variante des Two-Compartment Modells (TCM) entwickelt. TCM ermöglicht auf eine phänomenologische Weise, d.h., dass Diffusionskoeffizienten, Mischintensität oder Dichte der Bindungsstellen nicht bekannt sein müssen, eine quantitative experimentelle Analyse der Mikrospot-Kinetik unter Berücksichtigung von Effekten des Massentransports. Um die phänomenologischen TCM-Werte interpretieren zu können und um den Mechanismus der Mikrospot-Reaktion zu untersuchen, wurden auch andere, für die Mikrospot-Kinetik relevante, klassische Theorien an die Bedingungen der Mikrospot-Reaktion angepasst und mit dem modifizierten TCM mathematisch verbunden. Als das erste in der Mikroarray-Technologie mathematisch-physikalische Werkzeug dieser Art hat die hier entwickelte Theorie ein großes Potential, auch in den anderen verwandten Techniken wie DNA- oder Peptid-Mikroarrays Verwendung zu finden. Außerdem wurde innerhalb dieser Arbeit ein anderes einheitliches theoretisches Modell entwickelt, das eine kinetische Simulation von verschiedenen Reaktionsphasen sowohl für konventionelle als auch für Mikrospot-Immunoassays ermöglicht. Im Rahmen dieser Arbeit konnte für einen typischen Standard-Antikörper-Mikroarray theoretisch und experimentell eine lang andauernde, stark massentransportabhängige Mikrospot-Kinetik beschrieben werden. Es konnte gezeigt werden, dass das Erreichen eines thermodynamischen Gleichgewichts in Mikroarrays wegen eines relativ langsamen Ligandentransports zum Spot eine lange Zeit dauert, je nach Bindungskonstante, Diffusionsgeschwindigkeit und Ligandenkonzentration mehrere Stunden bis hin zu Wochen. In dieser Arbeit wurde ein neues physikalisches Konzept, das dem heutzutage dominierenden Blickwinkel, der sogenannten ambient analyte Theorie, opponierend gegenübersteht, formuliert. Auch konnten viele Konsequenzen fürs Design und die zukünftige Entwicklung dieser relativ neuen Technologie gezogen werden. Als eine logische Folge der massentransportlimitierten Reaktionen ist das Design eines Antikörper-Mikroarray ein kritischer Punkt für die Leistung des Verfahrens. Im Laufe der experimentellen und/oder theoretischen Betrachtungen konnte gezeigt werden, dass eine Reihe allgemeiner Parameter wie Größe eines Spots, Spotting-Muster, Inkubationsgeometrie, Volumen und Konzentration einer Probe, Viskosität des Inkubationspuffers und Mischintensität die Reaktionsraten auf den Spots insgesamt um mehrere Größenordnungen beeinflusst. Ist die maximale Rate des Massentransports in einem Mikroarray-Verfahren gewährleistet, kann dann auch die maximale Bindungsleistung der Spots, die durch die Dichte der Bindungsstellen, Bindungsaffinität, Inkubationszeit und andere relevante Parameter eingestellt wird, erreicht werden. Aber nicht nur in der Inkubationsphase, sondern auch bei den Wasch- und Detektionsschritten sollte die gleiche Liste der Parameter berücksichtigt werden. Durch die Optimierung all dieser Parametern konnte eine deutliche Verbesserung der Sensitivität von Antikörper-Mikroarrays in der Protein-Expressionsanalyse von klinischen Blutproben erzielt werden In einer weiteren Studie zur Analyse von unterschiedlichen Detektionsverfahren konnte die Sensitivität und Reproduzierbarkeit der etablierten Antikörper-Mikroarrays weiter verbessert werden. Eine Reihe unterschiedlicher Markierungssubstanzen mit NHS (N-hydroxysuccinimide) und ULS (universal linkage system) reaktiven Gruppen wurden innerhalb drei Detektionsverfahren untersucht: 1) eine direkte Probenmarkierung mit Fluoreszenzfarbstoffen, 2) Markierung der Probe mit Biotin-Substanzen und nachfolgender Detektion mittels fluoreszenzmarkierten Extravidin und 3) Markierung der Probe mit Fluorescein-Substanzen mit Anti-Fluorescein-Detektion. Aus den Erfahrungen der vorherigen kinetischen Untersuchungen wurde hier vorerst das kinetische Verhalten des Testsystems analysiert und optimale Inkubationsbedingungen festgelegt. Anschließend wurden optimale Konzentrationen all dieser Substanzen für die Markierung von Blutplasma bestimmt. Im Vergleich zur direkten Fluoreszenzmarkierung resultierten sich die indirekten Detektionsverfahren mit Biotin- und Fluorescein-Substanzen in wesentlich besseren Signal-zu-Hintergrund-Verhältnissen. In einer anschließenden Vergleichsanalyse zeigten sich einige Substanzen wie Biotin-ULS oder Fluoresceine-NHS als am besten geeignet für eine Protein-Expressionsanalyse von Blutplasma. Sensitivitäten im femtomolaren Bereich konnten mittels der etablierten Antikörper-Mikroarrays sowohl für eine markierte Antigenmischung als auch für komplexe klinische Proben innerhalb dieser Dissertation erzielt werden. Viele niedrig konzentrierte Proteine wie beispielsweise Zytokine, die normalerweise in einer piko-oder femtomolaren Konzentration im Blut vorliegen, wurden in dieser Arbeit mit sehr hohen Signal-zu-Hintergrund-Verhältnissen detektiert. Das hier beschriebene Verfahren öffnet zusätzliche Möglichkeiten für schnelle, kostengünstige und unbeschränkt erweiterungsfähige Mikrospot-Immunoassays. N2 - Although protein microarrays are superficially similar to DNA microarrays, the conversion of microarray technology to the protein world still represents a big technological challenge because of the enormous physicochemical variability and relatively low stability of proteins as well as complex microspot kinetics. Therefore, the intention of developing the concept of antibody microarray into a really functioning tool requires a multiplicity of technological solutions as well as a systematic and physically justified approach in this technological development. These were essentially the two most important goals while developing antibody microarrays. Aiming to establish antibody microarrays in principle und to find optimal antibody immobilization chemistry, several chemical coatings of glass slides, antibody spotting conditions for different surfaces, different blocking procedures and strategies for slides storage were analysed and optimised in the first part of this dissertation. Subsequently, a set of commercial and home-made chemically coated slides was compared under these optimized conditions. As a main result, manufacturing of antibody microarrays was established. Among other things, the epoxysilan surface was found to be best suitable for fabrication of antibody microarrays in course of this systematic analysis. This kind of chemical coating is nowadays one of the most popular in the protein microarray field and it was also used in all other studies presented here. The development of antibody microarray technology in the last years demonstrated substantial difficulties trying to achieve the required sensitivity and reproducibility. In order to get the bottom of this issue and to be able to examine microspot kinetics experimentally, the so-called two-compartment model (TCM) was modified and adapted for the case of microrrays in this work. TCM enables a quantitative experimental analysis of microspot kinetics with regard to effects of mass transport. It is a phenomenological model, so that one does not need to know density of binding sites or any parameters of mass transport such as diffusion coefficient or mixing intensity. To be able to interpret the phenomenological reaction descriptors of TCM and to investigate reaction mechanism, some relevant theoretical models were also adapted for the case of microspot reaction as well as were mathematically joined with the modified TCM. Our theory is the first mathematical tool of this sort in the microarray technology and it has therefore a lot of potential to be applied also in the other related techniques such as DNA or peptide microarrays. Additionally, another uniform theoretical model was developed in this work. It enables a kinetic simulation of different reaction regimes for the case of conventional as well as microspot immunoassays. Long-lasting and strongly mass transport dependent microspot kinetics was described in this work, both theoretically and experimentally. The attainment of the thermodynamic equilibrium in microarrays may require many hours, days or even weeks due to a relatively slow ligand transport to spots. A new physical concept, which represents the opposite view to the today’s most widespread concept, so called ambient analyte theory, could be formulated in consequence of this investigation. Also, we could draw many consequences for design and future development of this relatively new techique. As a logical consequence of the mass transport limited reactions, proper assay design is cruicial for performance of antibody microarrays. In the course of our experimental and/or theoretical considerations, it was shown that a number of general parameters such as size of a spot, spotting pattern, incubation geometry, volume and concentration of a sample, viscosity of incubation buffer and mixing intensity could altogether affect signal velocity by many orders of magnitude. If the maximum rate of mass transport in a microarray procedure is ensured, then also the maximum binding capacity of spots could be achieved by adjusting such parameters as density of binding sites, binding affinity, incubation time etc. The same factors should be also considered for washing and detection steps in a kinetically relevant design of microarray procedure. Optimizing these parameters, the performance of antibody microarrays as applied for protein profiling of clinical specimens could be strongly improved. A significant improvement of the antibody microarray performance as applied for protein profiling of clinical blood samples could be also achieved in a further study aiming to analyze different detection approaches. A number of labeling substances containing either NHS (N-hydroxysuccinimide) or ULS (universal linkage system) reactive groups was examined within three general detection procedures: 1) direct sample labeling with fluorescence dyes, 2) sample labelling with biotin- containing substances with subsequent detection using fluorescently labeled extravidin and 3) sample labelling with fluorescein-substances with detzection by anti-fluorescein. Based on the experience of the previous kinetic investigations, kinetic behavior of the applied test system was first analyzed in this study to find optimal incubation conditions. Also, optimal blood plasma labelling concentration for every analyzed substance was determined in this study. The indirect detection approaches (biotin/extravidin and fluorescein/anti-fluorescein) resulted in substantially better signal-to-noise ratios as compared to direct fluorescent labeling. Some substances such as biotin-ULS or fluorescein-NHS were found to be best suitable for microarray-based protein profiling of blood plasma. Using the established antibody microarrays, sensitivities in the fM range could be attained in this dissertation both for a labeled mix of antigens as well as for complex clinical samples. Many low abundant proteins as for example cytokines, which are normally present in a pM-fM concentration in the blood, was detected in this work with very high signal-to-noise ratios. The approach described here opens additional possibilities for fast, economical and unrestricted multiplexing microspot immunoassays. KW - Microarray KW - Antikörper KW - Antikörper-Mikroarray KW - Oberflächenchemie KW - Kinetik KW - Fluoreszenz KW - Blutserum KW - antibody microarray KW - surface chemistry KW - kinetics KW - fluorescence KW - serum Y1 - 2006 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-22534 ER - TY - THES A1 - Heisig, Julia T1 - Identifizierung neuer Zielgene der Hey bHLH Transkriptionsfaktoren T1 - Identification of novel target genes of Hey bHLH transcription factors N2 - Der Notch Signalweg spielt während der Embryonalentwicklung eine zentrale Rolle in der Spezifizierung des Zellschicksales, der Proliferation und der Kommunikation benachbarter Zellen. Die Hey bHLH Transkriptionsfaktoren sind Zielgene des Notch-Signalweges und besitzen wichtige Funktionen in der kardiovaskulären Entwicklung. Hey2 Knockout (KO) Mäuse und Hey1/HeyL Doppelknockout-Mäuse (DKO) sind gekennzeichnet durch eine fehlerhafte Ausbildung der Herzscheidewand und der Herzklappen und durch eine unzureichende Differenzierung während der Blutgefäßentwicklung. Ziel dieser Arbeit war es, neue Zielgene der Hey Proteine zu finden, um ihre Funktion in der Organentwicklung und die Ausprägung der Hey KO Maus-Phänotypen besser verstehen zu können. Dazu wurde als Methode eine Kombination aus Microarray-Analyse und Chromatinimmunpräzipitation (ChIP) gewählt, um gleichzeitig einen Überblick über die regulierten Zielgene und der direkt gebundenen Promotoren zu gewinnen. Als Zellkulturmodell wurden HEK293-Zellen genutzt, die doxyzyklin-induzierbar Flag-markiertes Hey1, bzw. Hey2 Protein überexprimieren. Eine Microarray-Analyse nach Überexpression von Hey1, bzw. Hey2 ergab insgesamt ca. 100 bis zu 5-fach herunterregulierte Zielgene und nur für Hey2 15 Gene, die stärker als 2-fach hochreguliert waren. Eine ChIP mit αFlag-Antikörper zeigte eine direkte DNA-Bindung von Hey1, bzw. Hey2, im proximalen Promotorbereich von 4 herunterregulierten Zielgenen (HEY1, BMP2, KLF10 und FOXC1). Ist jedoch die DNA-bindende basische Domäne des Hey1-Proteins deletiert, bzw. durch Aminosäureaustausche (3 Arginine zu 3 Lysine) vermutlich nicht mehr DNA-bindend, kann eine Herunterregulation der Zielgene nach Überexpression der Hey1-Mutanten nicht mehr festgestellt werden. Ebenso kann eine Bindung der Hey1-Mutanten an die ausgewählten Promotoren von HEY1, BMP2, KLF10 oder FOXC1 mit ChIP nicht mehr nachgewiesen werden. Dies deutet darauf hin, dass die basische Domäne essentiell für die DNA-Bindung und für die Funktion der Hey Proteine ist. Mit ChIP-PET und anschließender Hochdurchsatz-Sequenzierung wurde ein genomweiter Screen der Hey1- und der Hey2-Bindungsstellen in HEK293-Zellen durchgeführt. Für Hey1 wurden 1453 Zielgene, für Hey2 4288 Zielgene bestimmt, wobei 1147 Gene gemeinsame Zielgene von Hey1 und Hey2 waren. Obwohl die Bindungsstellen in 5'- und 3'-Richtung von kodierenden Sequenzen und auch in Exons und Introns lokalisiert waren, waren 55 %, bzw. 49 % aller Bindungsstellen für Hey1, bzw. Hey2 im proximalen Promotorbereich von -0,5 kb und im ersten Exon lokalisiert. Eine in silico Analyse des Bindemotivs deutete auf eine repetitive GC-haltige Sequenz hin, die vermutlich in CpG Inseln lokalisiert ist. Diese Ergebnisse weisen auf eine direkte Regulation der Transkriptionsmaschinerie durch die Hey Proteine hin. Ein Vergleich der Zielgene aus den Microarray-Analysen mit den ChIP-PET Daten zeigte einen hohen Anteil an herunterregulierten Genen mit Bindestellen, die direkt von Hey gebunden waren. Während 60 % der herunterregulierten Hey2 Zielgene in der ChIP-PET Analyse eine direkte DNA-Bindung zeigen, weisen nur 20 % der hochregulierten Gene Bindestellen für Hey2 auf. Dies spricht für eine überwiegende Repressorfunktion der Hey Proteine. Um zu überprüfen, inwieweit die Hey Proteine zelltypspezifisch verschiedene Zielgene regulieren, wurden embryonale Stammzellen (ES-Zellen) generiert, die ebenfalls doxyzyklin-induzierbar Hey1, bzw. Hey2 überexprimieren. Diese ES-Zellen konnten effektiv zu Kardiomyozyten differenziert werden, so dass auch in diesen Zellen eine Hey Überexpression induziert und somit eine Genexpressionsanalyse durchgeführt werden konnte. Microarray Analysen der ES-Zellen und Kardiomyozyten ergaben mehr hoch- als herunterregulierte Gene im Vergleich zu HEK293-Zellen. Die Überlappung an gemeinsam regulierten Zielgenen in HEK293, ES-Zellen und Kardiomyozyten war sehr gering. Nur zwei Hey2-Zielgene wurden gleichzeitig in HEK293 und ES-Zellen stärker als 2-fach reguliert (Hes1, Zic2). Diese geringe Überlappung deutet auf ein enges zelltypspezifische Regulationspotential hin. Eine Genontologie-Analyse aller Zielgene zeigte Interaktionen der Hey Proteine mit verschiedenen Signalwegen (z.B. TGFβ-, Id- oder Wnt-Signalweg), die alle unersetzlich in frühen Entwicklungsprozessen sind. Diese Ergebnisse deuten darauf hin, dass die Hey Proteine zelltypspezifisch die Expression von Genen aus verschiedenen Signalwegen beeinflussen und modulieren können. Weiterhin eröffnen diese Daten neue Möglichkeiten für zukünftige Forschung, um die Rolle der Hey Proteine in der frühen Organentwicklung genauer ergründen. N2 - During embryonic development, the Notch signaling pathway plays a central role in cell fate specification, proliferation and communication between neighboring cells. Hey basic helix-loop-helix (bHLH) transcription factors are targets of the Notch signaling pathway and show crucial functions in cardiovascular development. Hey2 knock out (KO) mice and Hey1/HeyL double knock out mice (DKO) exhibit incomplete formation of the septum and valves in heart development and defects in the differentiation of blood vessels. The aim of this study was to find new target genes of the Hey proteins to further clarify their function during organ development and to get more insight into the phenotypes of the Hey KO mice. Towards this goal, a combination of microarray analysis and chromatin immunoprecipitation (ChIP) was chosen to get an overview of genes directly regulated by Hey proteins in a cell culture model of HEK293 cells overexpressing doxycycline-inducible Flag-tagged Hey1 or Hey2. Microarray analysis revealed approximately 100 target genes that were downregulated up to 5-fold by both Hey1 and Hey2. Interestingly, 15 genes were upregulated more than 2-fold by Hey2. ChIP with αFlag antibody confirmed direct interaction of Hey1 and Hey2 with the proximal promotor regions of 4 downregulated target genes (HEY1, BMP2, KLF10 und FOXC1). Overexpression of mutant Hey1 proteins with deletion of the DNA-binding basic domain or single amino acid exchanges in the basic domain (3 arginine to lysine), failed to downregulate Hey1 target genes. Additionally, ChIP assay demonstrated that the binding of the Hey mutants to the promotor regions of HEY1, BMP2, KLF10 or FOXC1 is abolished, suggesting an essential role for the basic domain in DNA binding and function of the Hey proteins. We then utilized ChIP-PET in conjunction with highthroughput sequencing to perform a genome-wide screen for Hey1 and Hey2 binding sites in HEK293 cells. 1453 and 4288 target genes were identified for Hey1 and Hey2, respectively, of which 1147 genes were targets of both Hey1 and Hey2. Although the binding sites were located upstream and downstream of coding sequences, or even in exons and introns, 55 % and 49 % of all binding sites for Hey1 and Hey2, respectively, were located in proximal promoter regions between -0.5 kb and the first exon. An in silico binding motif analysis suggests a repetitive GC-rich sequence for Hey binding which is probably located in CpG islands, indicating a direct regulation of the transcriptional machinery by the Hey proteins. A comparison of the target genes from microarray analysis and ChIP-PET sequencing data demonstrates a large number of downregulated genes with binding sites that are directly bound by the Hey proteins. While 60 % of Hey2 downregulated genes contain binding sites, only 20 % of upregulated genes have binding sites for Hey2, invoking a repressor function for Hey proteins. To investigate, whether the Hey proteins regulate different target genes in a cell type specific manner, embryonic stem cells (ES cells) were generated which also overexpress doxycycline-inducible Hey1 or Hey2. These ES cells could be differentiated efficiently into cardiomyocytes and thus could also be used for gene expression analysis after induction of Hey overexpression. Microarray analysis of ES cells and cardiomyocytes resulted in more up- than downregulated genes in comparison to HEK293 cells. The overlap of common regulated genes in HEK293, ES cells and cardiomyocytes was very low. Only two Hey2 target genes were regulated more than 2-fold in both HEK293 and ES cells (Hes1, Zic2). This disparity indicates a narrow cell-type specific gene regulation by Hey proteins. Gene ontology analysis of all target genes demonstrated interactions of Hey proteins with different signaling pathways (e.g. TGFβ, Id or Wnt signaling), which are all indispensable for early developmental processes. These results show that Hey proteins influence and modulate gene expression levels in different signaling pathways in a cell-type specific manner. These data provide new possibilities for future research efforts to elucidate the role of Hey proteins in early organ development. KW - Gen notch KW - Transkriptionsfaktor KW - Embryonalentwicklung KW - Kardiovaskuläres System KW - bHLH KW - Hey KW - Chromatinimmunpräzipitation KW - Microarray KW - bHLH KW - Hey KW - Chromatin Immunoprecipitation Y1 - 2011 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-65053 ER - TY - THES A1 - Friedrich, Torben T1 - New statistical Methods of Genome-Scale Data Analysis in Life Science - Applications to enterobacterial Diagnostics, Meta-Analysis of Arabidopsis thaliana Gene Expression and functional Sequence Annotation T1 - Neue statistische Methoden für genomweite Datenanalysen in den Biowissenschaften - Anwendungen in der Enterobakteriendiagnostik, Meta-Analyse von Arabidopsis thaliana Genexpression und funktionsbezogenen Sequenzannotation N2 - Recent progresses and developments in molecular biology provide a wealth of new but insufficiently characterised data. This fund comprises amongst others biological data of genomic DNA, protein sequences, 3-dimensional protein structures as well as profiles of gene expression. In the present work, this information is used to develop new methods for the characterisation and classification of organisms and whole groups of organisms as well as to enhance the automated gain and transfer of information. The first two presented approaches (chapters 4 und 5) focus on the medically and scientifically important enterobacteria. Its impact in medicine and molecular biology is founded in versatile mechanisms of infection, their fundamental function as a commensal inhabitant of the intestinal tract and their use as model organisms as they are easy to cultivate. Despite many studies on single pathogroups with clinical distinguishable pathologies, the genotypic factors that contribute to their diversity are still partially unknown. The comprehensive genome comparison described in Chapter 4 was conducted with numerous enterobacterial strains, which cover nearly the whole range of clinically relevant diversity. The genome comparison constitutes the basis of a characterisation of the enterobacterial gene pool, of a reconstruction of evolutionary processes and of comprehensive analysis of specific protein families in enterobacterial subgroups. Correspondence analysis, which is applied for the first time in this context, yields qualitative statements to bacterial subgroups and the respective, exclusively present protein families. Specific protein families were identified for the three major subgroups of enterobacteria namely the genera Yersinia and Salmonella as well as to the group of Shigella and E. coli by applying statistical tests. In conclusion, the genome comparison-based methods provide new starting points to infer specific genotypic traits of bacterial groups from the transfer of functional annotation. Due to the high medical importance of enterobacterial isolates their classification according to pathogenicity has been in focus of many studies. The microarray technology offers a fast, reproducible and standardisable means of bacterial typing and has been proved in bacterial diagnostics, risk assessment and surveillance. The design of the diagnostic microarray of enterobacteria described in chapter 5 is based on the availability of numerous enterobacterial genome sequences. A novel probe selection strategy based on the highly efficient algorithm of string search, which considers both coding and non-coding regions of genomic DNA, enhances pathogroup detection. This principle reduces the risk of incorrect typing due to restrictions to virulence-associated capture probes. Additional capture probes extend the spectrum of applications of the microarray to simultaneous diagnostic or surveillance of antimicrobial resistance. Comprehensive test hybridisations largely confirm the reliability of the selected capture probes and its ability to robustly classify enterobacterial strains according to pathogenicity. Moreover, the tests constitute the basis of the training of a regression model for the classification of pathogroups and hybridised amounts of DNA. The regression model features a continuous learning capacity leading to an enhancement of the prediction accuracy in the process of its application. A fraction of the capture probes represents intergenic DNA and hence confirms the relevance of the underlying strategy. Interestingly, a large part of the capture probes represents poorly annotated genes suggesting the existence of yet unconsidered factors with importance to the formation of respective virulence phenotypes. Another major field of microarray applications is gene expression analysis. The size of gene expression databases rapidly increased in recent years. Although they provide a wealth of expression data, it remains challenging to integrate results from different studies. In chapter 6 the methodology of an unsupervised meta-analysis of genome-wide A. thaliana gene expression data sets is presented, which yields novel insights in function and regulation of genes. The application of kernel-based principal component analysis in combination with hierarchical clustering identified three major groups of contrasts each sharing overlapping expression profiles. Genes associated with two groups are known to play important roles in Indol-3 acetic acid (IAA) mediated plant growth and development as well as in pathogen defence. Yet uncharacterised serine-threonine kinases could be assigned to novel functions in pathogen defence by meta-analysis. In general, hidden interrelation between genes regulated under different conditions could be unravelled by the described approach. HMMs are applied to the functional characterisation of proteins or the detection of genes in genome sequences. Although HMMs are technically mature and widely applied in computational biology, I demonstrate the methodical optimisation with respect to the modelling accuracy on biological data with various distributions of sequence lengths. The subunits of these models, the states, are associated with a certain holding time being the link to length distributions of represented sequences. An adaptation of simple HMM topologies to bell-shaped length distributions described in chapter 7 was achieved by serial chain-linking of single states, while residing in the class of conventional HMMs. The impact of an optimisation of HMM topologies was underlined by performance evaluations with differently adjusted HMM topologies. In summary, a general methodology was introduced to improve the modelling behaviour of HMMs by topological optimisation with maximum likelihood and a fast and easily implementable moment estimator. Chapter 8 describes the application of HMMs to the prediction of interaction sites in protein domains. As previously demonstrated, these sites are not trivial to predict because of varying degree in conservation of their location and type within the domain family. The prediction of interaction sites in protein domains is achieved by a newly defined HMM topology, which incorporates both sequence and structure information. Posterior decoding is applied to the prediction of interaction sites providing additional information of the probability of an interaction for all sequence positions. The implementation of interaction profile HMMs (ipHMMs) is based on the well established profile HMMs and inherits its known efficiency and sensitivity. The large-scale prediction of interaction sites by ipHMMs explained protein dysfunctions caused by mutations that are associated to inheritable diseases like different types of cancer or muscular dystrophy. As already demonstrated by profile HMMs, the ipHMMs are suitable for large-scale applications. Overall, the HMM-based method enhances the prediction quality of interaction sites and improves the understanding of the molecular background of inheritable diseases. With respect to current and future requirements I provide large-scale solutions for the characterisation of biological data in this work. All described methods feature a highly portable character, which allows for the transfer to related topics or organisms, respectively. Special emphasis was put on the knowledge transfer facilitated by a steadily increasing wealth of biological information. The applied and developed statistical methods largely provide learning capacities and hence benefit from the gain of knowledge resulting in increased prediction accuracies and reliability. N2 - Die aktuellen Fortschritte und Entwicklungen in der Molekularbiologie stellen eine Fülle neuer, bisher kaum analysierter Daten bereit. Dieser Fundus umfasst unter Anderem biologische Daten zu genomischer DNA, zu Proteinsequenzen, zu dreidimensionalen Proteinstrukturen sowie zu Genexpressionsprofilen. In der vorliegenden Arbeit werden diese Informationen genutzt, um neue Methoden der Charakterisierung und Klassifizierung von Organismen bzw. Organismengruppen zu entwickeln und einen automatisierten Informationsgewinn sowie eine Informationsübertragung zu ermöglichen. Die ersten beiden vorgestellten Ansätze (Kapitel 4 und 5) konzentrieren sich auf die medizinisch und wissenschaftlich bedeutsame Gruppe der Enterobakterien. Deren Bedeutung für Medizin und Mikrobiologie geht auf ihre Funktion als kommensale Bewohner des Darmtraktes, ihre Nutzung als leicht kultivierbare Modellorganismen und auf die vielseitigen Infektionsmechanismen zurück. Obwohl bereits viele Studien über einzelne Pathogruppen mit klinisch unterscheidbaren Symptomen existieren, sind die genotypischen Faktoren, die für diese Unterschiedlichkeit verantwortlich zeichnen, teilweise noch nicht bekannt. Der in Kapitel 4 beschriebene umfassende Genomvergleich wurde anhand einer Vielzahl von Enterobakterien durchgeführt, die nahezu die gesamte Bandbreite klinisch relevanter Diversität darstellen. Dieser Genomvergleich bildet die Basis für eine Charakterisierung des enterobakteriellen Genpools, für eine Rekonstruktion evolutionärer Prozesse und Einflüsse und für eine umfassende Untersuchung spezifischer Proteinfamilien in enterobakteriellen Untergruppen. Die in diesem Kontext vorher noch nicht angewandte Korrespondenzanalyse liefert qualitative Aussagen zu bakteriellen Untergruppen und den ausschließlich in ihnen vorkommenden Proteinfamilien. In drei Hauptuntergruppen der Enterobakterien, die den Gattungen Yersinia und Salmonella sowie der Gruppe aus Shigella und E. coli entsprechen, wurden die jeweils spezifischen Proteinfamilien mit Hilfe statistischer Tests identifiziert. Zusammenfassend bilden die auf Genomvergleichen aufbauenden Methoden neue Ansatzpunkte, um aus der Übertragung der bekannten Funktionalität einzelner Proteine auf spezifische, genotypische Besonderheiten bakterieller Gruppen zu schließen. Aufgrund ihrer hohen medizinischen Relevanz war die Typisierung enterobakterieller Isolate entsprechend ihrer Pathogenität Ziel zahlreicher Studien. Die Microarray-Technologie bietet ein schnelles, reproduzierbares und standardisierbares Hilfsmittel für bakterielle Typisierung und hat sich in der Bakteriendiagnostik, Risikobewertung und Überwachung bewährt. Das in Kapitel 5 beschriebene Design eines diagnostischen Microarray beruht auf einer großen Anzahl verfügbarer Genomsequenzen von Enterobakterien. Ein hocheffizienter String-Matching-Algorithmus ist die Grundlage einer neuartigen Strategie der Sondenauswahl, die sowohl kodierende als auch nicht-kodierende Bereiche genomischer DNA berücksichtigt. Im Vergleich zu Diagnostika, die ausschließlich auf Virulenz-assoziierten Sonden beruhen, verringert dieses Prinzip das Risiko einer inkorrekten Typisierung. Zusätzliche Sonden erweitern das Anwendungsspektrum auf eine simultane Diagnostik der Antibiotikaresistenz bzw. eine Überwachung der Resistenzausbreitung. Umfangreiche Testhybridisierungen belegen eine überwiegende Zuverlässigkeit der Sonden und vor allem eine robuste Klassifizierung enterobakterieller Stämme entsprechend der Pathogruppen. Die Tests bilden zudem die Grundlage für das Training eines Regressionsmodells zur Klassifizierung der Pathogruppe und zur Vorhersage der Menge hybridisierter DNA. Das Regressionsmodell zeichnet sich durch kontinuierliche Lernfähigkeit und damit durch eine Verbesserung der Vorhersagequalität im Prozess der Anwendung aus. Ein Teil der Sonden repräsentiert intergenische DNA und bestätigt infolgedessen die Relevanz der zugrunde liegenden Strategie. Die Tatsache, dass ein großer Teil der von den Sonden repräsentierten Gene noch nicht annotiert ist, legt die Existenz bisher unentdeckter Faktoren mit Bedeutung für die Ausbildung entsprechender Virulenz-Phänotypen nahe. Ein weiteres Haupteinsatzgebiet von Microarrays ist die Genexpressionsanalyse. Die Größe von Genexpressionsdatenbanken ist in den vergangenen Jahren stark gewachsen. Obwohl sie eine Fülle von Expressionsdaten bieten, sind Ergebnisse aus unterschiedlichen Studien weiterhin schwer in einen übergreifenden Zusammenhang zu bringen. In Kapitel 6 wird die Methodik einer ausschließlich datenbasierten Meta-Analyse für genomweite A. thaliana Genexpressionsdatensätze dargestellt, die neue Erkenntnisse über Funktion und Regulation von Genen verspricht. Die Anwendung von Kernel-basierter Hauptkomponentenanalyse in Kombination mit hierarchischem Clustering identifizierte drei Hauptgruppen von Kontrastexperimenten mit jeweils überlappenden Expressionsmustern. In zwei Gruppen konnten deregulierte Gene wichtigen Funktionen bei Indol-3-Essigsäure (IAA) vermitteltem Pflanzenwachstum und -entwicklung sowie pflanzlicher Pathogenabwehr zugeordnet werden. Bisher funktionell nicht näher charakterisierte Serin-Threonin-Kinasen wurden über die Meta-Analyse mit der Pathogenabwehr assoziiert. Grundsätzlich kann dieser Ansatz versteckte Wechselbeziehungen zwischen Genen aufdecken, die unter verschiedenen Bedingungen reguliert werden. Bei der funktionellen Charakterisierung von Proteinen oder der Vorhersage von Genen in Genomsequenzen werden Hidden-Markov-Modelle (HMMs) eingesetzt. HMMs sind technisch ausgereift und in der computergestützten Biologie vielfach eingesetzt worden. Trotzdem birgt die Methodik das Potential zur Optimierung bezüglich der Modellierung biologischer Daten, die hinsichtlich der Längenverteilung ihrer Sequenzen variieren. Untereinheiten dieser Modelle, die Zustände, repräsentieren über ihre individuelle Verweildauer zugrunde liegende Verteilungen von Sequenzlängen. Kapitel 7 stellt eine Methode zur Anpassung einfacher HMM-Topologien an biologische Daten, die glockenkurvenartige Längenverteilungen zeigen, vor. Die Modellierung solcher Verteilungen wird dabei durch eine serielle Verkettung vervielfältigter Zustände gewährleistet, ohne dass die Klasse herkömmlicher HMMs verlassen wird. Auswertungen der Modellierungsleistung bei unterschiedlich stark optimierten HMM-Topologien unterstreichen die Bedeutung der entwickelten Topologieoptimierung. Zusammenfassend wird hier eine generelle Methodik beschrieben, die die Modelleigenschaften von HMMs über Topologieoptimierungen verbessert. Die Parameter dieser Optimierung werden mit Hilfe von Maximum-Likelihood und einem leicht einzubindenden Momentschätzer bestimmt. In Kapitel 8 wird die Anwendung von HMMs zur Vorhersage von Interaktionsstellen in Proteindomänen beschrieben. Wie bereits gezeigt wurde, sind solche Stellen aufgrund einer variablen Konserviertheit ihrer Position und ihres Typs schwer zu bestimmen. Eine Vorhersage von Interaktionstellen in Proteindomänen wird über die Definition einer neuen HMM-Topologie erreicht, die sowohl Sequenz- als auch Strukturdaten einbindet. Interaktionsstellen werden mit einem Posterior-Decoding-Algorithmus vorhergesagt, der zusätzliche Informationen über die Wahrscheinlichkeit einer Interaktion für alle Sequenzpositionen bereitstellt. Die Implementierung der Interaktionsprofil-HMMs (ipHMMs) basiert auf den etablierten Profil-HMMs und erbt deren Effizienz und Sensitivität. Eine groß angelegte Vorhersage von Interaktionsstellen mit ipHMMs konnte mutationsbedingte Fehlfunktionen in Proteinen erklären, die mit vererbbaren Krankheiten wie unterschiedlichen Tumortypen oder Muskeldystrophie assoziiert sind. Wie Profile-HMMs sind auch ipHMMs für groß angelegte Anwendungen geeignet. Insgesamt verbessert die HMM-gestützte Methode sowohl die Vorhersagequalität für Interaktionsstellen als auch das Verständnis molekularer Hintergründe bei vererbbaren Krankheiten. Im Hinblick auf aktuelle und zukünftige Anforderungen stelle ich in dieser Arbeit Lösungsansätze für eine umfassende Charakterisierung großer Mengen biologischer Daten vor. Alle beschriebenen Methoden zeichnen sich durch gute Übertragbarkeit auf verwandte Probleme aus. Besonderes Augenmerk wurde dabei auf den Wissenstransfer gelegt, der durch einen stetig wachsenden Fundus biologischer Information ermöglicht wird. Die angewandten und entwickelten statistischen Methoden sind lernfähig und profitieren von diesem Wissenszuwachs, Vorhersagequalität und Zuverlässigkeit der Ergebnisse verbessern sich. KW - Genomik KW - Hidden-Markov-Modell KW - Enterobacteriaceae KW - Genexpression KW - Microarray KW - Sequenzanalyse KW - diagnostischer Microarray KW - Sequence Analysis KW - diagnostic Microarray Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-39858 ER - TY - THES A1 - Engelmann, Julia Cathérine T1 - DNA microarrays: applications and novel approaches for analysis and interpretation T1 - DNA Mikroarrays: Anwendungen und neue Ansätze für die Analyse und Interpretation N2 - In der vorliegenden Dissertation wird die Entwicklung eines phylogenetischen DNA Microarrays, die Analyse von mehreren Microarray-Genexpressionsdatensätzen und neue Ansätze für die Datenanalyse und Interpretation der Ergebnisse vorgestellt. Die Entwicklung und Analyse der Daten eines phylogenetischen DNA Microarrays wird in der ersten Publikation dargestellt. Ich konnte zeigen, dass die Spezies-Detektion mit phylogenetischen Microarrays durch die Datenanalyse mit einem linearen Regressionsansatz signifikant verbessert werden kann. Standard-Methoden haben bislang nur Signalintensitäten betrachtet und eine Spezies als an- oder abwesend bezeichnet, wenn die Signalintensität ihres Messpunktes oberhalb eines willkürlich gesetzten Schwellenwertes lag. Dieses Verfahren ist allerdings aufgrund von Kreuz-Hybridisierungen nicht auf sehr nah verwandte Spezies mit hoher Sequenzidentität anwendbar. Durch die Modellierung des Hybridisierungs und Kreuz-Hybridisierungsverhaltens mit einem linearen Regressionsmodell konnte ich zeigen, dass Spezies mit einer Sequenzähnlichkeit von 97% im Markergen immer noch unterschieden werden können. Ein weiterer Vorteil der Modellierung ist, dass auch Mischungen verschiedener Spezies zuverlässig vorhergesagt werden können. Theoretisch sind auch quantitative Vorhersagen mit diesem Modell möglich. Um die großen Datenmengen, die in öffentlichen Microarray-Datenbanken abgelegt sind besser nutzen zu können, bieten sich Meta-Analysen an. In der zweiten Publikation wird eine explorative Meta-Analyse auf Arabidopsis thaliana-Datensätzen vorgestellt. Mit der Analyse verschiedener Datensätze, die den Einfluss von Pflanzenhormonen, Pathogenen oder verschiedenen Mutationen auf die Genexpression untersucht haben, konnten die Datensätze anhand ihrer Genexpressionsprofile in drei große Gruppen eingeordnet werden: Experimente mit Indol-3-Essigsäure (IAA), mit Pathogenen und andere Experimente. Gene, die charakteristisch für die Gruppe der IAA-Datensätze beziehungsweise für die Gruppe der Pathogen-Datensätze sind, wurden näher betrachtet. Diese Gene hatten Funktionen, die bereits mit Pathogenbefall bzw. dem Einfluss von IAA in Verbindung gebracht wurden. Außerdem wurden Hypothesen über die Funktionen von bislang nicht annotierten Genen aufgestellt. In dieser Arbeit werden auch Primäranalysen von einzelnen Arabidopsis thaliana Genexpressions-Datensätzen vorgestellt. In der dritten Publikation wird ein Experiment beschrieben, das durchgeführt wurde um herauszufinden ob Mikrowellen-Strahlung einen Einfluss auf die Genexpression einer Zellkultur hat. Dazu wurden explorative Analysemethoden angewendet. Es wurden geringe aber signifikante Veränderungen in einer sehr kleinen Anzahl von Genen beobachtet, die experimentell bestätigt werden konnten. Die Funktionen der regulierten Gene und eine Meta-Analyse mit öffentlich zugänglichen Datensätzen einer Datenbank deuten darauf hin, dass die pflanzliche Zellkultur die Strahlung als eine Art Energiequelle ähnlich dem Licht wahrnimmt. Des weiteren wird in der vierten Publikation die funktionelle Analyse eines Arabidopsis thaliana Genexpressionsdatensatzes beschrieben. Die Analyse der Genexpressions eines pflanzlichen Tumores zeigte, dass er seinen Stoffwechsel von aerob und auxotroph auf anaerob und heterotroph umstellt. Gene der Photosynthese werden im Tumorgewebe reprimiert, Gene des Aminosäure- und Fettstoffwechsels, der Zellwand und Transportkanäle werden so reguliert, dass Wachstum und Entwicklung des Tumors gefördert werden. In der fünften Publikation in dieser Arbeit wird GEPAT (Genome Expression Pathway Analysis Tool) beschrieben. Es besteht aus einer Internet- Anwendung und einer Datenbank, die das einfache Hochladen von Datensätzen in die Datenbank und viele Möglichkeiten der Datenanalyse und die Integration anderer Datentypen erlaubt. In den folgenden zwei Publikationen (Publikation 6 und Publikation 7) wird GEPAT auf humane Microarray-Datensätze angewendet um Genexpressionsdaten mit weiteren Datentypen zu verknüpfen. Genexpressionsdaten und Daten aus vergleichender Genom-Hybridisierung (CGH) von primären Tumoren von 71 Mantel-Zell-Lymphom (MCL) Patienten ermöglichte die Ermittlung eines Prädiktors, der die Vorhersage der Überlebensdauer von Patienten gegenüber herkömmlichen Methoden verbessert. Die Analyse der CGH Daten zeigte, dass auch diese für die Vorhersage der Überlebensdauer geeignet sind. Für den Datensatz von Patienten mit großzellig diffusem B-Zell-Lymphom DLBCL konnte aus den Genexpressionsdaten ebenfalls ein neuer Prädiktor vorgeschlagen werden. Mit den zwischen lang und kurz überlebenden Patienten differentiell exprimierten Genen der MCL Patienten und mit den Genen, die zwischen den beiden Untergruppen von DLBCL reguliert sind, wurden Interaktionsnetzwerke gebildet. Diese zeigen, dass bei beiden Krebstypen Gene des Zellzyklus und der Proliferation zwischen Patienten mit kurzer und langer Überlebensdauer unterschiedlich reguliert sind. N2 - In this thesis, the development of a phylogenetic DNA microarray, the analysis of several gene expression microarray datasets and new approaches for improved data analysis and interpretation are described. In the first publication, the development and analysis of a phylogenetic microarray is presented. I could show that species detection with phylogenetic DNA microarrays can be significantly improved when the microarray data is analyzed with a linear regression modeling approach. Standard methods have so far relied on pure signal intensities of the array spots and a simple cutoff criterion was applied to call a species present or absent. This procedure is not applicable to very closely related species with high sequence similarity because cross-hybridization of non-target DNA renders species detection impossible based on signal intensities alone. By modeling hybridization and cross-hybridization with linear regression, as I have presented in this thesis, even species with a sequence similarity of 97% in the marker gene can be detected and distinguished from related species. Another advantage of the modeling approach over existing methods is that the model also performs well on mixtures of different species. In principle, also quantitative predictions can be made. To make better use of the large amounts of microarray data stored in public databases, meta-analysis approaches need to be developed. In the second publication, an explorative meta-analysis exemplified on Arabidopsis thaliana gene expression datasets is presented. Integrating datasets studying effects such as the influence of plant hormones, pathogens and different mutations on gene expression levels, clusters of similarly treated datasets could be found. From the clusters of pathogen-treated and indole-3-acetic acid (IAA) treated datasets, representative genes were selected which pointed to functions which had been associated with pathogen attack or IAA effects previously. Additionally, hypotheses about the functions of so far uncharacterized genes could be set up. Thus, this kind of meta-analysis could be used to propose gene functions and their regulation under different conditions. In this work, also primary data analysis of Arabidopsis thaliana datasets is presented. In the third publication, an experiment which was conducted to find out if microwave irradiation has an effect on the gene expression of a plant cell culture is described. During the first steps, the data analysis was carried out blinded and exploratory analysis methods were applied to find out if the irradiation had an effect on gene expression of plant cells. Small but statistically significant changes in a few genes were found and could be experimentally confirmed. From the functions of the regulated genes and a meta-analysis with publicly available microarray data, it could be suspected that the plant cell culture somehow perceived the irradiation as energy, similar to perceiving light rays. The fourth publication describes the functional analysis of another Arabidopsis thaliana gene expression dataset. The gene expression data of the plant tumor dataset pointed to a switch from a mainly aerobic, auxotrophic to an anaerobic and heterotrophic metabolism in the plant tumor. Genes involved in photosynthesis were found to be repressed in tumors; genes of amino acid and lipid metabolism, cell wall and solute transporters were regulated in a way that sustains tumor growth and development. Furthermore, in the fifth publication, GEPAT (Genome Expression Pathway Analysis Tool), a tool for the analysis and integration of microarray data with other data types, is described. It consists of a web application and database which allows comfortable data upload and data analysis. In later chapters of this thesis (publication 6 and publication 7), GEPAT is used to analyze human microarray datasets and to integrate results from gene expression analysis with other datatypes. Gene expression and comparative genomic hybridization data from 71 Mantle Cell Lymphoma (MCL) patients was analyzed and allowed proposing a seven gene predictor which facilitates survival predictions for patients compared to existing predictors. In this study, it was shown that CGH data can be used for survival predictions. For the dataset of Diffuse Large B-cell lymphoma (DLBCL) patients, an improved survival predictor could be found based on the gene expression data. From the genes differentially expressed between long and short surviving MCL patients as well as for regulated genes of DLBCL patients, interaction networks could be set up. They point to differences in regulation for cell cycle and proliferation genes between patients with good and bad prognosis. KW - Microarray KW - Differentielle Genexpression KW - Genexpression KW - Statistische Analyse KW - Cluster-Analyse KW - Datenanalyse KW - Explorative Datenanalyse KW - Non-Hodgkin-Lymphom KW - B-Zell-Lymphom KW - Metabolom KW - Tumorklassifikation KW - Tumor KW - Krebs KW - Schmalwa KW - phylogenetische Arrays KW - Interaktionsnetzwerke KW - lineare Regression KW - DNA microarray KW - gene expression KW - statistical analysis KW - clustering KW - classification KW - interaction networks Y1 - 2008 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-29747 ER - TY - THES A1 - Busold, Christian T1 - Facilitating functional interpretation of microarray data by integration of gene annotations in Correspondence Analysis T1 - Verbesserte funktionelle Analyse von Microarraydaten mittels Integration von Gen-Annotationen in Korrespondenzanalyse N2 - DNS-Chips (’Microarrays’) haben sich zu einer der Standardmethoden zur Erstellung von genomweiten Expressionsstudien entwickelt. Mittlerweile wurden dazu eine Vielzahl von Methoden zur Identifizierung von differentiell regulierten Genen veröffentlicht. Ungeachtet dessen stellt die abschliessende funktionelle Interpretation der Ergebnisse einen der Engpässe in der Analyse von Chip-Daten dar. Die Mehrzahl der Analysemethoden stellt die signifikant regulierten Gene in Listen dar, aus denen in einem weiteren Schritt gemeinsame funktionelle Eigenschaften abgeleitet werden müssen. Dies stellt nicht nur eine arbeitsintensive Arbeit dar, die mit steigender Anzahl an experimentellen Konditionen immer weniger praktikabel wird, sondern ist auch fehleranfällig, da diese Auswertung im allgemeinen auf dem visuellen Vergleich von Listen beruht. In der vorliegenden Arbeit wurden Methoden für eine rechnergestützte Auswertung von funktionellen Geneigenschaften entwickelt und validiert. Hierzu wurde die ’Gene Ontology’ als Quelle für die Annotationsdaten ausgewählt, da hier die Daten in einem Format gespeichert sind, das sowohl eine leichte menschliche Interaktion sowie die statistische Analyse der Annotationen ermöglicht. Diese Genannotation wurden als Zusatzinformationen in die Korrespondenzanalyse integriert, welches eine simultane Darstellung von Genen, Hybridisierungen und funktionellen Kategorien in einer Grafik ermöglicht. Aufgrund der ständig wachsenden Anzahl an verfügbaren Annotationen und der Tatsache, daß zwischen den meisten experimentellen Bedingungen nur wenige funktionelle Prozesse differentiell reguliert sind, wurden Filter entwickelt, die die Anzahl der dargestellten Annotationen auf eine im gegebenen experimentellen Kontext relevante Gruppe reduzieren. Die Anwendbarkeit der Visualisierung und der Filter wurde auf Datensätzen unterschiedlicher Komplexität getestet: beginnend mit dem gut verstandenen Glukosestoffwechsel im Modellorganismus S. cerevisiae, bis hin zum Vergleich unterschiedlicher Tumortypen im Menschen. In beiden Fällen generierte die Methode gut zu interpretierende Grafiken, in denen die funktionellen Hauptunterschiede durch die dargestellten Annotationen gut beschrieben werden [90]. Während die Integration von Annotationsdaten wie GO die funktionelle Interpretation vereinfacht, fehlt die Möglichkeit zur Identifikation einzelner relevanter Schlüsselgene. Um eine solche Analyse zu ermöglichen, wurden Daten zum Vorkommen von Transskriptionsfaktorbindestellen in den 5’-Bereichen von Genen integriert. Auch diese Methode wurde an Datensätzen von S. cerevisiae und vergleichenden Studien von humanen Krebszelllinien validiert.In beiden Fällen konnten Transkriptionsfaktoren identifiziert werden, die für die beobachteten transkriptionellen Unterschiede von entscheidender Bedeutung sind [206]. Zusammenfassend, ermöglicht die Integration von Zusatzinformationen in die Korrespondenzanalyse eine simultane Visualisierung von Genen, Hybridisierungen und Annotationsdaten in einer einzigen, gut zu interpretierenden Grafik. Dies erlaubt auch in komplexen experimentellen Bedingungen eine intuitive Identifizierung von relevanten Annotationen. Der hier vorgestellte Ansatz, ist nicht auf die gezeigten Datenstrukturen beschränkt, sondern kann auf die Mehrzahl der verfügbaren Annotationsdaten angewendet werden. N2 - DNA microarrays have become a standard technique to assess the mRNA levels for complete genomes. To identify significantly regulated genes from these large amounts of data a wealth of methods has been developed. Despite this, the functional interpretation (i.e. deducing biological hypothesis from the data) still remains a major bottleneck in microarray data analysis. Most available methods display the set of significant genes in long lists, from which common functional properties have to be extracted. This is not only a tedious and time-consuming task, which becomes less and less feasible with increasing numbers of experimental conditions, but is also prone to errors, since it is commonly done by eye. In the course of this work methods have been developed and tested, that allow for a computerbased analysis of functional properties being relevant in the given experimental setting. To this end the Gene Ontology was chosen as an appropriate source of annotation data, because it combines human-readability with computer-accessibility of the annotations term and thus allows for a statistical analysis of functional properties. Here the gene-annotations are integrated in a Correspondence Analysis which allows to visualize genes, hybridizations and functional categories in a single plot. Due to the increasing amounts of available annotations and the fact that in most settings only few functional processes are differentially regulated, several filter criteria have been developed to reduce the number of displayed annotations to a set being relevant in the given experimental setting. The applicability of the presented visualization and filtering have both been validated on datasets of varying complexity. Starting from the well studied glucose-pathway in S. cerevisiae up to the comparison of different tumor types in human. In both settings the method generated well interpretable plots, which allowed for an immediate identification of the major functional differences between the experimental conditions [90]. While the integration of annotation data like GO facilitates functional interpretation, it lacks the capability to identify key regulatory elements. To facilitate such an analysis, the occurrence of transcription factor binding sites in upstream regions of genes has been integrated to the analysis as well. Again this methodology was biologically validated on S. cerevisiae as well human cancer data sets. In both settings TFs known to exhibit central roles for the observed transcriptional changes were plotted in marked positions and thus could be immediately identified [206]. In essence, integration of supplementary information in Correspondence Analysis visualizes genes, hybridizations and annotation data in a single, well interpretable plot. This allows for an intuitive identification of relevant annotations even in complex experimental settings. The presented approach is not limited to the shown types of data, but is generalizable to account for the majority of the available annotation data. KW - Microarray KW - DNS KW - Genexpression KW - Auswertung KW - Microarray Analyse KW - GO-Annotationen KW - funktionelle Analyse KW - Korrespondenzanalyse KW - microarray data analysis KW - GO-annotations KW - functional interpretation KW - correspondence analysis Y1 - 2006 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-21150 ER -