TY - THES A1 - Hokema, Anna T1 - Beeinflussung der Genexpression verschiedener Gene durch Xmrk in Pigmentzelltumoren bei Oryzias latipes T1 - The effect of Xmrk on the gene expression of various genes in pigment cell tumors in oryzias latipes N2 - Ziel dieser Arbeit ist es ein besseres Verständinis der molekularen Prozesse der Melanomentstehung und Tumorprogression zu gewinnen. Hierfür wurde ein Tiermodell transgener Medakas (Oryzias latipes) verwendet, welche als stabiles Transgen das Konstrukt mitf::xmrk besitzen. Diese Fische entwickelten Pigmentzelltumore, welche für eine Microarrayanalyse herangezogen wurden. Aus diesem Microarraydatensatz wurden 11 Gene ausgewählt, welche in dieser Arbeit näher untersucht wurden. Beobachtungen haben ergeben, dass sich bei transgenen Medakas, welche Xmrk exprimieren, verschiedene pigmentierte Hauttumore entwickeln. Diese Tumore wurden je nach ihrem verschiedenen Histiotyp klassifiziert und untersucht. Um einen Eindruck zu gewinnen, wie Xmrk die Transkription verschiedener Gene, welche in der Krebsentstehung und –progression eine wichtige Rolle spielen, beeinflusst, wurden pigmentierte Hauttumore transgener Medakas, so wie zu Vergleichszwecken hyperpigmentierte Haut transgener Medakas und Lymphome und gesunde Organe von Wildtyp-Medakas, untersucht. Mit Hilfe von Real-time-PCR’s wurden die folgenden Gene untersucht: G6PC, GAMT, GM2A, MAPK3, NID1, SLC24A5, SPP1, PDIA4, RASL11B, TACC2 und ZFAND5. Dabei konnte festgestellt werden, dass die Expression der Gene GM2A, MAPK3, NID1, PDIA4, RASL11B, SLC24A5 und ZFAND5 von Xmrk beeinflusst wird, während dies für die Gene G6PC, GAMT, SPP1 und TACC2 nicht zutrifft. Im Vergleich zu gesunder Haut werden GM2A, MAPK3, PDIA4, RASL11B, SLC24A5 und ZFAND5 in Tumoren höher exprimiert. Die Gene G6PC, GAMT, NID1, SPP1 und TACC2 werden dagegen verglichen mit gesunder Haut unverändert oder niedriger exprimiert. Die Bedeutung der erhöhten Genexpression lässt sich in vielen Fällen zurzeit nur theoretisch erfassen. Eine höhere Expression von SLC24A5 beispielsweise lässt vermuten, dass ein Zusammenhang zwischen der Melaninproduktion und der Zellproliferation besteht. Die Überexpression von GM2A weist dagegen auf eine Rolle von GM2A als Tumormarker hin. Dahingegen scheint die erniedrigte Expression von GAMT und G6PC Auskunft über den veränderten Stoffwechsel in Tumoren zu geben. Um diese Ergebnisse zu bestätigen und zu entschlüsseln wie genau Xmrk die Expression der getesteten Gene beeinflusst, sind allerdings noch weitere funktionelle Studien nötig. Generell kommt man zu dem Schluss, dass die Genexpression sich in jedem Tumor unterscheidet. Daher scheint jeder Tumor seinen eigenen Evolutionsweg zu beschreiten. N2 - Target of this work is to get a better understanding in melanomagenesis and tumorprogression. Therefore a model of transgenic medakas (Oryzias latipes) was used, wich had the construct mitf::Xmrk as a stable, integrated transgen. Those fishes developed pigmentcelltumors that, wich where used in a microarrayanalysis. Of the results of this microarray 11 genes where chosen and analysed in this study. Those transgenic medakas which got xmrk injected, but without a tumorsuppresorgen, developed various pigmented kinds of skin cancer. Those tumors were analysed equally to their histiotyps. To get an idea, how Xmrk effects the transcription of several genes, which play an important role in tumor development and progression, pigmented skin cancer of transgenic medakas and for comparison, hyper pigmented skin of transgenic medakas and also lymphoma and healthy organs where tested. The following genes where tested by real-time-PCR: G6PC, GAMT, GM2A, MAPK3, NID1, SLC24A5, SPP1, PDIA4, RASL11B, TACC2 and ZFAND5. It was noticed that the expression of the genes GM2A, MAPK3, NID1, PDIA4, RASL11B, SLC24A5 und ZFAND5 gets modified by Xmrk. In contrast the genes G6PC, GAMT, SPP1 and TACC2 didn't. In comparison to healthy skin GM2A, MAPK3, PDIA4, RASL11B, SLC24A5 and ZFAND5 got higher expressed in tumors. Indeed the expression level of the genes G6PC, GAMT, NID1, SPP1 and TACC2 is the same or even lower than in healthy skin. The meaning of the higher gen expression can currently just be theoretically conceived. The higher expression of SLC24A5 for example leads to guess that there is a link between the production of melanin and cell proliferation. The overexpression of GM2A shows that GM2A plays maybe a role as an tumor marker. However the lower expression of G6PC and GAMT gets references about the metabolism in cancer. To fix this results and get an better understanding how Xmrk affects the expression of this genes, additional funktional studies are necessary. The result is that gene expression differs in each tumor. A common conclusion is not possible. It appears that each tumor goes its own evolutionary way. KW - Japankärpfling KW - Melanom KW - Hauttumor KW - Genexpression KW - Real time quantitative PCR KW - Onkogen KW - Xmrk KW - Xmrk Y1 - 2011 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-75616 ER - TY - THES A1 - Kirchmaier, Bettina Carmen T1 - Characterization of the Popeye domain containing gene family in zebrafish T1 - Charakterisierung der Popeye domain containing Genfamilie im Zebrafisch N2 - The Popeye domain containing (Popdc) gene family of membrane proteins is predominantly expressed in striated and smooth muscle tissues and has been shown to act as novel cAMP-binding proteins. In mice, loss of Popdc1 and Popdc2, respectively, affects sinus node function in the postnatal heart in an age and stress-dependent manner. In this thesis, I examined gene expression pattern and function of the Popdc gene family during zebrafish development with an emphasis on popdc2. Expression of the zebrafish popdc2 was exclusively present in cardiac and skeletal muscle during cardiac development, whereas popdc3 was expressed in striated muscle tissue and in distinct regions of the brain. In order to study the function of these genes, an antisense morpholino-based knockdown approach was used. Knockdown of popdc2 resulted in aberrant development of facial and tail musculature. In the heart, popdc2 morphants displayed irregular ventricular contractions with 2:1 and 3:1 ventricular pauses. Recordings of calcium transients using a transgenic indicator line Tg(cmlc2:gCaMP)s878 and selective plane illumination microscopy (SPIM) revealed the presence of an atrioventricular (AV) block in popdc2 morphants as well as a complete heart block. Interestingly, preliminary data revealed that popdc3 morphants developed a similar phenotype. In order to find a morphological correlate for the observed AV conduction defect, I studied the structure of the AV canal in popdc2 morphants using confocal analysis of hearts of the transgenic line Tg(cmlc2:eGFP-ras)s883, which outlines individual cardiac myocytes with the help of membrane-localized GFP. However, no evidence for morphological alterations was obtained. To ensure that the observed arrhythmia phenotype in the popdc2 morphant was based on a myocardial defect and not caused by defective valve development, live imaging was performed revealing properly formed valves. Thus, in agreement with the data obtained in knockout mice, popdc2 and popdc3 genes in zebrafish are involved in the regulation of cardiac electrical activity. However, both genes are not required for cardiac pacemaking, but they play essential roles in AV conduction. In order to elucidate the biological importance of cAMP-binding, wild type Popdc1 as well as mutants with a significant reduction in binding affinity for cAMP in vitro were overexpressed in zebrafish embryos. Expression of wild type Popdc1 led to a cardiac insufficiency phenotype characterized by pericardial edema and venous blood retention. Strikingly, the ability of the Popdc1 mutants to induce a cardiac phenotype correlated with the binding affinity for cAMP. These data suggest that cAMP-binding represents an important biological property of the Popdc protein family. N2 - Die Popeye domain containing (Popdc) Gene kodieren für eine Familie von Membranproteinen, die vorwiegend in der gestreiften und glatten Muskulatur exprimiert werden und in der Lage sind cAMP zu binden. In Mäusen resultiert der Verlust von Popdc1 oder Popdc2 in einer stressinduzierten Sinusknotendysfunktion, die sich altersabhängig entwickelt. In meiner Dissertation habe ich das Expressionsmuster und die Funktion der Popdc Genfamilie mit Schwerpunkt auf dem popdc2-Gen im Zebrafisch untersucht. Das popdc2-Gen im Zebrafisch wurde ausschließlich in der Herz- und Skelettmuskulatur exprimiert, während popdc3 sowohl in der quergestreiften Muskulatur, als auch im Gehirn exprimiert wurde. Um die Funktion dieser Gene zu untersuchen, wurde die Prozessierung der prä-mRNA mit Hilfe von Morpholinos unterdrückt, die gegen die Spleißdonor bzw. -akzeptorsequenzen von popdc2 und popdc3 gerichtet waren. Das Fehlen von popdc2 im Zebrafisch resultierte in einer Fehlentwicklung der Gesichts- und Schwanzmuskulatur. Im Herzen der popdc2-Morphanten waren ventrikuläre Überleitungsstörungen mit einem 2:1 oder 3:1 Rhythmus zu beobachten. Analysen der Calciumfreisetzung mittels SPIM (selective plane illumination microscopy) in der transgenen Zebrafischlinie Tg(cmlc2:gCaMP)s878, die einen fluoreszierenden Calciumindikator exprimiert, zeigten in den popdc2-Morphanten einen AV-Block bis hin zum kompletten Herzblock. Interessanterweise ergaben vorläufige Analysen in popdc3-Morphanten einen ähnlichen Phänotyp. Um eine mögliche morphologische Ursache der beobachteten AV-Überleitungsstörung zu finden, habe ich die Struktur des AV-Kanals von popdc2-Morphanten mit Hilfe der transgenen Zebrafischlinie Tg(cmlc2:eGFP-rass883) und konfokaler Mikroskopie untersucht. Allerdings konnte ich kein Anzeichen für morphologische Veränderungen erkennen. Um sicherzugehen, dass der beobachtete Rhythmusphänotyp der popdc2-Morphanten nicht auf einer myokardialen Störung beruht oder auf einem Defekt bei der Klappenentwicklung, wurden zusätzlich Lebendaufnahmen angefertigt, die zeigten, dass die Klappen normal entwickelt waren. In Übereinstimmung mit den Daten aus den Knockout-Mäusen haben die popdc2- und popdc3-Gene auch im Zebrafisch eine wichtige Funktion bei der elektrischen Reizleitung im Herzen. Allerdings sind die beiden Gene für die Erregungsbildung im Sinusknoten nicht essentiell, sondern werden für die Signalübertragung im AV-Kanal benötigt. Um die biologische Signifikanz der cAMP-Bindung zu untersuchen, wurden Wildtyp-Popdc1 und Punktmutanten, die eine Reduktion in der cAMP-Bindung aufweisen, nach RNA-Injektion in Zebrafischembryonen überexprimiert. Die Injektion von Wildtyp-Popdc1 induzierte eine embryonale Herzinsuffizienz, die durch perikardiales Ödem und venösen Blutstau charakterisiert war. Die Fähigkeit der Popdc1-Punktmutanten, einen Herzphänotyp nach Überexpression zu induzieren, war direkt korreliert mit der Bindungsaffinität für cAMP. Diese Daten lassen den Schluss zu, dass die Fähigkeit der cAMP-Bindung eine wichtige biologische Eigenschaft der Popdc-Proteinfamilie darstellt. KW - Zebrabärbling KW - Genexpression KW - Herzmuskel KW - Herz KW - Popdc Genfamilie KW - heart KW - popdc gene family Y1 - 2010 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-49413 ER - TY - THES A1 - Jauch, Mandy T1 - Die Serin/Arginin Proteinkinase 79D (SRPK79D) von Drosophila melanogaster und ihre Rolle bei der Bildung Aktiver Zonen von Synapsen T1 - The serine/arginine protein kinase 79D (SRPK79D) of Drosophila melanogaster and its role in the formation of active zones of synapses N2 - Synapsen als Stellen der Kommunikation zwischen Neuronen besitzen spezialisierte Bereiche – Aktive Zonen (AZs) genannt –, die aus einem hoch komplexen Netzwerk von Proteinen aufgebaut sind und die Maschinerie für den Prozess der Neurotransmitter-Ausschüttung und das Vesikel-Recycling beinhalten. In Drosophila ist das Protein Bruchpilot (BRP) ein wichtiger Baustein für die T-förmigen Bänder („T-Bars“) der präsynaptischen Aktiven Zonen. BRP ist notwendig für eine intakte Struktur der Aktiven Zone und eine normale Exocytose von Neurotransmitter-Vesikeln. Auf der Suche nach Mutationen, welche die Verteilung von Bruchpilot im Gewebe beeinträchtigen, wurde eine P-Element-Insertion im Gen CG11489 an der Position 79D identifiziert, welches eine Kinase kodiert, die einen hohen Grad an Homologie zur Familie der SR Proteinkinasen (SRPKs) von Säugern aufweist. Die Mitglieder dieser Familie zeichnen sich durch eine evolutionär hoch konservierte zweigeteilte Kinasedomäne aus, die durch eine nicht konservierte Spacer-Sequenz unterbrochen ist. SRPKs phosphorylieren SR-Proteine, die zu einer evolutionär hoch konservierten Familie Serin/Arginin-reicher Spleißfaktoren gehören und konstitutive sowie alternative Spleißprozesse steuern und damit auf post-transkriptioneller Ebene die Genexpression regulieren. Mutation des Srpk79D-Gens durch die P-Element-Insertion (Srpk79DP1) oder eine Deletion im Gen (Srpk79DVN Nullmutante) führt zu auffälligen BRP-Akkumulationen in larvalen und adulten Nerven. In der vorliegenden Arbeit wird gezeigt, dass diese BRP-Akkumulationen auf Ultrastruktur-Ebene ausgedehnten axonalen Agglomeraten elektronendichter Bänder entsprechen und von klaren Vesikeln umgeben sind. Charakterisierung durch Immuno-Elektronenmikroskopie ergab, dass diese Strukturen BRP-immunoreaktiv sind. Um die Bildung BRP-enthaltender Agglomerate in Axonen zu verhindern und damit eine intakte Gehirnfunktion zu gewährleisten, scheint die SRPK79D nur auf niedrigem Niveau exprimiert zu werden, da die endogene Kinase mit verschiedenen Antikörpern nicht nachweisbar war. Wie in anderen Arbeiten gezeigt werden konnte, ist die Expression der PB-, PC- oder PF-Isoform der vier möglichen SRPK79D-Varianten, die durch alternativen Transkriptionsstart in Exon eins beziehungsweise drei und alternatives Spleißen von Exon sieben zustande kommen, zur Rettung des Phänotyps der BRP-Akkumulation im Srpk79DVN Nullmutanten-Hintergrund ausreichend. Zur Charakterisierung der Rescue-Eigenschaften der SRPK79D-PE-Isoform wurde mit der Klonierung der cDNA in einen UAS-Vektor begonnen. Offenbar beruht die Bildung der axonalen BRP-Agglomerate nicht auf einer Überexpression von BRP in den betroffenen Neuronen, denn auch bei reduzierter Expression des BRP-Proteins im Srpk79DVN Nullmutanten-Hintergrund entstehen die BRP-Agglomerate. In Köpfen der Srpk79DVN Nullmutante ist die Gesamtmenge an Bruchpilot-Protein im Vergleich zum Wildtyp nicht deutlich verändert. Auch die auf Protein-Ebene untersuchte Expression der verschiedenen Isoformen der präsynaptischen Proteine Synapsin, Sap47 und CSP weicht in der Srpk79DVN Nullmutante nicht wesentlich von der Wildtyp-Situation ab, sodass sich keine Hinweise auf verändertes Spleißen der entsprechenden prä-mRNAs ergeben. Jedes der sieben bekannten SR-Proteine von Drosophila ist ein potentielles Zielprotein der SRPK79D. Knock-down-Experimente für die drei hier untersuchten SR-Proteine SC35, X16/9G8 und B52/SRp55 im gesamten Nervensystem durch RNA-Interferenz zeigten allerdings keinen Effekt auf die Verteilung von BRP im Gewebe. Hinsichtlich der Flugfähigkeit der Tiere hat die Srpk79DVN Nullmutation keinen additiven Effekt zum Knock-down des BRP-Proteins, denn die Doppelmutanten zeigten bei der Bestimmung des Anteils an flugunfähigen Tieren vergleichbare Werte wie die Einzelmutanten, die entweder die Nullmutation im Srpk79D-Gen trugen, oder BRP reduziert exprimierten. Vermutlich sind Bruchpilot und die SR Proteinkinase 79D somit Teil desselben Signalwegs. Durch Doppelfärbungen mit Antikörpern gegen BRP und CAPA-Peptide wurde abschließend entdeckt, dass Bruchpilot auch im Median- und Transvers-Nervensystem (MeN/TVN) von Drosophila zu finden ist, welche die Neurohämal-Organe beherbergen. Aufgabe dieser Organe ist die Speicherung und Ausschüttung von Neuropeptid-Hormonen. Daher ist zu vermuten, dass das BRP-Protein neben Funktionen bei der Neurotransmitter-Exocytose möglicherweise eine Rolle bei der Ausschüttung von Neuropeptiden spielt. Anders als in den Axonen der larvalen Segmental- und Intersegmentalnerven der Srpk79DVN Nullmutante, die charakteristische BRP-Agglomerate aufweisen, hat die Mutation des Srpk79D-Gens in den Axonen der Va-Neurone, die das MeN/TVN-System bilden, keinen sichtbaren Effekt auf die Verteilung von Brp, denn das Muster bei Färbung gegen BRP weist keine deutlichen Veränderungen zum Wildtyp auf. N2 - Synapses as sites of communication between neurons contain specialized regions termed active zones (AZs) which are composed of a highly complex network of proteins comprising the exocytotic machinery for neurotransmitter release and vesicle recycling. In Drosophila the Bruchpilot (BRP) protein is an important building block of the T-shaped ribbons („T-bars“) at presynaptic active zones. By screening for mutations affecting the tissue distribution of Bruchpilot, a P-transposon insertion in the Srpk gene at the position 79D has been identified (Srpk79D, CG11489). This gene codes for a kinase which shows high homology to the mammalian family of serine/arginine protein kinases (SRPKs). Members of this family have an evolutionarily highly conserved bipartite kinase domain in common which is separated by a non-conserved spacer sequence. SRPKs phosphorylate SR proteins, an evolutionarily highly conserved family of serine/arginine-rich splicing factors that control the processes of constitutive and alternative splicing. Mutation of the Srpk79D gene caused by the P-element insertion (Srpk79DP1) or by a deletion in the gene (Srpk79DVN null mutant) leads to conspicuous accumulations of BRP in larval and adult axons. This thesis shows that these BRP accumulations at the ultrastructural level correspond to extensive axonal agglomerates of electron-dense ribbons surrounded by clear vesicles. Using immuno electron microscopy, these accumulation were characterized as BRP immuno-reactive structures. To prevent the assembly of BRP containing agglomerates in axons and to maintain intact brain function the SRPK79D seems to be expressed only at low levels because the endogenous kinase was not detectable using various antibodies. It was shown in other thesis that the expression of the PB, PC or PF isoform of the four possible SRPK79D variants resulting from two alternative transcription start sites in exon one and three, respectively, and alternative splicing of exon seven is sufficient to rescue the phenotype of BRP accumulation in the Srpk79DVN null-mutant background. Cloning of the cDNA for the SRPK79D-PE isoform into a UAS vector has been started in order to characterize the ability of this isoform to rescue the BRP-phenotype. It seems as if the formation of axonal BRP agglomerates is not due to BRP overexpression in the affected neurons as was shown by reduced expression of the BRP protein in the Srpk79DVN null-mutant background which still leads to BRP agglomerates. The overall amount of Bruchpilot protein in adult heads of the Srpk79DVN null mutant is not clearly altered compared to wild type. No clear alteration was observed between Srpk79DVN null-mutant and wild-type flies comparing the expression of different presynaptic proteins like Synapsin, Synapse-associated protein of 47 kDa (Sap47), and Cysteine string protein (CSP). The experiment does not point towards altered splicing of the corresponding pre-mRNAs. Each of the seven known SR proteins of Drosophila is a potential target protein of the SRPK79D. Pan-neuronal knock-down experiments for the three SR proteins SC35, X16/9G8, and B52/SRp55 investigated in this thesis by RNA interference did not show an effect on the tissue distribution of BRP. It was shown that the Srpk79DVN null mutation has no additive effect on the knock-down of the BRP protein regarding the flight ability of the respective animals because the double mutants showed similar values of non-flyers as each of the single mutants with either null mutation of the Srpk79D gene or knock-down of BRP. Presumably, Bruchpilot and the SR protein kinase 79D are part of the same signaling pathway. Performing double fluorescence stainings with antibodies against BRP and the CAPA peptides it was shown that Bruchpilot is also present in the median and transverse nerve system (MeN/TVN) of Drosophila containing the neurohaemal organs. These organs are responsible for storage and release of neuropeptide hormones. In contrast to the larval segmental and intersegmental nerves of the Srpk79DVN null mutant which show characteristic BRP agglomerates, mutation of the Srpk79D gene does not affect the distribution of BRP in the axons of the Va neurons which form the MeN/TVN system. The staining pattern of BRP in these nerves does not show clear alterations in the Srpk79DVN null mutant compared to wild type. The finding that BRP is present in the median and transverse nerve system opens the field for speculation of a role for the Bruchpilot protein not only in the neurotransmitter exocytosis but also in the release of neuropeptides. KW - Taufliege KW - Serin KW - Arginin KW - Proteinkinasen KW - Synapse KW - Genexpression KW - Aktive Zone KW - Serin/Arginin Proteinkinase KW - SRPK KW - Bruchpilot KW - Drosophila KW - Synapse KW - Motorische Endplatte KW - Nervenzelle KW - Neurotransmitter KW - active zone KW - serine/arginine protein kinase KW - SRPK KW - Bruchpilot Y1 - 2010 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-53974 ER - TY - THES A1 - Vainshtein, Yevhen T1 - Applying microarray‐based techniques to study gene expression patterns: a bio‐computational approach T1 - Anwendung von Mikroarrayanalysen um Genexpressionsmuster zu untersuchen: Ein bioinformatischer Ansatz N2 - The regulation and maintenance of iron homeostasis is critical to human health. As a constituent of hemoglobin, iron is essential for oxygen transport and significant iron deficiency leads to anemia. Eukaryotic cells require iron for survival and proliferation. Iron is part of hemoproteins, iron-sulfur (Fe-S) proteins, and other proteins with functional groups that require iron as a cofactor. At the cellular level, iron uptake, utilization, storage, and export are regulated at different molecular levels (transcriptional, mRNA stability, translational, and posttranslational). Iron regulatory proteins (IRPs) 1 and 2 post-transcriptionally control mammalian iron homeostasis by binding to iron-responsive elements (IREs), conserved RNA stem-loop structures located in the 5’- or 3‘- untranslated regions of genes involved in iron metabolism (e.g. FTH1, FTL, and TFRC). To identify novel IRE-containing mRNAs, we integrated biochemical, biocomputational, and microarray-based experimental approaches. Gene expression studies greatly contribute to our understanding of complex relationships in gene regulatory networks. However, the complexity of array design, production and manipulations are limiting factors, affecting data quality. The use of customized DNA microarrays improves overall data quality in many situations, however, only if for these specifically designed microarrays analysis tools are available. Methods In this project response to the iron treatment was examined under different conditions using bioinformatical methods. This would improve our understanding of an iron regulatory network. For these purposes we used microarray gene expression data. To identify novel IRE-containing mRNAs biochemical, biocomputational, and microarray-based experimental approaches were integrated. IRP/IRE messenger ribonucleoproteins were immunoselected and their mRNA composition was analysed using an IronChip microarray enriched for genes predicted computationally to contain IRE-like motifs. Analysis of IronChip microarray data requires specialized tool which can use all advantages of a customized microarray platform. Novel decision-tree based algorithm was implemented using Perl in IronChip Evaluation Package (ICEP). Results IRE-like motifs were identified from genomic nucleic acid databases by an algorithm combining primary nucleic acid sequence and RNA structural criteria. Depending on the choice of constraining criteria, such computational screens tend to generate a large number of false positives. To refine the search and reduce the number of false positive hits, additional constraints were introduced. The refined screen yielded 15 IRE-like motifs. A second approach made use of a reported list of 230 IRE-like sequences obtained from screening UTR databases. We selected 6 out of these 230 entries based on the ability of the lower IRE stem to form at least 6 out of 7 bp. Corresponding ESTs were spotted onto the human or mouse versions of the IronChip and the results were analysed using ICEP. Our data show that the immunoselection/microarray strategy is a feasible approach for screening bioinformatically predicted IRE genes and the detection of novel IRE-containing mRNAs. In addition, we identified a novel IRE-containing gene CDC14A (Sanchez M, et al. 2006). The IronChip Evaluation Package (ICEP) is a collection of Perl utilities and an easy to use data evaluation pipeline for the analysis of microarray data with a focus on data quality of custom-designed microarrays. The package has been developed for the statistical and bioinformatical analysis of the custom cDNA microarray IronChip, but can be easily adapted for other cDNA or oligonucleotide-based designed microarray platforms. ICEP uses decision tree-based algorithms to assign quality flags and performs robust analysis based on chip design properties regarding multiple repetitions, ratio cut-off, background and negative controls (Vainshtein Y, et al., 2010). N2 - Die Regulierung und Aufrechterhaltung der Eisen-Homeostase ist bedeutend für die menschliche Gesundheit. Als Bestandteil des Hämoglobins ist es wichtig für den Transport von Sauerstoff, ein Mangel führt zu Blutarmut. Eukaryotische Zellen benötigen Eisen zum Überleben und zum Proliferieren. Eisen ist am Aufbau von Hämo- und Eisenschwefelproteinen (Fe-S) beteiligt und kann als Kofaktor dienen. Die Aufnahme, Nutzung, Speicherung und der Export von Eisen ist zellulär auf verschiedenen molekularen Ebenen reguliert (Transkription, mRNA-Level, Translation, Protein-Level). Die iron regulatory proteins (IRPs) 1 und 2 kontrollieren die Eisen-Homeostase in Säugetieren posttranslational durch die Bindung an Iron-responsive elements (IREs). IREs sind konservierte RNA stem-loop Strukturen in den 5' oder 3' untranslatierten Bereichen von Genen, die im Eisenmetabolismus involviert sind (z.B. FTH1, FTL und TFRC). In dieser Arbeit wurden biochemische und bioinformatische Methoden mit Microarray-Experimenten kombiniert, um neue mRNAs mit IREs zu identifizieren. Genexpressionsstudien verbessern unser Verständnis über die komplexen Zusammenhänge in genregulatorischen Netzwerken. Das komplexe Design von Microarrays, deren Produktion und Manipulation sind dabei die limitierenden Faktoren bezüglich der Datenqualität. Die Verwendung von angepassten DNA Microarrays verbessert häufig die Datenqualität, falls entsprechende Analysemöglichkeiten für diese Arrays existieren. Methoden Um unser Verständnis von eisenregulierten Netzwerken zu verbessern, wurde im Rahmen dieses Projektes die Auswirkung einer Behandlung mit Eisen bzw. von Knockout Mutation unter verschiedenen Bedingungen mittels bioinformatischer Methoden untersucht. Hierfür nutzen wir Expressionsdaten aus Microarray-Experimenten. Durch die Verknüpfung von biochemischen, bioinformatischen und Microarray Ansätzen können neue Proteine mit IREs identifiziert werden. IRP/IRE messenger Ribonucleoproteine wurden immunpräzipitiert. Die Zusammensetzung der enthaltenen mRNAs wurde mittels einem IronChip Microarray analysiert: Für diesen Chip wurden bioinformatisch Gene vorhergesagt, die IRE-like Motive aufweisen. Der Chip wurde mit solchen Oligonucleotiden beschichtet und durch Hybridisierung überprüft, ob die präzipitierten mRNA sich hieran binden. Die Analyse der erhaltenen Daten erfordert ein spezialisiertes Werkzeug um von allen Vorteilen der angepassten Microarrays zu profitieren. Ein neuer Entscheidungsbaum-basierter Algorithmus wurde in Perl im IronChip Evaluation Package (ICEP) implementiert. Ergebnisse Aus großen Sequenz-Datenbanken wurden IRE-like Motive identifiziert. Dazu kombiniert der Algorithmus, insbesondere RNA-Primärsequenz und RNA-Strukturdaten. Solche Datenbankanalysen tendieren dazu, eine große Anzahl falsch positiver Treffer zu generieren. Daher wurden zusätzliche Bedingungen formuliert, um die Suche zu verfeinern und die Anzahl an falsch positiven Treffer zu reduzieren. Die angepassten Suchkriterien ergaben 15 IRE-like Motive. In einem weiteren Ansatz verwendeten wir eine Liste von 230 IRE-like Sequenzen aus UTR-Datenbanken. Daraus wurden 6 Sequenzen ausgewählt, die auch im unteren Teil stabil sind (untere Helix über 6 bp stabil). Die korrespondierenden Expressed Sequence Tags (ESTs) wurden auf die humane oder murine Version des IronChips aufgetragen. Die Microarray Ergebnisse wurden mit dem ICEP Programm ausgewertet. Unsere Ergebnisse zeigen, dass die Immunpräzipitation mit anschließender Microarrayanalyse ein nützlicher Ansatz ist, um bioinformatisch vorhergesagte IRE-Gene zu identifizieren. Darüber hinaus ermöglicht uns dieser Ansatz die Detektion neuer mRNAs, die IREs enthalten, wie das von uns gefundene Gen CDC14A (Sanchez et al., 2006). ICEP ist ein optimiertes Programmpaket aus Perl Programmen (Vainshtein et al., BMC Bioinformatics, 2010). Es ermöglicht die einfache Auswertung von Microarray Daten mit dem Fokus auf selbst entwickelten Microarray Designs. ICEP diente für die statistische und bioinformatische Analyse von selbst entwickelten IronChips, kann aber auch leicht an die Analyse von oligonucleotidbasierten oder cDNA Microarrays adaptiert werden. ICEP nutzt einen Entscheidungsbaum-basierten Algorithmus um die Qualität zu bewerten und führt eine robuste Analyse basierend auf Chipeigenschaften, wie mehrfachen Wiederholungen, Signal/Rausch Verhältnis, Hintergrund und Negativkontrollen durch. KW - Microarray KW - Genexpression KW - Bioinformatik KW - geneexpression KW - microarrays KW - IronChip KW - ICEP Y1 - 2010 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-51967 ER - TY - THES A1 - Breher, Stephanie T1 - Die kardiale Funktion von Popdc1 in der Maus: Vom Gen zum Phän T1 - The cardiac function of Popdc1 in mouse: From gene to phene N2 - Die Popeye domain containing (Popdc)-Gene bilden eine evolutionär stark konservierte Genfamilie mit präferenzieller Expression im Herzen und in der Skelettmuskulatur. In dieser Arbeit konnte gezeigt werden, dass Popdc1 in kardialen Myozyten in Glanzstreifen, lateralen Membranen und im T-Tubuli-System exprimiert wird und mit Ionenkanälen und anderen myozytären Membranproteinen wie Cav1.2, Caveolin 3 und NCX1 kolokalisiert ist. Im ventrikulären Reizleitungssystem ist die Expression von Popdc1 gegenüber dem ventrikulären Arbeitsmyokard erhöht, während Atrium und Sinusknoten nahezu äquivalente Expressionsdomänen aufweisen. Mithilfe von elektrophysiologischen Untersuchungen konnte bei den Popdc1-Nullmutanten eine stressinduzierte Sinusbradykardie festgestellt werden, die altersabhängig auftritt und auf Sinuspausen zurückzuführen ist. Histologische Untersuchungen, unter Zuhilfenahme des Sinusknotenmarkers HCN4, zeigten einen Zellverlust im inferioren Teil des Sinusknotens. Popdc1 ist ein Transmembranprotein, das eine 150 Aminosäure umfassende, stark konservierte Popeye-Domäne aufweist. Für diese Domäne konnte auf struktureller Ebene eine Homologie zu zyklischen Nukleotid-Bindungsdomänen vorhergesagt und eine Bindung an cAMP und cGMP experimentell demonstriert werden. Es handelt sich bei den Popdc-Proteinen um einen neuen Zweig der Bindungsproteine für zyklische Nukleotidmonophosphate (cNMP). Die Bindungssequenz weist signifikante Unterschiede zu anderen bereits identifizierten cNMP-Bindungsproteinen auf. Weiterhin wurde die Interaktion von Popdc1 mit TREK1, einem Mitglied der Tandemporenkanäle untersucht. Es zeigte sich, dass Popdc1 nach Koexpression in Froschoozyten, den TREK1-Strom erhöht und dass die β-adrenerge Inhibition des TREK1 Kanals durch Popdc1 verstärkt wird. Im Arbeitsmyokard, im kardialen Reizleitungssystem und in kotransfizierten Cos7-Zellen werden beide Proteine überlappend exprimiert. Diese Daten zeigen, dass Popdc1 eine wichtige Funktion bei der Regulation der Schrittmacheraktivität, der Aufrechterhaltung der Sinusknotenmorphologie und der Modulation von Ionenkanälen aufweist. Interessanterweise wurden von unserer Arbeitsgruppe bereits die gleichen Phänotypen für die Popdc2 Maus beschrieben, sodass die Popdc Genfamilie überlappende und redundante Funktionen aufweist. N2 - The Popeye domain containing (Popdc) family is a highly evolutionary conserved gene family, which shows no homology to other genes. This family shows a preferential expression in the heart and skeletal muscle. In the present study it is shown that Popdc1 protein in the heart was predominantly localized to the intercalated disc, lateral membranes and T-tubularsystem, where it was co-localized with other cardiac membrane proteins such as Cav1.2, Caveolin 3 and NCX1. The expression of Popdc1-LacZ transgene as well as Popdc1 protein was elevated in the ventricular conduction system compared to the ventricular working myocardium. In contrast, expression in atrial tissue was equivalent to the expression in the sinus node. Electrophysiological measurements in Popdc1 null mutants revealed a stressinduced and age-dependent sinus bradycardia, which was due to an increase in sinus pauses and independent of the nature of stress. Histological examinations with the help of the sinus node marker HCN4 revealed structural alterations in the inferior part of the sinus node in 8 months old Popdc1-mice. Biochemical examinations of Popdc1 showed that Popdc1 is a transmembrane protein. The N-terminus is extracellular and glycosylated, while the Cterminus is intracellular and harbours a highly conserved 150 amino acid-long Popeye domain. For this domain, a predicted homology to cyclic nucleotide binding domains was observed. Binding of cAMP and cGMP was experimentally demonstrated and thus, the Popdc proteins constitute a novel branch of the cyclic nucleotide binding protein family. Furthermore interaction of Popdc1 with the tandem pore channel TREK1 was examined. After co-injection of Popdc1 the TREK1 current was increased in Xenopus oocytes. Furthermore, β-adrenergic inhibition of TREK1 current was enhanced in the presence of Popdc1. In working myocardium, conduction tissue as well as in co-transfected Cos7 cells the two proteins showed a similar distribution. In conclusion, Popdc1 is involved in cardiac pacemaker activity, maintaining sinus node morphology and modulating ion channels that contribute to the setting of the membrane potential in cardiac myocytes. Interestingly, a highly similar phenotype was observed for the Popdc2 mouse mutant and therefore the Popdc gene family displays overlapping and redundant functions. KW - Sinusknoten KW - Genexpression KW - Elektrophysiologie KW - Popdc1 KW - Transmembranprotein KW - Sinusknotenbradykardie KW - cAMP-Bindung KW - Popdc1 KW - transmembrane protein KW - sinus bradycardia KW - cAMP binding Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-37283 ER - TY - THES A1 - Friedrich, Torben T1 - New statistical Methods of Genome-Scale Data Analysis in Life Science - Applications to enterobacterial Diagnostics, Meta-Analysis of Arabidopsis thaliana Gene Expression and functional Sequence Annotation T1 - Neue statistische Methoden für genomweite Datenanalysen in den Biowissenschaften - Anwendungen in der Enterobakteriendiagnostik, Meta-Analyse von Arabidopsis thaliana Genexpression und funktionsbezogenen Sequenzannotation N2 - Recent progresses and developments in molecular biology provide a wealth of new but insufficiently characterised data. This fund comprises amongst others biological data of genomic DNA, protein sequences, 3-dimensional protein structures as well as profiles of gene expression. In the present work, this information is used to develop new methods for the characterisation and classification of organisms and whole groups of organisms as well as to enhance the automated gain and transfer of information. The first two presented approaches (chapters 4 und 5) focus on the medically and scientifically important enterobacteria. Its impact in medicine and molecular biology is founded in versatile mechanisms of infection, their fundamental function as a commensal inhabitant of the intestinal tract and their use as model organisms as they are easy to cultivate. Despite many studies on single pathogroups with clinical distinguishable pathologies, the genotypic factors that contribute to their diversity are still partially unknown. The comprehensive genome comparison described in Chapter 4 was conducted with numerous enterobacterial strains, which cover nearly the whole range of clinically relevant diversity. The genome comparison constitutes the basis of a characterisation of the enterobacterial gene pool, of a reconstruction of evolutionary processes and of comprehensive analysis of specific protein families in enterobacterial subgroups. Correspondence analysis, which is applied for the first time in this context, yields qualitative statements to bacterial subgroups and the respective, exclusively present protein families. Specific protein families were identified for the three major subgroups of enterobacteria namely the genera Yersinia and Salmonella as well as to the group of Shigella and E. coli by applying statistical tests. In conclusion, the genome comparison-based methods provide new starting points to infer specific genotypic traits of bacterial groups from the transfer of functional annotation. Due to the high medical importance of enterobacterial isolates their classification according to pathogenicity has been in focus of many studies. The microarray technology offers a fast, reproducible and standardisable means of bacterial typing and has been proved in bacterial diagnostics, risk assessment and surveillance. The design of the diagnostic microarray of enterobacteria described in chapter 5 is based on the availability of numerous enterobacterial genome sequences. A novel probe selection strategy based on the highly efficient algorithm of string search, which considers both coding and non-coding regions of genomic DNA, enhances pathogroup detection. This principle reduces the risk of incorrect typing due to restrictions to virulence-associated capture probes. Additional capture probes extend the spectrum of applications of the microarray to simultaneous diagnostic or surveillance of antimicrobial resistance. Comprehensive test hybridisations largely confirm the reliability of the selected capture probes and its ability to robustly classify enterobacterial strains according to pathogenicity. Moreover, the tests constitute the basis of the training of a regression model for the classification of pathogroups and hybridised amounts of DNA. The regression model features a continuous learning capacity leading to an enhancement of the prediction accuracy in the process of its application. A fraction of the capture probes represents intergenic DNA and hence confirms the relevance of the underlying strategy. Interestingly, a large part of the capture probes represents poorly annotated genes suggesting the existence of yet unconsidered factors with importance to the formation of respective virulence phenotypes. Another major field of microarray applications is gene expression analysis. The size of gene expression databases rapidly increased in recent years. Although they provide a wealth of expression data, it remains challenging to integrate results from different studies. In chapter 6 the methodology of an unsupervised meta-analysis of genome-wide A. thaliana gene expression data sets is presented, which yields novel insights in function and regulation of genes. The application of kernel-based principal component analysis in combination with hierarchical clustering identified three major groups of contrasts each sharing overlapping expression profiles. Genes associated with two groups are known to play important roles in Indol-3 acetic acid (IAA) mediated plant growth and development as well as in pathogen defence. Yet uncharacterised serine-threonine kinases could be assigned to novel functions in pathogen defence by meta-analysis. In general, hidden interrelation between genes regulated under different conditions could be unravelled by the described approach. HMMs are applied to the functional characterisation of proteins or the detection of genes in genome sequences. Although HMMs are technically mature and widely applied in computational biology, I demonstrate the methodical optimisation with respect to the modelling accuracy on biological data with various distributions of sequence lengths. The subunits of these models, the states, are associated with a certain holding time being the link to length distributions of represented sequences. An adaptation of simple HMM topologies to bell-shaped length distributions described in chapter 7 was achieved by serial chain-linking of single states, while residing in the class of conventional HMMs. The impact of an optimisation of HMM topologies was underlined by performance evaluations with differently adjusted HMM topologies. In summary, a general methodology was introduced to improve the modelling behaviour of HMMs by topological optimisation with maximum likelihood and a fast and easily implementable moment estimator. Chapter 8 describes the application of HMMs to the prediction of interaction sites in protein domains. As previously demonstrated, these sites are not trivial to predict because of varying degree in conservation of their location and type within the domain family. The prediction of interaction sites in protein domains is achieved by a newly defined HMM topology, which incorporates both sequence and structure information. Posterior decoding is applied to the prediction of interaction sites providing additional information of the probability of an interaction for all sequence positions. The implementation of interaction profile HMMs (ipHMMs) is based on the well established profile HMMs and inherits its known efficiency and sensitivity. The large-scale prediction of interaction sites by ipHMMs explained protein dysfunctions caused by mutations that are associated to inheritable diseases like different types of cancer or muscular dystrophy. As already demonstrated by profile HMMs, the ipHMMs are suitable for large-scale applications. Overall, the HMM-based method enhances the prediction quality of interaction sites and improves the understanding of the molecular background of inheritable diseases. With respect to current and future requirements I provide large-scale solutions for the characterisation of biological data in this work. All described methods feature a highly portable character, which allows for the transfer to related topics or organisms, respectively. Special emphasis was put on the knowledge transfer facilitated by a steadily increasing wealth of biological information. The applied and developed statistical methods largely provide learning capacities and hence benefit from the gain of knowledge resulting in increased prediction accuracies and reliability. N2 - Die aktuellen Fortschritte und Entwicklungen in der Molekularbiologie stellen eine Fülle neuer, bisher kaum analysierter Daten bereit. Dieser Fundus umfasst unter Anderem biologische Daten zu genomischer DNA, zu Proteinsequenzen, zu dreidimensionalen Proteinstrukturen sowie zu Genexpressionsprofilen. In der vorliegenden Arbeit werden diese Informationen genutzt, um neue Methoden der Charakterisierung und Klassifizierung von Organismen bzw. Organismengruppen zu entwickeln und einen automatisierten Informationsgewinn sowie eine Informationsübertragung zu ermöglichen. Die ersten beiden vorgestellten Ansätze (Kapitel 4 und 5) konzentrieren sich auf die medizinisch und wissenschaftlich bedeutsame Gruppe der Enterobakterien. Deren Bedeutung für Medizin und Mikrobiologie geht auf ihre Funktion als kommensale Bewohner des Darmtraktes, ihre Nutzung als leicht kultivierbare Modellorganismen und auf die vielseitigen Infektionsmechanismen zurück. Obwohl bereits viele Studien über einzelne Pathogruppen mit klinisch unterscheidbaren Symptomen existieren, sind die genotypischen Faktoren, die für diese Unterschiedlichkeit verantwortlich zeichnen, teilweise noch nicht bekannt. Der in Kapitel 4 beschriebene umfassende Genomvergleich wurde anhand einer Vielzahl von Enterobakterien durchgeführt, die nahezu die gesamte Bandbreite klinisch relevanter Diversität darstellen. Dieser Genomvergleich bildet die Basis für eine Charakterisierung des enterobakteriellen Genpools, für eine Rekonstruktion evolutionärer Prozesse und Einflüsse und für eine umfassende Untersuchung spezifischer Proteinfamilien in enterobakteriellen Untergruppen. Die in diesem Kontext vorher noch nicht angewandte Korrespondenzanalyse liefert qualitative Aussagen zu bakteriellen Untergruppen und den ausschließlich in ihnen vorkommenden Proteinfamilien. In drei Hauptuntergruppen der Enterobakterien, die den Gattungen Yersinia und Salmonella sowie der Gruppe aus Shigella und E. coli entsprechen, wurden die jeweils spezifischen Proteinfamilien mit Hilfe statistischer Tests identifiziert. Zusammenfassend bilden die auf Genomvergleichen aufbauenden Methoden neue Ansatzpunkte, um aus der Übertragung der bekannten Funktionalität einzelner Proteine auf spezifische, genotypische Besonderheiten bakterieller Gruppen zu schließen. Aufgrund ihrer hohen medizinischen Relevanz war die Typisierung enterobakterieller Isolate entsprechend ihrer Pathogenität Ziel zahlreicher Studien. Die Microarray-Technologie bietet ein schnelles, reproduzierbares und standardisierbares Hilfsmittel für bakterielle Typisierung und hat sich in der Bakteriendiagnostik, Risikobewertung und Überwachung bewährt. Das in Kapitel 5 beschriebene Design eines diagnostischen Microarray beruht auf einer großen Anzahl verfügbarer Genomsequenzen von Enterobakterien. Ein hocheffizienter String-Matching-Algorithmus ist die Grundlage einer neuartigen Strategie der Sondenauswahl, die sowohl kodierende als auch nicht-kodierende Bereiche genomischer DNA berücksichtigt. Im Vergleich zu Diagnostika, die ausschließlich auf Virulenz-assoziierten Sonden beruhen, verringert dieses Prinzip das Risiko einer inkorrekten Typisierung. Zusätzliche Sonden erweitern das Anwendungsspektrum auf eine simultane Diagnostik der Antibiotikaresistenz bzw. eine Überwachung der Resistenzausbreitung. Umfangreiche Testhybridisierungen belegen eine überwiegende Zuverlässigkeit der Sonden und vor allem eine robuste Klassifizierung enterobakterieller Stämme entsprechend der Pathogruppen. Die Tests bilden zudem die Grundlage für das Training eines Regressionsmodells zur Klassifizierung der Pathogruppe und zur Vorhersage der Menge hybridisierter DNA. Das Regressionsmodell zeichnet sich durch kontinuierliche Lernfähigkeit und damit durch eine Verbesserung der Vorhersagequalität im Prozess der Anwendung aus. Ein Teil der Sonden repräsentiert intergenische DNA und bestätigt infolgedessen die Relevanz der zugrunde liegenden Strategie. Die Tatsache, dass ein großer Teil der von den Sonden repräsentierten Gene noch nicht annotiert ist, legt die Existenz bisher unentdeckter Faktoren mit Bedeutung für die Ausbildung entsprechender Virulenz-Phänotypen nahe. Ein weiteres Haupteinsatzgebiet von Microarrays ist die Genexpressionsanalyse. Die Größe von Genexpressionsdatenbanken ist in den vergangenen Jahren stark gewachsen. Obwohl sie eine Fülle von Expressionsdaten bieten, sind Ergebnisse aus unterschiedlichen Studien weiterhin schwer in einen übergreifenden Zusammenhang zu bringen. In Kapitel 6 wird die Methodik einer ausschließlich datenbasierten Meta-Analyse für genomweite A. thaliana Genexpressionsdatensätze dargestellt, die neue Erkenntnisse über Funktion und Regulation von Genen verspricht. Die Anwendung von Kernel-basierter Hauptkomponentenanalyse in Kombination mit hierarchischem Clustering identifizierte drei Hauptgruppen von Kontrastexperimenten mit jeweils überlappenden Expressionsmustern. In zwei Gruppen konnten deregulierte Gene wichtigen Funktionen bei Indol-3-Essigsäure (IAA) vermitteltem Pflanzenwachstum und -entwicklung sowie pflanzlicher Pathogenabwehr zugeordnet werden. Bisher funktionell nicht näher charakterisierte Serin-Threonin-Kinasen wurden über die Meta-Analyse mit der Pathogenabwehr assoziiert. Grundsätzlich kann dieser Ansatz versteckte Wechselbeziehungen zwischen Genen aufdecken, die unter verschiedenen Bedingungen reguliert werden. Bei der funktionellen Charakterisierung von Proteinen oder der Vorhersage von Genen in Genomsequenzen werden Hidden-Markov-Modelle (HMMs) eingesetzt. HMMs sind technisch ausgereift und in der computergestützten Biologie vielfach eingesetzt worden. Trotzdem birgt die Methodik das Potential zur Optimierung bezüglich der Modellierung biologischer Daten, die hinsichtlich der Längenverteilung ihrer Sequenzen variieren. Untereinheiten dieser Modelle, die Zustände, repräsentieren über ihre individuelle Verweildauer zugrunde liegende Verteilungen von Sequenzlängen. Kapitel 7 stellt eine Methode zur Anpassung einfacher HMM-Topologien an biologische Daten, die glockenkurvenartige Längenverteilungen zeigen, vor. Die Modellierung solcher Verteilungen wird dabei durch eine serielle Verkettung vervielfältigter Zustände gewährleistet, ohne dass die Klasse herkömmlicher HMMs verlassen wird. Auswertungen der Modellierungsleistung bei unterschiedlich stark optimierten HMM-Topologien unterstreichen die Bedeutung der entwickelten Topologieoptimierung. Zusammenfassend wird hier eine generelle Methodik beschrieben, die die Modelleigenschaften von HMMs über Topologieoptimierungen verbessert. Die Parameter dieser Optimierung werden mit Hilfe von Maximum-Likelihood und einem leicht einzubindenden Momentschätzer bestimmt. In Kapitel 8 wird die Anwendung von HMMs zur Vorhersage von Interaktionsstellen in Proteindomänen beschrieben. Wie bereits gezeigt wurde, sind solche Stellen aufgrund einer variablen Konserviertheit ihrer Position und ihres Typs schwer zu bestimmen. Eine Vorhersage von Interaktionstellen in Proteindomänen wird über die Definition einer neuen HMM-Topologie erreicht, die sowohl Sequenz- als auch Strukturdaten einbindet. Interaktionsstellen werden mit einem Posterior-Decoding-Algorithmus vorhergesagt, der zusätzliche Informationen über die Wahrscheinlichkeit einer Interaktion für alle Sequenzpositionen bereitstellt. Die Implementierung der Interaktionsprofil-HMMs (ipHMMs) basiert auf den etablierten Profil-HMMs und erbt deren Effizienz und Sensitivität. Eine groß angelegte Vorhersage von Interaktionsstellen mit ipHMMs konnte mutationsbedingte Fehlfunktionen in Proteinen erklären, die mit vererbbaren Krankheiten wie unterschiedlichen Tumortypen oder Muskeldystrophie assoziiert sind. Wie Profile-HMMs sind auch ipHMMs für groß angelegte Anwendungen geeignet. Insgesamt verbessert die HMM-gestützte Methode sowohl die Vorhersagequalität für Interaktionsstellen als auch das Verständnis molekularer Hintergründe bei vererbbaren Krankheiten. Im Hinblick auf aktuelle und zukünftige Anforderungen stelle ich in dieser Arbeit Lösungsansätze für eine umfassende Charakterisierung großer Mengen biologischer Daten vor. Alle beschriebenen Methoden zeichnen sich durch gute Übertragbarkeit auf verwandte Probleme aus. Besonderes Augenmerk wurde dabei auf den Wissenstransfer gelegt, der durch einen stetig wachsenden Fundus biologischer Information ermöglicht wird. Die angewandten und entwickelten statistischen Methoden sind lernfähig und profitieren von diesem Wissenszuwachs, Vorhersagequalität und Zuverlässigkeit der Ergebnisse verbessern sich. KW - Genomik KW - Hidden-Markov-Modell KW - Enterobacteriaceae KW - Genexpression KW - Microarray KW - Sequenzanalyse KW - diagnostischer Microarray KW - Sequence Analysis KW - diagnostic Microarray Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-39858 ER - TY - THES A1 - Stoll, Sascha T1 - Funktionelle Analyse von Blochmannia floridanus, dem primären Endosymbionten der Rossameise Camponotus floridanus T1 - Functional analysis of Blochmannia floridanus, the primary endosymbiont of the carpenter ant Camponotus floridanus N2 - Ameisen der Gattung Camponotus beherbergen bakterielle Symbionten der Gattung Blochmannia in spezialisierten Zellen des Mitteldarms (Blochmann, 1882; Buchner, 1965; Sauer, 2000; Schröder et al., 1996). Die Genomsequenzierung dieser Symbionten zeigte, dass Blochmannia, ähnlich den Symbionten von Blattläusen, hauptsächlich Gene der Aminosäurebiosynthese beibehalten hat (Degnan et al., 2005; Gil et al., 2003). Die Relevanz dieser nahrungsaufwertenden Funktion konnte experimentell bestätigt werden (Feldhaar et al., 2007). Ein Schwerpunkt der vorliegenden Arbeit war die Aufklärung der dynamischen Interaktion der beiden Partner während des komplexen Lebenszyklus des holometabolen Wirtes. Frühere Studien deuteten darauf hin, dass die Symbiose vor allem während der Larven- und Puppenphasen von Bedeutung sein könnte (Feldhaar et al., 2007; Wolschin et al., 2004; Zientz et al., 2006). Mit fluoreszenter in situ Hybridisierung (FISH) und konfokaler Laserscanning Mikroskopie konnte in der vorliegenden Arbeit die Lokalisierung von B. floridanus während der wichtigsten Entwicklungsstadien aufgeklärt werden. Hierbei konnte gezeigt werden, dass die Symbionten schon im ersten Larvenstadium in spezialisierten Zellen um den Darm angeordnet sind, aber in späteren Stadien nicht, wie bisher angenommen, auf diese Bakteriozyten beschränkt sind, sondern bis zum Schlupf der jungen Arbeiterinnen massiv andere Darmzellen infizieren. Übereinstimmend mit Bestimmungen der Zellzahl in den verschiedenen Wirtsstadien ist die Anzahl der Symbionten gegen Ende der Metamorphose am höchsten. Die Symbiose degeneriert in sehr alten Arbeiterinnen, gut gefüllte Bakteriozyten werden jedoch noch monatelang beibehalten. Mit Macroarray- und qRT- PCR- basierten Transkriptomanalysen wurde die Expression der bakteriellen Gene in charakteristischen Entwicklungsstadien des Wirtes untersucht. Allgemein zeigen vor allem Gene für molekulare Chaperons und bestimmte bakterielle Grundfunktionen eine hohe Expression. Aber auch viele Gene, die möglicherweise wichtige Funktionen in der Symbiose besitzen, wie die Biosynthese essentieller Aminosäuren und das Recycling von Stickstoffverbindungen, zeigen ein hohes absolutes Transkriptlevel. Zudem besteht eine positive Korrelation zwischen dem Expressionsniveau und dem GC- Gehalt der Gene, die in dem höheren Selektionsdruck und damit einer geringeren Mutationsrate der essentiellen Gene begründet liegt (Schaber et al., 2005). Durch Proteinanalysen konnte bestätigt werden, dass die Faktoren mit der höchsten absoluten Transkription die dominanten Proteine der Symbionten darstellen. In den unterschiedlichen Entwicklungsstadien zeigen viele Gene eine deutliche Dynamik, deren Ausmaß aber, verglichen mit freilebenden Bakterien, gering ist. Aus den Expressionsprofilen aufeinanderfolgender Gene lassen sich mögliche Transkriptionseinheiten ableiten, die teilweise auch experimentell bestätigt wurden. Oftmals zeigen auch Gene, die nicht in Transkriptionseinheiten angeordnet sind, aber verwandten Stoffwechselwegen angehören, ähnliche Muster. Dies deutet auf das Vorhandensein grundlegender Genregulations-mechanismen hin, obwohl im Genom von B. floridanus nur noch sehr wenige Transkriptionsfaktoren codiert sind (Gil et al., 2003). Auf übergeordneter Ebene zeigt sich, dass bei Symbionten aus späten Puppenstadien viele symbioserelevante Gene im Vergleich zu Genen des Grundmetabolismus eine erhöhte Expression zeigen. Dies betrifft besonders die Biosynthese aromatischer und verzweigter Aminosäuren, die in diesen Stadien vom Wirt in hoher Menge benötigt werden, während die internen Reserven gleichzeitig zur Neige gehen. Dies äußert sich auch im deutlichen Abfallen der Speicherproteinmenge des Wirts gegen Ende der Puppenphase. Die festgestellte Veränderung der Symbiontenzahl übertrifft das geringe Ausmaß der Genregulation um ein Vielfaches. Die Bakterien liegen in jedem Stadium polyploid mit bis zu 100 Genomkopien vor, dieser Polyploidiegrad bleibt jedoch während der gesamten Wirtsentwicklung weitestgehend konstant. Somit scheint die Kontrolle des Wirts über die bakterielle Vermehrung der entscheidende Faktor dieser Symbiose zu sein. Die verbleibenden regulatorischen Fähigkeiten der Bakterien stellen möglicherweise eine Feinjustierung von optimierten Produktionseinheiten dar, deren Anzahl nach den Bedürfnissen des Wirtes verändert wird. Insgesamt konnten in der vorliegenden Arbeit neue Einblicke in das komplexe Zusammenleben von Blochmannia und Camponotus gewonnen werden, die zu einem besseren Verständnis der biologischen Funktion und der grundlegenden Mechanismen dieser Symbiose führen. Eine der wichtigsten Fragestellungen nach dem Sinn einer nahrungsaufwertenden Symbiose für einen Nahrungsgeneralisten konnte mit starken Hinweisen auf eine stadienabhängige Relevanz der Symbiose beantwortet werden, die den enormen evolutionären Erfolg dieser Ameisengattung erklären könnte.  N2 - Ants of the genus Camponotus harbor bacterial endosymbionts of the genus Blochmannia in specialized cells of their midgut (Blochmann, 1882; Buchner, 1965; Sauer, 2000; Schröder et al., 1996). The complete sequencing of the symbiont’s genome revealed, that Blochmannia, comparable to the symbionts of aphids, mainly retained genes involved in the biosynthesis of essential amino acids (Degnan et al., 2005; Gil et al., 2003). The biological relevance of a nutritional upgrading by Blochmannia could be confirmed experimentally (Feldhaar et al., 2007). One focus of this thesis was the elucidation of the dynamic interactions between the two partners during the complex life cycle of the holometabolic host animal. Previous studies pointed towards a temporal relevance of this symbiosis especially during larval and pupal development (Feldhaar et al., 2007; Wolschin et al., 2004; Zientz et al., 2006). In this thesis the localization of B. floridanus could be documented throughout all life stages of the host by fluorescent in situ hybridization (FISH) and confocal laser scanning microscopy. A layer of densely filled bacteriocytes surrounding the gut could already be identified in first instar larvae. In contrast to previous assumptions, the bacteria are not restricted to these cells in later stages, as until the eclosion of the young adult workers bacteria massively infect other midgut cells. Concordant with previous findings, bacterial load is highest at the end of metamorphosis and symbiont numbers decrease in older workers, yet densely filled bacteriocytes are still visible after several months. The expression of the bacterial genes during characteristic life stages of the C. floridanus was assessed by macroarray and qRT- PCR- based experiments. In general, especially molecular chaperones, central basic metabolism and may putative symbiosis related factors like pathways leading to essential amino acids or nitrogen recycling show highest absolute expression levels. A positive correlation between expression level and GC- content of the genes can be observed, which is caused by a higher selection pressure and lower mutation rate of these essential factors (Schaber et al., 2005). Protein analyses confirmed the correlation between gene expression and translation of the most abundant factors. Many B. floridanus genes exhibit a dynamic expression during the different host stages but the extent of this gene regulation is modest as compared to free living bacteria. Expression profiles of genes located next to each other on the genome allow proposal of local transcription units, which were confirmed experimentally in several cases. Often genes that are not clustered locally but belong to related metabolic functions also exhibit similar expression patterns. This indicates the existence of basic mechanisms of gene regulation despite the low number of transcription factors annotated in the B. floridanus genome (Gil et al., 2003). In late pupal stages symbiosis related genes often show a higher expression compared to basic metabolic functions. This especially includes biosynthetic pathways for aromatic and branched amino acids, which are needed by the host at this stage in increased amounts, while internal storages are depleted. This could be demonstrated by the significant decrease in storage proteins of the host at the end of the pupal phase. The observed change in bacterial numbers per host exceeds the extent of bacterial gene regulation by far. The symbionts are polyploid in each host stage with up to 100 genome copies per cell. The degree of polyploidy is largely constant during host development. Thus the control over bacterial reproduction seems to be the decisive factor in this symbiosis. The residual regulatory capacities of the symbionts might represent a mechanism of fine tuning of a production unit that has been streamlined by evolution and whose numbers are adjusted according to the host’s needs. In conclusion, this thesis delivers new insights into the complex symbiosis of Blochmannia and Camponotus leading to a better understanding of its biological function and the underlying mechanisms. One of the central mysteries concerning the need of a symbiont for nutritional upgrading for an omnivorous host could be explained by a temporal, stage- dependent relevance of this symbiosis, possibly being the reason for the enormous evolutionary success of this ant genus. KW - Intrazelluläre Symbiose KW - Symbiose KW - Ameisen KW - Mikrobiologie KW - Gram-negative Bakterien KW - Bakterien KW - Differentielle Genexpression KW - Genexpression KW - Entwicklung KW - Blochmannia KW - Camponotus KW - symbiosis KW - endosymbiosis KW - ants KW - bacteria KW - gene expression Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-37238 ER - TY - THES A1 - Li, Naixin T1 - Dorso-ventral Differentiation and Specification of the Mesencephalon in Early Chick Embryos T1 - Die dorsoventrale Differenzierung und Spezifikation des frühen embryonalen Hühnermittelhirn N2 - The chick midbrain is subdivided into functionally distinct ventral and dorsal domains, tegmentum and optic tectum. In the mature tectum, neurons are organized in layers, while they form discrete nuclei in the tegmentum. An interesting characteristic of the embryonic brain is the development of a large optic tectum, of which the growth becomes obvious at embryonic day 3 (E3). Dorsoventral (DV) specification of the early midbrain should thus play a crucial role for the organization of the neuronal circuitry in optic tectum and tegmentum. In the first part of my thesis, I investigated regional commitment and establishment of cellular differences along the midbrain DV axis. I examined the commitment of gene expression patterns in isolated ventral and dorsal tissue in vivo and in vitro, and studied their cell mixing properties. Explant cultures, and grafting of dorsal midbrain into a ventral environment or vice versa, revealed a gradual increase in the autonomy of region-specific gene regulation between, which was accompanied by a gradual increase in differential adhesive properties from E2 to E3, once the DV axis polarity was fixed. These events happened at a time-point when the majority of midbrain cells are not yet differentiated. Long-term transplantation (6 - 9 days) using quail cells from ventral midbrain as grafts showed the same result. Hence, the results suggest that progressive specification of the midbrain DV axis is accompanied by progressively reduced cell mixing between dorsal and ventral precursors, leading to a partial regionalization of midbrain tissue into autonomous units of precursor cell populations. In the second part I investigated the genes that might be involved in regulating the growth of the tectum. In particular, I focused on the role of Pax7 transcription factor, a paired domain protein. The results suggested that Pax7 was involved in regulating the medial-lateral extension of the tectum. Over expression of Pax7 in dorsal midbrain led to an enlarged tectum accompanied by a raise in cell division, while Pax7 knockdown by shrank caused a reduction in tectum. The overall pattern of neuronal differentiation was not disturbed by an up or down regulation of Pax7. Pax7 also positively regulated Pax3, another pair-ruled gene expressed dorsally. These results suggest that Pax7 very likely together with Pax3 could facilitate or maintain neural cell proliferation in the midbrain at early stages and that a regulation of the size in that region does not influence the neuronal patterning of the developmental field. I further checked the expression and function of a GFPase Rab 23, that was suggested to be involved in the DV patterning in mouse neural tube as a negative regulator of Shh signaling. Overexpression of Rab23 indicated that it facilitated the expression of Pax7 and Pax3 in the neural tube and suppressed ventral genes like Nkx6.1 cell autonomously, however, it did not disturb neuronal patterning. Interestingly, a thorough expression study of Rab 23 during chick early development revealed that Rab23 is already expressed very early and asymmetrically during gastrulation, suggesting a possible role of Rab23 on the left-right determination of Hensen’s node. In combination with the result that Rab23 is expressed in the notochord early in development, I assume that both Rab23 and Shh exist in all neural progenitor cells initially, and when their expression patterns separate gradually the neural cells adopt a ventral or dorsal fate according to their location along the dorsoventral axis. The avian embryo is a classic system used widely to investigate questions of vertebrate development. The easy and cheap accessibility of the embryo for in ovo or ex ovo experiments all around the year make it an ideal animal model to work with. The only recently developed method of over expressing genes in specific cells or regions in the chick embryo by electroporation enabled me to study different ways of gene suppression using this way of gene transfection. Thus, I compared the effect of long-hairpin and short hairpin dsRNA in different vectors and antisense morpholino oligonucleotides. The results revealed that all hairpin dsRNA constructs did reduce gene and protein expression often accompanied by morphological changes. Most efficiently were shRNAi constructs cloned into a siRNA-specific vector – pSilencer 1.0-U6. Gene silencing was already well observed 36 hours after transfection. In comparison antisense morpholino oligonucleotides did not show such big gene reduction as the shRNA in pSilencer. Taken together, this methodical research proposes that the shRNA in the pSilencer vector was a good and effective tool to reduce gene and protein expression locally. N2 - Das Mittelhirn des Huhns wird in funktionel unterschiedliche, ventrale und dorsale Regionen eingeteilt, nämlich das Tegmentum ventral und das optisches Tectum dorsal. Im vollentwickelten Tectum bilden Nervenzellen Schichten, während das Tegmentum aus unterschiedlichen Nuclei besteht. Ein charakteristisches Merkmal des embryonalen Gehirns ist die Entwicklung eines großen optischen Techtums, die am dritten embryonalen Tag (E3) sehr deutlich zu beobachten ist. Diese unterschiedliche funktionelle und morphologische Entwicklung des Mittelhirns deutet daraufhin, das die dorsoventrale Spezifikation des frühen Mittelhirns für der Organisation neuronaler Netzwerke im optischen Tectum und Tegmentum eine kritische Rolle spielt. Im ersten Teil dieser Doktorarbeit wurde die regionale Bestimmung und Bildung zellulärer Unterschiede entlang der DV Achse des Mittelhirns untersucht. Dafür bestimmte ich den Zeitpunkt, an dem spezifische ventrale und dorsale Genexpressionsmuster festgelegt werden in isoliertem ventralen und dorsalen Gewebe in vivo and in vitro. Desweiteren untersuchte ich die Entwicklung unterschiedlicher adhäsiver Eigenschaften von ventralen und dorsalen Zellen in vitro. Explantatkulturen und Transplantationen von dorsalem Mittelhirn in eine ventrale Umgebung oder vice versa liessen eine schrittweise Zunahme der Autonomie der region-spezifischen Genregulation erkennen. Dies wurde von einer schrittweisen Zunahme des differentialen Adhäsionsverhaltens von ventralen und dorsalen Mittelhirnzellen von E2 zu E3 begleitet, der Zeitspanne, in der die Polarität der DV Achse festgelegt wurde. Diese Entwicklungsprozesse fanden u einem Zeitpunkt statt, an dem die meisten Zellen des Mittelhirns noch nicht differenziert hatten. Transplantationen,. von ventralen Mittelhirnzellen der Wachtel ins dorsale Hühnertecctum, die erst nach mehreren Tagen (6 - 9 Tage) untersucht wurden, zeigten das gleiche Ergebnis. Diese Ergebnisse lassen schliessen, dass eine partielle Regionalisierung des Mittelhirns in autonome Einheiten von Vorläuferzellen der dorsoventralen Achse stattfindet. Dies erlaubt den Zellen eine Positionsidentität zu bewahren – unhabhängig von der wachsenden Distanz zu Signalzentren. Im zweiten Teil meiner Arbeit untersuchte ich Gene, die das Wachstum und die spezifische Entwicklung des Tectums regulieren könnten. Die Arbeit konzentrierte sich speziell auf die Rolle von Pax7, ein Mitglied der sogenannten ‚pair-ruled’ Familie von Transkriptionsfaktoren, und auf die Rolle von Rab23, einer GTPase, die den Shh-Signalweg im dorsalen Neuralrohr inhibiert. Dieser Versuch zeigte, dass Pax7 an der Regulation der medio-lateral Ausdehnung des Tectums beteiligt ist. Überexpression von Pax7 im dorsalen Mittelhirn führte zu einer Vergrößerung des Tectums, die von einer Zunahme der Zellteilung begleitet wurde, während Knockdown von Pax7 eine Größereduktion des Tectums verursachte. Das neuronale Differenzierungsmuster im generellen wurde nicht von der Überexpression oder Repression von Pax7 gestört. Pax7 induzierte ausserdem Pax3, ein Mitglied derselben Familie, das ebenfalls dorsal exprimiert wird und unterdrückte ventrale Gene wie Nkx6.1. Diese Ergebnisse lassen vermuten, dass Pax7, sehr wahrscheinlich zusammen mit Pax3, die neural Zellproliferation im Mittelhirn in frühen Entwicklungsstadien fördert oder auf einem konstanten Level hält und dass die Muster der neuronalen Entwicklung nicht durch der Regulation der Größe dieser Region beeinflusst wird. Außerdem förderte Rab 23, das sehr wahrscheinlich ein negativer Regulator von Shh ist, die Expression von Pax7 und Pax3 im ventralen Mittelhirn und unterdrückte ventrale Gene wie Nkx6.1. Die Überexpression von Rab 23 beeinflusste auch nicht das neuronale Differenzierungsmusterung. Interessanterweise zeigte eine genaue Analyse der Expression von Rab 23 während der frühen Entwicklungsstadien des Huhns, dass Rab 23 bereits sehr früh und asymmetrisch während der Gastrulation exprimiert wurde. Dies deutet auf eine mögliche Rolle von Rab 23 für die links-rechts Determination des Hensen´s node an. Betrachtet man diese Ergebnisse zusammen, dann könnte man zu fogender Schlussfolgerung kommen, nämlich, dass sowohl Rab 23 als auch Shh früh in allen neural Progenitorzellen existieren, und dass die neuralen Zellen jeweils nach ihrer Lage entlang der dorsoventral Achse ein ventrales oder dorsales Schicksal annehmen, wenn das sich die Expressionsmuster von Rab 23 und Shh allmänlich trennen. Der Vogelembryo ist ein klassisches und häufig benutztes System, um die Entwicklung der Vertebraten zu untersuchen. Die einfache und preiswerte Zugänglichkeit des Embryos für in ovo oder ex ovo Experiment das ganze Jahr über machen ihn zu einem idealen Tiermodell. Die in den letzten Jahren entwickelte Methode der Elektroporation eines Embryos zum Gentransfer in die Zellen, ermöglichte es mir unterschiedliche Weisen der Genunterdrückung in embryonalem Gewebe zu testen und zu vergleichen.Ich verglich in dieser Untersuchung die Wirkung von langen und kurzen Haarnadel-RNAs (hairpin RNA) in verschieden Vektoren mit der Wirkung von Antisense-morpholino-Oligonucleotiden verglichen. Die Ergebnisse zeigten, dass alle Haarnadel-dsRNA-Konstruktionen die Gen- und Proteinexpression reduzierten, wobei es häufig zu einer morphologischen Veränderung kam. Die kurze shRNAi-Konstruktionen, die in einen siRNA-spezifischen Vektor – pSilencer 1.0-U6 - geklont wurden war, zeigte sich dabei am effizientesten.. Die Herunterregulierung der Gene wurde bereits 36 Stunden nach der Transfektion beobachtet. Im Gegensatz dazu, zeigten die Antisense-Morpholino-Oligonucleotiden keine solche starke Reduktion wie das shRNA in pSilencer. Zusammenfassend zeigt diese methodische Untersuchung, dass die shRNA im pSilencer-Vektor ein gutes und effektives Werkzeug ist, um Gen- und Proteinexpression örtlich zu reduzieren. KW - Differenzierung KW - Embryo KW - Genexpression KW - Mittelhirn KW - Spezifikation KW - Dorso-ventral Patterning KW - Mesencephalon KW - Morpholino KW - Neuronal Proliferation KW - Pax3 KW - Pax7 KW - Rab23 KW - Shh KW - siRNA KW - Transplantation Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-32950 ER - TY - THES A1 - Engelmann, Julia Cathérine T1 - DNA microarrays: applications and novel approaches for analysis and interpretation T1 - DNA Mikroarrays: Anwendungen und neue Ansätze für die Analyse und Interpretation N2 - In der vorliegenden Dissertation wird die Entwicklung eines phylogenetischen DNA Microarrays, die Analyse von mehreren Microarray-Genexpressionsdatensätzen und neue Ansätze für die Datenanalyse und Interpretation der Ergebnisse vorgestellt. Die Entwicklung und Analyse der Daten eines phylogenetischen DNA Microarrays wird in der ersten Publikation dargestellt. Ich konnte zeigen, dass die Spezies-Detektion mit phylogenetischen Microarrays durch die Datenanalyse mit einem linearen Regressionsansatz signifikant verbessert werden kann. Standard-Methoden haben bislang nur Signalintensitäten betrachtet und eine Spezies als an- oder abwesend bezeichnet, wenn die Signalintensität ihres Messpunktes oberhalb eines willkürlich gesetzten Schwellenwertes lag. Dieses Verfahren ist allerdings aufgrund von Kreuz-Hybridisierungen nicht auf sehr nah verwandte Spezies mit hoher Sequenzidentität anwendbar. Durch die Modellierung des Hybridisierungs und Kreuz-Hybridisierungsverhaltens mit einem linearen Regressionsmodell konnte ich zeigen, dass Spezies mit einer Sequenzähnlichkeit von 97% im Markergen immer noch unterschieden werden können. Ein weiterer Vorteil der Modellierung ist, dass auch Mischungen verschiedener Spezies zuverlässig vorhergesagt werden können. Theoretisch sind auch quantitative Vorhersagen mit diesem Modell möglich. Um die großen Datenmengen, die in öffentlichen Microarray-Datenbanken abgelegt sind besser nutzen zu können, bieten sich Meta-Analysen an. In der zweiten Publikation wird eine explorative Meta-Analyse auf Arabidopsis thaliana-Datensätzen vorgestellt. Mit der Analyse verschiedener Datensätze, die den Einfluss von Pflanzenhormonen, Pathogenen oder verschiedenen Mutationen auf die Genexpression untersucht haben, konnten die Datensätze anhand ihrer Genexpressionsprofile in drei große Gruppen eingeordnet werden: Experimente mit Indol-3-Essigsäure (IAA), mit Pathogenen und andere Experimente. Gene, die charakteristisch für die Gruppe der IAA-Datensätze beziehungsweise für die Gruppe der Pathogen-Datensätze sind, wurden näher betrachtet. Diese Gene hatten Funktionen, die bereits mit Pathogenbefall bzw. dem Einfluss von IAA in Verbindung gebracht wurden. Außerdem wurden Hypothesen über die Funktionen von bislang nicht annotierten Genen aufgestellt. In dieser Arbeit werden auch Primäranalysen von einzelnen Arabidopsis thaliana Genexpressions-Datensätzen vorgestellt. In der dritten Publikation wird ein Experiment beschrieben, das durchgeführt wurde um herauszufinden ob Mikrowellen-Strahlung einen Einfluss auf die Genexpression einer Zellkultur hat. Dazu wurden explorative Analysemethoden angewendet. Es wurden geringe aber signifikante Veränderungen in einer sehr kleinen Anzahl von Genen beobachtet, die experimentell bestätigt werden konnten. Die Funktionen der regulierten Gene und eine Meta-Analyse mit öffentlich zugänglichen Datensätzen einer Datenbank deuten darauf hin, dass die pflanzliche Zellkultur die Strahlung als eine Art Energiequelle ähnlich dem Licht wahrnimmt. Des weiteren wird in der vierten Publikation die funktionelle Analyse eines Arabidopsis thaliana Genexpressionsdatensatzes beschrieben. Die Analyse der Genexpressions eines pflanzlichen Tumores zeigte, dass er seinen Stoffwechsel von aerob und auxotroph auf anaerob und heterotroph umstellt. Gene der Photosynthese werden im Tumorgewebe reprimiert, Gene des Aminosäure- und Fettstoffwechsels, der Zellwand und Transportkanäle werden so reguliert, dass Wachstum und Entwicklung des Tumors gefördert werden. In der fünften Publikation in dieser Arbeit wird GEPAT (Genome Expression Pathway Analysis Tool) beschrieben. Es besteht aus einer Internet- Anwendung und einer Datenbank, die das einfache Hochladen von Datensätzen in die Datenbank und viele Möglichkeiten der Datenanalyse und die Integration anderer Datentypen erlaubt. In den folgenden zwei Publikationen (Publikation 6 und Publikation 7) wird GEPAT auf humane Microarray-Datensätze angewendet um Genexpressionsdaten mit weiteren Datentypen zu verknüpfen. Genexpressionsdaten und Daten aus vergleichender Genom-Hybridisierung (CGH) von primären Tumoren von 71 Mantel-Zell-Lymphom (MCL) Patienten ermöglichte die Ermittlung eines Prädiktors, der die Vorhersage der Überlebensdauer von Patienten gegenüber herkömmlichen Methoden verbessert. Die Analyse der CGH Daten zeigte, dass auch diese für die Vorhersage der Überlebensdauer geeignet sind. Für den Datensatz von Patienten mit großzellig diffusem B-Zell-Lymphom DLBCL konnte aus den Genexpressionsdaten ebenfalls ein neuer Prädiktor vorgeschlagen werden. Mit den zwischen lang und kurz überlebenden Patienten differentiell exprimierten Genen der MCL Patienten und mit den Genen, die zwischen den beiden Untergruppen von DLBCL reguliert sind, wurden Interaktionsnetzwerke gebildet. Diese zeigen, dass bei beiden Krebstypen Gene des Zellzyklus und der Proliferation zwischen Patienten mit kurzer und langer Überlebensdauer unterschiedlich reguliert sind. N2 - In this thesis, the development of a phylogenetic DNA microarray, the analysis of several gene expression microarray datasets and new approaches for improved data analysis and interpretation are described. In the first publication, the development and analysis of a phylogenetic microarray is presented. I could show that species detection with phylogenetic DNA microarrays can be significantly improved when the microarray data is analyzed with a linear regression modeling approach. Standard methods have so far relied on pure signal intensities of the array spots and a simple cutoff criterion was applied to call a species present or absent. This procedure is not applicable to very closely related species with high sequence similarity because cross-hybridization of non-target DNA renders species detection impossible based on signal intensities alone. By modeling hybridization and cross-hybridization with linear regression, as I have presented in this thesis, even species with a sequence similarity of 97% in the marker gene can be detected and distinguished from related species. Another advantage of the modeling approach over existing methods is that the model also performs well on mixtures of different species. In principle, also quantitative predictions can be made. To make better use of the large amounts of microarray data stored in public databases, meta-analysis approaches need to be developed. In the second publication, an explorative meta-analysis exemplified on Arabidopsis thaliana gene expression datasets is presented. Integrating datasets studying effects such as the influence of plant hormones, pathogens and different mutations on gene expression levels, clusters of similarly treated datasets could be found. From the clusters of pathogen-treated and indole-3-acetic acid (IAA) treated datasets, representative genes were selected which pointed to functions which had been associated with pathogen attack or IAA effects previously. Additionally, hypotheses about the functions of so far uncharacterized genes could be set up. Thus, this kind of meta-analysis could be used to propose gene functions and their regulation under different conditions. In this work, also primary data analysis of Arabidopsis thaliana datasets is presented. In the third publication, an experiment which was conducted to find out if microwave irradiation has an effect on the gene expression of a plant cell culture is described. During the first steps, the data analysis was carried out blinded and exploratory analysis methods were applied to find out if the irradiation had an effect on gene expression of plant cells. Small but statistically significant changes in a few genes were found and could be experimentally confirmed. From the functions of the regulated genes and a meta-analysis with publicly available microarray data, it could be suspected that the plant cell culture somehow perceived the irradiation as energy, similar to perceiving light rays. The fourth publication describes the functional analysis of another Arabidopsis thaliana gene expression dataset. The gene expression data of the plant tumor dataset pointed to a switch from a mainly aerobic, auxotrophic to an anaerobic and heterotrophic metabolism in the plant tumor. Genes involved in photosynthesis were found to be repressed in tumors; genes of amino acid and lipid metabolism, cell wall and solute transporters were regulated in a way that sustains tumor growth and development. Furthermore, in the fifth publication, GEPAT (Genome Expression Pathway Analysis Tool), a tool for the analysis and integration of microarray data with other data types, is described. It consists of a web application and database which allows comfortable data upload and data analysis. In later chapters of this thesis (publication 6 and publication 7), GEPAT is used to analyze human microarray datasets and to integrate results from gene expression analysis with other datatypes. Gene expression and comparative genomic hybridization data from 71 Mantle Cell Lymphoma (MCL) patients was analyzed and allowed proposing a seven gene predictor which facilitates survival predictions for patients compared to existing predictors. In this study, it was shown that CGH data can be used for survival predictions. For the dataset of Diffuse Large B-cell lymphoma (DLBCL) patients, an improved survival predictor could be found based on the gene expression data. From the genes differentially expressed between long and short surviving MCL patients as well as for regulated genes of DLBCL patients, interaction networks could be set up. They point to differences in regulation for cell cycle and proliferation genes between patients with good and bad prognosis. KW - Microarray KW - Differentielle Genexpression KW - Genexpression KW - Statistische Analyse KW - Cluster-Analyse KW - Datenanalyse KW - Explorative Datenanalyse KW - Non-Hodgkin-Lymphom KW - B-Zell-Lymphom KW - Metabolom KW - Tumorklassifikation KW - Tumor KW - Krebs KW - Schmalwa KW - phylogenetische Arrays KW - Interaktionsnetzwerke KW - lineare Regression KW - DNA microarray KW - gene expression KW - statistical analysis KW - clustering KW - classification KW - interaction networks Y1 - 2008 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-29747 ER - TY - THES A1 - Blenk, Steffen T1 - Bioinformatical analysis of B-cell lymphomas T1 - Bioinformatische Analyse von B-Zell Lymphomen N2 - Background: The frequency of the most observed cancer, Non Hodgkin Lymphoma (NHL), is further rising. Diffuse large B-cell lymphoma (DLBCL) is the most common of the NHLs. There are two subgroups of DLBCL with different gene expression patterns: ABC (“Activated B-like DLBCL”) and GCB (“Germinal Center B-like DLBCL”). Without therapy the patients often die within a few months, the ABC type exhibits the more aggressive behaviour. A further B-cell lymphoma is the Mantle cell lymphoma (MCL). It is rare and shows very poor prognosis. There is no cure yet. Methods: In this project these B-cell lymphomas were examined with methods from bioinformatics, to find new characteristics or undiscovered events on the molecular level. This would improve understanding and therapy of lymphomas. For this purpose we used survival, gene expression and comparative genomic hybridization (CGH) data. In some clinical studies, you get large data sets, from which one can reveal yet unknown trends. Results (MCL): The published proliferation signature correlates directly with survival. Exploratory analyses of gene expression and CGH data of MCL samples (n=71) revealed a valid grouping according to the median of the proliferation signature values. The second axis of correspondence analysis distinguishes between good and bad prognosis. Statistical testing (moderate t-test, Wilcoxon rank-sum test) showed differences in the cell cycle and delivered a network of kinases, which are responsible for the difference between good and bad prognosis. A set of seven genes (CENPE, CDC20, HPRT1, CDC2, BIRC5, ASPM, IGF2BP3) predicted, similarly well, survival patterns as proliferation signature with 20 genes. Furthermore, some bands could be associated with prognosis in the explorative analysis (chromosome 9: 9p24, 9p23, 9p22, 9p21, 9q33 and 9q34). Results (DLBCL): New normalization of gene expression data of DLBCL patients revealed better separation of risk groups by the 2002 published signature based predictor. We could achieve, similarly well, a separation with six genes. Exploratory analysis of gene expression data could confirm the subgroups ABC and GCB. We recognized a clear difference in early and late cell cycle stages of cell cycle genes, which can separate ABC and GCB. Classical lymphoma and best separating genes form a network, which can classify and explain the ABC and GCB groups. Together with gene sets which identify ABC and GCB we get a network, which can classify and explain the ABC and GCB groups (ASB13, BCL2, BCL6, BCL7A, CCND2, COL3A1, CTGF, FN1, FOXP1, IGHM, IRF4, LMO2, LRMP, MAPK10, MME, MYBL1, NEIL1 and SH3BP5; Altogether these findings are useful for diagnosis, prognosis and therapy (cytostatic drugs). N2 - Hintergrund: Die Häufigkeit von Non-Hodgkin-Lymphomen (NHL), den am meisten beobachteten Krebserkrankungen, steigt weiter an. Von den aggressiven Non-Hodgkin-Lymphomen (NHL) macht das “großzellige, diffuse B-Zell-Lymphom” (DLBCL) den größten Anteil aus. Durch Genexpressionsmuster wurden zwei Subtypen definiert: ACB (“Activated B-like DLBCL”) und GCB (“Germinal Center B-like DLBCL”). Die Patienten der Gruppe ABC sterben ohne Therapie oft innerhalb weniger Monate, weil der ABC Typ einen aggressiveren Krankheitsverlauf aufweist. Ein weiteres, von einer malignen Entartung der B-Lymphozyten ausgehendes Lymphom, ist das “Mantelzell Lymphom” (MCL). Es tritt selten auf und ist ebenfalls mit einer schlechten Prognose verbunden. Eine vollständige Heilung nach der Therapie ist sehr selten. Methoden: In diesem Projekt wurden diese B-zell Lymphome mit bioinformatischen Methoden untersucht, um auf molekularer Ebene neue Eigenschaften oder bisher unentdeckte Zusammenhänge zu finden. Das würde das Verständnis und damit auch die Therapie voranbringen. Dafür standen uns Überlebens-, Genexpressions- und chromosomale Aberrationsdaten zur Verfügung. Sie sind die bevorzugte Wahl der Mittel, um genetische Veränderungen in Tumorzellen zu bestimmen. Hierbei fallen oft große Datenmengen an, aus welchen man mit bioinformatischen Methoden vorher unerkannte Trends und Hinweise identifizieren kann. Ergebnisse (MCL): Explorative Analysen sowohl der Genexpressions- (zweite Hauptachse der Korrespondenz Analyse) als auch der chromosomalen Aberrationsdaten des Mantelzell-Lymphom zeigten uns hierbei, daß es trotz der linearen Korrelation zwischen der veröffentlichten Proliferationssignatur und der Überlebenszeit sinnvoll ist, in den Patienten (n=71) zwei Ausprägungen zu betrachten: Patienten mit schlechter und mit guter Prognose. Statistische Tests (moderate t-test, Wilcoxon rank-sum test) dieser beiden Typen zeigten Unterschiede im Zellzyklus und ein Netzwerk von Kinasen auf, welche für den Unterschied zwischen guter und schlechter Prognose verantwortlich sind. Sieben Gene (CENPE, CDC20, HPRT1, CDC2, BIRC5, ASPM, IGF2BP3) konnten gefunden werden, die eine ähnliche gute Prognose für Überlebenszeiten ermöglichen, wie eine früher veröffentlichte Proliferationssignatur mit 20 Genen. Außerdem konnten chromosomale Banden durch eine explorative Analyse mit der Prognose assoziiert werden (Chromosom 9: 9p24, 9p23, 9p22, 9p21, 9q33 and 9q34). Ergebnisse (DLBCL): Durch geeignete Normalisierung der Genexpressionsdaten von 248 DLBCL-Patienten trennte der Signatur basierte Predictor die Risikogruppen nun besser auf. Eine ähnlich gute Auftrennung konnte von uns sogar mit sechs Genen erreicht werden. Die explorative Analyse der Genexpressionsdaten konnte die Subtypen ABC und GCB als valide Gruppen bestätigen. In den Genen, die ABC und GCB unterscheiden, ergab sich eine Häufung in späten und frühen Zellzyklusstadien. Klassische Lymphommarker, neu aufgefundene spezielle Gene und Zellzyklusgene bilden ein Netzwerk, das die ABC und GCB Gruppen klassifizieren und Unterschiede in deren Regulation erklären kann (ASB13, BCL2, BCL6, BCL7A, CCND2, COL3A1, CTGF, FN1, FOXP1, IGHM, IRF4, LMO2, LRMP, MAPK10, MME, MYBL1, NEIL1 and SH3BP5. Dies ist auch für die Diagnose, Prognose und Therapie (Zytostatika) interessant. KW - Bioinformatik KW - Genexpression KW - Auswertung KW - B-Zell-Lymphom KW - Diffuses großzelliges B-Zell-Lymphom KW - Mantelzell-Lymphom KW - Bioinformatics KW - gene expression KW - B-cell lymphoma KW - Diffuse large B-cell lymphoma (DLBCL) KW - Mantle cell lymphoma (MCL) Y1 - 2007 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-27421 ER -