@phdthesis{Engelmann2008, author = {Engelmann, Julia Cath{\´e}rine}, title = {DNA microarrays: applications and novel approaches for analysis and interpretation}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-29747}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2008}, abstract = {In der vorliegenden Dissertation wird die Entwicklung eines phylogenetischen DNA Microarrays, die Analyse von mehreren Microarray-Genexpressionsdatens{\"a}tzen und neue Ans{\"a}tze f{\"u}r die Datenanalyse und Interpretation der Ergebnisse vorgestellt. Die Entwicklung und Analyse der Daten eines phylogenetischen DNA Microarrays wird in der ersten Publikation dargestellt. Ich konnte zeigen, dass die Spezies-Detektion mit phylogenetischen Microarrays durch die Datenanalyse mit einem linearen Regressionsansatz signifikant verbessert werden kann. Standard-Methoden haben bislang nur Signalintensit{\"a}ten betrachtet und eine Spezies als an- oder abwesend bezeichnet, wenn die Signalintensit{\"a}t ihres Messpunktes oberhalb eines willk{\"u}rlich gesetzten Schwellenwertes lag. Dieses Verfahren ist allerdings aufgrund von Kreuz-Hybridisierungen nicht auf sehr nah verwandte Spezies mit hoher Sequenzidentit{\"a}t anwendbar. Durch die Modellierung des Hybridisierungs und Kreuz-Hybridisierungsverhaltens mit einem linearen Regressionsmodell konnte ich zeigen, dass Spezies mit einer Sequenz{\"a}hnlichkeit von 97\% im Markergen immer noch unterschieden werden k{\"o}nnen. Ein weiterer Vorteil der Modellierung ist, dass auch Mischungen verschiedener Spezies zuverl{\"a}ssig vorhergesagt werden k{\"o}nnen. Theoretisch sind auch quantitative Vorhersagen mit diesem Modell m{\"o}glich. Um die großen Datenmengen, die in {\"o}ffentlichen Microarray-Datenbanken abgelegt sind besser nutzen zu k{\"o}nnen, bieten sich Meta-Analysen an. In der zweiten Publikation wird eine explorative Meta-Analyse auf Arabidopsis thaliana-Datens{\"a}tzen vorgestellt. Mit der Analyse verschiedener Datens{\"a}tze, die den Einfluss von Pflanzenhormonen, Pathogenen oder verschiedenen Mutationen auf die Genexpression untersucht haben, konnten die Datens{\"a}tze anhand ihrer Genexpressionsprofile in drei große Gruppen eingeordnet werden: Experimente mit Indol-3-Essigs{\"a}ure (IAA), mit Pathogenen und andere Experimente. Gene, die charakteristisch f{\"u}r die Gruppe der IAA-Datens{\"a}tze beziehungsweise f{\"u}r die Gruppe der Pathogen-Datens{\"a}tze sind, wurden n{\"a}her betrachtet. Diese Gene hatten Funktionen, die bereits mit Pathogenbefall bzw. dem Einfluss von IAA in Verbindung gebracht wurden. Außerdem wurden Hypothesen {\"u}ber die Funktionen von bislang nicht annotierten Genen aufgestellt. In dieser Arbeit werden auch Prim{\"a}ranalysen von einzelnen Arabidopsis thaliana Genexpressions-Datens{\"a}tzen vorgestellt. In der dritten Publikation wird ein Experiment beschrieben, das durchgef{\"u}hrt wurde um herauszufinden ob Mikrowellen-Strahlung einen Einfluss auf die Genexpression einer Zellkultur hat. Dazu wurden explorative Analysemethoden angewendet. Es wurden geringe aber signifikante Ver{\"a}nderungen in einer sehr kleinen Anzahl von Genen beobachtet, die experimentell best{\"a}tigt werden konnten. Die Funktionen der regulierten Gene und eine Meta-Analyse mit {\"o}ffentlich zug{\"a}nglichen Datens{\"a}tzen einer Datenbank deuten darauf hin, dass die pflanzliche Zellkultur die Strahlung als eine Art Energiequelle {\"a}hnlich dem Licht wahrnimmt. Des weiteren wird in der vierten Publikation die funktionelle Analyse eines Arabidopsis thaliana Genexpressionsdatensatzes beschrieben. Die Analyse der Genexpressions eines pflanzlichen Tumores zeigte, dass er seinen Stoffwechsel von aerob und auxotroph auf anaerob und heterotroph umstellt. Gene der Photosynthese werden im Tumorgewebe reprimiert, Gene des Aminos{\"a}ure- und Fettstoffwechsels, der Zellwand und Transportkan{\"a}le werden so reguliert, dass Wachstum und Entwicklung des Tumors gef{\"o}rdert werden. In der f{\"u}nften Publikation in dieser Arbeit wird GEPAT (Genome Expression Pathway Analysis Tool) beschrieben. Es besteht aus einer Internet- Anwendung und einer Datenbank, die das einfache Hochladen von Datens{\"a}tzen in die Datenbank und viele M{\"o}glichkeiten der Datenanalyse und die Integration anderer Datentypen erlaubt. In den folgenden zwei Publikationen (Publikation 6 und Publikation 7) wird GEPAT auf humane Microarray-Datens{\"a}tze angewendet um Genexpressionsdaten mit weiteren Datentypen zu verkn{\"u}pfen. Genexpressionsdaten und Daten aus vergleichender Genom-Hybridisierung (CGH) von prim{\"a}ren Tumoren von 71 Mantel-Zell-Lymphom (MCL) Patienten erm{\"o}glichte die Ermittlung eines Pr{\"a}diktors, der die Vorhersage der {\"U}berlebensdauer von Patienten gegen{\"u}ber herk{\"o}mmlichen Methoden verbessert. Die Analyse der CGH Daten zeigte, dass auch diese f{\"u}r die Vorhersage der {\"U}berlebensdauer geeignet sind. F{\"u}r den Datensatz von Patienten mit großzellig diffusem B-Zell-Lymphom DLBCL konnte aus den Genexpressionsdaten ebenfalls ein neuer Pr{\"a}diktor vorgeschlagen werden. Mit den zwischen lang und kurz {\"u}berlebenden Patienten differentiell exprimierten Genen der MCL Patienten und mit den Genen, die zwischen den beiden Untergruppen von DLBCL reguliert sind, wurden Interaktionsnetzwerke gebildet. Diese zeigen, dass bei beiden Krebstypen Gene des Zellzyklus und der Proliferation zwischen Patienten mit kurzer und langer {\"U}berlebensdauer unterschiedlich reguliert sind.}, subject = {Microarray}, language = {en} } @phdthesis{Blenk2007, author = {Blenk, Steffen}, title = {Bioinformatical analysis of B-cell lymphomas}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-27421}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2007}, abstract = {Background: The frequency of the most observed cancer, Non Hodgkin Lymphoma (NHL), is further rising. Diffuse large B-cell lymphoma (DLBCL) is the most common of the NHLs. There are two subgroups of DLBCL with different gene expression patterns: ABC ("Activated B-like DLBCL") and GCB ("Germinal Center B-like DLBCL"). Without therapy the patients often die within a few months, the ABC type exhibits the more aggressive behaviour. A further B-cell lymphoma is the Mantle cell lymphoma (MCL). It is rare and shows very poor prognosis. There is no cure yet. Methods: In this project these B-cell lymphomas were examined with methods from bioinformatics, to find new characteristics or undiscovered events on the molecular level. This would improve understanding and therapy of lymphomas. For this purpose we used survival, gene expression and comparative genomic hybridization (CGH) data. In some clinical studies, you get large data sets, from which one can reveal yet unknown trends. Results (MCL): The published proliferation signature correlates directly with survival. Exploratory analyses of gene expression and CGH data of MCL samples (n=71) revealed a valid grouping according to the median of the proliferation signature values. The second axis of correspondence analysis distinguishes between good and bad prognosis. Statistical testing (moderate t-test, Wilcoxon rank-sum test) showed differences in the cell cycle and delivered a network of kinases, which are responsible for the difference between good and bad prognosis. A set of seven genes (CENPE, CDC20, HPRT1, CDC2, BIRC5, ASPM, IGF2BP3) predicted, similarly well, survival patterns as proliferation signature with 20 genes. Furthermore, some bands could be associated with prognosis in the explorative analysis (chromosome 9: 9p24, 9p23, 9p22, 9p21, 9q33 and 9q34). Results (DLBCL): New normalization of gene expression data of DLBCL patients revealed better separation of risk groups by the 2002 published signature based predictor. We could achieve, similarly well, a separation with six genes. Exploratory analysis of gene expression data could confirm the subgroups ABC and GCB. We recognized a clear difference in early and late cell cycle stages of cell cycle genes, which can separate ABC and GCB. Classical lymphoma and best separating genes form a network, which can classify and explain the ABC and GCB groups. Together with gene sets which identify ABC and GCB we get a network, which can classify and explain the ABC and GCB groups (ASB13, BCL2, BCL6, BCL7A, CCND2, COL3A1, CTGF, FN1, FOXP1, IGHM, IRF4, LMO2, LRMP, MAPK10, MME, MYBL1, NEIL1 and SH3BP5; Altogether these findings are useful for diagnosis, prognosis and therapy (cytostatic drugs).}, subject = {Bioinformatik}, language = {en} }