@phdthesis{Blenk2007, author = {Blenk, Steffen}, title = {Bioinformatical analysis of B-cell lymphomas}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-27421}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2007}, abstract = {Background: The frequency of the most observed cancer, Non Hodgkin Lymphoma (NHL), is further rising. Diffuse large B-cell lymphoma (DLBCL) is the most common of the NHLs. There are two subgroups of DLBCL with different gene expression patterns: ABC ("Activated B-like DLBCL") and GCB ("Germinal Center B-like DLBCL"). Without therapy the patients often die within a few months, the ABC type exhibits the more aggressive behaviour. A further B-cell lymphoma is the Mantle cell lymphoma (MCL). It is rare and shows very poor prognosis. There is no cure yet. Methods: In this project these B-cell lymphomas were examined with methods from bioinformatics, to find new characteristics or undiscovered events on the molecular level. This would improve understanding and therapy of lymphomas. For this purpose we used survival, gene expression and comparative genomic hybridization (CGH) data. In some clinical studies, you get large data sets, from which one can reveal yet unknown trends. Results (MCL): The published proliferation signature correlates directly with survival. Exploratory analyses of gene expression and CGH data of MCL samples (n=71) revealed a valid grouping according to the median of the proliferation signature values. The second axis of correspondence analysis distinguishes between good and bad prognosis. Statistical testing (moderate t-test, Wilcoxon rank-sum test) showed differences in the cell cycle and delivered a network of kinases, which are responsible for the difference between good and bad prognosis. A set of seven genes (CENPE, CDC20, HPRT1, CDC2, BIRC5, ASPM, IGF2BP3) predicted, similarly well, survival patterns as proliferation signature with 20 genes. Furthermore, some bands could be associated with prognosis in the explorative analysis (chromosome 9: 9p24, 9p23, 9p22, 9p21, 9q33 and 9q34). Results (DLBCL): New normalization of gene expression data of DLBCL patients revealed better separation of risk groups by the 2002 published signature based predictor. We could achieve, similarly well, a separation with six genes. Exploratory analysis of gene expression data could confirm the subgroups ABC and GCB. We recognized a clear difference in early and late cell cycle stages of cell cycle genes, which can separate ABC and GCB. Classical lymphoma and best separating genes form a network, which can classify and explain the ABC and GCB groups. Together with gene sets which identify ABC and GCB we get a network, which can classify and explain the ABC and GCB groups (ASB13, BCL2, BCL6, BCL7A, CCND2, COL3A1, CTGF, FN1, FOXP1, IGHM, IRF4, LMO2, LRMP, MAPK10, MME, MYBL1, NEIL1 and SH3BP5; Altogether these findings are useful for diagnosis, prognosis and therapy (cytostatic drugs).}, subject = {Bioinformatik}, language = {en} } @phdthesis{Busold2006, author = {Busold, Christian}, title = {Facilitating functional interpretation of microarray data by integration of gene annotations in Correspondence Analysis}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-21150}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2006}, abstract = {DNS-Chips ('Microarrays') haben sich zu einer der Standardmethoden zur Erstellung von genomweiten Expressionsstudien entwickelt. Mittlerweile wurden dazu eine Vielzahl von Methoden zur Identifizierung von differentiell regulierten Genen ver{\"o}ffentlicht. Ungeachtet dessen stellt die abschliessende funktionelle Interpretation der Ergebnisse einen der Engp{\"a}sse in der Analyse von Chip-Daten dar. Die Mehrzahl der Analysemethoden stellt die signifikant regulierten Gene in Listen dar, aus denen in einem weiteren Schritt gemeinsame funktionelle Eigenschaften abgeleitet werden m{\"u}ssen. Dies stellt nicht nur eine arbeitsintensive Arbeit dar, die mit steigender Anzahl an experimentellen Konditionen immer weniger praktikabel wird, sondern ist auch fehleranf{\"a}llig, da diese Auswertung im allgemeinen auf dem visuellen Vergleich von Listen beruht. In der vorliegenden Arbeit wurden Methoden f{\"u}r eine rechnergest{\"u}tzte Auswertung von funktionellen Geneigenschaften entwickelt und validiert. Hierzu wurde die 'Gene Ontology' als Quelle f{\"u}r die Annotationsdaten ausgew{\"a}hlt, da hier die Daten in einem Format gespeichert sind, das sowohl eine leichte menschliche Interaktion sowie die statistische Analyse der Annotationen erm{\"o}glicht. Diese Genannotation wurden als Zusatzinformationen in die Korrespondenzanalyse integriert, welches eine simultane Darstellung von Genen, Hybridisierungen und funktionellen Kategorien in einer Grafik erm{\"o}glicht. Aufgrund der st{\"a}ndig wachsenden Anzahl an verf{\"u}gbaren Annotationen und der Tatsache, daß zwischen den meisten experimentellen Bedingungen nur wenige funktionelle Prozesse differentiell reguliert sind, wurden Filter entwickelt, die die Anzahl der dargestellten Annotationen auf eine im gegebenen experimentellen Kontext relevante Gruppe reduzieren. Die Anwendbarkeit der Visualisierung und der Filter wurde auf Datens{\"a}tzen unterschiedlicher Komplexit{\"a}t getestet: beginnend mit dem gut verstandenen Glukosestoffwechsel im Modellorganismus S. cerevisiae, bis hin zum Vergleich unterschiedlicher Tumortypen im Menschen. In beiden F{\"a}llen generierte die Methode gut zu interpretierende Grafiken, in denen die funktionellen Hauptunterschiede durch die dargestellten Annotationen gut beschrieben werden [90]. W{\"a}hrend die Integration von Annotationsdaten wie GO die funktionelle Interpretation vereinfacht, fehlt die M{\"o}glichkeit zur Identifikation einzelner relevanter Schl{\"u}sselgene. Um eine solche Analyse zu erm{\"o}glichen, wurden Daten zum Vorkommen von Transskriptionsfaktorbindestellen in den 5'-Bereichen von Genen integriert. Auch diese Methode wurde an Datens{\"a}tzen von S. cerevisiae und vergleichenden Studien von humanen Krebszelllinien validiert.In beiden F{\"a}llen konnten Transkriptionsfaktoren identifiziert werden, die f{\"u}r die beobachteten transkriptionellen Unterschiede von entscheidender Bedeutung sind [206]. Zusammenfassend, erm{\"o}glicht die Integration von Zusatzinformationen in die Korrespondenzanalyse eine simultane Visualisierung von Genen, Hybridisierungen und Annotationsdaten in einer einzigen, gut zu interpretierenden Grafik. Dies erlaubt auch in komplexen experimentellen Bedingungen eine intuitive Identifizierung von relevanten Annotationen. Der hier vorgestellte Ansatz, ist nicht auf die gezeigten Datenstrukturen beschr{\"a}nkt, sondern kann auf die Mehrzahl der verf{\"u}gbaren Annotationsdaten angewendet werden.}, subject = {Microarray}, language = {en} }