TY - THES A1 - Wilde, Sabrina T1 - Einsatz von mechanistischen Biomarkern zur Charakterisierung und Bewertung von \(in\) \(vitro\) Genotoxinen T1 - Use of mechanistic biomarkers for the characterization and evaluation of \(in\) \(vitro\) genotoxins N2 - Die verfügbaren in vitro Genotoxizitätstests weisen hinsichtlich ihrer Spezifität und ihres Informationsgehalts zum vorliegenden Wirkmechanismus (Mode of Action, MoA) Einschränkungen auf. Um diese Mängel zu überwinden, wurden in dieser Arbeit zwei Ziele verfolgt, die zu der Entwicklung und Etablierung neuer in vitro Methoden zur Prüfung auf Genotoxizität in der Arzneimittelentwicklung beitragen. 1. Etablierung und Bewertung einer neuen in vitro Genotoxizitätsmethode (MultiFlow Methode) Die MultiFlow Methode basiert auf DNA-schadensassoziierten Proteinantworten von γH2AX (DNA-Doppelstrangbrüche), phosphorylierten H3 (S10) (mitotische Zellen), nukleären Protein p53 (Genotoxizität) und cleaved PARP1 (Apoptose) in TK6-Zellen. Insgesamt wurden 31 Modellsubstanzen mit dem MultiFlow Assay und ergänzend mit dem etablierten Mikrokerntest (MicroFlow MNT), auf ihre Fähigkeit verschiedene MoA-Gruppen (Aneugene/Klastogene/Nicht-Genotoxine) zu differenzieren, untersucht. Die Performance der „neuen“ gegenüber der „alten“ Methode führte zu einer verbesserten Sensitivität von 95% gegenüber 90%, Spezifität von 90% gegenüber 72% und einer MoA-Klassifizierungsrate von 85% gegenüber 45% (Aneugen vs. Klastogen). 2. Identifizierung mechanistischer Biomarker zur Klassifizierung genotoxischer Substanzen Die Analyse 67 ausgewählter DNA-schadensassoziierter Gene in der QuantiGene Plex Methode zeigte, dass mehrere Gene gleichzeitig zur MoA-Klassifizierung beitragen können. Die Kombination der höchstrangierten Marker BIK, KIF20A, TP53I3, DDB2 und OGG1 ermöglichte die beste Identifizierungsrate der Modellsubstanzen. Das synergetische Modell kategorisierte 16 von 16 Substanzen korrekt in Aneugene, Klastogene und Nicht-Genotoxine. Unter Verwendung der Leave-One-Out-Kreuzvalidierung wurde das Modell evaluiert und erreichte eine Sensitivität, Spezifität und Prädiktivität von 86%, 83% und 85%. Ergebnisse der traditionellen qPCR Methode zeigten, dass Genotoxizität mit TP53I3, Klastogenität mit ATR und RAD17 und oxidativer Stress mit NFE2L2 detektiert werden kann. Durch die Untersuchungen von posttranslationalen Modifikationen unter Verwendung der High-Content-Imaging-Technologie wurden mechanistische Assoziationen für BubR1 (S670) und pH3 (S28) mit Aneugenität, 53BP1 (S1778) und FANCD2 (S1404) mit Klastogenität, p53 (K373) mit Genotoxizität und Nrf2 (S40) mit oxidativem Stress identifiziert. Diese Arbeit zeigt, dass (Geno)toxine unterschiedliche Gen- und Proteinveränderungen in TK6-Zellen induzieren, die zur Erfassung mechanistischer Aktivitäten und Einteilung (geno)toxischer MoA-Gruppen (Aneugen/Klastogen/ Reaktive Sauerstoffspezies) eingesetzt werden können und daher eine bessere Risikobewertung von Wirkstoffkandidaten ermöglichen. N2 - Available in vitro genotoxicity tests have limitations regarding their specificity and mode of action (MoA) information. To overcome these shortages, two objectives were pursued in this work to develop and establish new in vitro tools for genotoxicity testing. 1. Establishment and evaluation of a novel in vitro genotoxicity method (MultiFlow method) The MultiFlow method is based on DNA damage-related protein responses of γH2AX (DNA double-strand breaks), phosphorylated H3 (S10) (mitotic cells), nuclear protein p53 (genotoxicity) and cleaved PARP1 (apoptosis) in TK6 cells. In total, 31 model substances were studied flow cytometrically in the MultiFlow assay - and also with the well-established micronucleus test (MicroFlow MNT) - for their ability to classify across MoA groups: aneugens, clastogens and non-genotoxicants. The performance of the new method resulted in an improved sensitivity of 95% to 90%, specificity of 90% to 72% and a MoA classification rate of 85% to 45% (aneugen vs. clastogen). 2. Identification of mechanistic biomarkers for the characterization of genotoxicants The analysis of 67 selected DNA-damage associated genes using the QuantiGene Plex method showed that a combinaten of genes can contribute to MoA classification. The combination of the highest-ranked markers (BIK, KIF20A, TP53I3, DDB2 and OGG1) highlighted the best identification rate of model substances. The synergistic statistic tool correctly categorized 16 of 16 substances into aneugens, clastogens and non-genotoxicants. By using leave-one out cross validation, the model was evaluated and achieved a sensitivity, specificity and predictivity of 86%, 83%, 85% respectively. Follow-up with qPCR was conducted and revealed associations with TP53I3 for genotoxicity, ATR and RAD17 for clastogenicity and NFE2L2 for oxidative stress. By investigating posttranslational modifications using high-content imaging, associations for BubR1 (S670) and pH3 (S28) with aneugenicity, 53BP1 (S1778) and FANCD2 (S1404) with clastogenicity, p53 (K373) with genotoxicity and Nrf2 (S40) with oxidative stress were found to be further useful for MoA identification. This work demonstrates that genotoxicants and non-genotoxicants induce different gene- and protein expression changes in the TK6 cells that can be used to classify the MoA groups (aneugen/clastogen/non-genotoxicant/reactive oxygen species), thus enabling better risk assessment of potential drug candidates. KW - Genotoxizität KW - Genotoxicitiy KW - Klastogene KW - Aneugene KW - Biomarker KW - Klassifizierung KW - clastogens KW - aneugens KW - biomarker KW - classification Y1 - 2019 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-182782 ER - TY - JOUR A1 - Staiger, Christine A1 - Cadot, Sidney A1 - Kooter, Raul A1 - Dittrich, Marcus A1 - Müller, Tobias A1 - Klau, Gunnar W. A1 - Wessels, Lodewyk F. A. T1 - A Critical Evaluation of Network and Pathway-Based Classifiers for Outcome Prediction in Breast Cancer JF - PLoS One N2 - Recently, several classifiers that combine primary tumor data, like gene expression data, and secondary data sources, such as protein-protein interaction networks, have been proposed for predicting outcome in breast cancer. In these approaches, new composite features are typically constructed by aggregating the expression levels of several genes. The secondary data sources are employed to guide this aggregation. Although many studies claim that these approaches improve classification performance over single genes classifiers, the gain in performance is difficult to assess. This stems mainly from the fact that different breast cancer data sets and validation procedures are employed to assess the performance. Here we address these issues by employing a large cohort of six breast cancer data sets as benchmark set and by performing an unbiased evaluation of the classification accuracies of the different approaches. Contrary to previous claims, we find that composite feature classifiers do not outperform simple single genes classifiers. We investigate the effect of (1) the number of selected features; (2) the specific gene set from which features are selected; (3) the size of the training set and (4) the heterogeneity of the data set on the performance of composite feature and single genes classifiers. Strikingly, we find that randomization of secondary data sources, which destroys all biological information in these sources, does not result in a deterioration in performance of composite feature classifiers. Finally, we show that when a proper correction for gene set size is performed, the stability of single genes sets is similar to the stability of composite feature sets. Based on these results there is currently no reason to prefer prognostic classifiers based on composite features over single genes classifiers for predicting outcome in breast cancer. KW - modules KW - protein-interaction networks KW - expression signature KW - classification KW - set KW - metastasis KW - stability KW - survival KW - database KW - markers Y1 - 2012 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-131323 VL - 7 IS - 4 ER - TY - THES A1 - Engelmann, Julia Cathérine T1 - DNA microarrays: applications and novel approaches for analysis and interpretation T1 - DNA Mikroarrays: Anwendungen und neue Ansätze für die Analyse und Interpretation N2 - In der vorliegenden Dissertation wird die Entwicklung eines phylogenetischen DNA Microarrays, die Analyse von mehreren Microarray-Genexpressionsdatensätzen und neue Ansätze für die Datenanalyse und Interpretation der Ergebnisse vorgestellt. Die Entwicklung und Analyse der Daten eines phylogenetischen DNA Microarrays wird in der ersten Publikation dargestellt. Ich konnte zeigen, dass die Spezies-Detektion mit phylogenetischen Microarrays durch die Datenanalyse mit einem linearen Regressionsansatz signifikant verbessert werden kann. Standard-Methoden haben bislang nur Signalintensitäten betrachtet und eine Spezies als an- oder abwesend bezeichnet, wenn die Signalintensität ihres Messpunktes oberhalb eines willkürlich gesetzten Schwellenwertes lag. Dieses Verfahren ist allerdings aufgrund von Kreuz-Hybridisierungen nicht auf sehr nah verwandte Spezies mit hoher Sequenzidentität anwendbar. Durch die Modellierung des Hybridisierungs und Kreuz-Hybridisierungsverhaltens mit einem linearen Regressionsmodell konnte ich zeigen, dass Spezies mit einer Sequenzähnlichkeit von 97% im Markergen immer noch unterschieden werden können. Ein weiterer Vorteil der Modellierung ist, dass auch Mischungen verschiedener Spezies zuverlässig vorhergesagt werden können. Theoretisch sind auch quantitative Vorhersagen mit diesem Modell möglich. Um die großen Datenmengen, die in öffentlichen Microarray-Datenbanken abgelegt sind besser nutzen zu können, bieten sich Meta-Analysen an. In der zweiten Publikation wird eine explorative Meta-Analyse auf Arabidopsis thaliana-Datensätzen vorgestellt. Mit der Analyse verschiedener Datensätze, die den Einfluss von Pflanzenhormonen, Pathogenen oder verschiedenen Mutationen auf die Genexpression untersucht haben, konnten die Datensätze anhand ihrer Genexpressionsprofile in drei große Gruppen eingeordnet werden: Experimente mit Indol-3-Essigsäure (IAA), mit Pathogenen und andere Experimente. Gene, die charakteristisch für die Gruppe der IAA-Datensätze beziehungsweise für die Gruppe der Pathogen-Datensätze sind, wurden näher betrachtet. Diese Gene hatten Funktionen, die bereits mit Pathogenbefall bzw. dem Einfluss von IAA in Verbindung gebracht wurden. Außerdem wurden Hypothesen über die Funktionen von bislang nicht annotierten Genen aufgestellt. In dieser Arbeit werden auch Primäranalysen von einzelnen Arabidopsis thaliana Genexpressions-Datensätzen vorgestellt. In der dritten Publikation wird ein Experiment beschrieben, das durchgeführt wurde um herauszufinden ob Mikrowellen-Strahlung einen Einfluss auf die Genexpression einer Zellkultur hat. Dazu wurden explorative Analysemethoden angewendet. Es wurden geringe aber signifikante Veränderungen in einer sehr kleinen Anzahl von Genen beobachtet, die experimentell bestätigt werden konnten. Die Funktionen der regulierten Gene und eine Meta-Analyse mit öffentlich zugänglichen Datensätzen einer Datenbank deuten darauf hin, dass die pflanzliche Zellkultur die Strahlung als eine Art Energiequelle ähnlich dem Licht wahrnimmt. Des weiteren wird in der vierten Publikation die funktionelle Analyse eines Arabidopsis thaliana Genexpressionsdatensatzes beschrieben. Die Analyse der Genexpressions eines pflanzlichen Tumores zeigte, dass er seinen Stoffwechsel von aerob und auxotroph auf anaerob und heterotroph umstellt. Gene der Photosynthese werden im Tumorgewebe reprimiert, Gene des Aminosäure- und Fettstoffwechsels, der Zellwand und Transportkanäle werden so reguliert, dass Wachstum und Entwicklung des Tumors gefördert werden. In der fünften Publikation in dieser Arbeit wird GEPAT (Genome Expression Pathway Analysis Tool) beschrieben. Es besteht aus einer Internet- Anwendung und einer Datenbank, die das einfache Hochladen von Datensätzen in die Datenbank und viele Möglichkeiten der Datenanalyse und die Integration anderer Datentypen erlaubt. In den folgenden zwei Publikationen (Publikation 6 und Publikation 7) wird GEPAT auf humane Microarray-Datensätze angewendet um Genexpressionsdaten mit weiteren Datentypen zu verknüpfen. Genexpressionsdaten und Daten aus vergleichender Genom-Hybridisierung (CGH) von primären Tumoren von 71 Mantel-Zell-Lymphom (MCL) Patienten ermöglichte die Ermittlung eines Prädiktors, der die Vorhersage der Überlebensdauer von Patienten gegenüber herkömmlichen Methoden verbessert. Die Analyse der CGH Daten zeigte, dass auch diese für die Vorhersage der Überlebensdauer geeignet sind. Für den Datensatz von Patienten mit großzellig diffusem B-Zell-Lymphom DLBCL konnte aus den Genexpressionsdaten ebenfalls ein neuer Prädiktor vorgeschlagen werden. Mit den zwischen lang und kurz überlebenden Patienten differentiell exprimierten Genen der MCL Patienten und mit den Genen, die zwischen den beiden Untergruppen von DLBCL reguliert sind, wurden Interaktionsnetzwerke gebildet. Diese zeigen, dass bei beiden Krebstypen Gene des Zellzyklus und der Proliferation zwischen Patienten mit kurzer und langer Überlebensdauer unterschiedlich reguliert sind. N2 - In this thesis, the development of a phylogenetic DNA microarray, the analysis of several gene expression microarray datasets and new approaches for improved data analysis and interpretation are described. In the first publication, the development and analysis of a phylogenetic microarray is presented. I could show that species detection with phylogenetic DNA microarrays can be significantly improved when the microarray data is analyzed with a linear regression modeling approach. Standard methods have so far relied on pure signal intensities of the array spots and a simple cutoff criterion was applied to call a species present or absent. This procedure is not applicable to very closely related species with high sequence similarity because cross-hybridization of non-target DNA renders species detection impossible based on signal intensities alone. By modeling hybridization and cross-hybridization with linear regression, as I have presented in this thesis, even species with a sequence similarity of 97% in the marker gene can be detected and distinguished from related species. Another advantage of the modeling approach over existing methods is that the model also performs well on mixtures of different species. In principle, also quantitative predictions can be made. To make better use of the large amounts of microarray data stored in public databases, meta-analysis approaches need to be developed. In the second publication, an explorative meta-analysis exemplified on Arabidopsis thaliana gene expression datasets is presented. Integrating datasets studying effects such as the influence of plant hormones, pathogens and different mutations on gene expression levels, clusters of similarly treated datasets could be found. From the clusters of pathogen-treated and indole-3-acetic acid (IAA) treated datasets, representative genes were selected which pointed to functions which had been associated with pathogen attack or IAA effects previously. Additionally, hypotheses about the functions of so far uncharacterized genes could be set up. Thus, this kind of meta-analysis could be used to propose gene functions and their regulation under different conditions. In this work, also primary data analysis of Arabidopsis thaliana datasets is presented. In the third publication, an experiment which was conducted to find out if microwave irradiation has an effect on the gene expression of a plant cell culture is described. During the first steps, the data analysis was carried out blinded and exploratory analysis methods were applied to find out if the irradiation had an effect on gene expression of plant cells. Small but statistically significant changes in a few genes were found and could be experimentally confirmed. From the functions of the regulated genes and a meta-analysis with publicly available microarray data, it could be suspected that the plant cell culture somehow perceived the irradiation as energy, similar to perceiving light rays. The fourth publication describes the functional analysis of another Arabidopsis thaliana gene expression dataset. The gene expression data of the plant tumor dataset pointed to a switch from a mainly aerobic, auxotrophic to an anaerobic and heterotrophic metabolism in the plant tumor. Genes involved in photosynthesis were found to be repressed in tumors; genes of amino acid and lipid metabolism, cell wall and solute transporters were regulated in a way that sustains tumor growth and development. Furthermore, in the fifth publication, GEPAT (Genome Expression Pathway Analysis Tool), a tool for the analysis and integration of microarray data with other data types, is described. It consists of a web application and database which allows comfortable data upload and data analysis. In later chapters of this thesis (publication 6 and publication 7), GEPAT is used to analyze human microarray datasets and to integrate results from gene expression analysis with other datatypes. Gene expression and comparative genomic hybridization data from 71 Mantle Cell Lymphoma (MCL) patients was analyzed and allowed proposing a seven gene predictor which facilitates survival predictions for patients compared to existing predictors. In this study, it was shown that CGH data can be used for survival predictions. For the dataset of Diffuse Large B-cell lymphoma (DLBCL) patients, an improved survival predictor could be found based on the gene expression data. From the genes differentially expressed between long and short surviving MCL patients as well as for regulated genes of DLBCL patients, interaction networks could be set up. They point to differences in regulation for cell cycle and proliferation genes between patients with good and bad prognosis. KW - Microarray KW - Differentielle Genexpression KW - Genexpression KW - Statistische Analyse KW - Cluster-Analyse KW - Datenanalyse KW - Explorative Datenanalyse KW - Non-Hodgkin-Lymphom KW - B-Zell-Lymphom KW - Metabolom KW - Tumorklassifikation KW - Tumor KW - Krebs KW - Schmalwa KW - phylogenetische Arrays KW - Interaktionsnetzwerke KW - lineare Regression KW - DNA microarray KW - gene expression KW - statistical analysis KW - clustering KW - classification KW - interaction networks Y1 - 2008 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-29747 ER -