Refine
Has Fulltext
- yes (2)
Is part of the Bibliography
- yes (2)
Document Type
- Doctoral Thesis (2)
Keywords
- Tumor (2) (remove)
Institute
- Pathologisches Institut (2) (remove)
Machine-Learning-Based Identification of Tumor Entities, Tumor Subgroups, and Therapy Options
(2023)
Molecular genetic analyses, such as mutation analyses, are becoming increasingly important in the tumor field, especially in the context of therapy stratification. The identification of the underlying tumor entity is crucial, but can sometimes be difficult, for example in the case of metastases or the so-called Cancer of Unknown Primary (CUP) syndrome. In recent years, methylome and transcriptome utilizing machine learning (ML) approaches have been developed to enable fast and reliable tumor and tumor subtype identification. However, so far only methylome analysis have become widely used in routine diagnostics.
The present work addresses the utility of publicly available RNA-sequencing data to determine the underlying tumor entity, possible subgroups, and potential therapy options. Identification of these by ML - in particular random forest (RF) models - was the first task. The results with test accuracies of up to 99% provided new, previously unknown insights into the trained models and the corresponding entity prediction. Reducing the input data to the top 100 mRNA transcripts resulted in a minimal loss of prediction quality and could potentially enable application in clinical or real-world settings.
By introducing the ratios of these top 100 genes to each other as a new database for RF models, a novel method was developed enabling the use of trained RF models on data from other sources.
Further analysis of the transcriptomic differences of metastatic samples by visual clustering showed that there were no differences specific for the site of metastasis. Similarly, no distinct clusters were detectable when investigating primary tumors and metastases of cutaneous skin melanoma (SKCM).
Subsequently, more than half of the validation datasets had a prediction accuracy of at least 80%, with many datasets even achieving a prediction accuracy of – or close to – 100%.
To investigate the applicability of the used methods for subgroup identification, the TCGA-KIPAN dataset, consisting of the three major kidney cancer subgroups, was used. The results revealed a new, previously unknown subgroup consisting of all histopathological groups with clinically relevant characteristics, such as significantly different survival. Based on significant differences in gene expression, potential therapeutic options of the identified subgroup could be proposed.
Concludingly, in exploring the potential applicability of RNA-sequencing data as a basis for therapy prediction, it was shown that this type of data is suitable to predict entities as well as subgroups with high accuracy. Clinical relevance was also demonstrated for a novel subgroup in renal cell carcinoma. The reduction of the number of genes required for entity prediction to 100 genes, enables panel sequencing and thus demonstrates potential applicability in a real-life setting.
Das follikuläre Lymphom ist eines der häufigsten Non-Hodgkin Lymphome und überwiegend eine Erkrankung des erwachsenen Menschen. In der WHO-Klassifikation ist es als ein Lymphom von Keimzentrumszellen definiert, das follikulär und/oder diffus wachsen kann. Zur Subklassifikation follikulärer Lymphome empfiehlt die WHO-Klassifikation eine Unterscheidung der Grade 1, 2 und 3 durch Auszählen der Zentroblasten pro zehn Gesichtsfelder in starker Vergrößerung. Beim Grad 3A liegen neben Zentroblasten auch Zentrozyten vor. FL Grad 3B bestehen ausschließlich aus Zentroblasten. Hinsichtlich der Zytomorphologie, Immunhistologie und Genetik bestehen deutliche Unterschiede zwischen FL Grad 1, 2 und 3A gegenüber FL Grad 3B. In der vorliegenden Arbeit konnte gezeigt werden, dass die weit überwiegende Zahl der follikulären Lymphome Grad 1, 2 und 3A ein prädominant follikuläres Wachstumsmuster aufwies. Ein follikulärer und diffuser Wuchstyp lag seltener vor. Noch seltener war ein überwiegend bzw. „rein“ diffuses Wachstumsmuster. Die mitotische und proliferative Aktivität stieg mit dem Tumorgrad linear an. Hinsichtlich der CD10 Reaktivität, der BCL-2 und p53 Expression sowie des Nachweises einer sekretorischen Differenzierung ergaben sich beim Vergleich der FL Grad 1 bis 3A keine statistisch signifikanten Unterschiede. Die BCL-2 Expression nahm allerdings bei den FL1-3A mit zunehmendem Grad ab. In zytogenetischen Untersuchungen wurden in allen follikulären Lymphomen Grad 1 bis 3A primäre bzw. sekundäre Chromosomenaberrationen gefunden. Unter den rekurrenten chromosomalen Alterationen trat die Translokation t(14;18)(q32;q21) am häufigsten auf und war insbesondere bei follikulären Lymphomen Grad 1 und 2, in etwas geringerem Maße auch bei FL Grad 3A anzutreffen. Diese Translokation scheint also in einem frühen Stadium der B-Zell-Entwicklung aufzutreten und führt primär zu einem höher differenzierten (zentrozytenreichen) Lymphom. Die t(14;18) bedingt zumeist eine Überexpression des BCL-2 Gens, die sich auch immunhistochemisch nachweisen lässt und diagnostische Verwendung findet. Das BCL-2 Protein ist daher von Nutzen für die Unterscheidung neoplastischer von reaktiven Follikeln, nicht aber, um follikuläre von anderen „low grade“ B-Zell Lymphomen zu unterscheiden. Die sekundären Alterationen charakterisieren bestimmte undifferenzierte Stadien mit hohem Blastenanteil und einer hohen mitotischen und proliferativen Aktivität. In zytogenetischen Untersuchungen von überwiegend diffus wachsenden FL konnte keine Translokation t(14;18)(q32;q21) nachgewiesen werden. Die identische Morphologie dieser Lymphome und die identischen Veränderungen auch auf genetischer Ebene deuten auf die nahe Verwandtschaft der überwiegend diffus wachsenden FL mit den typischen Keimzentrums-lymphomen hin. Es handelt sich jedoch um eine eigenständige Identität, die differenzierten Keimzentrumslymphome, die wahrscheinlich aufgrund des Fehlens einer t(14;18)(q32;q21) ein primär und ausgeprägt diffuses Wachstumsmuster aufweisen.