Refine
Has Fulltext
- yes (2)
Is part of the Bibliography
- yes (2)
Year of publication
- 2016 (2)
Document Type
- Journal article (1)
- Doctoral Thesis (1)
Keywords
- Bioinformatic (1)
- Bioinformatik (1)
- DNS-Sequenz (1)
- Identifizierungspipeline (1)
- Next Generation Sequencing (1)
- Pipeline-Rechner (1)
- Sequenzierung (1)
- Somatische Mutation (1)
- Variantcalling (1)
- amplicon sequencing (1)
Die Sequenzierungstechnologien entwickeln sich stetig weiter, dies ermöglicht eine zuvor nicht erreichte Ausbeute an experimentellen Daten und auch an Neuentwicklungen von zuvor nicht realisierbaren Experimenten. Zugleich werden spezifische Datenbanken, Algorithmen und Softwareprogramme entwickelt, um die neu entstandenen Daten zu analysieren. Während der Untersuchung bioinformatischer Methoden für die Identifizierung und Klassifizierung somatischer Mutationen in hämatologischen Erkrankungen, zeigte sich eine hohe Vielfalt an alternativen Softwaretools die für die jeweiligen Analyseschritte genutzt werden können. Derzeit existiert noch kein Standard zur effizienten Analyse von Mutationen aus Next-Generation-Sequencing (NGS)-Daten. Die unterschiedlichen Methoden und Pipelines generieren Kandidaten, die zum größten Anteil in allen Ansätzen identifiziert werden können, jedoch werden Software spezifische Kandidaten nicht einheitlich detektiert.
Um eine einheitliche und effiziente Analyse von NGS-Daten durchzuführen war im Rahmen dieser Arbeit die Entwicklung einer benutzerfreundlichen und einheitlichen Pipeline vorgesehen. Hierfür wurden zunächst die essentiellen Analysen wie die Identifizierung der Basen, die Alignierung und die Identifizierung der Mutationen untersucht. Des Weiteren wurden unter Berücksichtigung von Effizienz und Performance diverse verfügbare Softwaretools getestet, ausgewertet und sowohl mögliche Verbesserungen als auch Erleichterungen der bisherigen Analysen vorgestellt und diskutiert. Durch Mitwirken in Konsortien wie der klinischen Forschergruppe 216 (KFO 216) und International Cancer Genome Consortium (ICGC) oder auch bei Haus-internen Projekten wurden Datensätze zu den Entitäten Multiples Myelom (MM), Burkitt Lymphom (BL) und Follikuläres Lymphom (FL) erstellt und analysiert. Die Selektion geeigneter Softwaretools und die Generierung der Pipeline basieren auf komparativen Analysen dieser Daten, sowie auf geteilte Ergebnisse und Erfahrungen in der Literatur und auch in Foren. Durch die gezielte Entwicklung von Skripten konnten biologische und klinische Fragestellungen bearbeitet werden. Hierzu zählten eine einheitliche Annotation der Gennamen, sowie die Erstellung von Genmutations-Heatmaps mit nicht Variant-Calling-File (VCF)-Syntax konformen Dateien. Des Weiteren konnten nicht abgedeckte Regionen des Genoms in den NGS-Daten identifiziert und analysiert werden. Neue Projekte zur detaillierten Untersuchung der Verteilung von wiederkehrender Mutationen und Funktionsassays zu einzelnen Mutationskandidaten konnten basierend auf den Ergebnissen initiiert werden.
Durch eigens erstellte Python-Skripte konnte somit die Funktionalität der Pipeline erweitert werden und zu wichtigen Erkenntnissen bei der biologischen Interpretation der Sequenzierungsdaten führen, wie beispielsweise zu der Detektion von drei neuen molekularen Subgruppen im MM. Die Erweiterungen, der in dieser Arbeit entwickelten Pipeline verbesserte somit die Effizienz der Analyse und die Vergleichbarkeit unserer Daten. Des Weiteren konnte durch die Erstellung eines eigenen Skripts die Analyse von unbeachteten Regionen in den NGS-Daten erfolgen.
Multiple myeloma (MM) is a plasma cell disorder that is characterized by a great genetic heterogeneity. Recent next generation sequencing studies revealed an accumulation of tumor-associated mutations in receptor tyrosine kinases (RTKs) which may also contribute to the activation of survival pathways in MM. To investigate the clinical role of RTK-mutations in MM, we deep-sequenced the coding DNA-sequence of EGFR, EPHA2, ERBB3, IGF1R, NTRK1 and NTRK2 which were previously found to be mutated in MM, in 75 uniformly treated MM patients of the “Deutsche Studiengruppe Multiples Myelom”. Subsequently, we correlated the detected mutations with common cytogenetic alterations and clinical parameters. We identified 11 novel non-synonymous SNVs or rare patient-specific SNPs, not listed in the SNP databases 1000 genomes and dbSNP, in 10 primary MM cases. The mutations predominantly affected the tyrosine-kinase and ligand-binding domains and no correlation with cytogenetic parameters was found. Interestingly, however, patients with RTK-mutations, specifically those with rare patient-specific SNPs, showed a significantly lower overall, event-free and progression-free survival. This indicates that RTK SNVs and rare patient-specific RTK SNPs are of prognostic relevance and suggests that MM patients with RTK-mutations could potentially profit from treatment with RTK-inhibitors.