@phdthesis{Pischimarov2016, author = {Pischimarov, Jordan Ivanov}, title = {Bioinformatische Methoden zur Identifizierung und Klassifizierung somatischer Mutationen in h{\"a}matologischen Erkrankungen}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-147773}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2016}, abstract = {Die Sequenzierungstechnologien entwickeln sich stetig weiter, dies erm{\"o}glicht eine zuvor nicht erreichte Ausbeute an experimentellen Daten und auch an Neuentwicklungen von zuvor nicht realisierbaren Experimenten. Zugleich werden spezifische Datenbanken, Algorithmen und Softwareprogramme entwickelt, um die neu entstandenen Daten zu analysieren. W{\"a}hrend der Untersuchung bioinformatischer Methoden f{\"u}r die Identifizierung und Klassifizierung somatischer Mutationen in h{\"a}matologischen Erkrankungen, zeigte sich eine hohe Vielfalt an alternativen Softwaretools die f{\"u}r die jeweiligen Analyseschritte genutzt werden k{\"o}nnen. Derzeit existiert noch kein Standard zur effizienten Analyse von Mutationen aus Next-Generation-Sequencing (NGS)-Daten. Die unterschiedlichen Methoden und Pipelines generieren Kandidaten, die zum gr{\"o}ßten Anteil in allen Ans{\"a}tzen identifiziert werden k{\"o}nnen, jedoch werden Software spezifische Kandidaten nicht einheitlich detektiert. Um eine einheitliche und effiziente Analyse von NGS-Daten durchzuf{\"u}hren war im Rahmen dieser Arbeit die Entwicklung einer benutzerfreundlichen und einheitlichen Pipeline vorgesehen. Hierf{\"u}r wurden zun{\"a}chst die essentiellen Analysen wie die Identifizierung der Basen, die Alignierung und die Identifizierung der Mutationen untersucht. Des Weiteren wurden unter Ber{\"u}cksichtigung von Effizienz und Performance diverse verf{\"u}gbare Softwaretools getestet, ausgewertet und sowohl m{\"o}gliche Verbesserungen als auch Erleichterungen der bisherigen Analysen vorgestellt und diskutiert. Durch Mitwirken in Konsortien wie der klinischen Forschergruppe 216 (KFO 216) und International Cancer Genome Consortium (ICGC) oder auch bei Haus-internen Projekten wurden Datens{\"a}tze zu den Entit{\"a}ten Multiples Myelom (MM), Burkitt Lymphom (BL) und Follikul{\"a}res Lymphom (FL) erstellt und analysiert. Die Selektion geeigneter Softwaretools und die Generierung der Pipeline basieren auf komparativen Analysen dieser Daten, sowie auf geteilte Ergebnisse und Erfahrungen in der Literatur und auch in Foren. Durch die gezielte Entwicklung von Skripten konnten biologische und klinische Fragestellungen bearbeitet werden. Hierzu z{\"a}hlten eine einheitliche Annotation der Gennamen, sowie die Erstellung von Genmutations-Heatmaps mit nicht Variant-Calling-File (VCF)-Syntax konformen Dateien. Des Weiteren konnten nicht abgedeckte Regionen des Genoms in den NGS-Daten identifiziert und analysiert werden. Neue Projekte zur detaillierten Untersuchung der Verteilung von wiederkehrender Mutationen und Funktionsassays zu einzelnen Mutationskandidaten konnten basierend auf den Ergebnissen initiiert werden. Durch eigens erstellte Python-Skripte konnte somit die Funktionalit{\"a}t der Pipeline erweitert werden und zu wichtigen Erkenntnissen bei der biologischen Interpretation der Sequenzierungsdaten f{\"u}hren, wie beispielsweise zu der Detektion von drei neuen molekularen Subgruppen im MM. Die Erweiterungen, der in dieser Arbeit entwickelten Pipeline verbesserte somit die Effizienz der Analyse und die Vergleichbarkeit unserer Daten. Des Weiteren konnte durch die Erstellung eines eigenen Skripts die Analyse von unbeachteten Regionen in den NGS-Daten erfolgen.}, subject = {Pipeline-Rechner}, language = {de} } @article{KepplerWeissbachLangeretal.2016, author = {Keppler, Sarah and Weißbach, Susann and Langer, Christian and Knop, Stefan and Pischimarov, Jordan and Kull, Miriam and St{\"u}hmer, Thorsten and Steinbrunn, Torsten and Bargou, Ralf and Einsele, Hermann and Rosenwald, Andreas and Leich, Ellen}, title = {Rare SNPs in receptor tyrosine kinases are negative outcome predictors in multiple myeloma}, series = {Oncotarget}, volume = {7}, journal = {Oncotarget}, number = {25}, doi = {10.18632/oncotarget.9607}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-177840}, pages = {38762-38774}, year = {2016}, abstract = {Multiple myeloma (MM) is a plasma cell disorder that is characterized by a great genetic heterogeneity. Recent next generation sequencing studies revealed an accumulation of tumor-associated mutations in receptor tyrosine kinases (RTKs) which may also contribute to the activation of survival pathways in MM. To investigate the clinical role of RTK-mutations in MM, we deep-sequenced the coding DNA-sequence of EGFR, EPHA2, ERBB3, IGF1R, NTRK1 and NTRK2 which were previously found to be mutated in MM, in 75 uniformly treated MM patients of the "Deutsche Studiengruppe Multiples Myelom". Subsequently, we correlated the detected mutations with common cytogenetic alterations and clinical parameters. We identified 11 novel non-synonymous SNVs or rare patient-specific SNPs, not listed in the SNP databases 1000 genomes and dbSNP, in 10 primary MM cases. The mutations predominantly affected the tyrosine-kinase and ligand-binding domains and no correlation with cytogenetic parameters was found. Interestingly, however, patients with RTK-mutations, specifically those with rare patient-specific SNPs, showed a significantly lower overall, event-free and progression-free survival. This indicates that RTK SNVs and rare patient-specific RTK SNPs are of prognostic relevance and suggests that MM patients with RTK-mutations could potentially profit from treatment with RTK-inhibitors.}, language = {en} }