TY - THES A1 - Pischimarov, Jordan Ivanov T1 - Bioinformatische Methoden zur Identifizierung und Klassifizierung somatischer Mutationen in hämatologischen Erkrankungen T1 - Bioinformatics approaches for the detection and classification of somatic mutations in hematological malignancies N2 - Die Sequenzierungstechnologien entwickeln sich stetig weiter, dies ermöglicht eine zuvor nicht erreichte Ausbeute an experimentellen Daten und auch an Neuentwicklungen von zuvor nicht realisierbaren Experimenten. Zugleich werden spezifische Datenbanken, Algorithmen und Softwareprogramme entwickelt, um die neu entstandenen Daten zu analysieren. Während der Untersuchung bioinformatischer Methoden für die Identifizierung und Klassifizierung somatischer Mutationen in hämatologischen Erkrankungen, zeigte sich eine hohe Vielfalt an alternativen Softwaretools die für die jeweiligen Analyseschritte genutzt werden können. Derzeit existiert noch kein Standard zur effizienten Analyse von Mutationen aus Next-Generation-Sequencing (NGS)-Daten. Die unterschiedlichen Methoden und Pipelines generieren Kandidaten, die zum größten Anteil in allen Ansätzen identifiziert werden können, jedoch werden Software spezifische Kandidaten nicht einheitlich detektiert. Um eine einheitliche und effiziente Analyse von NGS-Daten durchzuführen war im Rahmen dieser Arbeit die Entwicklung einer benutzerfreundlichen und einheitlichen Pipeline vorgesehen. Hierfür wurden zunächst die essentiellen Analysen wie die Identifizierung der Basen, die Alignierung und die Identifizierung der Mutationen untersucht. Des Weiteren wurden unter Berücksichtigung von Effizienz und Performance diverse verfügbare Softwaretools getestet, ausgewertet und sowohl mögliche Verbesserungen als auch Erleichterungen der bisherigen Analysen vorgestellt und diskutiert. Durch Mitwirken in Konsortien wie der klinischen Forschergruppe 216 (KFO 216) und International Cancer Genome Consortium (ICGC) oder auch bei Haus-internen Projekten wurden Datensätze zu den Entitäten Multiples Myelom (MM), Burkitt Lymphom (BL) und Follikuläres Lymphom (FL) erstellt und analysiert. Die Selektion geeigneter Softwaretools und die Generierung der Pipeline basieren auf komparativen Analysen dieser Daten, sowie auf geteilte Ergebnisse und Erfahrungen in der Literatur und auch in Foren. Durch die gezielte Entwicklung von Skripten konnten biologische und klinische Fragestellungen bearbeitet werden. Hierzu zählten eine einheitliche Annotation der Gennamen, sowie die Erstellung von Genmutations-Heatmaps mit nicht Variant-Calling-File (VCF)-Syntax konformen Dateien. Des Weiteren konnten nicht abgedeckte Regionen des Genoms in den NGS-Daten identifiziert und analysiert werden. Neue Projekte zur detaillierten Untersuchung der Verteilung von wiederkehrender Mutationen und Funktionsassays zu einzelnen Mutationskandidaten konnten basierend auf den Ergebnissen initiiert werden. Durch eigens erstellte Python-Skripte konnte somit die Funktionalität der Pipeline erweitert werden und zu wichtigen Erkenntnissen bei der biologischen Interpretation der Sequenzierungsdaten führen, wie beispielsweise zu der Detektion von drei neuen molekularen Subgruppen im MM. Die Erweiterungen, der in dieser Arbeit entwickelten Pipeline verbesserte somit die Effizienz der Analyse und die Vergleichbarkeit unserer Daten. Des Weiteren konnte durch die Erstellung eines eigenen Skripts die Analyse von unbeachteten Regionen in den NGS-Daten erfolgen. N2 - The sequencing technologies, while still being under further development, render it possible to develop novel experiments and allow the generation of larger amounts of utilizable data. At the same time novel software tools, databases and algorithms are developed to analyze these larger amounts of data. The analysis of somatic mutations in hematological malignancies showed that a high variety of alternative software tools can be used for different analysis steps. Furthermore there is currently no standardized procedure for the efficient identification and analysis of mutations in NGS data. The different pipeline and methods are, for the most part, able to identify the same mutation candidates, however there are software specific candidates which are not called by all pipelines. The scope of this dissertation was therefore to develop a user-friendly pipeline which is able to call candidate mutations uniformly and efficiently. For this purpose necessary analysis steps including base calling, alignment generation and variant calling were investigated. Furthermore available software tools were tested and evaluated regarding their efficiency and performance. Possible improvements of these software tools and previously performed analysis are explained and discussed in this work. NGS data sets of the different cancer entities multiple myeloma (MM), Burkitt lymphoma (BL) and follicular lymphoma (FL) were generated and analyzed within the framework of cooperate projects like the International Cancer Genome Consortium (ICGC) and the Clinical Research Group 216 (KFO) as well as for internal projects. The development of the pipeline and selection of suitable software tools is based on the comparative analysis of the generated data sets, as well as previously described results and experiences in literature and forums. The selective development of certain python scripts enabled the evaluation of novel biological and clinical questions by standardizing gene names in the annotation step, generating heat- maps of non-standardized VCF-files as well as the identification and analysis of uncovered regions in NGS data sets. This work and the obtained results thereby provide the groundwork for further projects e.g. the analysis of the distribution of recurrent mutations or the functional analysis of specific mutation candidates. This extensions of the developed pipeline with python scripts helped to improve the efficiency and comparability of the NGS data. The interpretation of the NGS data with the extended script for example led to the discovery of three distinct molecular subgroups in MM. Furthermore the generation of the novel python scripts helped to analyze uncovered regions in the NGS data sets.  KW - Pipeline-Rechner KW - somatische Mutationen KW - Sequenzierung KW - Bioinformatik KW - Identifizierungspipeline KW - Next Generation Sequencing KW - Variantcalling KW - Bioinformatic KW - somatic mutations KW - DNS-Sequenz KW - Somatische Mutation Y1 - 2016 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-147773 ER - TY - THES A1 - Hampel, Christine T1 - Evaluierung des Resplex-Testsystems zum Nachweis des respiratorischen Synzytialvirus und von Adenoviren bei Kindern mit akuten respiratorischen Erkrankungen T1 - Evaluation of the Resplex panel for detection of respiratory syncytial virus and adenovirus in children with acute respiratory diseases N2 - Hintergrund: In den letzten Jahren werden in der virologischen Routinediagnostik herkömmliche Methoden, wie der Immunfluoreszenztest (IFT), zunehmend durch neue molekulare Detektionsmethoden ersetzt. Auf der Suche nach einem für das Kinderklinik-Kollektiv geeigneten alternativen Screeningtest war im Vorfeld das Resplex Panel im Vergleich zum aktuellen Standard (IFT) getestet worden. Die Ergebnisse für ADV und RSV waren dabei deutlich diskrepant. Studiendesign: Zur weiteren Abklärung der diskrepanten Ergebnisse zwischen IFT und Resplex wurden respiratorische Proben aus dem Zeitraum Mai 2004 bis Februar 2008 von Patienten aus Würzburger Kinderkliniken verwendet. Dies umfasste 71 Proben, die im IFT positiv für Adenovirus-Antigen vorgetestet waren, und 68 Proben, die im IFT positiv für RSV-Antigen vorgetestet waren. Für alle Proben lagen Resplex-Ergebnisse vor. Mittels Sequenzierung aus Restmaterial wurden Adenovirus-Typen und RSV-Subtypen bestimmt. IFT-, Resplex- und Typisierungs-Ergebnisse wurden verglichen. Zusätzlich erfolgte eine epidemiologische Auswertung. Ergebnisse: Das Resplex Panel zeigt sich im vorliegenden pädiatrischen Kollektiv zur Detektion von ADV und RSV aufgrund unterschiedlicher Ursachen als ungeeignet: Für ADV ist sein auf zwei Spezies (ADV B und E) beschränktes Spektrum unzureichend, wodurch es die im Kollektiv häufige ADV C-Spezies (43%) nicht erfasst. Für RSV bedürfen die Primer bzw. Sonden einer Überarbeitung, da das Resplex Panel, verglichen mit dem IFT, wesentlich weniger Proben (41%) als RSV-positiv erkennt. Bezüglich der Prävalenz der Typen wurde eine für ADV typische Verteilung in Kinderkollektiven (54% ADV 3, 26% ADV 2, 12% ADV 1) nachgewiesen. Betroffen waren vor allem Kinder im Alter von sechs Monaten bis fünf Jahren. Kinder mit ADV C-Infektionen waren signifikant jünger als Kinder mit ADV B-Infektionen. Für RSV zeigte sich in der respiratorischen Saison 2006/2007 und in den Wintermonaten 1 – 2/2008 eine Dominanz von RSV Subtyp B. Betroffen waren vor allem Kinder im ersten Lebensjahr. Resumé: Die vorliegende Studie bestätigt die unzureichende Detektion von ADV und RSV durch das Resplex Panel, wobei bezüglich ADV ein unzureichendes Spektrum, für RSV unzureichend optimierte Primer und Sonden vermutlich ursächlich sind. Die epidemiologischen Daten stehen mit denen aus anderen Studien an ähnlichen Kollektiven in Einklang. N2 - Background: Over the past years conventional virological diagnostic like the immunofluorescence assay (IFA) has been replaced by molecular diagnostic methods. In this context previously the standard (IFA) had been tested compared to the Resplex panel, a new multiplex PCR, for testing respiratory samples. The results were discrepant for adenovirus and RSV. Study design: In order to identify the reasons for this discrepancy the samples (68 samples for RSV, 71 for Adenovirus) were re-evaluated by further testing (sequencing). Results: The Resplex panel is not suitable as a respiratory screening test in the pediatric collective for the detection of adenovirus and RSV because of different reasons: for adenovirus the spectrum is limited to two of the possible seven species (B and E). That’s why adenovirus species C which is common in the pediatric collective (43%) cannot be detected. For RSV the primers and probes should be improved. The epidemiological data is consistent with other studies concerning similar collectives. KW - Adenoviren KW - RS-Virus KW - Atemwegsinfektion KW - Resplex KW - Sequenzierung KW - Screeningtest KW - Multiplex-PCR Y1 - 2015 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-134704 ER - TY - THES A1 - Möller, Christian T1 - Mutationen im Gen der Dihydrolipoamid-Dehydrogenase bei Patienten mit familiärer dilatativer Kardiomyopathie T1 - Mutations in the gene of dihydrolipoamide dehydrogenase in patients with familial dilated cardiomyopathy N2 - Die Arbeitsgruppe Zimmer am Institut für Klinische Biochemie und Pathobiochemie der Universität Würzburg detektierte im Gen der Dihydrolipoamid-Dehydrogenase (DLD) eine bisher nicht bekannte Mutation, die für die Entwicklung einer familiären Form der dilatativen Kardiomyopathie (DCM) verantwortlich ist. Die DLD spielt als Teil von mitochondrialen Enzymkomplexen eine wichtige Rolle im Energie- und Aminosäurestoffwechsel der Zelle. Mutationen im DLD-Gen führen dabei meist zu neurologischen Syndromen mit Erscheinungsbildern wie mentaler Entwicklungsverzögerung, Krampfanfällen und spastischen Bewegungsstörungen. Fälle von Herzinsuffizienz und frühkindlicher Hypertropher Kardiomyopathie wurden ebenfalls beschrieben. Von den zahlreichen Gendefekten, die als Auslöser für die dilatative Kardiomyopathie bekannt sind, ist bisher noch keiner im Gen der DLD beschrieben worden. Vielmehr sind DCM-Mutationen in Genen zu finden, die für muskelspezifische Proteine kodieren. Dadurch führen sie oft zu einer Beeinflussung der Kraftübertragung im Sarkomer. Die durch die Arbeitsgruppe Zimmer beschriebene DLD-Mutation wurde in einer portugiesischen Großfamilie entdeckt, in welcher das Auftreten der dilatativen Kardiomyopathie über mehrere Generationen hinweg zu verfolgen ist. Ähnliche Fälle außerhalb dieser Familie sind nicht bekannt. Demnach gibt es keine Daten, die die Häufigkeit DCM-assoziierter Mutationen im Gen der Dihydrolipoamid-Dehydrogenase beschreiben. Die vorliegende Arbeit beschäftigte sich damit weitere Zusammenhänge zwischen genetischen Alterationen im DLD-Gen und dem Auftreten einer DCM aufzudecken. In diesem Rahmen wurden DCM-Patienten, die erwiesenermaßen an einer familiären Form dieser Erkrankung leiden, gezielt auf Veränderungen in den Exons des DLD-Gens untersucht. Insgesamt wurden die Exons von 88 Patienten auf das Vorhandensein heterozygoter Mutationen überprüft. Hierfür wurden PCR-Produkte, die die jeweiligen Exons enthielten, mit Hilfe der Denaturing High-Performance Liquid Chromatography (DHPLC) untersucht. Diese Methode ermöglicht eine hochsensitive und gleichermaßen äußerst spezifische Detektion heterozygoter Mutationen. Auffällige Ergebnisse wurden anschließend mittels Sequenzierung verifiziert. Insgesamt wurden bei elf Patienten fünf unterschiedliche Mutationen nachgewiesen. Es handelte sich um vier bereits bekannte Einzelnukleotid-Polymorphismen und eine bisher nicht beschriebene Mutation. Dabei lagen vier Mutationen in nicht näher bezeichneten Intron-Bereichen, eine Mutation in einer 3‘ Spleißstelle und eine weitere Mutation in der 3‘ UTR (untranslated region) der mRNA. Somit befanden sich also einige Mutationen an für die Regulation der Genfunktion strategisch wichtigen Positionen. Da es sich dabei um bekannte Polymorphismen handelte, wurde mit Hilfe der Daten des HapMap Projekts überprüft, ob es bereits Hinweise für eine klinische Assoziation gab. Die Daten zeigten, dass bisher keiner der hier detektierten SNPs mit klinischen Erscheinungsbildern in Verbindung gebracht werden konnte. Es gab auch keine Hinweise dafür, dass die erfassten SNPs im Patientenkollektiv häufiger vorkamen als in der Normalbevölkerung. Einer der hier beschriebenen Mutationen war nicht in den verwendeten Datenbanken aufgeführt. Daher kann ein pathologischer Einfluss dieser Mutation zwar nicht ausgeschlossen werden, erscheint aber aufgrund ihrer Lage in einem weit vom Exon entfernten Intron-Bereich nicht offensichtlich. Es ließen sich also für keine der detektierten Mutationen pathogene Eigenschaften nachweisen. In Protein-kodierenden Sequenzbereichen konnten keine Mutationen nachgewiesen werden. Abschließend lässt sich also sagen, dass eine Assoziation zwischen Mutationen im DLD-Gen und dem Auftreten einer familiären DCM im Rahmen dieser Arbeit nicht bestätigt werden konnte. Es ist jedoch möglich, dass DCM-assoziierte Mutationen im DLD-Gen nur äußerst selten auftreten oder aber die durch die Arbeitsgruppe Zimmer detektierte Mutation im DLD-Gen die bisher einzige ist, die mit DCM in Verbindung gebracht werden kann. Um diese Frage zu klären müssen Untersuchungen mit größeren Patientenkollektiven angeschlossen werden. N2 - The working group Zimmer at the Institute of Clinical Biochemistry and Pathobiochemistry at the University of Wuerzburg detected an until now unknown mutation in the gene of dihydrolipoamide dehydrogenase (DLD), which causes a familial dilated cardiomyopathy (DCM). The DLD plays an important role in the metabolism of carbohydrates and amino acids. In most cases mutations in the DLD gene lead to neurological symptoms like mental developmental delay, seizures and spastic movement disorders. Cases of heart failure and an early childhood hypertrophic cardiomyopathy are also known. Among the numerous genetic defects, which are known to be responsible for the development of a dilated cardiomyopathy, there is no one known in the gene of DLD. To a greater degree DCM mutations are found in genes, which encode for muscle-specific proteins. In this way they often lead to an affectation of the force transmission in the sarcomer. The mutation, which was described by the working group Zimmer was found in an portuguese extended familiy. In this family the presence of a dilated cardiomyopathy could be followed up for several generations. Similar cases outside of this family are not known. So there is no data about the frequency of DCM associated mutations in the gene of dihydrolipoamide dehydrogenase. The work in hand dealt with revealing further relationships between genetic variances in the DLD gene and the presence of DCM. In this context the exons of the DLD gene of DCM patients with a familial form of this disease were examined. Overall the DLD exons of 88 patients were investigated looking for heterozygous mutations. For this purpose the Denaturing High-Performance Liquid Chromatography was used. This method allows a highly sensitive and also exceedingly specific detection of heterozygous mutations. Afterwards conspicuous results were verified by sequencing. Altogether five different mutations in eleven patients were found. It was about four already known single nucleotide polymorphisms and one until know not known mutation. Four mutations were located in not further described intronic regions. One was found in a 3' splice site and one in a 3' UTR. In this way some mutations were located in regions which are important for the regulation of gene function. Because it was about known SNPs, it was checked if there is evidence for associations with clinical phenotypes. Therefor the data of the HapMap project was used. The data shows that no one of the detected SNPs is known to be associated with clinical phenotypes. In protein coding sequences no mutation was detected. Conclusively it can be said that within this work an association between mutations in the DLD gene and the presence of a familial DCM could not be confirmed. It is possible that mutations in the DLD gene associated with DCM are very rare or unique in this family. To reason this out, investigations with greater patient populations are necessary. KW - Kongestive Herzmuskelkrankheit KW - Punktmutation KW - Genmutation KW - Genommutation KW - Mutation KW - Dihydrolipoamid-Dehydrogenase KW - Polymorphismus KW - SNP KW - Seque KW - Denaturing high-performance liquid chromatography KW - Sequenzierung KW - Familiäre dilatative Kardiomyopathie KW - Denaturing high-performance liquid chromatography KW - sequencing KW - familial dilated cardiomyopathy Y1 - 2011 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-74278 ER -