Refine
Has Fulltext
- yes (2) (remove)
Is part of the Bibliography
- yes (2)
Document Type
- Doctoral Thesis (2)
Language
- German (2) (remove)
Keywords
- Next Generation Sequencing (2) (remove)
Institute
Innerhalb des letzten Jahrzehnts entstanden zahlreiche neue Anreicherungs- und Sequenzier-technologien der zweiten (und dritten) Generation, die in rasantem Tempo weiterentwickelt und schon jetzt in vielen Bereichen als neuer Goldstandard für molekulargenetische For-schung und Diagnostik angesehen werden. Als Hochdurchsatz-Verfahren ermöglichen diese Next Generation Sequencing-Methoden (NGS) in immer kürzerer Zeit die parallele Analyse zahlreicher Proben und immer größerer Zielregionen bis hin zum ganzen Genom und führten in der Humangenetik dadurch zu Forschungsansätzen in neuen Dimensionen.
In dieser Doktorarbeit, die im molekulargenetischen Diagnostik-Labor der Humangenetik Würzburg durchgeführt wurde, wurden in fünf Projekten NGS-Ansätze unterschiedlicher Stufen bzw. Größenordnungen für verschiedene erblich bedingte Erkrankungen konzipiert und etabliert und in Forschungsprojekten sowie der Routinediagnostik eingesetzt. Dabei wurden verschiedene Methoden zur Anreicherung der Zielsequenzen und zur NGS-Sequenzierung erprobt und auf ihre Effizienz beurteilt. Die Ergebnisse des NGS und darauf basierender Nachweis-Experimente wurden in sieben Veröffentlichungen dokumentiert, auf denen diese Dissertation aufbaut.
In den drei ersten Projekten wurden das Access Array-System (Fluidigm) zur Anreicherung der Zielsequenzen und der GS Junior (Roche) zur Erzeugung der Sequenzen verwendet.
In Projekt 1 wurde COL4A6 als neues Kandidatengen für nicht-syndromale Hörstörungen identifiziert. Um mögliche weitere Mutationsträger zu detektieren, wurde erfolgreich ein kleiner NGS-Ansatz für das zügige Screening dieses Gens bei knapp 100 weiteren Patienten etabliert. Diese und weitere Ergebnisse bestätigten die Kausalität der COL4A6-Mutation eines Index-Patienten mit schwerer, X-chromosomal-rezessiver Hörstörung.
Ein geeigneter NGS-Ansatz für die Analyse des großen RYR1-Gens wurde in Projekt 2 ge-sucht. Der erste Ansatz mit Access Array-System und GS Junior führte zwar bei 39 von 87 Patienten mit Maligner Hyperthermie und/oder Central Core Disease zu dem Auffinden einer (potentiell) pathogenen Variante, allerdings mit hohen Ausfallquoten. Mit der zweiten Methode (Anreicherung: SureSelect-System custom design, Agilent; Sequenzierung: HiSeq, Illumina) wurden neben RYR1 noch 63 weitere Gene analysiert, was zu deutlich besseren Ergebnissen und vier Mutationsfunden führte.
Projekt 3 beinhaltete die Etablierung zwei kleiner Panels für Muskelkrankheiten. Ein Panel für drei Gene für Gliedergürteldystrophien wurde sogar erfolgreich in die akkreditierte Rou-tinediagnostik übernommen. Mit dem zweiten Panel für acht Kandidatengene myofibrillärer Myopathien (MFM) wurde u.a. eine neue Mutation im BAG3-Gen identifiziert.
Das Exom eines MFM-Patienten wurde in Projekt 4 nach Anreicherung mit dem SureSelect-System (Agilent) auf dem HiSeq (Illumina) sequenziert. Nach Auswertung und Beurteilung der identifizierten Varianten wurde ein neuer Erbgang für Myotilinopathien entdeckt. Verschiedene Nachweisexperimente bestätigten die Kausalität der Mutation im Myotilin-Gen.
In Projekt 5 wurde die komplette genomische Sequenz des F8-Gens nach tiefen intronischen Mutationen bei Hämophilie-Patienten abgesucht (Anreicherung SureSelect custom design, Agilent; Sequenzierung MiSeq, Illumina). Bei jedem der analysierten Patienten konnte min-destens eine verdächtige Variante identifiziert werden, die zu verändertem Spleißverhalten führen könnte. Drei Mutationen waren schon durch Publikationen bekannt, bei einer weite-ren konnten in vitro-Spleißanalysen die Kausalität bestätigen.
Die Ergebnisse dieser Arbeit zeigen, dass die zur Verfügung stehenden Methoden zur An-reicherung von Zielsequenzen aus dem menschlichen Genom und zu deren Sequenzierung je nach Komplexität der Fragestellung, d.h. der Anzahl und Größe der Gene sowie der Anzahl der zu untersuchenden Proben, sinnvoll und effizient kombiniert werden können. Im Verlauf der Arbeit haben sich die NGS-Techniken rasant weiterentwickelt. So sind PCR-basierte Ansätze zur Anreicherung der Zielsequenzen für die meisten Anwendungen von hybridisierungs-basierten Methoden verdrängt worden. Von den ursprünglich drei konkur-rierenden Verfahren zur Hochdurchsatzsequenzierung hat sich die Methode des „sequen-cing-by-synthesis“ (Illumina) weitgehend durchgesetzt. Diese Entwicklung spiegelt sich auch in den während dieser Arbeit erhobenen Daten wider.
Die Sequenzierungstechnologien entwickeln sich stetig weiter, dies ermöglicht eine zuvor nicht erreichte Ausbeute an experimentellen Daten und auch an Neuentwicklungen von zuvor nicht realisierbaren Experimenten. Zugleich werden spezifische Datenbanken, Algorithmen und Softwareprogramme entwickelt, um die neu entstandenen Daten zu analysieren. Während der Untersuchung bioinformatischer Methoden für die Identifizierung und Klassifizierung somatischer Mutationen in hämatologischen Erkrankungen, zeigte sich eine hohe Vielfalt an alternativen Softwaretools die für die jeweiligen Analyseschritte genutzt werden können. Derzeit existiert noch kein Standard zur effizienten Analyse von Mutationen aus Next-Generation-Sequencing (NGS)-Daten. Die unterschiedlichen Methoden und Pipelines generieren Kandidaten, die zum größten Anteil in allen Ansätzen identifiziert werden können, jedoch werden Software spezifische Kandidaten nicht einheitlich detektiert.
Um eine einheitliche und effiziente Analyse von NGS-Daten durchzuführen war im Rahmen dieser Arbeit die Entwicklung einer benutzerfreundlichen und einheitlichen Pipeline vorgesehen. Hierfür wurden zunächst die essentiellen Analysen wie die Identifizierung der Basen, die Alignierung und die Identifizierung der Mutationen untersucht. Des Weiteren wurden unter Berücksichtigung von Effizienz und Performance diverse verfügbare Softwaretools getestet, ausgewertet und sowohl mögliche Verbesserungen als auch Erleichterungen der bisherigen Analysen vorgestellt und diskutiert. Durch Mitwirken in Konsortien wie der klinischen Forschergruppe 216 (KFO 216) und International Cancer Genome Consortium (ICGC) oder auch bei Haus-internen Projekten wurden Datensätze zu den Entitäten Multiples Myelom (MM), Burkitt Lymphom (BL) und Follikuläres Lymphom (FL) erstellt und analysiert. Die Selektion geeigneter Softwaretools und die Generierung der Pipeline basieren auf komparativen Analysen dieser Daten, sowie auf geteilte Ergebnisse und Erfahrungen in der Literatur und auch in Foren. Durch die gezielte Entwicklung von Skripten konnten biologische und klinische Fragestellungen bearbeitet werden. Hierzu zählten eine einheitliche Annotation der Gennamen, sowie die Erstellung von Genmutations-Heatmaps mit nicht Variant-Calling-File (VCF)-Syntax konformen Dateien. Des Weiteren konnten nicht abgedeckte Regionen des Genoms in den NGS-Daten identifiziert und analysiert werden. Neue Projekte zur detaillierten Untersuchung der Verteilung von wiederkehrender Mutationen und Funktionsassays zu einzelnen Mutationskandidaten konnten basierend auf den Ergebnissen initiiert werden.
Durch eigens erstellte Python-Skripte konnte somit die Funktionalität der Pipeline erweitert werden und zu wichtigen Erkenntnissen bei der biologischen Interpretation der Sequenzierungsdaten führen, wie beispielsweise zu der Detektion von drei neuen molekularen Subgruppen im MM. Die Erweiterungen, der in dieser Arbeit entwickelten Pipeline verbesserte somit die Effizienz der Analyse und die Vergleichbarkeit unserer Daten. Des Weiteren konnte durch die Erstellung eines eigenen Skripts die Analyse von unbeachteten Regionen in den NGS-Daten erfolgen.