@phdthesis{KuhngebBach2015, author = {Kuhn [geb. Bach], Julia Elisa}, title = {Design und Etablierung von Next Generation Sequencing-Methoden zur Diagnostik verschiedener Erbkrankheiten}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-116854}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2015}, abstract = {Innerhalb des letzten Jahrzehnts entstanden zahlreiche neue Anreicherungs- und Sequenzier-technologien der zweiten (und dritten) Generation, die in rasantem Tempo weiterentwickelt und schon jetzt in vielen Bereichen als neuer Goldstandard f{\"u}r molekulargenetische For-schung und Diagnostik angesehen werden. Als Hochdurchsatz-Verfahren erm{\"o}glichen diese Next Generation Sequencing-Methoden (NGS) in immer k{\"u}rzerer Zeit die parallele Analyse zahlreicher Proben und immer gr{\"o}ßerer Zielregionen bis hin zum ganzen Genom und f{\"u}hrten in der Humangenetik dadurch zu Forschungsans{\"a}tzen in neuen Dimensionen. In dieser Doktorarbeit, die im molekulargenetischen Diagnostik-Labor der Humangenetik W{\"u}rzburg durchgef{\"u}hrt wurde, wurden in f{\"u}nf Projekten NGS-Ans{\"a}tze unterschiedlicher Stufen bzw. Gr{\"o}ßenordnungen f{\"u}r verschiedene erblich bedingte Erkrankungen konzipiert und etabliert und in Forschungsprojekten sowie der Routinediagnostik eingesetzt. Dabei wurden verschiedene Methoden zur Anreicherung der Zielsequenzen und zur NGS-Sequenzierung erprobt und auf ihre Effizienz beurteilt. Die Ergebnisse des NGS und darauf basierender Nachweis-Experimente wurden in sieben Ver{\"o}ffentlichungen dokumentiert, auf denen diese Dissertation aufbaut. In den drei ersten Projekten wurden das Access Array-System (Fluidigm) zur Anreicherung der Zielsequenzen und der GS Junior (Roche) zur Erzeugung der Sequenzen verwendet. In Projekt 1 wurde COL4A6 als neues Kandidatengen f{\"u}r nicht-syndromale H{\"o}rst{\"o}rungen identifiziert. Um m{\"o}gliche weitere Mutationstr{\"a}ger zu detektieren, wurde erfolgreich ein kleiner NGS-Ansatz f{\"u}r das z{\"u}gige Screening dieses Gens bei knapp 100 weiteren Patienten etabliert. Diese und weitere Ergebnisse best{\"a}tigten die Kausalit{\"a}t der COL4A6-Mutation eines Index-Patienten mit schwerer, X-chromosomal-rezessiver H{\"o}rst{\"o}rung. Ein geeigneter NGS-Ansatz f{\"u}r die Analyse des großen RYR1-Gens wurde in Projekt 2 ge-sucht. Der erste Ansatz mit Access Array-System und GS Junior f{\"u}hrte zwar bei 39 von 87 Patienten mit Maligner Hyperthermie und/oder Central Core Disease zu dem Auffinden einer (potentiell) pathogenen Variante, allerdings mit hohen Ausfallquoten. Mit der zweiten Methode (Anreicherung: SureSelect-System custom design, Agilent; Sequenzierung: HiSeq, Illumina) wurden neben RYR1 noch 63 weitere Gene analysiert, was zu deutlich besseren Ergebnissen und vier Mutationsfunden f{\"u}hrte. Projekt 3 beinhaltete die Etablierung zwei kleiner Panels f{\"u}r Muskelkrankheiten. Ein Panel f{\"u}r drei Gene f{\"u}r Gliederg{\"u}rteldystrophien wurde sogar erfolgreich in die akkreditierte Rou-tinediagnostik {\"u}bernommen. Mit dem zweiten Panel f{\"u}r acht Kandidatengene myofibrill{\"a}rer Myopathien (MFM) wurde u.a. eine neue Mutation im BAG3-Gen identifiziert. Das Exom eines MFM-Patienten wurde in Projekt 4 nach Anreicherung mit dem SureSelect-System (Agilent) auf dem HiSeq (Illumina) sequenziert. Nach Auswertung und Beurteilung der identifizierten Varianten wurde ein neuer Erbgang f{\"u}r Myotilinopathien entdeckt. Verschiedene Nachweisexperimente best{\"a}tigten die Kausalit{\"a}t der Mutation im Myotilin-Gen. In Projekt 5 wurde die komplette genomische Sequenz des F8-Gens nach tiefen intronischen Mutationen bei H{\"a}mophilie-Patienten abgesucht (Anreicherung SureSelect custom design, Agilent; Sequenzierung MiSeq, Illumina). Bei jedem der analysierten Patienten konnte min-destens eine verd{\"a}chtige Variante identifiziert werden, die zu ver{\"a}ndertem Spleißverhalten f{\"u}hren k{\"o}nnte. Drei Mutationen waren schon durch Publikationen bekannt, bei einer weite-ren konnten in vitro-Spleißanalysen die Kausalit{\"a}t best{\"a}tigen. Die Ergebnisse dieser Arbeit zeigen, dass die zur Verf{\"u}gung stehenden Methoden zur An-reicherung von Zielsequenzen aus dem menschlichen Genom und zu deren Sequenzierung je nach Komplexit{\"a}t der Fragestellung, d.h. der Anzahl und Gr{\"o}ße der Gene sowie der Anzahl der zu untersuchenden Proben, sinnvoll und effizient kombiniert werden k{\"o}nnen. Im Verlauf der Arbeit haben sich die NGS-Techniken rasant weiterentwickelt. So sind PCR-basierte Ans{\"a}tze zur Anreicherung der Zielsequenzen f{\"u}r die meisten Anwendungen von hybridisierungs-basierten Methoden verdr{\"a}ngt worden. Von den urspr{\"u}nglich drei konkur-rierenden Verfahren zur Hochdurchsatzsequenzierung hat sich die Methode des „sequen-cing-by-synthesis" (Illumina) weitgehend durchgesetzt. Diese Entwicklung spiegelt sich auch in den w{\"a}hrend dieser Arbeit erhobenen Daten wider.}, subject = {Diagnostik}, language = {de} } @phdthesis{Pischimarov2016, author = {Pischimarov, Jordan Ivanov}, title = {Bioinformatische Methoden zur Identifizierung und Klassifizierung somatischer Mutationen in h{\"a}matologischen Erkrankungen}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-147773}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2016}, abstract = {Die Sequenzierungstechnologien entwickeln sich stetig weiter, dies erm{\"o}glicht eine zuvor nicht erreichte Ausbeute an experimentellen Daten und auch an Neuentwicklungen von zuvor nicht realisierbaren Experimenten. Zugleich werden spezifische Datenbanken, Algorithmen und Softwareprogramme entwickelt, um die neu entstandenen Daten zu analysieren. W{\"a}hrend der Untersuchung bioinformatischer Methoden f{\"u}r die Identifizierung und Klassifizierung somatischer Mutationen in h{\"a}matologischen Erkrankungen, zeigte sich eine hohe Vielfalt an alternativen Softwaretools die f{\"u}r die jeweiligen Analyseschritte genutzt werden k{\"o}nnen. Derzeit existiert noch kein Standard zur effizienten Analyse von Mutationen aus Next-Generation-Sequencing (NGS)-Daten. Die unterschiedlichen Methoden und Pipelines generieren Kandidaten, die zum gr{\"o}ßten Anteil in allen Ans{\"a}tzen identifiziert werden k{\"o}nnen, jedoch werden Software spezifische Kandidaten nicht einheitlich detektiert. Um eine einheitliche und effiziente Analyse von NGS-Daten durchzuf{\"u}hren war im Rahmen dieser Arbeit die Entwicklung einer benutzerfreundlichen und einheitlichen Pipeline vorgesehen. Hierf{\"u}r wurden zun{\"a}chst die essentiellen Analysen wie die Identifizierung der Basen, die Alignierung und die Identifizierung der Mutationen untersucht. Des Weiteren wurden unter Ber{\"u}cksichtigung von Effizienz und Performance diverse verf{\"u}gbare Softwaretools getestet, ausgewertet und sowohl m{\"o}gliche Verbesserungen als auch Erleichterungen der bisherigen Analysen vorgestellt und diskutiert. Durch Mitwirken in Konsortien wie der klinischen Forschergruppe 216 (KFO 216) und International Cancer Genome Consortium (ICGC) oder auch bei Haus-internen Projekten wurden Datens{\"a}tze zu den Entit{\"a}ten Multiples Myelom (MM), Burkitt Lymphom (BL) und Follikul{\"a}res Lymphom (FL) erstellt und analysiert. Die Selektion geeigneter Softwaretools und die Generierung der Pipeline basieren auf komparativen Analysen dieser Daten, sowie auf geteilte Ergebnisse und Erfahrungen in der Literatur und auch in Foren. Durch die gezielte Entwicklung von Skripten konnten biologische und klinische Fragestellungen bearbeitet werden. Hierzu z{\"a}hlten eine einheitliche Annotation der Gennamen, sowie die Erstellung von Genmutations-Heatmaps mit nicht Variant-Calling-File (VCF)-Syntax konformen Dateien. Des Weiteren konnten nicht abgedeckte Regionen des Genoms in den NGS-Daten identifiziert und analysiert werden. Neue Projekte zur detaillierten Untersuchung der Verteilung von wiederkehrender Mutationen und Funktionsassays zu einzelnen Mutationskandidaten konnten basierend auf den Ergebnissen initiiert werden. Durch eigens erstellte Python-Skripte konnte somit die Funktionalit{\"a}t der Pipeline erweitert werden und zu wichtigen Erkenntnissen bei der biologischen Interpretation der Sequenzierungsdaten f{\"u}hren, wie beispielsweise zu der Detektion von drei neuen molekularen Subgruppen im MM. Die Erweiterungen, der in dieser Arbeit entwickelten Pipeline verbesserte somit die Effizienz der Analyse und die Vergleichbarkeit unserer Daten. Des Weiteren konnte durch die Erstellung eines eigenen Skripts die Analyse von unbeachteten Regionen in den NGS-Daten erfolgen.}, subject = {Pipeline-Rechner}, language = {de} }