@phdthesis{Keller2010, author = {Keller, Alexander}, title = {Secondary (and tertiary) structure of the ITS2 and its application for phylogenetic tree reconstructions and species identification}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-56151}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2010}, abstract = {Biodiversity may be investigated and explored by the means of genetic sequence information and molecular phylogenetics. Yet, with ribosomal genes, information for phylogenetic studies may not only be retained from the primary sequence, but also from the secondary structure. Software that is able to cope with two dimensional data and designed to answer taxonomic questions has been recently developed and published as a new scientific pipeline. This thesis is concerned with expanding this pipeline by a tool that facialiates the annotation of a ribosomal region, namely the ITS2. We were also able to show that this states a crucial step for secondary structure phylogenetics and for data allocation of the ITS2-database. This resulting freely available tool determines high quality annotations. In a further study, the complete phylogenetic pipeline has been evaluated on a theoretical basis in a comprehensive simulation study. We were able to show that both, the accuracy and the robustness of phylogenetic trees are largely improved by the approach. The second major part of this thesis concentrates on case studies that applied this pipeline to resolve questions in taxonomy and ecology. We were able to determine several independent phylogenies within the green algae that further corroborate the idea that secondary structures improve the obtainable phylogenetic signal, but now from a biological perspective. This approach was applicable in studies on the species and genus level, but due to the conservation of the secondary structure also for investigations on the deeper level of taxonomy. An additional case study with blue butterflies indicates that this approach is not restricted to plants, but may also be used for metazoan phylogenies. The importance of high quality phylogenetic trees is indicated by two ecological studies that have been conducted. By integrating secondary structure phylogenetics, we were able to answer questions about the evolution of ant-plant interactions and of communities of bacteria residing on different plant tissues. Finally, we speculate how phylogenetic methods with RNA may be further enhanced by integration of the third dimension. This has been a speculative idea that was supplemented with a small phylogenetic example, however it shows that the great potential of structural phylogenetics has not been fully exploited yet. Altogether, this thesis comprises aspects of several different biological disciplines, which are evolutionary biology and biodiversity research, community and invasion ecology as well as molecular and structural biology. Further, it is complemented by statistical approaches and development of informatical software. All these different research areas are combined by the means of bioinformatics as the central connective link into one comprehensive thesis.}, subject = {Phylogenie}, language = {en} } @phdthesis{Sickel2016, author = {Sickel, Wiebke}, title = {High-throughput biodiversity assessment - Powers and limitations of meta-barcoding}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-144573}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2016}, abstract = {Traditional species identification based on morphological characters is laborious and requires expert knowledge. It is further complicated in the case of species assemblages or degraded and processed material. DNA-barcoding, species identification based on genetic data, has become a suitable alternative, yet species assemblages are still difficult to study. In the past decade meta-barcoding has widely been adopted for the study of species communities, due to technological advances in modern sequencing platforms and because manual separation of individual specimen is not required. Here, meta-barcoding is put into context and applied to the study of bee-collected pollen as well as bacterial communities. These studies provide the basis for a critical evaluation of the powers and limitations of meta-barcoding. Advantages identified include species identification without the need for expert knowledge as well as the high throughput of samples and sequences. In microbiology, meta-barcoding can facilitate directed cultivation of taxa of interest identified with meta-barcoding data. Disadvantages include insufficient species resolution due to short read lengths and incomplete reference databases, as well as limitations in abundance estimation of taxa and functional profiling. Despite these, meta-barcoding is a powerful method for the analysis of species communities and holds high potential especially for automated biomonitoring.}, subject = {Biodiversit{\"a}t}, language = {en} } @phdthesis{Pischimarov2016, author = {Pischimarov, Jordan Ivanov}, title = {Bioinformatische Methoden zur Identifizierung und Klassifizierung somatischer Mutationen in h{\"a}matologischen Erkrankungen}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-147773}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2016}, abstract = {Die Sequenzierungstechnologien entwickeln sich stetig weiter, dies erm{\"o}glicht eine zuvor nicht erreichte Ausbeute an experimentellen Daten und auch an Neuentwicklungen von zuvor nicht realisierbaren Experimenten. Zugleich werden spezifische Datenbanken, Algorithmen und Softwareprogramme entwickelt, um die neu entstandenen Daten zu analysieren. W{\"a}hrend der Untersuchung bioinformatischer Methoden f{\"u}r die Identifizierung und Klassifizierung somatischer Mutationen in h{\"a}matologischen Erkrankungen, zeigte sich eine hohe Vielfalt an alternativen Softwaretools die f{\"u}r die jeweiligen Analyseschritte genutzt werden k{\"o}nnen. Derzeit existiert noch kein Standard zur effizienten Analyse von Mutationen aus Next-Generation-Sequencing (NGS)-Daten. Die unterschiedlichen Methoden und Pipelines generieren Kandidaten, die zum gr{\"o}ßten Anteil in allen Ans{\"a}tzen identifiziert werden k{\"o}nnen, jedoch werden Software spezifische Kandidaten nicht einheitlich detektiert. Um eine einheitliche und effiziente Analyse von NGS-Daten durchzuf{\"u}hren war im Rahmen dieser Arbeit die Entwicklung einer benutzerfreundlichen und einheitlichen Pipeline vorgesehen. Hierf{\"u}r wurden zun{\"a}chst die essentiellen Analysen wie die Identifizierung der Basen, die Alignierung und die Identifizierung der Mutationen untersucht. Des Weiteren wurden unter Ber{\"u}cksichtigung von Effizienz und Performance diverse verf{\"u}gbare Softwaretools getestet, ausgewertet und sowohl m{\"o}gliche Verbesserungen als auch Erleichterungen der bisherigen Analysen vorgestellt und diskutiert. Durch Mitwirken in Konsortien wie der klinischen Forschergruppe 216 (KFO 216) und International Cancer Genome Consortium (ICGC) oder auch bei Haus-internen Projekten wurden Datens{\"a}tze zu den Entit{\"a}ten Multiples Myelom (MM), Burkitt Lymphom (BL) und Follikul{\"a}res Lymphom (FL) erstellt und analysiert. Die Selektion geeigneter Softwaretools und die Generierung der Pipeline basieren auf komparativen Analysen dieser Daten, sowie auf geteilte Ergebnisse und Erfahrungen in der Literatur und auch in Foren. Durch die gezielte Entwicklung von Skripten konnten biologische und klinische Fragestellungen bearbeitet werden. Hierzu z{\"a}hlten eine einheitliche Annotation der Gennamen, sowie die Erstellung von Genmutations-Heatmaps mit nicht Variant-Calling-File (VCF)-Syntax konformen Dateien. Des Weiteren konnten nicht abgedeckte Regionen des Genoms in den NGS-Daten identifiziert und analysiert werden. Neue Projekte zur detaillierten Untersuchung der Verteilung von wiederkehrender Mutationen und Funktionsassays zu einzelnen Mutationskandidaten konnten basierend auf den Ergebnissen initiiert werden. Durch eigens erstellte Python-Skripte konnte somit die Funktionalit{\"a}t der Pipeline erweitert werden und zu wichtigen Erkenntnissen bei der biologischen Interpretation der Sequenzierungsdaten f{\"u}hren, wie beispielsweise zu der Detektion von drei neuen molekularen Subgruppen im MM. Die Erweiterungen, der in dieser Arbeit entwickelten Pipeline verbesserte somit die Effizienz der Analyse und die Vergleichbarkeit unserer Daten. Des Weiteren konnte durch die Erstellung eines eigenen Skripts die Analyse von unbeachteten Regionen in den NGS-Daten erfolgen.}, subject = {Pipeline-Rechner}, language = {de} }