@phdthesis{Zeeshan2012, author = {Zeeshan, Ahmed}, title = {Bioinformatics Software for Metabolic and Health Care Data Management}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-73926}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2012}, abstract = {Computer Science approaches (software, database, management systems) are powerful tools to boost research. Here they are applied to metabolic modelling in infections as well as health care management. Starting from a comparative analysis this thesis shows own steps and examples towards improvement in metabolic modelling software and health data management. In section 2, new experimental data on metabolites and enzymes induce high interest in metabolic modelling including metabolic flux calculations. Data analysis of metabolites, calculation of metabolic fluxes, pathways and their condition-specific strengths is now possible by an advantageous combination of specific software. How can available software for metabolic modelling be improved from a computational point of view? A number of available and well established software solutions are first discussed individually. This includes information on software origin, capabilities, development and used methodology. Performance information is obtained for the compared software using provided example data sets. A feature based comparison shows limitations and advantages of the compared software for specific tasks in metabolic modeling. Often found limitations include third party software dependence, no comprehensive database management and no standard format for data input and output. Graphical visualization can be improved for complex data visualization and at the web based graphical interface. Other areas for development are platform independency, product line architecture, data standardization, open source movement and new methodologies. The comparison shows clearly space for further software application development including steps towards an optimal user friendly graphical user interface, platform independence, database management system and third party independence especially in the case of desktop applications. The found limitations are not limited to the software compared and are of course also actively tackled in some of the most recent developments. Other improvements should aim at generality and standard data input formats, improved visualization of not only the input data set but also analyzed results. We hope, with the implementation of these suggestions, metabolic software applications will become more professional, cheap, reliable and attractive for the user. Nevertheless, keeping these inherent limitations in mind, we are confident that the tools compared can be recommended for metabolic modeling for instance to model metabolic fluxes in bacteria or metabolic data analysis and studies in infection biology. ...}, subject = {Stoffwechsel}, language = {en} } @phdthesis{Koetschan2012, author = {Koetschan, Christian}, title = {The Eukaryotic ITS2 Database - A workbench for modelling RNA sequence-structure evolution}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-73128}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2012}, abstract = {In den vergangenen Jahren etablierte sich der Marker „internal transcribed spacer 2" (ITS2) zu einem h{\"a}ufig genutzten Werkzeug in der molekularen Phylogenetik der Eukaryoten. Seine schnell evolvierende Sequenz eignet sich bestens f{\"u}r den Einsatz in niedrigeren phylogenetischen Ebenen. Die ITS2 faltet jedoch auch in eine sehr konservierte Sekund{\"a}rstruktur. Diese erm{\"o}glicht die Unterscheidung weit entfernter Arten. Eine Kombination aus beiden in einer Sequenzstrukturanalyse verbessert die Aufl{\"o}sung des Markers und erm{\"o}glicht die Rekonstruktion von robusteren B{\"a}umen auf h{\"o}herer taxonomischer Breite. Jedoch war die Durchf{\"u}hrung solch einer Analyse, die die Nutzung unterschiedlichster Programme und Datenbanken vorraussetzte, f{\"u}r den klassischen Biologen nicht einfach durchf{\"u}hrbar. Um diese H{\"u}rde zu umgehen, habe ich den „ITS2 Workbench" entwickelt, eine im Internet nutzbare Arbeitsplattform zur automatisierten sequenzstrukturbasierten phylogenetischen Analyse basierend auf der ITS2 (http://its2.bioapps.biozentrum.uni-wuerzburg.de). Die Entwicklung begann mit der L{\"a}ngenoptimierung unterschiedlicher „Hidden Markov Model" (HMM)-Topologien, die erfolgreich auf ein Modell zur Sequenzstrukturvorhersage der ITS2 angewandt wurden. Hierbei wird durch die Analyse von Sequenzbestandteilen in Kombination mit der L{\"a}ngenverteilung verschiedener Helixregionen die Struktur vorhergesagt. Anschließend konnte ich HMMs auch bei der Sequenzstrukturgenerierung einsetzen um die ITS2 innerhalb einer gegebenen Sequenz zu lokalisieren. Dieses neu implementierte Verfahren verdoppelte die Anzahl vorhergesagter Strukturen und verk{\"u}rzte die Laufzeit auf wenige Tage. Zusammen mit weiteren Optimierungen des Homologiemodellierungsprozesses kann ich nun ersch{\"o}pfend Sekund{\"a}rstrukturen in mehreren Interationen vorhersagen. Diese Optimierungen liefern derzeit 380.000 annotierte Sequenzen einschließlich 288.000 Strukturvorhersagen. Um diese Strukturen f{\"u}r die Berechnung von Alignments und phylogenetischen B{\"a}umen zu verwenden hab ich das R-Paket „treeforge" entwickelt. Es erm{\"o}glicht die Generierung von Sequenzstrukturalignments auf bis zu vier unterschiedlich kodierten Alphabeten. Damit k{\"o}nnen erstmals auch strukturelle Basenpaarungen in die Alignmentberechnung mit einbezogen werden, die eine Sch{\"a}tzung neuer Scorematrizen vorraussetzten. Das R-Paket erm{\"o}glicht zus{\"a}tzlich die Rekonstruktion von „Maximum Parsimony", „Maximum Likelihood" und „Neighbour Joining" B{\"a}umen auf allen vier Alphabeten mittels weniger Zeilen Programmcode. Das Paket wurde eingesetzt, um die noch umstrittene Phylogenie der „chlorophyceae" zu rekonstruieren und k{\"o}nnte in zuk{\"u}nftigen Versionen des ITS2 workbench verwendet werden. Die ITS2 Plattform basiert auf einer modernen und sehr umfangreichen Web 2.0 Oberfl{\"a}che und beinhaltet neuste AJAX und Web-Service Technologien. Sie umfasst die HMM basierte Sequenzannotation, Strukturvorhersage durch Energieminimierung bzw. Homologiemodellierung, Alignmentberechnung und Baumrekonstruktion basierend auf einem flexiblen Datenpool, der {\"A}nderungen am Datensatz automatisch aktualisiert. Zus{\"a}tzlich wird eine Detektion von Sequenzmotiven erm{\"o}glicht, die zur Kontrolle von Annotation und Strukturvorhersage dienen kann. Eine BLAST basierte Suche auf Sequenz- und Strukturebene bietet zus{\"a}tzlich eine Vereinfachung des Taxonsamplings. Alle Funktionen sowie die Nutzung der ITS2 Webseite sind in einer kurzen Videoanleitung dargestellt. Die Plattform l{\"a}sst jedoch nur eine bestimmte Gr{\"o}ße von Datens{\"a}tzen zu. Dies liegt vor allem an der erheblichen Rechenleistung, die bei diesen Berechnungen ben{\"o}tigt wird. Um die Funktion dieses Verfahrens auch auf großen Datenmengen zu demonstrieren, wurde eine voll automatisierte Rekonstruktion des Gr{\"u}nalgenbaumes (Chlorophyta) durchgef{\"u}hrt. Diese erfolgreiche, auf dem ITS2 Marker basierende Studie spricht f{\"u}r die Sequenz-Strukturanalyse auf weiteren Daten in der Phylogenetik. Hier bietet der ITS2 Workbench den idealen Ausgangspunkt.}, subject = {Ribosomale RNA}, language = {en} } @phdthesis{Foerster2010, author = {F{\"o}rster, Frank}, title = {Making the most of phylogeny: Unique adaptations in tardigrades and 216374 internal transcribed spacer 2 structures}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-51466}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2010}, abstract = {The phylum Tardigrada consists of about 1000 described species to date. The animals live in habitats within marine, freshwater and terrestrial ecosystems allover the world. Tardigrades are polyextremophiles. They are capable to resist extreme temperature, pressure or radiation. In the event of desiccation, tardigrades enter a so-called tun stage. The reason for their great tolerance capabilities against extreme environmental conditions is not discovered yet. Our Funcrypta project aims at finding answers to the question what mechanisms underlie these adaption capabilities particularly with regard to the species Milnesium tardigradum. The first part of this thesis describes the establishment of expressed sequence tags (ESTs) libraries for different stages of M. tardigradum. From proteomics data we bioinformatically identified 144 proteins with a known function and additionally 36 proteins which seemed to be specific for M. tardigradum. The generation of a comprehensive web-based database allows us to merge the proteome and transcriptome data. Therefore we created an annotation pipeline for the functional annotation of the protein and nucleotide sequences. Additionally, we clustered the obtained proteome dataset and identified some tardigrade-specific proteins (TSPs) which did not show homology to known proteins. Moreover, we examined the heat shock proteins of M. tardigradum and their different expression levels depending on the actual state of the animals. In further bioinformatical analyses of the whole data set, we discovered promising proteins and pathways which are described to be correlated with the stress tolerance, e.g. late embryogenesis abundant (LEA) proteins. Besides, we compared the tardigrades with nematodes, rotifers, yeast and man to identify shared and tardigrade specific stress pathways. An analysis of the 50 and 30 untranslated regions (UTRs) demonstrates a strong usage of stabilising motifs like the 15-lipoxygenase differentiation control element (15-LOX-DICE) but also reveals a lack of other common UTR motifs normally used, e.g. AU rich elements. The second part of this thesis focuses on the relatedness between several cryptic species within the tardigrade genus Paramacrobiotus. Therefore for the first time, we used the sequence-structure information of the internal transcribed spacer 2 (ITS2) as a phylogenetic marker in tardigrades. This allowed the description of three new species which were indistinguishable using morphological characters or common molecular markers like the 18S ribosomal ribonucleic acid (rRNA) or the Cytochrome c oxidase subunit I (COI). In a large in silico simulation study we also succeeded to show the benefit for the phylogenetic tree reconstruction by adding structure information to the ITS2 sequence. Next to the genus Paramacrobiotus we used the ITS2 to corroborate a monophyletic DO-group (Sphaeropleales) within the Chlorophyceae. Additionally we redesigned another comprehensive database—the ITS2 database resulting in a doubled number of sequence-structure pairs of the ITS2. In conclusion, this thesis shows the first insights (6 first author publications and 4 coauthor publications) into the reasons for the enormous adaption capabilities of tardigrades and offers a solution to the debate on the phylogenetic relatedness within the tardigrade genus Paramacrobiotus.}, subject = {Phylogenie}, language = {en} } @misc{Selig2007, type = {Master Thesis}, author = {Selig, Christian}, title = {The ITS2 Database - Application and Extension}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-23895}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2007}, abstract = {Der internal transcribed spacer 2 (ITS2) des ribosomalen Genrepeats ist ein zunehmend wichtiger phylogenetischer Marker, dessen RNA-Sekund{\"a}rstruktur innerhalb vieler eukaryontischer Organismen konserviert ist. Die ITS2-Datenbank hat zum Ziel, eine umfangreiche Ressource f{\"u}r ITS2-Sequenzen und -Sekund{\"a}rstrukturen auf Basis direkter thermodynamischer als auch homologiemodellierter RNA-Faltung zu sein. Ergebnisse: (a) Eine komplette Neufassung der urspr{\"u}nglichen die ITS2-Datenbank generierenden Skripte, angewandt auf einen aktuellen NCBI-Datensatz, deckte mehr als 65.000 ITS2-Strukturen auf. Dies verdoppelt den Inhalt der urspr{\"u}nglichen Datenbank und verdreifacht ihn, wenn partielle Strukturen mit einbezogen werden. (b) Die Endbenutzer-Schnittstelle wurde neu geschrieben, erweitert und ist jetzt in der Lage, benutzerdefinierte Homologiemodellierungen durchzuf{\"u}hren. (c) Andere m{\"o}glichen RNA-Strukturaufkl{\"a}rungsmethoden (suboptimales und formenbasiertes Falten) sind hilfreich, k{\"o}nnen aber Homologiemodellierung nicht ersetzen. (d) Ein Anwendungsfall der ITS2-Datenbank in Zusammenhang mit anderen am Lehrstuhl entwickelten Werkzeugen gab Einblick in die Verwendung von ITS2 f{\"u}r molekulare Phylogenie.}, subject = {Phylogenie}, language = {en} }