TY - THES A1 - Zeeshan, Ahmed T1 - Bioinformatics Software for Metabolic and Health Care Data Management T1 - Metabolische Flux-Analyse N2 - Computer Science approaches (software, database, management systems) are powerful tools to boost research. Here they are applied to metabolic modelling in infections as well as health care management. Starting from a comparative analysis this thesis shows own steps and examples towards improvement in metabolic modelling software and health data management. In section 2, new experimental data on metabolites and enzymes induce high interest in metabolic modelling including metabolic flux calculations. Data analysis of metabolites, calculation of metabolic fluxes, pathways and their condition-specific strengths is now possible by an advantageous combination of specific software. How can available software for metabolic modelling be improved from a computational point of view? A number of available and well established software solutions are first discussed individually. This includes information on software origin, capabilities, development and used methodology. Performance information is obtained for the compared software using provided example data sets. A feature based comparison shows limitations and advantages of the compared software for specific tasks in metabolic modeling. Often found limitations include third party software dependence, no comprehensive database management and no standard format for data input and output. Graphical visualization can be improved for complex data visualization and at the web based graphical interface. Other areas for development are platform independency, product line architecture, data standardization, open source movement and new methodologies. The comparison shows clearly space for further software application development including steps towards an optimal user friendly graphical user interface, platform independence, database management system and third party independence especially in the case of desktop applications. The found limitations are not limited to the software compared and are of course also actively tackled in some of the most recent developments. Other improvements should aim at generality and standard data input formats, improved visualization of not only the input data set but also analyzed results. We hope, with the implementation of these suggestions, metabolic software applications will become more professional, cheap, reliable and attractive for the user. Nevertheless, keeping these inherent limitations in mind, we are confident that the tools compared can be recommended for metabolic modeling for instance to model metabolic fluxes in bacteria or metabolic data analysis and studies in infection biology. ... N2 - Informatik Ansätze (Software, Datenbank, Management-Systeme) sind wichtige Werkzeuge für die Forschung in der Biologie. Ausgehend von einer vergleichenden Analyse zeigt diese Arbeit eigene Schritte und Beispiele zur Verbesserung von metabolischer Modellierungs-Software und Gesundheit Datenmanagementsystemen auf. Neue experimentelle Daten über Metaboliten und Enzyme führen zu hohem Interesse an metabolischen Modellierungen einschließlich Stoffwechselflusses Berechnungen. In Kapitel 2 zeigen wir, das die Datenanalyse von Metaboliten, die Berechnung der Stoffflüsse und Wege sowie die spezifischen Softwarestärken nur durch eine vorteilhafte Kombination voll ausgeschöpft werden. Wie kann Software zur metabolischen Modellierung von einer informatischen Sicht her verbessert werden? Eine Anzahl von verfügbaren und gut etablierten Softwareansätzen wird zunächst einzeln diskutiert. Dazu gehören Informationen über Software-Herkunft, Fähigkeiten, Entwicklung und verwendeten Methodik einschließlich Testdatensätzen und Modellen. Ein Vergleich zeigt, merkmalsbasierte Einschränkungen und Vorteile der verglichenen Software für spezifische Aufgaben in der metabolischen Modellierung. Häufige Einschränkungen der verglichenen Software sind ihre Abhängigkeit von Drittanbietern, kein umfassendes Datenbank-Management und kein Standard-Format für Dateneingabe und -ausgabe. Die grafische Visualisierung für komplexe Visualisierungen von Daten und die Web-basierte grafische Benutzeroberfläche kann oft noch verbessert werden. Andere Bereiche für weitere Entwicklung sind Plattformunabhängigkeit, Produktlinien-Architektur, Daten-Standardisierung, die Open-Source-Bewegung und neue Algorithmen und Methoden. Der Vergleich zeigt deutlich Möglichkeiten für weitere Entwicklung von Softwareanwendungen auf, einschließlich Schritten in Richtung einer optimalen, benutzerfreundlichen grafischen Benutzeroberfläche, Plattform-Unabhängigkeit, Datenbank-Management-System und Unabhängigkeit von weiterer software, vor allem im Falle von Desktop-Anwendungen. Die gefundenen Einschränkungen sind von allgemeiner Bedeutung für bioinformatische Modellierungssoftware einschließlich jüngster Entwicklungen. Weitere Verbesserungen betreffen standardisierte Formate und eine, verbesserte Visualisierung von Eingabedatensatz und analysierten Ergebnissen. Wir hoffen, dass mit der Umsetzung dieser Vorschläge metabolische Software-Anwendungen professioneller werden, billiger, zuverlässiger und attraktiver für den Anwender. Trotz dieser inhärenten Einschränkungen im Hinterkopf sind wir zuversichtlich und ... KW - Stoffwechsel KW - Modell KW - Software KW - Gesundheitswesen KW - Datenbanksystem KW - Metabolische Flux-Analyse KW - Massen-Isotopomer Verteilungs-Analyse KW - Datenbank KW - Management-Systeme KW - Metabolic Flux Analysis KW - Mass Isotopomers Distribution Analysis KW - Software KW - Database KW - Management System Y1 - 2012 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-73926 ER - TY - THES A1 - Förster, Frank T1 - Making the most of phylogeny: Unique adaptations in tardigrades and 216374 internal transcribed spacer 2 structures T1 - Einzigartige Anpassungen in Tardigraden und 216374 "internal transcribed spacer 2" Strukturen N2 - The phylum Tardigrada consists of about 1000 described species to date. The animals live in habitats within marine, freshwater and terrestrial ecosystems allover the world. Tardigrades are polyextremophiles. They are capable to resist extreme temperature, pressure or radiation. In the event of desiccation, tardigrades enter a so-called tun stage. The reason for their great tolerance capabilities against extreme environmental conditions is not discovered yet. Our Funcrypta project aims at finding answers to the question what mechanisms underlie these adaption capabilities particularly with regard to the species Milnesium tardigradum. The first part of this thesis describes the establishment of expressed sequence tags (ESTs) libraries for different stages of M. tardigradum. From proteomics data we bioinformatically identified 144 proteins with a known function and additionally 36 proteins which seemed to be specific for M. tardigradum. The generation of a comprehensive web-based database allows us to merge the proteome and transcriptome data. Therefore we created an annotation pipeline for the functional annotation of the protein and nucleotide sequences. Additionally, we clustered the obtained proteome dataset and identified some tardigrade-specific proteins (TSPs) which did not show homology to known proteins. Moreover, we examined the heat shock proteins of M. tardigradum and their different expression levels depending on the actual state of the animals. In further bioinformatical analyses of the whole data set, we discovered promising proteins and pathways which are described to be correlated with the stress tolerance, e.g. late embryogenesis abundant (LEA) proteins. Besides, we compared the tardigrades with nematodes, rotifers, yeast and man to identify shared and tardigrade specific stress pathways. An analysis of the 50 and 30 untranslated regions (UTRs) demonstrates a strong usage of stabilising motifs like the 15-lipoxygenase differentiation control element (15-LOX-DICE) but also reveals a lack of other common UTR motifs normally used, e.g. AU rich elements. The second part of this thesis focuses on the relatedness between several cryptic species within the tardigrade genus Paramacrobiotus. Therefore for the first time, we used the sequence-structure information of the internal transcribed spacer 2 (ITS2) as a phylogenetic marker in tardigrades. This allowed the description of three new species which were indistinguishable using morphological characters or common molecular markers like the 18S ribosomal ribonucleic acid (rRNA) or the Cytochrome c oxidase subunit I (COI). In a large in silico simulation study we also succeeded to show the benefit for the phylogenetic tree reconstruction by adding structure information to the ITS2 sequence. Next to the genus Paramacrobiotus we used the ITS2 to corroborate a monophyletic DO-group (Sphaeropleales) within the Chlorophyceae. Additionally we redesigned another comprehensive database—the ITS2 database resulting in a doubled number of sequence-structure pairs of the ITS2. In conclusion, this thesis shows the first insights (6 first author publications and 4 coauthor publications) into the reasons for the enormous adaption capabilities of tardigrades and offers a solution to the debate on the phylogenetic relatedness within the tardigrade genus Paramacrobiotus. N2 - Der Tierstamm Tardigrada besteht aus derzeitig etwa 1000 beschriebenen Arten. Die Tiere leben in Habitaten in marinen, limnischen und terrestrischen Ökosystemen auf der ganzen Welt. Tardigraden sind polyextremophil. Sie können extremer Temperatur, Druck oder Strahlung widerstehen. Beim Austrocknen bilden sie ein so genanntes Tönnchenstadium. Der Grund für die hohe Toleranz gegenüber extremen Umweltbedingungen ist bis jetzt nicht aufgeklärt worden. Unser Funcrypta Projekt versucht Antworten darauf zu finden, was die hinter dieser Anpassungsfähigkeit liegenden Mechanismen sind. Dabei steht die Art Milnesium tardigradum im Mittelpunkt. Der erste Teil dieser Arbeit beschreibt die Etablierung einer expressed sequence tags (ESTs) Bibliothek für verschiedene Stadien von M. tardigradum. Aus unseren Proteomansatz konnten wir bislang 144 Proteine bioinformatisch identifizieren, denen eine Funktion zugeordnet werden konnte. Darüber hinaus wurden 36 Proteine gefunden, welche spezifisch für M. tardigradum zu sein scheinen. Die Erstellung einer umfassenden internetbasierenden Datenbank erlaubt uns die Verknüpfung der Proteom und Transkriptomdaten. Dafür wurde eine Annotations-Pipeline erstellt um den Sequenzen Funktionen zuordnen zu können. Außerdem wurden die erhaltenen Proteindaten von uns geclustert. Dabei konnten wir einige Tardigraden-spezifische Proteine (tardigrade-specific protein, TSP) identifizieren die keinerlei Homologie zu bekannten Proteinen zeigen. Außerdem untersuchten wir die Hitze-Schock-Proteine von M. tardigradum und deren differenzielle Expression in Abhängigkeit vom Stadium der Tiere. In weiteren bioinformatischen Analysen konnten wir viel versprechende Proteine und Stoffwechselwege entdecken für die beschrieben ist, dass sie mit Stressreaktionen in Verbindung stehen, beispielsweise late embryogenesis abundant (LEA) Proteine. Des Weiteren verglichen wir Tardigraden mit Nematoden, Rotatorien, Hefe und dem Menschen, um gemeinsame und Tardigraden-spezifische Stoffwechselwege identifizieren zu können. Analysen der 50 und 30 untranslatierten Bereiche zeigen eine verstärkte Nutzung von stabilisierenden Motiven, wie dem 15-lipoxygenase differentiation control element (LEA). Im Gegensatz dazu werden häufig benutzte Motive, wie beispielsweise AU-reiche Bereiche, gar nicht gefunden. Der zweite Teil der Doktorarbeit beschäftigt sich mit den Verwandtschaftsverhältnissen einiger kryptischer Arten in der Tardigradengattung Paramacrobiotus. Hierfür haben wir, zum ersten Mal in Tardigraden, die Sequenz-Struktur-Informationen der internal transcribed spacer 2 Region als phylogenetischen Marker verwendet. Dies erlaubte uns die Beschreibung von drei neuen Arten, welche mit klassischen morphologischen Merkmalen oder anderen molekularen Markern wie 18S ribosomaler RNA oder Cytochrome c oxidase subunit I (COI) nicht unterschieden werden konnten. In einer umfangreichen in silico Simulationsstudie zeigten wir den Vorteil der bei der Rekonstruktion phylogenetischer Bäume unter der Hinzunahme der Strukturinformationen zur Sequenz der ITS2 entsteht. ITS2 Sequenz-Struktur-Informationen wurden außerdem auch dazu benutzt, eine monophyletische DO-Gruppe (Sphaeropleales) in den Chlorophyceae zu bestätigen. Zusätzlich haben wir eine umfassende Datenbank, die ITS2-Datenbank, überarbeitet. Dadurch konnten die Sequenz-Struktur-Informationen verdoppelt werden, die in dieser Datenbank verfügbar sind. Die vorliegende Doktorarbeit zeigt erste Einblicke (6 Erstautor- und 4 Koautor-Publikationen) in die Ursachen für die hervorragende Anpassungsfähigkeit der Tardigraden und beschreibt die erfolgreiche Aufklärung der Verwandtschaftsverhältnisse in der Tardigradengattung Paramacrobiotus. KW - Phylogenie KW - Bioinformatik KW - Würzburg / Universität / Lehrstuhl für Bioinformatik KW - Anpassung KW - Datenbank KW - ITS2 KW - Marker KW - Tardigraden KW - Bärtierchen KW - ITS2 KW - Marker KW - Tardigrades KW - Waterbear Y1 - 2010 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-51466 ER -