TY - THES A1 - Pischimarov, Jordan Ivanov T1 - Bioinformatische Methoden zur Identifizierung und Klassifizierung somatischer Mutationen in hämatologischen Erkrankungen T1 - Bioinformatics approaches for the detection and classification of somatic mutations in hematological malignancies N2 - Die Sequenzierungstechnologien entwickeln sich stetig weiter, dies ermöglicht eine zuvor nicht erreichte Ausbeute an experimentellen Daten und auch an Neuentwicklungen von zuvor nicht realisierbaren Experimenten. Zugleich werden spezifische Datenbanken, Algorithmen und Softwareprogramme entwickelt, um die neu entstandenen Daten zu analysieren. Während der Untersuchung bioinformatischer Methoden für die Identifizierung und Klassifizierung somatischer Mutationen in hämatologischen Erkrankungen, zeigte sich eine hohe Vielfalt an alternativen Softwaretools die für die jeweiligen Analyseschritte genutzt werden können. Derzeit existiert noch kein Standard zur effizienten Analyse von Mutationen aus Next-Generation-Sequencing (NGS)-Daten. Die unterschiedlichen Methoden und Pipelines generieren Kandidaten, die zum größten Anteil in allen Ansätzen identifiziert werden können, jedoch werden Software spezifische Kandidaten nicht einheitlich detektiert. Um eine einheitliche und effiziente Analyse von NGS-Daten durchzuführen war im Rahmen dieser Arbeit die Entwicklung einer benutzerfreundlichen und einheitlichen Pipeline vorgesehen. Hierfür wurden zunächst die essentiellen Analysen wie die Identifizierung der Basen, die Alignierung und die Identifizierung der Mutationen untersucht. Des Weiteren wurden unter Berücksichtigung von Effizienz und Performance diverse verfügbare Softwaretools getestet, ausgewertet und sowohl mögliche Verbesserungen als auch Erleichterungen der bisherigen Analysen vorgestellt und diskutiert. Durch Mitwirken in Konsortien wie der klinischen Forschergruppe 216 (KFO 216) und International Cancer Genome Consortium (ICGC) oder auch bei Haus-internen Projekten wurden Datensätze zu den Entitäten Multiples Myelom (MM), Burkitt Lymphom (BL) und Follikuläres Lymphom (FL) erstellt und analysiert. Die Selektion geeigneter Softwaretools und die Generierung der Pipeline basieren auf komparativen Analysen dieser Daten, sowie auf geteilte Ergebnisse und Erfahrungen in der Literatur und auch in Foren. Durch die gezielte Entwicklung von Skripten konnten biologische und klinische Fragestellungen bearbeitet werden. Hierzu zählten eine einheitliche Annotation der Gennamen, sowie die Erstellung von Genmutations-Heatmaps mit nicht Variant-Calling-File (VCF)-Syntax konformen Dateien. Des Weiteren konnten nicht abgedeckte Regionen des Genoms in den NGS-Daten identifiziert und analysiert werden. Neue Projekte zur detaillierten Untersuchung der Verteilung von wiederkehrender Mutationen und Funktionsassays zu einzelnen Mutationskandidaten konnten basierend auf den Ergebnissen initiiert werden. Durch eigens erstellte Python-Skripte konnte somit die Funktionalität der Pipeline erweitert werden und zu wichtigen Erkenntnissen bei der biologischen Interpretation der Sequenzierungsdaten führen, wie beispielsweise zu der Detektion von drei neuen molekularen Subgruppen im MM. Die Erweiterungen, der in dieser Arbeit entwickelten Pipeline verbesserte somit die Effizienz der Analyse und die Vergleichbarkeit unserer Daten. Des Weiteren konnte durch die Erstellung eines eigenen Skripts die Analyse von unbeachteten Regionen in den NGS-Daten erfolgen. N2 - The sequencing technologies, while still being under further development, render it possible to develop novel experiments and allow the generation of larger amounts of utilizable data. At the same time novel software tools, databases and algorithms are developed to analyze these larger amounts of data. The analysis of somatic mutations in hematological malignancies showed that a high variety of alternative software tools can be used for different analysis steps. Furthermore there is currently no standardized procedure for the efficient identification and analysis of mutations in NGS data. The different pipeline and methods are, for the most part, able to identify the same mutation candidates, however there are software specific candidates which are not called by all pipelines. The scope of this dissertation was therefore to develop a user-friendly pipeline which is able to call candidate mutations uniformly and efficiently. For this purpose necessary analysis steps including base calling, alignment generation and variant calling were investigated. Furthermore available software tools were tested and evaluated regarding their efficiency and performance. Possible improvements of these software tools and previously performed analysis are explained and discussed in this work. NGS data sets of the different cancer entities multiple myeloma (MM), Burkitt lymphoma (BL) and follicular lymphoma (FL) were generated and analyzed within the framework of cooperate projects like the International Cancer Genome Consortium (ICGC) and the Clinical Research Group 216 (KFO) as well as for internal projects. The development of the pipeline and selection of suitable software tools is based on the comparative analysis of the generated data sets, as well as previously described results and experiences in literature and forums. The selective development of certain python scripts enabled the evaluation of novel biological and clinical questions by standardizing gene names in the annotation step, generating heat- maps of non-standardized VCF-files as well as the identification and analysis of uncovered regions in NGS data sets. This work and the obtained results thereby provide the groundwork for further projects e.g. the analysis of the distribution of recurrent mutations or the functional analysis of specific mutation candidates. This extensions of the developed pipeline with python scripts helped to improve the efficiency and comparability of the NGS data. The interpretation of the NGS data with the extended script for example led to the discovery of three distinct molecular subgroups in MM. Furthermore the generation of the novel python scripts helped to analyze uncovered regions in the NGS data sets.  KW - Pipeline-Rechner KW - somatische Mutationen KW - Sequenzierung KW - Bioinformatik KW - Identifizierungspipeline KW - Next Generation Sequencing KW - Variantcalling KW - Bioinformatic KW - somatic mutations KW - DNS-Sequenz KW - Somatische Mutation Y1 - 2016 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-147773 ER - TY - THES A1 - Schulze, Katja T1 - Automatisierte Klassifizierung und Viabilitätsanalyse von Phytoplankton T1 - Automated classification and viability analysis for phytoplankton N2 - Zentrales Ziel dieser Arbeit war es, Methoden der Mikroskopie, Bildverarbeitung und Bilderkennung für die Charakterisierungen verschiedener Phyotplankter zu nutzen, um deren Analyse zu verbessern und zu vereinfachen. Der erste Schwerpunkt der Arbeit lag auf der Analyse von Phytoplanktongemeinschaften, die im Rahmen der Überprüfung der Süßwasserqualität als Marker dienen. Die konventionelle Analyse ist dabei sehr aufwendig, da diese noch immer vollständig von Hand durchgeführt wird und hierfür speziell ausgebildetes Personal eingesetzt werden muss. Ziel war es, ein System zur automatischen Erkennung aufzubauen, um die Analyse vereinfachen zu können. Mit Hilfe von automatischer Mikroskopie war es möglich Plankter unterschiedlicher Ausdehnung durch die Integration mehrerer Schärfeebenen besser in einem Bild aufzunehmen. Weiterhin wurden verschiedene Fluoreszenzeigenschaften in die Analyse integriert. Mit einem für ImageJ erstellten Plugin können Organismen vom Hintergrund der Aufnahmen abgetrennt und eine Vielzahl von Merkmalen berechnet werden. Über das Training von neuralen Netzen wird die Unterscheidung von verschieden Gruppen von Planktontaxa möglich. Zudem können weitere Taxa einfach in die Analyse integriert und die Erkennung erweitert werden. Die erste Analyse von Mischproben, bestehend aus 10 verschiedenen Taxa, zeigte dabei eine durchschnittliche Erkennungsrate von 94.7% und eine durchschnittliche Falsch-Positiv Rate von 5.5%. Im Vergleich mit bestehenden Systemen konnte die Erkennungsrate verbessert und die Falsch Positiv Rate deutlich gesenkt werde. Bei einer Erweiterung des Datensatzes auf 22 Taxa wurde darauf geachtet, Arten zu verwenden, die verschiedene Stadien in ihrem Wachstum durchlaufen oder höhere Ähnlichkeiten zu den bereits vorhandenen Arten aufweisen, um evtl. Schwachstellen des Systemes erkennen zu können. Hier ergab sich eine gute Erkennungsrate (86.8%), bei der der Ausschluss von nicht-planktonischen Partikeln (11.9%) weiterhin verbessert war. Der Vergleich mit weiteren Klassifikationsverfahren zeigte, dass neuronale Netze anderen Verfahren bei dieser Problemstellung überlegen sind. Ähnlich gute Klassifikationsraten konnten durch Support Vektor Maschinen erzielt werden. Allerdings waren diese bei der Unterscheidung von unbekannten Partikeln dem neuralen Netz deutlich unterlegen. Der zweite Abschnitt stellt die Entwicklung einer einfachen Methode zur Viabilitätsanalyse von Cyanobakterien, bei der keine weitere Behandlung der Proben notwendig ist, dar. Dabei wird die rote Chlorophyll - Autofluoreszenz als Marker für lebende Zellen und eine grüne unspezifische Fluoreszenz als Marker für tote Zellen genutzt. Der Assay wurde mit dem Modellorganismus Synechocystis sp. PCC 6803 etabliert und validiert. Die Auswahl eines geeigeneten Filtersets ermöglicht es beide Signale gleichzeitig anzuregen und zu beobachten und somit direkt zwischen lebendenden und toten Zellen zu unterscheiden. Die Ergebnisse zur Etablierung des Assays konnten durch Ausplattieren, Chlorophyllbestimmung und Bestimmung des Absorbtionsspektrums bestätigt werden. Durch den Einsatz von automatisierter Mikroskopie und einem neu erstellten ImageJ Plugin wurde eine sehr genaue und schnelle Analyse der Proben möglich. Der Einsatz beim Monitoring einer mutagenisierten Kultur zur Erhöhung der Temperaturtoleranz ermöglichte genaue und zeitnahe Einblicke in den Zustand der Kultur. Weitere Ergebnisse weisen darauf hin, dass die Kombination mit Absorptionsspektren es ermöglichen können bessere Einblicke in die Vitalität der Kultur zu erhalten. N2 - Central goal of this work was to improve and simplify the characterization of different phytoplankter by the use of automated microscopy, image processing and image analysis. The first part of the work dealt with the analysis of pytoplankton communities, which are used as a marker for the determination of fresh water quality. The current routine analysis, is very time consuming and expensive, as it is carried out manually by trained personnel. Thus the goal of this work was to develop a system for automating the analysis. With the use of automated microscopy different focal planes could be integrated into one image, which made it possible to image plankter of different focus levels simultaneously. Additionally it allowed the integration of different fluorescence characteristics into the analysis. An image processing routine, developed in ImageJ, allows the segmentation of organisms from the image background and the calculation of a large range of features. Neural networks are then used for the classification of previously defined groups of plankton taxa. The program allows easy integration of additional taxa and expansion of the recognition targets. The analysis of samples containing 10 different taxa showed an average recognition rate of 94.7% and an average error rate of 5.5%. The obtained recognition rate was better than those of existing systems and the exclusion of non-plankton particles could be greatly improved. After extending the data set to 22 different classes of (more demanding) taxa a still good recognition (86.9 %) and still improved error rate (11.9 %) were obtained. This extended set was specifically selected in order to target potential weaknesses of the system. It contained mainly taxa that showed strong similarities to each other or taxa that go through various different morphological stages during their growth. The obtained recognition rates were comparable or better than those of existing systems and the exclusion of non-plankton particles could be greatly improved. A comparison of different classification methods showed, that neural networks are superior to all other investigated methods when used for this specific task. While similar recognition rates could be achieved with the use of support vector machines they were vastly inferior for the differentiation of unknown particles. The second part focused on the development of a simple live - dead assay for unicellular cyanobacteria without the need of sample preparation. The assay uses red chlorophyll fluorescence, corresponding to viable cells, and an unspecific green autofluorescence, that can only be observed in non viable cells. The assay was established and validated for the model organism Synechocystis sp. PCC 6803. With the selection of a suitable filter-set both signals could be excited and observed simultaneously, allowing a direct classification of viable and non-viable cells. The results were confirmed by plating/colony count, absorption spectra and chlorophyll measurements. The use of an automated fluorescence microscope and an ImageJ based image analysis plugin allows a very precise and fast analysis. The monitoring of a random mutagenized culture undergoing selection for improved temperature tolerance allowed an accurate and prompt insight into the condition of the culture. Further results indicate that a combination of the new assay with absorption spectra or chlorophyll concentration measurements allows the estimation of the vitality of cells. KW - Bilderkennnung KW - Bioinformatik KW - Phytoplankton KW - Bilderkennung KW - Phytoplankton KW - Viabilität KW - Mikroskopie KW - Bioinformatik Y1 - 2014 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-107174 ER - TY - THES A1 - Cecil, Alexander [geb. Schmid] T1 - Metabolische Netzwerkanalysen für den Weg von xenobiotischen zu verträglichen antibiotischen Substanzen T1 - Metabolic network analysis for the path from xenobiotic to compliant antibiotic substances N2 - Durch das Auftreten neuer Stämme resistenter Krankheitserreger ist die Suche nach neuartigen Wirkstoffen gegen diese, sich ständig weiter ausbreitende Bedrohung, dringend notwendig. Der interdisziplinäre Sonderforschungsbereich 630 der Universität Würzburg stellt sich dieser Aufgabe, indem hier neuartige Xenobiotika synthetisiert und auf ihre Wirksamkeit getestet werden. Die hier vorgelegte Dissertation fügt sich hierbei nahtlos in die verschiedenen Fachbereiche des SFB630 ein: Sie stellt eine Schnittstelle zwischen Synthese und Analyse der Effekte der im Rahmen des SFB630 synthetisierten Isochinolinalkaloid-Derivaten. Mit den hier angewandten bioinformatischen Methoden wurden zunächst die wichtigsten Stoffwechselwege von S. epidermidis R62A, S. aureus USA300 und menschlicher Zellen in sogenannten metabolischen Netzwerkmodellen nachgestellt. Basierend auf diesen Modellen konnten Enzymaktivitäten für verschiedene Szenarien an zugesetzten Xenobiotika berechnet werden. Die hierfür benötigten Daten wurden direkt aus Genexpressionsanalysen gewonnen. Die Validierung dieser Methode erfolgte durch Metabolommessungen. Hierfür wurde S. aureus USA300 mit verschiedenen Konzentrationen von IQ-143 behandelt und gemäß dem in dieser Dissertation vorgelegten Ernteprotokoll aufgearbeitet. Die Ergebnisse hieraus lassen darauf schließen, dass IQ-143 starke Effekte auf den Komplex 1 der Atmungskette ausübt – diese Resultate decken sich mit denen der metabolischen Netzwerkanalyse. Für den Wirkstoff IQ-238 ergaben sich trotz der strukturellen Ähnlichkeiten zu IQ-143 deutlich verschiedene Wirkeffekte: Dieser Stoff verursacht einen direkten Abfall der Enzymaktivitäten in der Glykolyse. Dadurch konnte eine unspezifische Toxizität dieser Stoffe basierend auf ihrer chemischen Struktur ausgeschlossen werden. Weiterhin konnten die bereits für IQ-143 und IQ-238 auf Bakterien angewandten Methoden erfolgreich zur Modellierung der Effekte von Methylenblau auf verschiedene resistente Stämme von P. falciparum 3D7 angewandt werden. Dadurch konnte gezeigt werden, dass Methylenblau in einer Kombination mit anderen Präparaten gegen diesen Parasiten zum einen die Wirkung des Primärpräparates verstärkt, zum anderen aber auch in gewissem Maße vorhandene Resistenzen gegen das Primärpräparat zu verringern vermag. Somit konnte durch die vorgelegte Arbeit eine Pipeline zur Identifizierung der metabolischen Effekte verschiedener Wirkstoffe auf unterschiedliche Krankheitserreger erstellt werden. Diese Pipeline kann jederzeit auf andere Organismen ausgeweitet werden und stellt somit einen wichtigen Ansatz um Netzwerkeffekte verschiedener, potentieller Medikamente aufzuklären. N2 - With the emergence of new strains of resistant pathogens, the search for new compounds against this spreading threat is of utmost importance. The interdisciplinary special research field SFB630 of the University of Würzburg is ready to tackle this task by synthesizing and analysing the effects of xenobiotics. The presented dissertation is seamlessly integrated into the diverse range of special fields of the SFB630: it provides a gateway between synthesis and analysis of the effects of the newly synthesized isoquinoline alkaloid derivatives. The presented bioinformatic methods were used to build a so called metabolic network model of the most important pathways of S. epidermidis RP62A, S. aureus USA300 and human cells. Based on these models it was possible to calculate the enzyme activities for different scenarios of added xenobiotics. The data needed for these calculations were derived directly from gene expression analysis. Validation of this method was done by metabolomic measurements. In order to accomplish this, a strain of S. aureus USA300 was subjected to different concentrations of IQ-143 and processed according to the workflow also published in this dissertation. The results suggest that IQ-143 has very strong effects on the complex 1 of the oxidative phosphorylation – these results are consistent with the results obtained by the metabolic network analysis. Although IQ-238 is structurally a close relative to IQ-143, the effects of this compound are very different: it leads to a drop of the enzyme activities in the glycolysis. Therefore an unspecific toxicity of those compounds based on their chemical structure dould be ruled out. The methods used to model the effects of IQ-143 and IQ-238 on bacteria were furthermore successfully transferred to model the effects of methylene blue on several resistant strains of P. falciparum 3D7. It was shown that a combination of methylene blue and other malaria medications either enhances the effects of the primary medication, or – in the case of a resistant strain – methylene blue was able to mitigate the resistances against the primary medication. The presented dissertation was thus successfully able to build a pipeline to identify the metabolic effects of different compounds on various germs. This pipeline can be expanded to other organisms at any time and therefore yields an important approach to identify network effects of various potential drugs. KW - Stoffwechsel KW - Bioinformatik KW - Mathematisches Modell KW - Enzymaktivität KW - Xenobiotikum KW - Netzwerkanalyse KW - Bioinformatik KW - Metabolische Stoffwechselmodellierung KW - Metabolomik KW - Metabonomik KW - Network analysis KW - Bioinformatics KW - metabolic pathway modeling KW - metabolomics KW - metabonomics Y1 - 2012 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-71866 ER - TY - THES A1 - Philippi, Nicole T1 - Modellierung von Signalwegen in verschiedenen biologischen Systemen T1 - Modeling of signaling pathways in different biological systems N2 - Die Apoptose der Leberzellen ist abhängig von externen Signalen wie beispielsweise Komponenten der Extrazellulären Matrix sowie anderen Zell-Zell-Kontakten, welche von einer Vielfalt und Vielzahl an Knoten verarbeitet werden. Einige von ihnen wurden im Rahmen dieser Arbeit auf ihre Systemeffekte hin unter- sucht. Trotz verschiedener äußerer Einflüsse und natürlicher Selektion ist das System daraufhin optimiert, eine kleine Anzahl verschiedener und klar voneinander unterscheidbarer Systemzustände anzunehmen. Die verschiedenartigen Einflüsse und Crosstalk-Mechanismen dienen der Optimierung der vorhandenen Systemzustände. Das in dieser Arbeit vorgestellte Modell zeigt zwei apoptotische sowie zwei nicht-apoptotische stabile Systemzustände, wobei der Grad der Aktivierung eines Knotens bis zu dem Moment stark variieren kann, in welchem der absolute Systemzustand selbst verändert wird (Philippi et al., BMC Systems Biology,2009) [1]. Dieses Modell stellt zwar eine Vereinfachung des gesamten zellulären Netzwerkes und seiner verschiedenen Zustände dar, ist aber trotz allem in der Lage, unabhängig von detaillierten kinetischen Daten und Parametern der einzelnen Knoten zu agieren. Gleichwohl erlaubt das Modell mit guter qualitativer Übereinstimmung die Apoptose als Folge einer Stimulation mit FasL zu modellieren. Weiterhin umfasst das Modell sowohl Crosstalk-Möglichkeiten des Collagen-Integrin-Signalwegs, ebenso berücksichtigt es die Auswirkungen der genetischen Deletion von Bid sowie die Konsequenzen einer viralen Infektion. In einem zweiten Teil werden andere Anwendungsmöglichkeiten dargestellt. Hormonale Signale in Pflanzen, Virusinfektionen und intrazelluläre Kommunikation werden semi-quantitativ modelliert. Auch hier zeigte sich eine gute Ubereinstimmung der Modelle mit den experimentellen Daten. N2 - Apoptosis of liver cells is dependent on external signals such as components of the extracellular matrix and cell-cell-contacts, which are processed by a variety of numerous nodes of which several are examined here for their system effects. Despite different input interferences and presumably also due to natural selecti- on, the system nevertheless appears to be optimized to adopt a small number of clear and distinguishable states, and the various inputs and crosstalk mechanisms only optimize the best choice between them. For the model described within this work, two nonapoptotic and two apoptotic states are found, although the degree of activation at a node can differ widely until the absolute system state is altered (Philippi et al., BMC Systems Biology, 2009) [1]. The model is still a simplification of the complete cellular network and its different states, and operates independently of detailed kinetic data and parameters for individual nodes. Nevertheless, it allows modeling the readout of apoptosis after FasL stimulation with qualitative agreement and includes crosstalks from collagen/integrin signa- ling, the effect of genetic deletion of Bid and the consequences of viral infection. The second part of this work deals with other applications using this method. Semi-quantitative models are used for hormonal signaling in plants, viral infec- tions and intra-cellular communication. The simulated results fit to the experi- mental data provided. KW - Systembiologie KW - Modellierung KW - Bioinformatik KW - Apoptose KW - Systems Biology KW - Modeling KW - Bioinformatics KW - Apoptosis Y1 - 2011 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-57690 ER - TY - THES A1 - Krüger, Beate T1 - Integration und Kombination bioinformatischer Methoden in Biotechnologie, synthetischer Biologie und Pharmaindustrie T1 - Intgration and combination of bioinformatical methods in biotechnology, synthetic biology and pharmaceutical industry N2 - Die Bioinformatik ist eine interdisziplinäre Wissenschaft, welche Probleme aus allen Lebenswissenschaften mit Hilfe computergestützter Methoden bearbeitet. Ihr Ziel ist es, die Verarbeitung und Interpretation großer Datenmengen zu ermöglichen. Zudem unterstützt sie den Designprozess von Experimenten in der Synthetischen Biologie. Die synthetische Biologie beschäftigt sich mit der Generierung neuer Komponenten und deren Eigenschaften, welche durch die Behandlung und Manipulation lebender Organismen oder Teilen daraus entstehen. Ein besonders interessantes Themengebiet hierbei sind Zweikomponenten-Systeme (Two-Component System, TCS). TCS sind wichtige Signalkaskaden in Bakterien, welche in der Lage sind Informationen aus der Umgebung in eine Zelle zu übertragen und darauf zu reagieren. Die vorliegende Dissertation beschäftigt sich mit der Beurteilung, Nutzung und Weiterentwicklung von bioinformatischen Methoden zur Untersuchung von Proteininteraktionen und biologischen Systemen. Der wissenschaftliche Beitrag der vorliegenden Arbeit kann in drei Aspekte unterteilt werden: - Untersuchung und Beurteilung von bioinformatischen Methoden und Weiterführung der Ergebnisse aus der vorhergehenden Diplomarbeit zum Thema Protein-Protein-Interaktionsvorhersagen. - Analyse genereller evolutionärer Modifikationsmöglichkeiten von TCS sowie deren Design und spezifische Unterschiede. - Abstraktion bzw. Transfer der gewonnenen Erkenntnisse auf technische und biologische Zusammenhänge. Mit dem Ziel das Design neuer Experimente in der synthetischen Biologie zu vereinfachen und die Vergleichbarkeit von technischen und biologischen Prozessen sowie zwischen Organismen zu ermöglichen. Das Ergebnis der durchgeführten Studie zeigte, dass Zweikomponenten-Systeme in ihrem Aufbau sehr konserviert sind. Nichtsdestotrotz konnten viele spezifische Eigenschaften und drei generelle Modifikationsmöglichkeiten entdeckt werden. Die Untersuchungen ermöglichten die Identifikation neuer Promotorstellen, erlaubten aber auch die Beschreibung der Beschaffenheit unterschiedlicher Signalbindestellen. Zudem konnten bisher fehlende Komponenten aus TCS entdeckt werden, ebenso wie neue divergierte TCS-Domänen im Organismus Mycoplasma. Eine Kombination aus technischen Ansätzen und synthetischer Biologie vereinfachte die gezielte Manipulation von TCS oder anderen modularen Systemen. Die Etablierung der vorgestellten zweistufigen Modul-Klassifikation ermöglichte eine effizientere Analyse modular aufgebauter Prozesse und erlaubte somit das molekulare Design synthetischer, biologischer Anwendungen. Zur einfachen Nutzung dieses Ansatzes wurde eine frei zugängliche Software GoSynthetic entwickelt. Konkrete Beispiele demonstrierten die praktische Anwendbarkeit dieser Analysesoftware. Die vorgestellte Klassifikation der synthetisch-biologischen und technischen Einheiten soll die Planung zukünftiger Designexperimente vereinfachen und neue Wege für sinnverwandte Bereiche aufzeigen. Es ist nicht die Hauptaufgabe der Bioinformatik, Experimente zu ersetzen, sondern resultierende große Datenmengen sinnvoll und effizient auszuwerten. Daraus sollen neue Ideen für weitere Analysen und alternative Anwendungen gewonnen werden, um fehlerhafte oder falsche Ansätze frühzeitig zu erkennen. Die Bioinformatik bietet moderne, technische Verfahren, um vertraute, aber oft mühsame experimentelle Wege durch neue, vielversprechende Ansätze zur Datenstrukturierung und Auswertung großer Datenmengen zu ergänzen. Neue Sichtweisen werden durch die Erleichterung des Testprozederes gefördert. Die resultierende Zeitersparnis führt zudem zu einer Kostenreduktion. N2 - The field of Bioinformatics is an interdisciplinary science focusing on the application of computer science to solve problems in different areas of life sciences. Its scope is to handle and interpret an immense quantity of data and to support computer-aided design approaches of synthetic biological experiments. Synthetic biology deals with the generation of new components and biological characteristics created by manipulation of living organisms or parts of them. Of particular interest are two-component systems (TCS). TCS describe simple and important signalling cascades in bacteria which transfer information from the environment into the cell as a reaction to changes in the environment. The present thesis is focused on the assessment, applicability and enhancement of bioinformatical methods in order to facilitate analysis of protein interactions and biological systems. The scientific efforts within the thesis can be divided into three aspects: - Analysis and assessment of bioinformatical methods and enhancement of results from the preceding diploma thesis dealing with protein-protein interaction predictions. - Analysis of general evolutionary modification possibilities within TCS as well as specific differences and design for the identification of a common approach. - Abstraction and transfer of the results to technical and biological contexts in order to simplify synthetic biological design experiments. Establishment of comparable vocabulary for both, technical and biological processes as well as different organisms. The outcome of this thesis revealed that TCS structure is very conserved but that it nevertheless contained some very specific characteristics. New promotor sites were discovered whilst additionally allowing the analysis of the signal binding sites. Missing elements from known TCS could be discovered and a completely new diverged TCS domain in the organism Mycoplasma could be identified as well as three general modification possibilities for TCS. The combination between technological approaches and synthetic biology simplifies the systematic manipulation of TCS or other modular systems. The established two-staged module classification simplifies the analysis of modular processes and thereby the molecular design of synthetical-biological questions. Concrete examples showed the functionality and usefulness of the classification. A freely accessible software GoSynthetic provided easy access and application of the developed toolbox. Not only new concrete scientific findings were provided by the given thesis but also a general approach to identify and analyse TCS and even to create similar analytic procedures. The established classification of biological and technical modules will ease the design of future experiments and reveals new pportunities applicable to similar scientific areas. It is not the task of Bioinformatics to replace experiments but to analyse the resulting huge amounts of data meaningfully and efficiently. Hence, new ideas for further analysis and alternative cases need to be generated which may finally help to identify erroneous approaches earlier. Bioinformatics offers modern technical methods to amend familiar and sometimes exhausting experimental procedures with promising new approaches for data structuring and analysis of immense quantities of data. New perceptions are encouraged and speedier progress is possible without increasing the experimental coasts. KW - Biotechnologie KW - Synthetische Biologie KW - Bioinformatik KW - Vaccinia-Virus KW - Zweikomponentensystem KW - Zweikomponenten-System KW - Pharmazeutische Industrie KW - biotechnology KW - synthetic biology KW - bioinformatic KW - two-component system KW - vaccinia virus KW - gene ontology Y1 - 2012 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-70702 ER - TY - THES A1 - Schwarz, Roland T1 - Modellierung von Metabolismus, Transkriptom und Zellentwicklung bei Arabidopsis, Listerien und anderen Organismen T1 - Modeling of metabolism, transcriptome and cell development in Arabidopsis, Listeria and other organisms N2 - Im gleichen Maße wie informatisches Wissen mehr und mehr in den wissenschaftlichen Alltag aller Lebenswissenschaften Einzug gehalten hat, hat sich der Schwerpunkt bioinformatischer Forschung in stärker mathematisch und informatisch-orientierte Themengebiete verschoben. Bioinformatik heute ist mehr als die computergestützte Verarbeitung großer Mengen an biologischen Daten, sondern hat einen entscheidenden Fokus auf der Modellierung komplexer biologischer Systeme. Zur Anwendung kommen hierbei insbesondere Theorien aus dem Bereich der Stochastik und Statistik, des maschinellen Lernens und der theoretischen Informatik. In der vorliegenden Dissertation beschreibe ich in Fallstudien die systematische Modellierung biologischer Systeme aus einem informatisch - mathematischen Standpunkt unter Anwendung von Verfahren aus den genannten Teilbereichen und auf unterschiedlichen Ebenen biologischer Abstraktion. Ausgehend von der Sequenzinformation über Transkriptom, Metabolom und deren regulatorischer Interaktion hin zur Modellierung von Populationseffekten werden hierbei aktuelle biologische Fragestellungen mit mathematisch - informatischen Modellen und einer Vielzahl experimenteller Daten kombiniert. Ein besonderer Augenmerk liegt dabei auf dem Vorgang der Modellierung und des Modellbegriffs als solchem im Rahmen moderner bioinformatischer Forschung. Im Detail umfassen die Projekte (mehrere Publikationen) die Entwicklung eines neuen Ansatzes zur Einbettung und Visualisierung von Multiplen Sequenz- und Sequenz-Strukturalignments, illustriert am Beispiel eines Hemagglutininalignments unterschiedlicher H5N1 Varianten, sowie die Modellierung des Transkriptoms von A. thaliana, bei welchem mit Hilfe einer kernelisierten nicht-parametrischen Metaanalyse neue, an der Infektionsabwehr beteiligten, Gene ausfindig gemacht werden konnten. Desweiteren ist uns mit Hilfe unserer Software YANAsquare eine detaillierte Untersuchung des Metabolismus von L. monocytogenes unter Aktivierung des Transkriptionsfaktors prfA gelungen, dessen Vorhersagen durch experimentelle 13C Isotopologstudien belegt werden konnten. In einem Anschlußprojekt war der Zusammenhang zwischen Regulation des Metabolismus durch Regulation der Genexpression und der Fluxverteilung des metabolischen Steady- State-Netzwerks das Ziel. Die Modellierung eines komplexen organismischen Phänotyps, der Zellgrößenentwicklung der Diatomee Pseudo-nitzschia delicatissima, schließt die Untersuchungen ab. N2 - In the same way that informatical knowledge has made its way into almost all areas of research in the Life Sciences, the focus of bioinformatical research has shifted towards topics originating more in the fields of mathematics and theoretical computer science. Bioinformatics today is more than the computer-driven processing of huge amounts of biological data, but it has a special focus on the emphmodelling of complex biological systems. Of special importance hereby are theories from stochastics and statistics, from the field of machine learning and theoretical computer science. In the following dissertation, I describe the systematic modelling of biological systems from an informatical-mathematical point of view in a case studies approach, applying methods from the aforementioned areas of research and on different levels of biological abstraction. Beginning with the sequence information itself, followed by the transcriptome, metabolome and the interaction of both and finally population effects I show how current biological questions can be tackled with mathematical models and combined with a variety of different experimental datasets. A special focus lies hereby on the procedure of modelling and the concept and notion of a model as such in the framework of bioinformatical research. In more detail, the projects contained the development of a new approach for embedding and visualizing Multiple Sequence and Structure Alignments, which was illustrated using a hemagglutinin alignment from different H5N1 variants as an example. Furthermore we investigated the A. thaliana transcriptome by means of a kernelized non-parametric meta-analysis, thus being able to annotate several new genes as pathogen-defense related. Another major part of this work was the modelling of the metabolic network of L. monocytogenes under activation of the transcription factor prfA, establishing predictions which were later verified by experimental 13C isotopologue studies. Following this project we investigated the relationship between the regulation of metabolism by changes in the cellular genexpression patterns and the flux distributions of the metabolic steady-state network. Modelling of a complex organismal property, the cell size development of the planktonic diatom Pseudo-nitzschia delicatissima concludes this work. KW - Bioinformatik KW - Würzburg / Universität / Lehrstuhl für Bioinformatik KW - Modellierung KW - Metabolismus KW - Stoffwechsel KW - Transkriptom KW - Transkriptomanalyse KW - bioinformatics KW - metabolome KW - transcriptome KW - modeling KW - steady-state Y1 - 2008 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-27622 ER - TY - THES A1 - Bertram, Helge T1 - Bioinformatische Identifikation von Domänenunterschieden bei Parasit und Wirt am Beispiel der Malaria T1 - Bioinformatic identification of domain differences in parasite and host using malaria as an example N2 - Diese Arbeit untersucht zelluläre Netzwerke mit dem Ziel, die so gewonnenen Einsichten medizinisch beziehungsweise biotechnologisch zu nutzen. Hierzu müssen zunächst Proteindomänen und wichtige regulatorische RNA Elemente erkannt werden. Dies geschieht für regulatorische Elemente in Nukleinsäuren am Beispiel von Iron Responsive Elements (IREs) in Staphylococcus aureus, wobei sich solche Elemente in viel versprechender Nähe zu exprimierten Sequenzen finden lassen (T. Dandekar, F. Du, H. Bertram (2001) Nonlinear Analysis 47(1): 225-34). Noch bedeutsamer als Ziele zur Medikamentenentwicklung gegen Parasiten sind Domänenunterschiede in Struktur und Sequenz bei Proteinen (T. Dandekar, F. Du, H. Bertram (2001) Nonlinear Analysis 47(1): 225-34). Ihre Identifikation wird am Beispiel eines potentiellen Transportproteins in Plasmodium falciparum exemplarisch dargestellt. Anschließend wird das Zusammenwirken von regulatorischen Elementen und Domänen in Netzwerken betrachtet (einschließlich experimenteller Daten). Dies kann einerseits zu allgemeineren Schlussfolgerungen über das Netzwerkverhalten führen, andererseits für konkrete Anwendungen genutzt werden. Als Beispiel wählten wir hier Redoxnetzwerke und die Bekämpfung von Plasmodien als Verursacher der Malaria. Da das gesamte Redoxnetzwerk einer lebenden Zelle mit Methoden der pH Wert Messung nur unzureichend zu erfassen ist, werden als alternative Messmethode für dieses Netzwerk Mikrokristalle der Glutathionreduktase als Indikatorsystem nach digitaler Verstärkung experimentell genutzt (H. Bertram, M. A. Keese, C. Boulin, R. H. Schirmer, R. Pepperkok, T. Dandekar (2002) Chemical Nanotechnology Talks III - Nano for Life Sciences). Um komplexe Redoxnetzwerke auch bioinformatisch zu modulieren, werden Verfahren der metabolischen Fluxanalyse vorgestellt und verbessert, um insbesondere ihrer Verzahnung besser gerecht zu werden und solche Netzwerke mit möglichst wenig elementaren Flussmoden zutreffend beschreiben zu können. Die Reduktion der Anzahl von Elementarmoden bei sehr großen metabolischen Netzwerken einer Zelle gelingt hier mit Hilfe unterschiedlicher Methoden und führt zu einer vereinfachten Darstellungsmöglichkeit komplexer Stoffwechselwege von Metaboliten. Dabei dient bei jeder dieser Methoden die biochemisch sinnvolle Definition von externen Metaboliten als Grundlage (T. Dandekar, F. Moldenhauer, S. Bulik, H. Bertram, S. Schuster (2003) Biosystems 70(3): 255-70). Allgemeiner werden Verfahren der Proteindomänenklassifikation sowie neue Strategien gegen mikrobielle Erreger betrachtet. In Bezug auf automatisierte Einteilung von Proteinen in Domänen wird ein neues System von Taylor (2002b) mit bekannten Systemen verglichen, die in unterschiedlichem Umfang menschlichen Eingriffs bedürfen (H. Bertram, T. Dandekar (2002) Chemtracts 15: 735-9). Außerdem wurde neben einer Arbeit über die verschiedenen Methoden aus den Daten eines Genoms Informationen über das metabolische Netzwerk der Zelle zu erlangen (H. Bertram, T. Dandekar (2004) it 46(1): 5-11) auch eine Übersicht über die Schwerpunkte der Bioinformatik in Würzburg zusammengestellt (H. Bertram, S. Balthasar, T. Dandekar (2003) Bioforum 1-2: 26-7). Schließlich wird beschrieben, wie die Pathogenomik und Virulenz von Bakterien der bioinformatischen Analyse zugänglich gemacht werden können (H. Bertram, S. Balthasar, T. Dandekar (2003) Bioforum Eur. 3: 157-9). Im letzten Teil wird die metabolische Fluxanalyse zur Identifikation neuer Strategien zur Bekämpfung von Plasmodien dargestellt: Beim Vergleich der Stoffwechselwege mit Glutathion und Thioredoxin in Plasmodium falciparum, Anopheles und Mensch geht es darum, gezielte Störungen im Stoffwechsel des Malariaerregers auszulösen und dabei den Wirt zu schonen. Es ergeben sich einige interessante Ansatzpunkte, deren medizinische Nutzung experimentell angestrebt werden kann. N2 - The objective of this thesis is to obtain information, which may be advantageous for biotechnical and medical purposes. In order to achieve this aim it is first necessary to identify protein domains and essential regulatory RNA elements. In case of regulatory RNA elements this is accomplished by investigating Iron Responsive Elements (IREs) in Staphylocuccus aureus as a model. In this case these elements are found in much promising vicinity to open reading frames coding for proteins (T. Dandekar, F. Du, H. Bertram (2001) Nonlinear Analysis 47(1): 225-34). Even more significant for the purpose of developing pharmaceuticals against parasites are differences of structure and sequence in protein domains (T. Dandekar, F. Du, H. Bertram (2001) Nonlinear Analysis 47(1): 225-34). Their identification is shown in a potential transport protein in Plasmodium falciparum. Subsequently the interaction of regulatory elements and domains in networks is considered (including experimental data). The resulting observations may lead to general conclusions concerning network reaction, as well as specific applications. Our example and field of interest are redox networks and Plasmodia causing malaria. It is not possible to cover the redox network state of a living cell using only pH measurements. Therefore small crystals of glutathione reductase are employed as a more suitable indicator, whose signal is digitally amplified (H. Bertram, M. A. Keese, C. Boulin, R. H. Schirmer, R. Pepperkok, T. Dandekar (2002) Chemical Nanotechnology Talks III - Nano for Life Sciences). In order to bioinformatically modulate complex redox networks techniques of metabolic flux analysis are presented. They are also improved particularly to advance the understanding of interdependences and to facilitate the correct comprehension of such networks with as few elementary flux modes as possible. In this thesis the reduction of the number of elementary modes of large and intertwined metabolic networks succeeds with various methods. This leads to a simpler model of complex metabolic functions. For each of the methods used in this process the biochemically justified definition of external and internal metabolites constitutes the basis (T. Dandekar, F. Moldenhauer, S. Bulik, H. Bertram, S. Schuster (2003) Biosystems 70(3): 255-70). In a more general sense methods of protein domain classification and new strategies for the control of microbial pathogens are considered. In reference to automated classification of protein domains a new system by Taylor (2002b) is compared with traditional systems, which require a varying degree of human intervention (H. Bertram, T. Dandekar (2002) Chemtracts 15: 735-9). In addition different methods of acquiring information on the cellular metabolic network from genomic data is discussed (H. Bertram, T. Dandekar (2004) it 46(1): 5-11). Furthermore a survey of the main fields of bioinformatic research in Würzburg is given (H. Bertram, S. Balthasar, T. Dandekar (2003) Bioforum 1-2: 26-7). Finally it is outlined how pathogenicity and virulence of bacteria may be made accessible to bioinformatic analysis (H. Bertram, S. Balthasar, T. Dandekar (2003) Bioforum Eur. 3: 157-9). In the conclusion metabolic flux analysis is used for the identification of new strategies in the battle against Plasmodia: The comparison of metabolic pathways with glutathione and thioredoxin in Plasmodium falciparum, Anopheles and man aims at raising planned dysfunctions in the metabolism of Plasmodium or Anopheles without harming the human host. Valuable suggestions for medical applications and pharmacological targets are obtained. KW - Plasmodium falciparum KW - Domäne KW - Klassifikation KW - Bioinformatik KW - Redoxsystem KW - Glutathion-Reductase KW - Malariamücke KW - Mensch KW - Stoffwechselweg KW - Malaria KW - metabolische Fluxanalyse KW - Glutathionreduktase KW - Iron Responsive Elements KW - Proteindomänenklassifikation KW - malaria KW - metabolic fluxanalysis KW - glutathione reductase KW - iron responsive elements KW - classification of protein domains Y1 - 2005 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-17188 ER -