@phdthesis{Breitenbach2019, author = {Breitenbach, Tim}, title = {A mathematical optimal control based approach to pharmacological modulation with regulatory networks and external stimuli}, doi = {10.25972/OPUS-17436}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-174368}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2019}, abstract = {In this work models for molecular networks consisting of ordinary differential equations are extended by terms that include the interaction of the corresponding molecular network with the environment that the molecular network is embedded in. These terms model the effects of the external stimuli on the molecular network. The usability of this extension is demonstrated with a model of a circadian clock that is extended with certain terms and reproduces data from several experiments at the same time. Once the model including external stimuli is set up, a framework is developed in order to calculate external stimuli that have a predefined desired effect on the molecular network. For this purpose the task of finding appropriate external stimuli is formulated as a mathematical optimal control problem for which in order to solve it a lot of mathematical methods are available. Several methods are discussed and worked out in order to calculate a solution for the corresponding optimal control problem. The application of the framework to find pharmacological intervention points or effective drug combinations is pointed out and discussed. Furthermore the framework is related to existing network analysis tools and their combination for network analysis in order to find dedicated external stimuli is discussed. The total framework is verified with biological examples by comparing the calculated results with data from literature. For this purpose platelet aggregation is investigated based on a corresponding gene regulatory network and associated receptors are detected. Furthermore a transition from one to another type of T-helper cell is analyzed in a tumor setting where missing agents are calculated to induce the corresponding switch in vitro. Next a gene regulatory network of a myocardiocyte is investigated where it is shown how the presented framework can be used to compare different treatment strategies with respect to their beneficial effects and side effects quantitatively. Moreover a constitutively activated signaling pathway, which thus causes maleficent effects, is modeled and intervention points with corresponding treatment strategies are determined that steer the gene regulatory network from a pathological expression pattern to physiological one again.}, subject = {Bioinformatik}, language = {en} } @phdthesis{Vainshtein2010, author = {Vainshtein, Yevhen}, title = {Applying microarray-based techniques to study gene expression patterns: a bio-computational approach}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-51967}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2010}, abstract = {The regulation and maintenance of iron homeostasis is critical to human health. As a constituent of hemoglobin, iron is essential for oxygen transport and significant iron deficiency leads to anemia. Eukaryotic cells require iron for survival and proliferation. Iron is part of hemoproteins, iron-sulfur (Fe-S) proteins, and other proteins with functional groups that require iron as a cofactor. At the cellular level, iron uptake, utilization, storage, and export are regulated at different molecular levels (transcriptional, mRNA stability, translational, and posttranslational). Iron regulatory proteins (IRPs) 1 and 2 post-transcriptionally control mammalian iron homeostasis by binding to iron-responsive elements (IREs), conserved RNA stem-loop structures located in the 5'- or 3'- untranslated regions of genes involved in iron metabolism (e.g. FTH1, FTL, and TFRC). To identify novel IRE-containing mRNAs, we integrated biochemical, biocomputational, and microarray-based experimental approaches. Gene expression studies greatly contribute to our understanding of complex relationships in gene regulatory networks. However, the complexity of array design, production and manipulations are limiting factors, affecting data quality. The use of customized DNA microarrays improves overall data quality in many situations, however, only if for these specifically designed microarrays analysis tools are available. Methods In this project response to the iron treatment was examined under different conditions using bioinformatical methods. This would improve our understanding of an iron regulatory network. For these purposes we used microarray gene expression data. To identify novel IRE-containing mRNAs biochemical, biocomputational, and microarray-based experimental approaches were integrated. IRP/IRE messenger ribonucleoproteins were immunoselected and their mRNA composition was analysed using an IronChip microarray enriched for genes predicted computationally to contain IRE-like motifs. Analysis of IronChip microarray data requires specialized tool which can use all advantages of a customized microarray platform. Novel decision-tree based algorithm was implemented using Perl in IronChip Evaluation Package (ICEP). Results IRE-like motifs were identified from genomic nucleic acid databases by an algorithm combining primary nucleic acid sequence and RNA structural criteria. Depending on the choice of constraining criteria, such computational screens tend to generate a large number of false positives. To refine the search and reduce the number of false positive hits, additional constraints were introduced. The refined screen yielded 15 IRE-like motifs. A second approach made use of a reported list of 230 IRE-like sequences obtained from screening UTR databases. We selected 6 out of these 230 entries based on the ability of the lower IRE stem to form at least 6 out of 7 bp. Corresponding ESTs were spotted onto the human or mouse versions of the IronChip and the results were analysed using ICEP. Our data show that the immunoselection/microarray strategy is a feasible approach for screening bioinformatically predicted IRE genes and the detection of novel IRE-containing mRNAs. In addition, we identified a novel IRE-containing gene CDC14A (Sanchez M, et al. 2006). The IronChip Evaluation Package (ICEP) is a collection of Perl utilities and an easy to use data evaluation pipeline for the analysis of microarray data with a focus on data quality of custom-designed microarrays. The package has been developed for the statistical and bioinformatical analysis of the custom cDNA microarray IronChip, but can be easily adapted for other cDNA or oligonucleotide-based designed microarray platforms. ICEP uses decision tree-based algorithms to assign quality flags and performs robust analysis based on chip design properties regarding multiple repetitions, ratio cut-off, background and negative controls (Vainshtein Y, et al., 2010).}, subject = {Microarray}, language = {en} } @phdthesis{Schulze2014, author = {Schulze, Katja}, title = {Automatisierte Klassifizierung und Viabilit{\"a}tsanalyse von Phytoplankton}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-107174}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2014}, abstract = {Zentrales Ziel dieser Arbeit war es, Methoden der Mikroskopie, Bildverarbeitung und Bilderkennung f{\"u}r die Charakterisierungen verschiedener Phyotplankter zu nutzen, um deren Analyse zu verbessern und zu vereinfachen. Der erste Schwerpunkt der Arbeit lag auf der Analyse von Phytoplanktongemeinschaften, die im Rahmen der {\"U}berpr{\"u}fung der S{\"u}ßwasserqualit{\"a}t als Marker dienen. Die konventionelle Analyse ist dabei sehr aufwendig, da diese noch immer vollst{\"a}ndig von Hand durchgef{\"u}hrt wird und hierf{\"u}r speziell ausgebildetes Personal eingesetzt werden muss. Ziel war es, ein System zur automatischen Erkennung aufzubauen, um die Analyse vereinfachen zu k{\"o}nnen. Mit Hilfe von automatischer Mikroskopie war es m{\"o}glich Plankter unterschiedlicher Ausdehnung durch die Integration mehrerer Sch{\"a}rfeebenen besser in einem Bild aufzunehmen. Weiterhin wurden verschiedene Fluoreszenzeigenschaften in die Analyse integriert. Mit einem f{\"u}r ImageJ erstellten Plugin k{\"o}nnen Organismen vom Hintergrund der Aufnahmen abgetrennt und eine Vielzahl von Merkmalen berechnet werden. {\"U}ber das Training von neuralen Netzen wird die Unterscheidung von verschieden Gruppen von Planktontaxa m{\"o}glich. Zudem k{\"o}nnen weitere Taxa einfach in die Analyse integriert und die Erkennung erweitert werden. Die erste Analyse von Mischproben, bestehend aus 10 verschiedenen Taxa, zeigte dabei eine durchschnittliche Erkennungsrate von 94.7\% und eine durchschnittliche Falsch-Positiv Rate von 5.5\%. Im Vergleich mit bestehenden Systemen konnte die Erkennungsrate verbessert und die Falsch Positiv Rate deutlich gesenkt werde. Bei einer Erweiterung des Datensatzes auf 22 Taxa wurde darauf geachtet, Arten zu verwenden, die verschiedene Stadien in ihrem Wachstum durchlaufen oder h{\"o}here {\"A}hnlichkeiten zu den bereits vorhandenen Arten aufweisen, um evtl. Schwachstellen des Systemes erkennen zu k{\"o}nnen. Hier ergab sich eine gute Erkennungsrate (86.8\%), bei der der Ausschluss von nicht-planktonischen Partikeln (11.9\%) weiterhin verbessert war. Der Vergleich mit weiteren Klassifikationsverfahren zeigte, dass neuronale Netze anderen Verfahren bei dieser Problemstellung {\"u}berlegen sind. {\"A}hnlich gute Klassifikationsraten konnten durch Support Vektor Maschinen erzielt werden. Allerdings waren diese bei der Unterscheidung von unbekannten Partikeln dem neuralen Netz deutlich unterlegen. Der zweite Abschnitt stellt die Entwicklung einer einfachen Methode zur Viabilit{\"a}tsanalyse von Cyanobakterien, bei der keine weitere Behandlung der Proben notwendig ist, dar. Dabei wird die rote Chlorophyll - Autofluoreszenz als Marker f{\"u}r lebende Zellen und eine gr{\"u}ne unspezifische Fluoreszenz als Marker f{\"u}r tote Zellen genutzt. Der Assay wurde mit dem Modellorganismus Synechocystis sp. PCC 6803 etabliert und validiert. Die Auswahl eines geeigeneten Filtersets erm{\"o}glicht es beide Signale gleichzeitig anzuregen und zu beobachten und somit direkt zwischen lebendenden und toten Zellen zu unterscheiden. Die Ergebnisse zur Etablierung des Assays konnten durch Ausplattieren, Chlorophyllbestimmung und Bestimmung des Absorbtionsspektrums best{\"a}tigt werden. Durch den Einsatz von automatisierter Mikroskopie und einem neu erstellten ImageJ Plugin wurde eine sehr genaue und schnelle Analyse der Proben m{\"o}glich. Der Einsatz beim Monitoring einer mutagenisierten Kultur zur Erh{\"o}hung der Temperaturtoleranz erm{\"o}glichte genaue und zeitnahe Einblicke in den Zustand der Kultur. Weitere Ergebnisse weisen darauf hin, dass die Kombination mit Absorptionsspektren es erm{\"o}glichen k{\"o}nnen bessere Einblicke in die Vitalit{\"a}t der Kultur zu erhalten.}, subject = {Bilderkennnung}, language = {de} } @phdthesis{Blenk2007, author = {Blenk, Steffen}, title = {Bioinformatical analysis of B-cell lymphomas}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-27421}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2007}, abstract = {Background: The frequency of the most observed cancer, Non Hodgkin Lymphoma (NHL), is further rising. Diffuse large B-cell lymphoma (DLBCL) is the most common of the NHLs. There are two subgroups of DLBCL with different gene expression patterns: ABC ("Activated B-like DLBCL") and GCB ("Germinal Center B-like DLBCL"). Without therapy the patients often die within a few months, the ABC type exhibits the more aggressive behaviour. A further B-cell lymphoma is the Mantle cell lymphoma (MCL). It is rare and shows very poor prognosis. There is no cure yet. Methods: In this project these B-cell lymphomas were examined with methods from bioinformatics, to find new characteristics or undiscovered events on the molecular level. This would improve understanding and therapy of lymphomas. For this purpose we used survival, gene expression and comparative genomic hybridization (CGH) data. In some clinical studies, you get large data sets, from which one can reveal yet unknown trends. Results (MCL): The published proliferation signature correlates directly with survival. Exploratory analyses of gene expression and CGH data of MCL samples (n=71) revealed a valid grouping according to the median of the proliferation signature values. The second axis of correspondence analysis distinguishes between good and bad prognosis. Statistical testing (moderate t-test, Wilcoxon rank-sum test) showed differences in the cell cycle and delivered a network of kinases, which are responsible for the difference between good and bad prognosis. A set of seven genes (CENPE, CDC20, HPRT1, CDC2, BIRC5, ASPM, IGF2BP3) predicted, similarly well, survival patterns as proliferation signature with 20 genes. Furthermore, some bands could be associated with prognosis in the explorative analysis (chromosome 9: 9p24, 9p23, 9p22, 9p21, 9q33 and 9q34). Results (DLBCL): New normalization of gene expression data of DLBCL patients revealed better separation of risk groups by the 2002 published signature based predictor. We could achieve, similarly well, a separation with six genes. Exploratory analysis of gene expression data could confirm the subgroups ABC and GCB. We recognized a clear difference in early and late cell cycle stages of cell cycle genes, which can separate ABC and GCB. Classical lymphoma and best separating genes form a network, which can classify and explain the ABC and GCB groups. Together with gene sets which identify ABC and GCB we get a network, which can classify and explain the ABC and GCB groups (ASB13, BCL2, BCL6, BCL7A, CCND2, COL3A1, CTGF, FN1, FOXP1, IGHM, IRF4, LMO2, LRMP, MAPK10, MME, MYBL1, NEIL1 and SH3BP5; Altogether these findings are useful for diagnosis, prognosis and therapy (cytostatic drugs).}, subject = {Bioinformatik}, language = {en} } @phdthesis{Bertram2005, author = {Bertram, Helge}, title = {Bioinformatische Identifikation von Dom{\"a}nenunterschieden bei Parasit und Wirt am Beispiel der Malaria}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-17188}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2005}, abstract = {Diese Arbeit untersucht zellul{\"a}re Netzwerke mit dem Ziel, die so gewonnenen Einsichten medizinisch beziehungsweise biotechnologisch zu nutzen. Hierzu m{\"u}ssen zun{\"a}chst Proteindom{\"a}nen und wichtige regulatorische RNA Elemente erkannt werden. Dies geschieht f{\"u}r regulatorische Elemente in Nukleins{\"a}uren am Beispiel von Iron Responsive Elements (IREs) in Staphylococcus aureus, wobei sich solche Elemente in viel versprechender N{\"a}he zu exprimierten Sequenzen finden lassen (T. Dandekar, F. Du, H. Bertram (2001) Nonlinear Analysis 47(1): 225-34). Noch bedeutsamer als Ziele zur Medikamentenentwicklung gegen Parasiten sind Dom{\"a}nenunterschiede in Struktur und Sequenz bei Proteinen (T. Dandekar, F. Du, H. Bertram (2001) Nonlinear Analysis 47(1): 225-34). Ihre Identifikation wird am Beispiel eines potentiellen Transportproteins in Plasmodium falciparum exemplarisch dargestellt. Anschließend wird das Zusammenwirken von regulatorischen Elementen und Dom{\"a}nen in Netzwerken betrachtet (einschließlich experimenteller Daten). Dies kann einerseits zu allgemeineren Schlussfolgerungen {\"u}ber das Netzwerkverhalten f{\"u}hren, andererseits f{\"u}r konkrete Anwendungen genutzt werden. Als Beispiel w{\"a}hlten wir hier Redoxnetzwerke und die Bek{\"a}mpfung von Plasmodien als Verursacher der Malaria. Da das gesamte Redoxnetzwerk einer lebenden Zelle mit Methoden der pH Wert Messung nur unzureichend zu erfassen ist, werden als alternative Messmethode f{\"u}r dieses Netzwerk Mikrokristalle der Glutathionreduktase als Indikatorsystem nach digitaler Verst{\"a}rkung experimentell genutzt (H. Bertram, M. A. Keese, C. Boulin, R. H. Schirmer, R. Pepperkok, T. Dandekar (2002) Chemical Nanotechnology Talks III - Nano for Life Sciences). Um komplexe Redoxnetzwerke auch bioinformatisch zu modulieren, werden Verfahren der metabolischen Fluxanalyse vorgestellt und verbessert, um insbesondere ihrer Verzahnung besser gerecht zu werden und solche Netzwerke mit m{\"o}glichst wenig elementaren Flussmoden zutreffend beschreiben zu k{\"o}nnen. Die Reduktion der Anzahl von Elementarmoden bei sehr großen metabolischen Netzwerken einer Zelle gelingt hier mit Hilfe unterschiedlicher Methoden und f{\"u}hrt zu einer vereinfachten Darstellungsm{\"o}glichkeit komplexer Stoffwechselwege von Metaboliten. Dabei dient bei jeder dieser Methoden die biochemisch sinnvolle Definition von externen Metaboliten als Grundlage (T. Dandekar, F. Moldenhauer, S. Bulik, H. Bertram, S. Schuster (2003) Biosystems 70(3): 255-70). Allgemeiner werden Verfahren der Proteindom{\"a}nenklassifikation sowie neue Strategien gegen mikrobielle Erreger betrachtet. In Bezug auf automatisierte Einteilung von Proteinen in Dom{\"a}nen wird ein neues System von Taylor (2002b) mit bekannten Systemen verglichen, die in unterschiedlichem Umfang menschlichen Eingriffs bed{\"u}rfen (H. Bertram, T. Dandekar (2002) Chemtracts 15: 735-9). Außerdem wurde neben einer Arbeit {\"u}ber die verschiedenen Methoden aus den Daten eines Genoms Informationen {\"u}ber das metabolische Netzwerk der Zelle zu erlangen (H. Bertram, T. Dandekar (2004) it 46(1): 5-11) auch eine {\"U}bersicht {\"u}ber die Schwerpunkte der Bioinformatik in W{\"u}rzburg zusammengestellt (H. Bertram, S. Balthasar, T. Dandekar (2003) Bioforum 1-2: 26-7). Schließlich wird beschrieben, wie die Pathogenomik und Virulenz von Bakterien der bioinformatischen Analyse zug{\"a}nglich gemacht werden k{\"o}nnen (H. Bertram, S. Balthasar, T. Dandekar (2003) Bioforum Eur. 3: 157-9). Im letzten Teil wird die metabolische Fluxanalyse zur Identifikation neuer Strategien zur Bek{\"a}mpfung von Plasmodien dargestellt: Beim Vergleich der Stoffwechselwege mit Glutathion und Thioredoxin in Plasmodium falciparum, Anopheles und Mensch geht es darum, gezielte St{\"o}rungen im Stoffwechsel des Malariaerregers auszul{\"o}sen und dabei den Wirt zu schonen. Es ergeben sich einige interessante Ansatzpunkte, deren medizinische Nutzung experimentell angestrebt werden kann.}, subject = {Plasmodium falciparum}, language = {de} } @phdthesis{Pischimarov2016, author = {Pischimarov, Jordan Ivanov}, title = {Bioinformatische Methoden zur Identifizierung und Klassifizierung somatischer Mutationen in h{\"a}matologischen Erkrankungen}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-147773}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2016}, abstract = {Die Sequenzierungstechnologien entwickeln sich stetig weiter, dies erm{\"o}glicht eine zuvor nicht erreichte Ausbeute an experimentellen Daten und auch an Neuentwicklungen von zuvor nicht realisierbaren Experimenten. Zugleich werden spezifische Datenbanken, Algorithmen und Softwareprogramme entwickelt, um die neu entstandenen Daten zu analysieren. W{\"a}hrend der Untersuchung bioinformatischer Methoden f{\"u}r die Identifizierung und Klassifizierung somatischer Mutationen in h{\"a}matologischen Erkrankungen, zeigte sich eine hohe Vielfalt an alternativen Softwaretools die f{\"u}r die jeweiligen Analyseschritte genutzt werden k{\"o}nnen. Derzeit existiert noch kein Standard zur effizienten Analyse von Mutationen aus Next-Generation-Sequencing (NGS)-Daten. Die unterschiedlichen Methoden und Pipelines generieren Kandidaten, die zum gr{\"o}ßten Anteil in allen Ans{\"a}tzen identifiziert werden k{\"o}nnen, jedoch werden Software spezifische Kandidaten nicht einheitlich detektiert. Um eine einheitliche und effiziente Analyse von NGS-Daten durchzuf{\"u}hren war im Rahmen dieser Arbeit die Entwicklung einer benutzerfreundlichen und einheitlichen Pipeline vorgesehen. Hierf{\"u}r wurden zun{\"a}chst die essentiellen Analysen wie die Identifizierung der Basen, die Alignierung und die Identifizierung der Mutationen untersucht. Des Weiteren wurden unter Ber{\"u}cksichtigung von Effizienz und Performance diverse verf{\"u}gbare Softwaretools getestet, ausgewertet und sowohl m{\"o}gliche Verbesserungen als auch Erleichterungen der bisherigen Analysen vorgestellt und diskutiert. Durch Mitwirken in Konsortien wie der klinischen Forschergruppe 216 (KFO 216) und International Cancer Genome Consortium (ICGC) oder auch bei Haus-internen Projekten wurden Datens{\"a}tze zu den Entit{\"a}ten Multiples Myelom (MM), Burkitt Lymphom (BL) und Follikul{\"a}res Lymphom (FL) erstellt und analysiert. Die Selektion geeigneter Softwaretools und die Generierung der Pipeline basieren auf komparativen Analysen dieser Daten, sowie auf geteilte Ergebnisse und Erfahrungen in der Literatur und auch in Foren. Durch die gezielte Entwicklung von Skripten konnten biologische und klinische Fragestellungen bearbeitet werden. Hierzu z{\"a}hlten eine einheitliche Annotation der Gennamen, sowie die Erstellung von Genmutations-Heatmaps mit nicht Variant-Calling-File (VCF)-Syntax konformen Dateien. Des Weiteren konnten nicht abgedeckte Regionen des Genoms in den NGS-Daten identifiziert und analysiert werden. Neue Projekte zur detaillierten Untersuchung der Verteilung von wiederkehrender Mutationen und Funktionsassays zu einzelnen Mutationskandidaten konnten basierend auf den Ergebnissen initiiert werden. Durch eigens erstellte Python-Skripte konnte somit die Funktionalit{\"a}t der Pipeline erweitert werden und zu wichtigen Erkenntnissen bei der biologischen Interpretation der Sequenzierungsdaten f{\"u}hren, wie beispielsweise zu der Detektion von drei neuen molekularen Subgruppen im MM. Die Erweiterungen, der in dieser Arbeit entwickelten Pipeline verbesserte somit die Effizienz der Analyse und die Vergleichbarkeit unserer Daten. Des Weiteren konnte durch die Erstellung eines eigenen Skripts die Analyse von unbeachteten Regionen in den NGS-Daten erfolgen.}, subject = {Pipeline-Rechner}, language = {de} } @phdthesis{Arumugam2010, author = {Arumugam, Manimozhiyan}, title = {Comparative metagenomic analysis of the human intestinal microbiota}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-55903}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2010}, abstract = {The human gut is home for thousands of microbes that are important for human life. As most of these cannot be cultivated, metagenomics is an important means to understand this important community. To perform comparative metagenomic analysis of the human gut microbiome, I have developed SMASH (Simple metagenomic analysis shell), a computational pipeline. SMASH can also be used to assemble and analyze single genomes, and has been successfully applied to the bacterium Mycoplasma pneumoniae and the fungus Chaetomium thermophilum. In the context of the MetaHIT (Metagenomics of the human intestinal tract) consortium our group is participating in, I used SMASH to validate the assembly and to estimate the assembly error rate of 576.7 Gb metagenome sequence obtained using Illumina Solexa technology from fecal DNA of 124 European individuals. I also estimated the completeness of the gene catalogue containing 3.3 million open reading frames obtained from these metagenomes. Finally, I used SMASH to analyze human gut metagenomes of 39 individuals from 6 countries encompassing a wide range of host properties such as age, body mass index and disease states. We find that the variation in the gut microbiome is not continuous but stratified into enterotypes. Enterotypes are complex host-microbial symbiotic states that are not explained by host properties, nutritional habits or possible technical biases. The concept of enterotypes might have far reaching implications, for example, to explain different responses to diet or drug intake. We also find several functional markers in the human gut microbiome that correlate with a number of host properties such as body mass index, highlighting the need for functional analysis and raising hopes for the application of microbial markers as diagnostic or even prognostic tools for microbiota-associated human disorders.}, subject = {Darmflora}, language = {en} } @phdthesis{Thakar2006, author = {Thakar, Juilee}, title = {Computational models for the study of responses to infections}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-17266}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2006}, abstract = {In diesem Jahrhundert haben neue experimentelle Techniken und Computer-Verfahren enorme Mengen an Information erzeugt, die bereits viele biologische R{\"a}tsel enth{\"u}llt haben. Doch die Komplexit{\"a}t biologischer Systeme wirft immer weitere neue Fragen auf. Um ein System zu verstehen, bestand der Hauptansatz bis jetzt darin, es in Komponenten zu zerlegen, die untersucht werden k{\"o}nnen. Ein neues Paradigma verkn{\"u}pft die einzelnen Informationsteile, um sie auf globaler Ebene verstehen zu k{\"o}nnen. In der vorgelegten Doktorarbeit habe ich deshalb versucht, infekti{\"o}se Krankheiten mit globalen Methoden („Systembiologie") bioinformatisch zu untersuchen. Im ersten Teil wird der Apoptose-Signalweg analysiert. Apoptose (Programmierter Zelltod) wird bei verschiedenen Infektionen, zum Beispiel bei Viruserkrankungen, als Abwehrmaßnahme eingesetzt. Die Interaktionen zwischen Proteinen, die ‚death' Dom{\"a}nen beinhalten, wurden untersucht, um folgende Fragen zu kl{\"a}ren: i) wie wird die Spezifit{\"a}t der Interaktionen erzielt? -sie wird durch Adapter erreicht, ii) wie werden Proliferation/ {\"U}berlebenssignale w{\"a}hrend der Aktivierung der Apoptose eingeleitet? - wir fanden Hinweise f{\"u}r eine entscheidende Rolle des RIP Proteins (Rezeptor-Interagierende Serine/Threonine-Proteinkinase 1). Das Modell erlaubte uns, die Interaktions-Oberfl{\"a}chen von RIP vorherzusagen. Der Signalweg wurde anschließend auf globaler Ebene mit Simulationen f{\"u}r verschiedene Zeitpunkte analysiert, um die Evolution der Aktivatoren und Inhibitoren des Signalwegs und seine Struktur besser zu verstehen. Weiterhin wird die Signalverarbeitung f{\"u}r Apoptosis-Signalwege in der Maus detailliert modelliert, um den Konzentrationsverlauf der Effektor-Kaspasen vorherzusagen. Weitere experimentelle Messungen von Kaspase-3 und die {\"U}berlebenskurven von Zellen best{\"a}tigen das Modell. Der zweite Teil der Resultate konzentriert sich auf das Phagosom, eine Organelle, die eine entscheidende Rolle bei der Eliminierung von Krankheitserregern spielt. Dies wird am Beispiel von M. tuberculosis veranschaulicht. Die Fragestellung wird wiederum in zwei Aspekten behandelt: i) Um die Prozesse, die durch M. tuberculosis inhibiert werden zu verstehen, haben wir uns auf das Phospholipid-Netzwerk konzentriert, das bei der Unterdr{\"u}ckung oder Aktivierung der Aktin-Polymerisation eine große Rolle spielt. Wir haben f{\"u}r diese Netzwerkanalyse eine Simulation f{\"u}r verschiedene Zeitpunkte {\"a}hnlich wie in Teil eins angewandt. ii) Es wird vermutet, dass Aktin-Polymere bei der Fusion des Phagosoms mit dem Lysosom eine Rolle spielen. Um diese Hypothese zu untersuchen, wurde ein in silico Modell von uns entwickelt. Wir fanden heraus, dass in der Anwesenheit von Aktin-Polymeren die Suchzeit f{\"u}r das Lysosom um das F{\"u}nffache reduziert wurde. Weiterhin wurden die Effekte der L{\"a}nge der Aktin-Polymere, die Gr{\"o}ße der Lysosomen sowie der Phagosomen und etliche andere Modellparameter analysiert. Nach der Untersuchung eines Signalwegs und einer Organelle f{\"u}hrte der n{\"a}chste Schritt zur Untersuchung eines komplexen biologischen Systems der Infektabwehr. Dies wurde am Beispiel der Wirt-Pathogen Interaktion bei Bordetella pertussis und Bordetella bronchiseptica dargestellt. Die geringe Menge verf{\"u}gbarer quantitativer Daten war der ausschlaggebende Faktor bei unserer Modellwahl. F{\"u}r die dynamische Simulation wurde ein selbst entwickeltes Bool'sches Modell verwendet. Die Ergebnisse sagen wichtige Faktoren bei der Pathologie von Bordetellen hervor, besonders die Bedeutung der Th1 assoziierten Antworten und dagegen nicht der Th2 assoziierten Antworten f{\"u}r die Eliminierung des Pathogens. Einige der quantitativen Vorhersagen wurden durch Experimente wie die Untersuchung des Verlaufs einer Infektion in verschiedenen Mutanten und Wildtyp-M{\"a}usen {\"u}berpr{\"u}ft. Die begrenzte Verf{\"u}gbarkeit kinetischer Daten war der kritische Faktor bei der Auswahl der computer-gest{\"u}tzten Modelle. Der Erfolg unserer Modelle konnte durch den Vergleich mit experimentellen Beobachtungen belegt werden. Die vergleichenden Modelle in Kapitel 6 und 9 k{\"o}nnen zur Untersuchung neuer Wirt-Pathogen Interaktionen verwendet werden. Beispielsweise f{\"u}hrt in Kapitel 6 die Analyse von Inhibitoren und inhibitorischer Signalwege aus drei Organismen zur Identifikation wichtiger regulatorischer Zentren in komplexen Organismen und in Kapitel 9 erm{\"o}glicht die Identifikation von drei Phasen in B. bronchiseptica und der Inhibition von IFN-\&\#947; durch den Faktor TTSS die Untersuchung {\"a}hnlicher Phasen und die Inhibition von IFN-\&\#947; in B. pertussis. Eine weitere wichtige Bedeutung bekommen diese Modelle durch die m{\"o}gliche Identifikation neuer, essentieller Komponenten in Wirt-Pathogen Interaktionen. In silico Modelle der Effekte von Deletionen zeigen solche Komponenten auf, die anschließend durch experimentelle Mutationen weiter untersucht werden k{\"o}nnen.}, subject = {Bordetella pertussis}, language = {en} } @article{DandekarLiangKrueger2013, author = {Dandekar, Thomas and Liang, Chunguang and Kr{\"u}ger, Beate}, title = {GoSynthetic database tool to analyse natural and engineered molecular processes}, series = {Database}, journal = {Database}, doi = {10.1093/database/bat043}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-97023}, year = {2013}, abstract = {An essential topic for synthetic biologists is to understand the structure and function of biological processes and involved proteins and plan experiments accordingly. Remarkable progress has been made in recent years towards this goal. However, efforts to collect and present all information on processes and functions are still cumbersome. The database tool GoSynthetic provides a new, simple and fast way to analyse biological processes applying a hierarchical database. Four different search modes are implemented. Furthermore, protein interaction data, cross-links to organism-specific databases (17 organisms including six model organisms and their interactions), COG/KOG, GO and IntAct are warehoused. The built in connection to technical and engineering terms enables a simple switching between biological concepts and concepts from engineering, electronics and synthetic biology. The current version of GoSynthetic covers more than one million processes, proteins, COGs and GOs. It is illustrated by various application examples probing process differences and designing modifications.}, language = {en} } @phdthesis{ZeeshangebMajeed2014, author = {Zeeshan [geb. Majeed], Saman}, title = {Implementation of Bioinformatics Methods for miRNA and Metabolic Modelling}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-102900}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2014}, abstract = {Dynamic interactions and their changes are at the forefront of current research in bioinformatics and systems biology. This thesis focusses on two particular dynamic aspects of cellular adaptation: miRNA and metabolites. miRNAs have an established role in hematopoiesis and megakaryocytopoiesis, and platelet miRNAs have potential as tools for understanding basic mechanisms of platelet function. The thesis highlights the possible role of miRNAs in regulating protein translation in platelet lifespan with relevance to platelet apoptosis and identifying involved pathways and potential key regulatory molecules. Furthermore, corresponding miRNA/target mRNAs in murine platelets are identified. Moreover, key miRNAs involved in aortic aneurysm are predicted by similar techniques. The clinical relevance of miRNAs as biomarkers, targets, resulting later translational therapeutics, and tissue specific restrictors of genes expression in cardiovascular diseases is also discussed. In a second part of thesis we highlight the importance of scientific software solution development in metabolic modelling and how it can be helpful in bioinformatics tool development along with software feature analysis such as performed on metabolic flux analysis applications. We proposed the "Butterfly" approach to implement efficiently scientific software programming. Using this approach, software applications were developed for quantitative Metabolic Flux Analysis and efficient Mass Isotopomer Distribution Analysis (MIDA) in metabolic modelling as well as for data management. "LS-MIDA" allows easy and efficient MIDA analysis and, with a more powerful algorithm and database, the software "Isotopo" allows efficient analysis of metabolic flows, for instance in pathogenic bacteria (Salmonella, Listeria). All three approaches have been published (see Appendices).}, subject = {miRNS}, language = {en} } @phdthesis{Pils2005, author = {Pils, Birgit}, title = {Insights into the evolution of protein domains give rise to improvements of function prediction}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-16805}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2005}, abstract = {The growing number of uncharacterised sequences in public databases has turned the prediction of protein function into a challenging research field. Traditional annotation methods are often error-prone due to the small subset of proteins with experimentally verified function. Goal of this thesis was to analyse the function and evolution of protein domains in order to understand molecular processes in the cell. The focus was on signalling domains of little understood function, as well as on functional sites of protein domains in general. Glucosaminidases (GlcNAcases) represent key enzymes in signal transduction pathways. Together with glucosamine transferases, they serve as molecular switches, similar to kinases and phosphatases. Little was known about the molecular function and structure of the GlcNAcases. In this thesis, the GlcNAcases were identified as remote homologues of N-acetyltransferases. By comparing the homologous sequences, I was able to predict functional sites of the GlcNAcase family and to identify the GlcNAcases as the first family member of the acetyltransferase superfamily with a distinct catalytic mechanism, which is not involved in the transfer of acetyl groups. In a similar approach, the sensor domain of a plant hormone receptor was studied. I was able to predict putative ligand-binding sites by comparing evolutionary constraints in functionally diverged subfamilies. Most of the putative ligand-binding sites have been experimentally confirmed in the meantime. Due to the importance of enzymes involved in cellular signalling, it seems impossible to find substitutions of catalytic amino acids that turn them catalytically inactive. Nevertheless, by scanning catalytic positions of the protein tyrosine phosphatase families, I found many inactive domains among single domain and tandem domain phosphatases in metazoan proteomes. In addition, I found that inactive phosphatases are conserved throughout evolution, which led to the question about the function of these catalytically inactive phosphatase domains. An analysis of evolutionary site rates of amino acid substitutions revealed a cluster of conserved residues in the apparently redundant domain of tandem phosphatases. This putative regulatory center might be responsible for the experimentally verified dimerization of the active and inactive domain in order to control the catalytic activity of the active phosphatase domain. Moreover, I detected a subgroup of inactive phosphatases, which presumably functions in substrate recognition, based on different evolutionary site rates within the phosphatase family. The characterization of these new regulatory modules in the phosphatase family raised the question whether inactivation of enzymes is a more general evolutionary mechanism to enlarge signalling pathways and whether inactive domains are also found in other enzyme families. A large-scale analysis of substitutions at catalytic positions of enzymatic domains was performed in this work. I identified many domains with inactivating substitutions in various enzyme families. Signalling domains harbour a particular high occurrence of catalytically inactive domains indicating that these domains have evolved to modulate existing regulatory pathways. Furthermore, it was shown that inactivation of enzymes by single substitutions happened multiple times independently in evolution. The surprising variability of amino acids at catalytic positions was decisive for a subsequent analysis of the diversity of functional sites in general. Using functional residues extracted from structural complexes I could show that functional sites of protein domains do not only vary in their type of amino acid but also in their structural location within the domain. In the process of evolution, protein domains have arisen from duplication events and subsequently adapted to new binding partners and developed new functions, which is reflected in the high variability of functional sites. However, great differences exist between domain families. The analysis demonstrated that functional sites of nuclear domains are more conserved than functional sites of extracellular domains. Furthermore, the type of ligand influences the degree of conservation, for example ion binding sites are more conserved than peptide binding sites. The work presented in this thesis has led to the detection of functional sites in various protein domains involved in signalling pathways and it has resulted in insights into the molecular function of those domains. In addition, properties of functional sites of protein domains were revealed. This knowledge can be used in the future to improve the prediction of protein function and to identify functional sites of proteins.}, subject = {Dom{\"a}ne }, language = {en} } @phdthesis{Beisser2011, author = {Beisser, Daniela}, title = {Integrated functional analysis of biological networks}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-70150}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2011}, abstract = {In recent years high-throughput experiments provided a vast amount of data from all areas of molecular biology, including genomics, transcriptomics, proteomics and metabolomics. Its analysis using bioinformatics methods has developed accordingly, towards a systematic approach to understand how genes and their resulting proteins give rise to biological form and function. They interact with each other and with other molecules in highly complex structures, which are explored in network biology. The in-depth knowledge of genes and proteins obtained from high-throughput experiments can be complemented by the architecture of molecular networks to gain a deeper understanding of biological processes. This thesis provides methods and statistical analyses for the integration of molecular data into biological networks and the identification of functional modules, as well as its application to distinct biological data. The integrated network approach is implemented as a software package, termed BioNet, for the statistical language R. The package includes the statistics for the integration of transcriptomic and functional data with biological networks, the scoring of nodes and edges of these networks as well as methods for subnetwork search and visualisation. The exact algorithm is extensively tested in a simulation study and outperforms existing heuristic methods for the calculation of this NP-hard problem in accuracy and robustness. The variability of the resulting solutions is assessed on perturbed data, mimicking random or biased factors that obscure the biological signal, generated for the integrated data and the network. An optimal, robust module can be calculated using a consensus approach, based on a resampling method. It summarizes optimally an ensemble of solutions in a robust consensus module with the estimated variability indicated by confidence values for the nodes and edges. The approach is subsequently applied to two gene expression data sets. The first application analyses gene expression data for acute lymphoblastic leukaemia (ALL) and differences between the subgroups with and without an oncogenic BCR/ABL gene fusion. In a second application gene expression and survival data from diffuse large B-cell lymphomas are examined. The identified modules include and extend already existing gene lists and signatures by further significant genes and their interactions. The most important novelty is that these genes are determined and visualised in the context of their interactions as a functional module and not as a list of independent and unrelated transcripts. In a third application the integrative network approach is used to trace changes in tardigrade metabolism to identify pathways responsible for their extreme resistance to environmental changes and endurance in an inactive tun state. For the first time a metabolic network approach is proposed to detect shifts in metabolic pathways, integrating transcriptome and metabolite data. Concluding, the presented integrated network approach is an adequate technique to unite high-throughput experimental data for single molecules and their intermolecular dependencies. It is flexible to apply on diverse data, ranging from gene expression changes over metabolite abundances to protein modifications in a combination with a suitable molecular network. The exact algorithm is accurate and robust in comparison to heuristic approaches and delivers an optimal, robust solution in form of a consensus module with confidence values. By the integration of diverse sources of information and a simultaneous inspection of a molecular event from different points of view, new and exhaustive insights into biological processes can be acquired.}, subject = {Bioinformatik}, language = {en} } @phdthesis{Krueger2012, author = {Kr{\"u}ger, Beate}, title = {Integration und Kombination bioinformatischer Methoden in Biotechnologie, synthetischer Biologie und Pharmaindustrie}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-70702}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2012}, abstract = {Die Bioinformatik ist eine interdisziplin{\"a}re Wissenschaft, welche Probleme aus allen Lebenswissenschaften mit Hilfe computergest{\"u}tzter Methoden bearbeitet. Ihr Ziel ist es, die Verarbeitung und Interpretation großer Datenmengen zu erm{\"o}glichen. Zudem unterst{\"u}tzt sie den Designprozess von Experimenten in der Synthetischen Biologie. Die synthetische Biologie besch{\"a}ftigt sich mit der Generierung neuer Komponenten und deren Eigenschaften, welche durch die Behandlung und Manipulation lebender Organismen oder Teilen daraus entstehen. Ein besonders interessantes Themengebiet hierbei sind Zweikomponenten-Systeme (Two-Component System, TCS). TCS sind wichtige Signalkaskaden in Bakterien, welche in der Lage sind Informationen aus der Umgebung in eine Zelle zu {\"u}bertragen und darauf zu reagieren. Die vorliegende Dissertation besch{\"a}ftigt sich mit der Beurteilung, Nutzung und Weiterentwicklung von bioinformatischen Methoden zur Untersuchung von Proteininteraktionen und biologischen Systemen. Der wissenschaftliche Beitrag der vorliegenden Arbeit kann in drei Aspekte unterteilt werden: - Untersuchung und Beurteilung von bioinformatischen Methoden und Weiterf{\"u}hrung der Ergebnisse aus der vorhergehenden Diplomarbeit zum Thema Protein-Protein-Interaktionsvorhersagen. - Analyse genereller evolution{\"a}rer Modifikationsm{\"o}glichkeiten von TCS sowie deren Design und spezifische Unterschiede. - Abstraktion bzw. Transfer der gewonnenen Erkenntnisse auf technische und biologische Zusammenh{\"a}nge. Mit dem Ziel das Design neuer Experimente in der synthetischen Biologie zu vereinfachen und die Vergleichbarkeit von technischen und biologischen Prozessen sowie zwischen Organismen zu erm{\"o}glichen. Das Ergebnis der durchgef{\"u}hrten Studie zeigte, dass Zweikomponenten-Systeme in ihrem Aufbau sehr konserviert sind. Nichtsdestotrotz konnten viele spezifische Eigenschaften und drei generelle Modifikationsm{\"o}glichkeiten entdeckt werden. Die Untersuchungen erm{\"o}glichten die Identifikation neuer Promotorstellen, erlaubten aber auch die Beschreibung der Beschaffenheit unterschiedlicher Signalbindestellen. Zudem konnten bisher fehlende Komponenten aus TCS entdeckt werden, ebenso wie neue divergierte TCS-Dom{\"a}nen im Organismus Mycoplasma. Eine Kombination aus technischen Ans{\"a}tzen und synthetischer Biologie vereinfachte die gezielte Manipulation von TCS oder anderen modularen Systemen. Die Etablierung der vorgestellten zweistufigen Modul-Klassifikation erm{\"o}glichte eine effizientere Analyse modular aufgebauter Prozesse und erlaubte somit das molekulare Design synthetischer, biologischer Anwendungen. Zur einfachen Nutzung dieses Ansatzes wurde eine frei zug{\"a}ngliche Software GoSynthetic entwickelt. Konkrete Beispiele demonstrierten die praktische Anwendbarkeit dieser Analysesoftware. Die vorgestellte Klassifikation der synthetisch-biologischen und technischen Einheiten soll die Planung zuk{\"u}nftiger Designexperimente vereinfachen und neue Wege f{\"u}r sinnverwandte Bereiche aufzeigen. Es ist nicht die Hauptaufgabe der Bioinformatik, Experimente zu ersetzen, sondern resultierende große Datenmengen sinnvoll und effizient auszuwerten. Daraus sollen neue Ideen f{\"u}r weitere Analysen und alternative Anwendungen gewonnen werden, um fehlerhafte oder falsche Ans{\"a}tze fr{\"u}hzeitig zu erkennen. Die Bioinformatik bietet moderne, technische Verfahren, um vertraute, aber oft m{\"u}hsame experimentelle Wege durch neue, vielversprechende Ans{\"a}tze zur Datenstrukturierung und Auswertung großer Datenmengen zu erg{\"a}nzen. Neue Sichtweisen werden durch die Erleichterung des Testprozederes gef{\"o}rdert. Die resultierende Zeitersparnis f{\"u}hrt zudem zu einer Kostenreduktion.}, subject = {Biotechnologie}, language = {de} } @phdthesis{Foerster2010, author = {F{\"o}rster, Frank}, title = {Making the most of phylogeny: Unique adaptations in tardigrades and 216374 internal transcribed spacer 2 structures}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-51466}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2010}, abstract = {The phylum Tardigrada consists of about 1000 described species to date. The animals live in habitats within marine, freshwater and terrestrial ecosystems allover the world. Tardigrades are polyextremophiles. They are capable to resist extreme temperature, pressure or radiation. In the event of desiccation, tardigrades enter a so-called tun stage. The reason for their great tolerance capabilities against extreme environmental conditions is not discovered yet. Our Funcrypta project aims at finding answers to the question what mechanisms underlie these adaption capabilities particularly with regard to the species Milnesium tardigradum. The first part of this thesis describes the establishment of expressed sequence tags (ESTs) libraries for different stages of M. tardigradum. From proteomics data we bioinformatically identified 144 proteins with a known function and additionally 36 proteins which seemed to be specific for M. tardigradum. The generation of a comprehensive web-based database allows us to merge the proteome and transcriptome data. Therefore we created an annotation pipeline for the functional annotation of the protein and nucleotide sequences. Additionally, we clustered the obtained proteome dataset and identified some tardigrade-specific proteins (TSPs) which did not show homology to known proteins. Moreover, we examined the heat shock proteins of M. tardigradum and their different expression levels depending on the actual state of the animals. In further bioinformatical analyses of the whole data set, we discovered promising proteins and pathways which are described to be correlated with the stress tolerance, e.g. late embryogenesis abundant (LEA) proteins. Besides, we compared the tardigrades with nematodes, rotifers, yeast and man to identify shared and tardigrade specific stress pathways. An analysis of the 50 and 30 untranslated regions (UTRs) demonstrates a strong usage of stabilising motifs like the 15-lipoxygenase differentiation control element (15-LOX-DICE) but also reveals a lack of other common UTR motifs normally used, e.g. AU rich elements. The second part of this thesis focuses on the relatedness between several cryptic species within the tardigrade genus Paramacrobiotus. Therefore for the first time, we used the sequence-structure information of the internal transcribed spacer 2 (ITS2) as a phylogenetic marker in tardigrades. This allowed the description of three new species which were indistinguishable using morphological characters or common molecular markers like the 18S ribosomal ribonucleic acid (rRNA) or the Cytochrome c oxidase subunit I (COI). In a large in silico simulation study we also succeeded to show the benefit for the phylogenetic tree reconstruction by adding structure information to the ITS2 sequence. Next to the genus Paramacrobiotus we used the ITS2 to corroborate a monophyletic DO-group (Sphaeropleales) within the Chlorophyceae. Additionally we redesigned another comprehensive database—the ITS2 database resulting in a doubled number of sequence-structure pairs of the ITS2. In conclusion, this thesis shows the first insights (6 first author publications and 4 coauthor publications) into the reasons for the enormous adaption capabilities of tardigrades and offers a solution to the debate on the phylogenetic relatedness within the tardigrade genus Paramacrobiotus.}, subject = {Phylogenie}, language = {en} } @phdthesis{Cecil2012, author = {Cecil, Alexander [geb. Schmid]}, title = {Metabolische Netzwerkanalysen f{\"u}r den Weg von xenobiotischen zu vertr{\"a}glichen antibiotischen Substanzen}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-71866}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2012}, abstract = {Durch das Auftreten neuer St{\"a}mme resistenter Krankheitserreger ist die Suche nach neuartigen Wirkstoffen gegen diese, sich st{\"a}ndig weiter ausbreitende Bedrohung, dringend notwendig. Der interdisziplin{\"a}re Sonderforschungsbereich 630 der Universit{\"a}t W{\"u}rzburg stellt sich dieser Aufgabe, indem hier neuartige Xenobiotika synthetisiert und auf ihre Wirksamkeit getestet werden. Die hier vorgelegte Dissertation f{\"u}gt sich hierbei nahtlos in die verschiedenen Fachbereiche des SFB630 ein: Sie stellt eine Schnittstelle zwischen Synthese und Analyse der Effekte der im Rahmen des SFB630 synthetisierten Isochinolinalkaloid-Derivaten. Mit den hier angewandten bioinformatischen Methoden wurden zun{\"a}chst die wichtigsten Stoffwechselwege von S. epidermidis R62A, S. aureus USA300 und menschlicher Zellen in sogenannten metabolischen Netzwerkmodellen nachgestellt. Basierend auf diesen Modellen konnten Enzymaktivit{\"a}ten f{\"u}r verschiedene Szenarien an zugesetzten Xenobiotika berechnet werden. Die hierf{\"u}r ben{\"o}tigten Daten wurden direkt aus Genexpressionsanalysen gewonnen. Die Validierung dieser Methode erfolgte durch Metabolommessungen. Hierf{\"u}r wurde S. aureus USA300 mit verschiedenen Konzentrationen von IQ-143 behandelt und gem{\"a}ß dem in dieser Dissertation vorgelegten Ernteprotokoll aufgearbeitet. Die Ergebnisse hieraus lassen darauf schließen, dass IQ-143 starke Effekte auf den Komplex 1 der Atmungskette aus{\"u}bt - diese Resultate decken sich mit denen der metabolischen Netzwerkanalyse. F{\"u}r den Wirkstoff IQ-238 ergaben sich trotz der strukturellen {\"A}hnlichkeiten zu IQ-143 deutlich verschiedene Wirkeffekte: Dieser Stoff verursacht einen direkten Abfall der Enzymaktivit{\"a}ten in der Glykolyse. Dadurch konnte eine unspezifische Toxizit{\"a}t dieser Stoffe basierend auf ihrer chemischen Struktur ausgeschlossen werden. Weiterhin konnten die bereits f{\"u}r IQ-143 und IQ-238 auf Bakterien angewandten Methoden erfolgreich zur Modellierung der Effekte von Methylenblau auf verschiedene resistente St{\"a}mme von P. falciparum 3D7 angewandt werden. Dadurch konnte gezeigt werden, dass Methylenblau in einer Kombination mit anderen Pr{\"a}paraten gegen diesen Parasiten zum einen die Wirkung des Prim{\"a}rpr{\"a}parates verst{\"a}rkt, zum anderen aber auch in gewissem Maße vorhandene Resistenzen gegen das Prim{\"a}rpr{\"a}parat zu verringern vermag. Somit konnte durch die vorgelegte Arbeit eine Pipeline zur Identifizierung der metabolischen Effekte verschiedener Wirkstoffe auf unterschiedliche Krankheitserreger erstellt werden. Diese Pipeline kann jederzeit auf andere Organismen ausgeweitet werden und stellt somit einen wichtigen Ansatz um Netzwerkeffekte verschiedener, potentieller Medikamente aufzukl{\"a}ren.}, subject = {Stoffwechsel}, language = {de} } @phdthesis{Schwarz2008, author = {Schwarz, Roland}, title = {Modellierung von Metabolismus, Transkriptom und Zellentwicklung bei Arabidopsis, Listerien und anderen Organismen}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-27622}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2008}, abstract = {Im gleichen Maße wie informatisches Wissen mehr und mehr in den wissenschaftlichen Alltag aller Lebenswissenschaften Einzug gehalten hat, hat sich der Schwerpunkt bioinformatischer Forschung in st{\"a}rker mathematisch und informatisch-orientierte Themengebiete verschoben. Bioinformatik heute ist mehr als die computergest{\"u}tzte Verarbeitung großer Mengen an biologischen Daten, sondern hat einen entscheidenden Fokus auf der Modellierung komplexer biologischer Systeme. Zur Anwendung kommen hierbei insbesondere Theorien aus dem Bereich der Stochastik und Statistik, des maschinellen Lernens und der theoretischen Informatik. In der vorliegenden Dissertation beschreibe ich in Fallstudien die systematische Modellierung biologischer Systeme aus einem informatisch - mathematischen Standpunkt unter Anwendung von Verfahren aus den genannten Teilbereichen und auf unterschiedlichen Ebenen biologischer Abstraktion. Ausgehend von der Sequenzinformation {\"u}ber Transkriptom, Metabolom und deren regulatorischer Interaktion hin zur Modellierung von Populationseffekten werden hierbei aktuelle biologische Fragestellungen mit mathematisch - informatischen Modellen und einer Vielzahl experimenteller Daten kombiniert. Ein besonderer Augenmerk liegt dabei auf dem Vorgang der Modellierung und des Modellbegriffs als solchem im Rahmen moderner bioinformatischer Forschung. Im Detail umfassen die Projekte (mehrere Publikationen) die Entwicklung eines neuen Ansatzes zur Einbettung und Visualisierung von Multiplen Sequenz- und Sequenz-Strukturalignments, illustriert am Beispiel eines Hemagglutininalignments unterschiedlicher H5N1 Varianten, sowie die Modellierung des Transkriptoms von A. thaliana, bei welchem mit Hilfe einer kernelisierten nicht-parametrischen Metaanalyse neue, an der Infektionsabwehr beteiligten, Gene ausfindig gemacht werden konnten. Desweiteren ist uns mit Hilfe unserer Software YANAsquare eine detaillierte Untersuchung des Metabolismus von L. monocytogenes unter Aktivierung des Transkriptionsfaktors prfA gelungen, dessen Vorhersagen durch experimentelle 13C Isotopologstudien belegt werden konnten. In einem Anschlußprojekt war der Zusammenhang zwischen Regulation des Metabolismus durch Regulation der Genexpression und der Fluxverteilung des metabolischen Steady- State-Netzwerks das Ziel. Die Modellierung eines komplexen organismischen Ph{\"a}notyps, der Zellgr{\"o}ßenentwicklung der Diatomee Pseudo-nitzschia delicatissima, schließt die Untersuchungen ab.}, subject = {Bioinformatik}, language = {de} } @phdthesis{Philippi2011, author = {Philippi, Nicole}, title = {Modellierung von Signalwegen in verschiedenen biologischen Systemen}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-57690}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2011}, abstract = {Die Apoptose der Leberzellen ist abh{\"a}ngig von externen Signalen wie beispielsweise Komponenten der Extrazellul{\"a}ren Matrix sowie anderen Zell-Zell-Kontakten, welche von einer Vielfalt und Vielzahl an Knoten verarbeitet werden. Einige von ihnen wurden im Rahmen dieser Arbeit auf ihre Systemeffekte hin unter- sucht. Trotz verschiedener {\"a}ußerer Einfl{\"u}sse und nat{\"u}rlicher Selektion ist das System daraufhin optimiert, eine kleine Anzahl verschiedener und klar voneinander unterscheidbarer Systemzust{\"a}nde anzunehmen. Die verschiedenartigen Einfl{\"u}sse und Crosstalk-Mechanismen dienen der Optimierung der vorhandenen Systemzust{\"a}nde. Das in dieser Arbeit vorgestellte Modell zeigt zwei apoptotische sowie zwei nicht-apoptotische stabile Systemzust{\"a}nde, wobei der Grad der Aktivierung eines Knotens bis zu dem Moment stark variieren kann, in welchem der absolute Systemzustand selbst ver{\"a}ndert wird (Philippi et al., BMC Systems Biology,2009) [1]. Dieses Modell stellt zwar eine Vereinfachung des gesamten zellul{\"a}ren Netzwerkes und seiner verschiedenen Zust{\"a}nde dar, ist aber trotz allem in der Lage, unabh{\"a}ngig von detaillierten kinetischen Daten und Parametern der einzelnen Knoten zu agieren. Gleichwohl erlaubt das Modell mit guter qualitativer {\"U}bereinstimmung die Apoptose als Folge einer Stimulation mit FasL zu modellieren. Weiterhin umfasst das Modell sowohl Crosstalk-M{\"o}glichkeiten des Collagen-Integrin-Signalwegs, ebenso ber{\"u}cksichtigt es die Auswirkungen der genetischen Deletion von Bid sowie die Konsequenzen einer viralen Infektion. In einem zweiten Teil werden andere Anwendungsm{\"o}glichkeiten dargestellt. Hormonale Signale in Pflanzen, Virusinfektionen und intrazellul{\"a}re Kommunikation werden semi-quantitativ modelliert. Auch hier zeigte sich eine gute Ubereinstimmung der Modelle mit den experimentellen Daten.}, subject = {Systembiologie}, language = {de} } @article{SchulzeTillichDandekaretal.2013, author = {Schulze, Katja and Tillich, Ulrich M. and Dandekar, Thomas and Frohme, Marcus}, title = {PlanktoVision - an automated analysis system for the identification of phytoplankton}, series = {BMC Bioinformatics}, journal = {BMC Bioinformatics}, doi = {10.1186/1471-2105-14-115}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-96395}, year = {2013}, abstract = {Background Phytoplankton communities are often used as a marker for the determination of fresh water quality. The routine analysis, however, is very time consuming and expensive as it is carried out manually by trained personnel. The goal of this work is to develop a system for an automated analysis. Results A novel open source system for the automated recognition of phytoplankton by the use of microscopy and image analysis was developed. It integrates the segmentation of the organisms from the background, the calculation of a large range of features, and a neural network for the classification of imaged organisms into different groups of plankton taxa. The analysis of samples containing 10 different taxa showed an average recognition rate of 94.7\% and an average error rate of 5.5\%. The presented system has a flexible framework which easily allows expanding it to include additional taxa in the future. Conclusions The implemented automated microscopy and the new open source image analysis system - PlanktoVision - showed classification results that were comparable or better than existing systems and the exclusion of non-plankton particles could be greatly improved. The software package is published as free software and is available to anyone to help make the analysis of water quality more reproducible and cost effective.}, language = {en} } @phdthesis{Wolter2014, author = {Wolter, Steve}, title = {Single-molecule localization algorithms in super-resolution microscopy}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-109370}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2014}, abstract = {Lokalisationsmikroskopie ist eine Methodenklasse der superaufl{\"o}senden Fluoreszenzmikroskopie, deren Methoden sich durch stochastische zeitliche Isolation der Fluoreszenzemission auszeichnen. Das Blinkverhalten von Fluorophoren wird so ver{\"a}ndert, dass gleichzeitige Aktivierung von einander nahen Fluorophoren unwahrscheinlich ist. Bekannte okalisationsmikroskopische Methoden umfassen dSTORM, STORM, PALM, FPALM, oder GSDIM. Lokalisationsmikroskopie ist von hohem biologischem Interesse, weil sie die Aufl{\"o}sung des Fluoreszenzmikroskops bei minimalem technischem Aufwand um eine Gr{\"o}ßenordnung verbessert. Der verbundene Rechenaufwand ist allerdings erheblich, da Millionen von Fluoreszenzemissionen einzeln mit Nanometergenauigkeit lokalisiert werden m{\"u}ssen. Der Rechen- und Implementationsaufwand dieser Auswertung hat die Verbreitung der superaufl{\"o}senden Mikroskopie lange verz{\"o}gert. Diese Arbeit beschreibt meine algorithmische Grundstruktur f{\"u}r die Auswertung lokalisationsmikroskopischer Daten. Die Echtzeitf{\"a}higkeit, d.h. eine Auswertegeschwindigkeit oberhalb der Datenaufnahmegeschwindigkeit an normalen Messaufbauten, meines neuartigen und quelloffenen Programms wird demonstriert. Die Geschwindigkeit wird auf verbrauchermarktg{\"a}ngigen Prozessoren erreicht und dadurch spezialisierte Rechenzentren oder der Einsatz von Grafikkarten vermieden. Die Berechnung wird mit dem allgemein anerkannten Gaussschen Punktantwortmodell und einem Rauschmodell auf Basis der gr{\"o}ßten Poissonschen Wahrscheinlichkeit durchgef{\"u}hrt. Die algorithmische Grundstruktur wird erweitert, um robuste und optimale Zweifarbenauswertung zu realisieren und damit korrelative Mikroskopie zwischen verschiedenen Proteinen und Strukturen zu erm{\"o}glichen. Durch den Einsatz von kubischen Basissplines wird die Auswertung von dreidimensionalen Proben vereinfacht und stabilisiert, um pr{\"a}zisem Abbilden von mikrometerdicken Proben n{\"a}her zu kommen. Das Grenzverhalten von Lokalisationsalgorithmen bei hohen Emissionsdichten wird untersucht. Abschließend werden Algorithmen f{\"u}r die Anwendung der Lokalisationsmikroskopie auf verbreitete Probleme der Biologie aufgezeigt. Zellul{\"a}re Bewegung und Motilit{\"a}t werden anhand der in vitro Bewegung von Myosin-Aktin-Filamenten studiert. Lebendzellbildgebung mit hellen und stabilen organischen Fluorophoren wird mittels SNAP-tag-Fusionsproteinen realisiert. Die Analyse des Aufbaus von Proteinklumpen zeigt, wie Lokalisationsmikroskopie neue quantitative Ans{\"a}tze jenseits reiner Bildgebung bietet.}, subject = {Fluoreszenzmikroskopie}, language = {en} } @misc{Selig2007, type = {Master Thesis}, author = {Selig, Christian}, title = {The ITS2 Database - Application and Extension}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-23895}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2007}, abstract = {Der internal transcribed spacer 2 (ITS2) des ribosomalen Genrepeats ist ein zunehmend wichtiger phylogenetischer Marker, dessen RNA-Sekund{\"a}rstruktur innerhalb vieler eukaryontischer Organismen konserviert ist. Die ITS2-Datenbank hat zum Ziel, eine umfangreiche Ressource f{\"u}r ITS2-Sequenzen und -Sekund{\"a}rstrukturen auf Basis direkter thermodynamischer als auch homologiemodellierter RNA-Faltung zu sein. Ergebnisse: (a) Eine komplette Neufassung der urspr{\"u}nglichen die ITS2-Datenbank generierenden Skripte, angewandt auf einen aktuellen NCBI-Datensatz, deckte mehr als 65.000 ITS2-Strukturen auf. Dies verdoppelt den Inhalt der urspr{\"u}nglichen Datenbank und verdreifacht ihn, wenn partielle Strukturen mit einbezogen werden. (b) Die Endbenutzer-Schnittstelle wurde neu geschrieben, erweitert und ist jetzt in der Lage, benutzerdefinierte Homologiemodellierungen durchzuf{\"u}hren. (c) Andere m{\"o}glichen RNA-Strukturaufkl{\"a}rungsmethoden (suboptimales und formenbasiertes Falten) sind hilfreich, k{\"o}nnen aber Homologiemodellierung nicht ersetzen. (d) Ein Anwendungsfall der ITS2-Datenbank in Zusammenhang mit anderen am Lehrstuhl entwickelten Werkzeugen gab Einblick in die Verwendung von ITS2 f{\"u}r molekulare Phylogenie.}, subject = {Phylogenie}, language = {en} }