TY - THES A1 - Koetschan, Christian T1 - The Eukaryotic ITS2 Database - A workbench for modelling RNA sequence-structure evolution T1 - Die Eukaryotische ITS2 Datenbank - Eine Plattform zur Modellierung von RNA Sequenzstruktur Evolution N2 - In den vergangenen Jahren etablierte sich der Marker „internal transcribed spacer 2" (ITS2) zu einem häufig genutzten Werkzeug in der molekularen Phylogenetik der Eukaryoten. Seine schnell evolvierende Sequenz eignet sich bestens für den Einsatz in niedrigeren phylogenetischen Ebenen. Die ITS2 faltet jedoch auch in eine sehr konservierte Sekundärstruktur. Diese ermöglicht die Unterscheidung weit entfernter Arten. Eine Kombination aus beiden in einer Sequenzstrukturanalyse verbessert die Auflösung des Markers und ermöglicht die Rekonstruktion von robusteren Bäumen auf höherer taxonomischer Breite. Jedoch war die Durchführung solch einer Analyse, die die Nutzung unterschiedlichster Programme und Datenbanken vorraussetzte, für den klassischen Biologen nicht einfach durchführbar. Um diese Hürde zu umgehen, habe ich den „ITS2 Workbench“ entwickelt, eine im Internet nutzbare Arbeitsplattform zur automatisierten sequenzstrukturbasierten phylogenetischen Analyse basierend auf der ITS2 (http://its2.bioapps.biozentrum.uni-wuerzburg.de). Die Entwicklung begann mit der Längenoptimierung unterschiedlicher „Hidden Markov Model“ (HMM)-Topologien, die erfolgreich auf ein Modell zur Sequenzstrukturvorhersage der ITS2 angewandt wurden. Hierbei wird durch die Analyse von Sequenzbestandteilen in Kombination mit der Längenverteilung verschiedener Helixregionen die Struktur vorhergesagt. Anschließend konnte ich HMMs auch bei der Sequenzstrukturgenerierung einsetzen um die ITS2 innerhalb einer gegebenen Sequenz zu lokalisieren. Dieses neu implementierte Verfahren verdoppelte die Anzahl vorhergesagter Strukturen und verkürzte die Laufzeit auf wenige Tage. Zusammen mit weiteren Optimierungen des Homologiemodellierungsprozesses kann ich nun erschöpfend Sekundärstrukturen in mehreren Interationen vorhersagen. Diese Optimierungen liefern derzeit 380.000 annotierte Sequenzen einschließlich 288.000 Strukturvorhersagen. Um diese Strukturen für die Berechnung von Alignments und phylogenetischen Bäumen zu verwenden hab ich das R-Paket „treeforge“ entwickelt. Es ermöglicht die Generierung von Sequenzstrukturalignments auf bis zu vier unterschiedlich kodierten Alphabeten. Damit können erstmals auch strukturelle Basenpaarungen in die Alignmentberechnung mit einbezogen werden, die eine Schätzung neuer Scorematrizen vorraussetzten. Das R-Paket ermöglicht zusätzlich die Rekonstruktion von „Maximum Parsimony“, „Maximum Likelihood“ und „Neighbour Joining“ Bäumen auf allen vier Alphabeten mittels weniger Zeilen Programmcode. Das Paket wurde eingesetzt, um die noch umstrittene Phylogenie der „chlorophyceae“ zu rekonstruieren und könnte in zukünftigen Versionen des ITS2 workbench verwendet werden. Die ITS2 Plattform basiert auf einer modernen und sehr umfangreichen Web 2.0 Oberfläche und beinhaltet neuste AJAX und Web-Service Technologien. Sie umfasst die HMM basierte Sequenzannotation, Strukturvorhersage durch Energieminimierung bzw. Homologiemodellierung, Alignmentberechnung und Baumrekonstruktion basierend auf einem flexiblen Datenpool, der Änderungen am Datensatz automatisch aktualisiert. Zusätzlich wird eine Detektion von Sequenzmotiven ermöglicht, die zur Kontrolle von Annotation und Strukturvorhersage dienen kann. Eine BLAST basierte Suche auf Sequenz- und Strukturebene bietet zusätzlich eine Vereinfachung des Taxonsamplings. Alle Funktionen sowie die Nutzung der ITS2 Webseite sind in einer kurzen Videoanleitung dargestellt. Die Plattform lässt jedoch nur eine bestimmte Größe von Datensätzen zu. Dies liegt vor allem an der erheblichen Rechenleistung, die bei diesen Berechnungen benötigt wird. Um die Funktion dieses Verfahrens auch auf großen Datenmengen zu demonstrieren, wurde eine voll automatisierte Rekonstruktion des Grünalgenbaumes (Chlorophyta) durchgeführt. Diese erfolgreiche, auf dem ITS2 Marker basierende Studie spricht für die Sequenz-Strukturanalyse auf weiteren Daten in der Phylogenetik. Hier bietet der ITS2 Workbench den idealen Ausgangspunkt. N2 - During the past years, the internal transcribed spacer 2 (ITS2) was established as a commonly used molecular phylogenetic marker for the eukaryotes. Its fast evolving sequence is predestinated for the use in low-level phylogenetics. However, the ITS2 also consists of a very conserved secondary structure. This enables the discrimination between more distantly related species. The combination of both in a sequence-structure based analysis increases the resolution of the marker and enables even more robust tree reconstructions on a broader taxonomic range. But, performing such an analysis required the application of different programs and databases making the use of the ITS2 non trivial for the typical biologist. To overcome this hindrance, I have developed the ITS2 Workbench, a completely web-based tool for automated phylogenetic sequence-structure analyses using the ITS2 (http://its2.bioapps.biozentrum.uni-wuerzburg.de). The development started with an optimization of length modelling topologies for Hidden Markov Models (HMMs), which were successfully applied on a secondary structure prediction model of the ITS2 marker. Here, structure is predicted by considering the sequences' composition in combination with the length distribution of different helical regions. Next, I integrated HMMs into the sequence-structure generation process for the delineation of the ITS2 within a given sequence. This re-implemented pipeline could more than double the number of structure predictions and reduce the runtime to a few days. Together with further optimizations of the homology modelling process I can now exhaustively predict secondary structures in several iterations. These modifications currently provide 380,000 annotated sequences including 288,000 structure predictions. To include these structures in the calculation of alignments and phylogenetic trees, I developed the R-package "treeforge". It generates sequence-structure alignments on up to four different coding alphabets. For the first time also structural bonds were considered in alignments, which required the estimation of new scoring matrices. Now, the reconstruction of Maximum Parsimony, Maximum Likelihood as well as Neighbour Joining trees on all four alphabets requires just a few lines of code. The package was used to resolve the controversial chlorophyceaen dataset and could be integrated into future versions of the ITS2 workbench. The platform is based on a modern, feature-rich Web 2.0 user interface equipped with the latest AJAX and Web-service technologies. It performs HMM-based sequence annotation, structure prediction by energy minimization or homology modelling, alignment calculation and tree reconstruction on a flexible data pool that repeats calculations according to data changes. Further, it provides sequence motif detection to control annotation and structure prediction and a sequence-structure based BLAST search, which facilitates the taxon sampling process. All features and the usage of the ITS2 workbench are explained in a video tutorial. However, the workbench bears some limitations regarding the size of datasets. This is caused mainly due to the immense computational power needed for such extensive calculations. To demonstrate the validity of the approach also for large-scale analyses, a fully automated reconstruction of the Chlorophyta (Green Algal) Tree of Life was performed. The successful application of the marker even on large datasets underlines the capabilities of ITS2 sequence-structure analysis and suggests its utilization on further datasets. The ITS2 workbench provides an excellent starting point for such endeavours. KW - Ribosomale RNA KW - Datenbank KW - Marker KW - Phylogenie KW - Evolution KW - Sequenz KW - Struktur KW - Hidden Markov Model KW - Evolution KW - ribosomal RNA KW - workbench KW - sequence-structure Y1 - 2012 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-73128 ER - TY - THES A1 - Noskov, Andrey T1 - Structural and functional studies of the Interleukin-5 receptor system T1 - Struktur und Funktionsanalyse des Interleukin-5 Rezeptor Systems N2 - The aim of current work was contribution to the long-term ongoing project on developing human IL-5 agonists/antagonists that intervene with or inhibit IL-5 numerous functions in cell culture and/or in animal disease models. To facilitate design of an IL-5 antagonist variant or low-molecular weight mimetics only capable of binding to the specific receptor alpha chain, but would lack the ability to attract the receptor common β-chain and thus initiate receptor complex activation it is necessary to gain the information on minimal structural and functional epitopes. Such a strategy was successfully adopted in our group on example of Interleukin 4. To precisely localize minimal structural epitope it is essential to have structure of the ligand in its bound form and especially informative would be structure of complex of the ligand and its specific receptor alpha chain. For this purpose large quantities (tens of milligrams), retaining full biological activity IL-5 and extracellular domain of IL-5 specific receptor α-chain were expressed in a bacterial expression system (E.coli). After successful refolding proteins were purified to 95-99% Stable and soluble receptor:ligand complex was prepared. Each established purification and refolding procedures were subjected to optimization targeting maximal yields and purity. Produced receptor:ligand complex was applied to crystallization experiments. Microcrystals were initially obtained with a flexible sparse matrix screening methodology. Crystal quality was subsequently improved by fine-tuning of the crystallization conditions. At this stage crystals of about 800x150x30µm in size can be obtained. They possess desirable visible characteristics of crystals including optical clarity, smooth facecs and sharp edges. Crystals rotate plane polarized light reflecting their well internal organization. Unfortunately relative slimness and sometimes cluster nature of the produced crystals complicates acquisition of high-resolution dataset and resolution of the structure. With some of obtained crystals diffraction to a resolution up to 4Å was observed. N2 - Das Ziel der vorliegenden Arbeit war, einen Beitrag zum langfristigen Projekt der Entwicklung humaner IL-5 Agonisten/Antagonisten zu leisten, die im tierischen Krankheitsmodell oder in der Zellkultur in die verschiedenen Funktionen des IL-5 eingreifen oder sie inhibieren. Um das Design eines IL-5 Antagonisten oder einer Mimetika mit geringem Molekulargewicht zu vereinfachen, die nur an die spezifische α-Rezeptorkette bindet, nicht jedoch an die gemeinsame β-Kette und somit die Aktivierung des Rezeptorkomplexes initiieren, ist es notwendig, Informationen über minimale strukturelle und funktionelle Epitope zu erhalten. Diese Strategie wurde in unserer Arbeitsgruppe erfolgreich am Beispiel von Interleukin 4 angewandt. Um minimale strukturelle Epitope präzise zu lokalisieren, ist es es notwendig, die Struktur des Liganden in seiner gebundenen Form zu kennen. Besonders informativ wäre die Struktur des Komplexes aus Ligand und spezifischer Rezeptor α-Kette. Zu diesem Zweck wurden große Mengen (einige 10 mg) IL-5 mit vollständiger biologischer Funktionaltät und der extrazellulären Domäne der IL-5 spezifischen Rezeptor α-Kette in einem bakteriellen Expressionssystem (E. coli) exprimiert. Nach erfolgreicher Faltung wurden die Proteine zu einer Reinheit von 95-99% aufgereinigt und ein stabiler und löslicher Rezeptor:Ligandenkomplex erzeugt. Die erfolgreiche Aufreinigung und Faltungsprozedur wurde bezüglich maximaler Menge und Reinheit optimiert. Mit den produzierten Rezeptor:Ligandenkomplexen wurden Kristallisationsexperimente durchgeführt. Zunächst wurden mit einer flexiblen Sparse-Matrix Screening Methode Mikrokristalle erzeugt. Die Qualität der Kristalle wurde dann durch Feinabstimmung der Kristallisationsbedingungen verbessert. In diesem Stadium wurden Kristalle von etwa 800x150x30µm Größe erzeugt, die die gewünschten optischen Eigenschaften wie glatte Oberflächen und scharfe Kanten besaßen. Die Kristalle drehen die Polarisationsebene linear polarisierten Lichtes, was ihren gleichmäßigen Aufbau zeigt. Leider verkompliziert die geringe Dicke und das teilweise Auftreten von Clustern die Aufnahme hochauflösender Daten und damit Auflösung der Struktur. Mit einigen der erhaltenen Kristalle wurde eine Beugung bis zur Auflösung von 4 Å beobachtet. KW - Interleukin 5 KW - Rezeptor KW - Struktur KW - Interleukin-5 KW - Rezeptor KW - Asthma KW - X-ray KW - Protein-Kristallisierung KW - Interleukin-5 KW - receptor KW - asthma KW - X-ray KW - protein crystallization Y1 - 2003 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-8195 ER -