Refine
Has Fulltext
- yes (2)
Is part of the Bibliography
- yes (2) (remove)
Document Type
- Doctoral Thesis (2)
Language
- German (2) (remove)
Keywords
- molekulardynamische Simulationen (2) (remove)
Institute
Techniken des computergestützten Wirkstoffdesigns spielen eine wichtige Rolle bei der Entwicklung neuer Wirkstoffe. Die vorliegende Arbeit befasst sich sowohl mit der Entwicklung als auch mit der praktischen Anwendung von Methoden des strukturbasierten Wirkstoffdesigns. Die Arbeit glieder sich daher in zwei Teile.
Der erste Teil beschäftigt sich mit der Entwicklung von empirischen Scoring-Funktionen, die eine Schlüsselrolle im strukturbasierten computergestützen Wirkstoffdesign einnehmen. Grundlage dieser Arbeiten sind die empirischen Deskriptoren und Scoring-Funktionen aus dem SFCscore-Programmpaket.
Dabei wurde zunächst untersucht, wie sich die Zusammensetzung der Trainingsdaten auf die Vorhersagen von empirischen Scoring-Funktionen auswirkt. Durch die gezielte Zusammenstellung eines neuen Trainingsdatensatzes wurde versucht, die Spannweite der Vorhersagen zu vergrößern, um so vor allem eine bessere Erkennung von hoch- und niedrig-affinen Komplexen zu erreichen. Die resultierende Funktion erzielte vor allem im niedrig-affinen Bereich verbesserte Vorhersagen.
Der zweite Themenkomplex beschäftigt sich ebenfalls mit der verbesserten Separierung von aktiven und inaktiven Verbindungen. Durch den Einsatz der Machine Learning-Methode RandomForest wurden dazu Klassifizierungsmodelle abgeleitet, die im Unterschied zu den klassischen Scoring-Funktionen keinen genauen Score liefern, sondern die Verbindungen nach ihrer potentiellen Aktivität klassifizieren.
Am Beispiel des mykobakteriellen Enzyms InhA konnte gezeigt werden, dass derartige Modelle den klassischen Scoring-Funktionen im Bezug auf die Erkennung von aktiven Verbindungen deutlich überlegen sind.
Der RandomForest-Algorithmus wurde im nächsten Schritt auch verwendet, um eine neue Scoring-Funktion zur Vorhersage von Bindungsaffinitäten abzuleiten. Diese Funktion wurde unter dem Namen SFCscoreRF in das SFCscore-Programmpaket implementiert. Die Funktion unterschiedet sich in einigen wesentlichen Punkten von den ursprünglichen SFCscore-Funktionen.
Zum einen handelt es sich beim RF-Algorithmus um eine nicht-lineare Methode, die im Unterschied zu den klassischen Methoden, die zur Ableitung von Scoring-Funktionen eingesetzt werden, nicht von der Additivität der einzelnen Deskriptoren ausgeht. Der Algorithmus erlaubt außerdem die Verwendung aller verfügbaren SFCscore-Deskriptoren, was eine deutlich umfassendere Repräsentation von Protein-Ligand-Komplexen als Grundlage des Scorings ermöglicht. Für die Ableitung von SFCscoreRF wurden insgesamt 1005 Komplexe im Trainingsdatensatz verwendet. Dieser Datensatz ist somit einer der größten, die bisher für die Ableitung einer empirischen Scoring-Funktion verwendet wurden.
Die Evaluierung gegen zwei Benchmark-Datensätze ergab deutlich bessere Vorhersagen von SFCscoreRF im Vergleich zu den ursprünglichen SFCscore-Funktionen. Auch im internationalen Vergleich mit anderen Scoring-Funktion konnten für beide Datensätze Spitzenwerte erreicht werden.
Weitere ausgiebige Testungen im Rahmen einer Leave-Cluster-Out-Validierung und die Teilnahme am CSAR 2012 Benchmark Exercise ergaben, dass auch SFCscoreRF Performanceschwankungen bei der Anwendung an proteinspezifischen Datensätzen zeigt - ein Phänomen, dass bei Scoring-Funktionen immer beobachtet wird. Die Analyse der CSAR 2012-Datensätze ergab darüber hinaus wichtige Erkenntnisse im Bezug auf Vorhersage von gedockten Posen sowie über die statistische Signifikanz bei der Evaluierung von Scoring-Funktionen.
Die Tatsache, dass empirische Scoring-Funktionen innerhalb eines bestimmten chemischen Raums trainiert wurden, ist ein wichtiger Faktor für die protein-abhängigen Leistungsschwankungen, die in dieser Arbeit beobachtet wurden. Verlässliche Vorhersagen sind nur innerhalb des kalibrierten chemischen Raums möglich. In dieser Arbeit wurden verschiedene Ansätze untersucht, mit denen sich diese ``Applicability Domain'' für die SFCscore-Funktionen definieren lässt. Mit Hilfe von PCA-Analysen ist es gelungen die ``Applicability Domain'' einzelner Funktionen zu visualisieren. Zusätzlich wurden eine Reihe numerischer Deskriptoren getestet, mit den die Vorhersageverlässlichkeit basierend auf der ``Applicability Domain'' abgeschätzt werden könnte. Die RF-Proximity hat sich hier als vielversprechender Ausgangspunkt für weitere Entwicklungen erwiesen.
Der zweite Teil der Arbeit beschäftigt sich mit der Entwicklung neuer Inhibitoren für das Chaperon Hsp70, welches eine vielversprechende Zielstruktur für die Therapie des multiplen Myeloms darstellt.
Grundlage dieser Arbeiten war eine Leitstruktur, die in einer vorhergehenden Arbeit entdeckt wurde und die vermutlich an einer neuartigen Bindestelle in der Interface-Region zwischen den beiden großen Domänen von Hsp70 angreift.
Die Weiterentwicklung und Optimierung dieser Leitstruktur, eines Tetrahydroisochinolinon-Derivats, stand zunächst im Vordergrund. Anhand detaillierter Docking-Analysen wurde der potentielle Bindemodus der Leitstruktur in der Interfaceregion von Hsp70 untersucht. Basierend auf diesen Ergebnissen wurde eine Substanzbibliothek erstellt, die von Kooperationspartnern innerhalb der KFO 216 synthetisiert und biologisch getestet wurde. Die Struktur-Wirkungsbeziehungen, die sich aus diesen experimentellen Daten ableiten lassen, konnten teilweise gut mit den erstellten Docking-Modellen korreliert werden. Andere Effekte konnten anhand der Docking-Posen jedoch nicht erklärt werden. Für die Entwicklung neuer Derivate ist deswegen eine umfassendere experimentelle Charakterisierung und darauf aufbauend eine Verfeinerung der Bindungsmodelle notwendig.
Strukturell handelt es sich bei Hsp70 um ein Zwei-Domänen-System, dass verschiedene allostere Zustände einnehmen kann. Um die Auswirkungen der daraus folgenden Flexibilität auf die Stabilität der Struktur und die Bindung von Inhibitoren zu untersuchen, wurden molekulardynamische Simulationen für das Protein durchgeführt.
Diese zeigen, dass das Protein tatsächlich eine überdurchschnittlich hohe Flexibilität aufweist, die vor allem durch die relative Bewegung der beiden großen Domänen zueinander dominiert wird. Die Proteinkonformation die in der Kristallstruktur hscaz beobachtet wird, bleibt jedoch in ihrer Grundstruktur in allen vier durchgeführten Simulationen erhalten. Es konnten hingegen keine Hinweise dafür gefunden werden, dass die Mutationen, welche die für die strukturbasierten Arbeiten verwendete Kristallstruktur im Vergleich zum Wildtyp aufweist, einen kritischen Einfluss auf die Gesamtstabilität des Systems haben.
Obwohl die Interface-Region zwischen NBD und SBD also in allen Simulationen erhalten bleibt, wird die Konformation in diesem Bereich doch wesentlich durch die Domänenbewegung beeinflusst und variiert. Da dieser Proteinbereich den wahrscheinlichsten Angriffspunkt der Tetrahydroisochinolinone darstellt, wurde der Konformationsraum detailliert untersucht. Wie erwartet weist die Region eine nicht unerhebliche Flexibilität auf, welche zudem, im Sinne eines ``Induced-Fit''-Mechanismus, durch die Gegenwart eines Liganden (Apoptozol) stark beeinflusst wird. Es ist daher als sehr wahrscheinlich anzusehen, dass die Dynamik der Interface-Region auch einen wesentlichen Einfluss auf die Bindung der Tetrahydroisochinolinone hat. Molekuardynamische Berechnungen werden deswegen auch in zukünftige Arbeiten auf diesem Gebiet eine wichtige Rolle spielen.
Die Analysen zeigen zudem, dass die Konformation der Interface-Region eng mit der Konformation des gesamten Proteins - vor allem im Bezug auf die relative Stellung von SBD und NBD zueinander - verknüpft ist. Das untermauert die Hypothese, dass die Interface-Bindetasche einen Angriffspunkt für die Inhibtion des Proteins darstellt.
Proteine sind dynamische makromolekulare Systeme, die nativ in verschiedenen Konfor-mationen vorliegen. Besonders Proteine mit einer ausgeprägten intrinsischen Flexibilität stellen als biologische Zielstrukturen für das computergestützte strukturbasierte Wirkstoff-design auch heute noch eine große Herausforderung dar. Die vorliegende Arbeit thematisiert die computergestützte Identifizierung neuer Liganden mit inhibitorischer Aktivität für zwei strukturell sehr flexible Enzyme, die bei verschiedenen Krankheiten eine pathophysio-logische Rolle spielen. Ein Schwerpunkt lag in diesem Zusammenhang auf der Entwicklung virtueller Screeningverfahren, die es ermöglichten, die Flexibilität der Proteine adäquat zu berücksichtigen.
Der erste Teil der Arbeit beschreibt ein virtuelles Screeningverfahren für die Identifizierung von Liganden einer neuen, durch Molekulardynamik (MD) Simulationen generierten Proteinkonformation der Aldose Reduktase (AR), einem Enzym, das im Zusammenhang mit der Entstehung von Folgeerkrankungen bei Diabetes mellitus steht. Die angewandte Vorgehensweise zeigt Möglichkeiten auf, wie eine ausgeprägte Proteinflexibilität mit Hilfe computerbasierter Methoden im Rahmen eines virtuellen Screenings explizit berücksichtigt werden kann. Die Studie war auf der einen Seite hinsichtlich methodischer Aspekte von Interesse, da dadurch sowohl eine Beurteilung der Aussagekraft computergenerierter Proteinkonformationen, als auch eine Überprüfung der prinzipiellen Eignung MD-generierter Enzymkonformationen als Template für strukturbasierten Ligandendesignstudien, erfolgen konnte. Auf der anderen Seite war diese Studie aufgrund einer möglichen Erweiterung des bekannten Konformationsraumes der AR auch aus strukturbiologischer Sicht von Interesse.
Bei der Suche nach geeigneten Liganden in Moleküldatenbanken kommerziell erhältlicher Verbindungen wurde eine protein- und eine ligandbasierte Strategie verfolgt. Im Rahmen des proteinbasierten Ansatzes erfolgte zunächst eine vergleichende Strukturanalyse verschiedener AR-Ligand-Komplexstrukturen, um Informationen hinsichtlich experimentell aufgeklärter Bindemotive, Protein-Ligand-Interaktionen sowie bestehender struktureller Differenzen zwischen der MD-Konformation und anderen Bindetaschenkonformationen der AR zu sammeln. Anschließend wurde die Bindetasche der MD-generierten Proteinstruktur hinsichtlich günstiger Interaktionspunkte analysiert, um aus den Erkenntnissen Pharmako-phormodelle als Filter für die nachfolgenden virtuellen Datenbanksuchen zu entwickeln.
Als Ergänzung zum proteinbasierten Ansatz wurde eine ligandbasierte Strategie für die Identifizierung potenzieller Kandidatenmoleküle verfolgt. Dabei diente ein bekannter AR-Inhibitor als Templatstruktur, bei dem aufgrund zuvor durchgeführter Dockingexperimente die begründete Annahme bestand, dass dieser die Bindetaschenform der MD-Proteinkonfor-mation stabilisieren könnte. Hierbei wurde zunächst eine Moleküldatenbank aus kommerziell erhältlichen Verbindungen, die alle über eine bestimmte Substruktur als Ankergruppe verfügten, aufgebaut und anschließend durch Berechnung molekularer Ähnlichkeiten zu der Templatstruktur auf mögliche Kandidatenmoleküle durchsucht.
Die virtuell identifizierten Moleküle der beiden Ansätze wurden im Anschluss mit Hilfe von Dockingsimulationen in die Bindetasche der MD-generierten Proteinkonformation gedockt und die berechneten Bindeposen mit einem Re- und Consensus-Scoringverfahren bewertet. Im nächsten Schritt erfolgte eine Untersuchung der Selektivität der Kandidatenmoleküle anhand eines Cross-Dockingexperiments an verschiedenen Bindetaschenkonformationen der AR. Auf der Grundlage aller durch das virtuelle Screeningverfahren gesammelten Informationen wurde eine finale Molekülauswahl getroffen und sechs kommerziell verfügbare Moleküle für experimentelle Untersuchungen bezogen. Die experimentelle Bestimmung der Enzyminhibition wurde dabei von Kooperationspartnern mit Hilfe eines in vitro Assays untersucht. Aufgrund einer unzureichenden Löslichkeit von vier Substanzen unter den Assaybedingungen konnte lediglich das Inhibitionspotenzial von zwei Verbindungen untersucht werden. Eine der Verbindungen zeigte bemerkenswerterweise eine inhibitorische Aktivität im einstelligen mikromolaren Bereich. Eine finale Beurteilung, ob die Zielsetzung dieser Studie, eine neue computergenerierte Bindetaschenkonformation der AR experi-mentell zugänglich zu machen, durch die vorgeschlagenen Verbindungen erfüllt werden konnte, konnte zum Zeitpunkt der Anfertigung der Dissertation aufgrund ausstehender Kristallstrukturen der jeweiligen AR-Ligand-Komplexe nicht erfolgen und bleibt das Ziel zukünftiger Arbeiten.
Die Studie zeigte jedoch deutlich, dass nicht nur experimentell aufgeklärte Proteinstrukturen sondern auch die Nutzung von mit Hilfe computerbasierter Verfahren, wie z.B. mittels MD Simulationen, berechneter Proteinkonformationen als Templatstrukturen für die Identifi-zierung neuer Liganden hilfreich sein kann und daher deren Verwendung für diese Zielsetzung ihre Berechtigung hat.
Der zweite Teil der Arbeit handelt von der computergestützten Identifizierung nieder-molekularer Liganden einer neuen potenziellen Bindestelle der biologischen Zielstruktur Hitzeschockprotein 70 (Hsp70), als eine neuartige Klasse von Hsp70-Inhibitoren. Hsp70 spielt eine pathophysiologische Rolle bei verschiedenen Krebserkrankungen sowie diversen weiteren Erkrankungen, wie z.B. neurodegenerativen Erkrankungen und Infektions-krankheiten. Bei der neuen potenziellen Bindestelle, die im Rahmen der vorliegenden Arbeit näher untersucht wurde, handelte es sich um das Interdomäneninterface, der Schnittstelle zwischen der Nukleotid- und Substratbindedomäne von Hsp70.
Zum Zeitpunkt der Arbeit waren keine Liganden dieser Proteinregion in der Literatur beschrieben, weshalb es zunächst galt, die Hypothese der Adressierbarkeit dieser Zielregion durch niedermolekulare Liganden zu verifizieren. Hierfür wurde ein virtuelles Screening durchgeführt, bei dem protein- sowie ligandbasierte Suchstrategien zum Einsatz kamen. Im Rahmen des proteinbasierten Ansatzes erfolgte zunächst eine Analyse der Hsp70 Tertiär-struktur auf potenziell vorhandene Ligandenbindestellen. Im Anschluss wurde das Interdomäneninterface auf günstige Interaktionspunkte für bestimmte Atomtypen und funktionelle Gruppen zukünftiger Liganden untersucht. Basierend auf diesen Informationen wurde ein Pharmakophormodell als Filter für nachfolgende virtuelle Datenbanksuchen entwickelt.
Bei dem ligandbasierten Ansatz fungierte der bekannte Hsp70-Ligand Apoptozol als Templatstruktur für die virtuelle Datenbanksuche, da die Ergebnisse eines vorab durchge-führten Cross-Dockingexperiments deutlich auf eine Bindung des Moleküls an das Interdomäneninterface hinwiesen. Diese Dockingstudie lieferte erste wertvolle Hinweise hinsichtlich der Bindestelle und potenzieller Bindemodi des Moleküls an Hsp70.
Im Anschluss an die virtuellen Datenbanksuchen wurden die identifizierten Kandidaten-moleküle hinsichtlich möglicher Bindemodi und Bindungsaffinitäten mittels Docking-simulationen in Verbindung mit einem Re- und Consensus-Scoringverfahren untersucht. Abschließend wurden neun ausgewählte Kandidatenmoleküle von kommerziellen Anbietern bezogen und mit Hilfe von in vitro Assays von Kooperationspartnern innerhalb der Klinischen Forschergruppe 216 auf ihre zytotoxische Aktivität gegenüber Multiplen Myelomzellen untersucht. Dabei konnte für fünf der neun getesteten Verbindungen bereits bei Konzentrationen im ein- bzw. zweistelligen mikromolaren Bereich eine Aktivität gemessen werden, was einer formalen Trefferquote von 56% entspricht. Weiterhin wurde und wird in Folgearbeiten von Kooperationspartnern versucht, eine Bindung der ausgewählten Kandidatenmoleküle an Hsp70 näher zu charakterisieren und sowohl am separierten Protein, als auch in der Targetzelle nachzuweisen.
Darüber hinaus wurde zusätzlich ein fragmentbasierter Ansatz, basierend auf einer bestimmten Substruktur, die als eine Art Ankergruppe fungieren sollte, verfolgt. Dabei diente bei der virtuellen Suche in Moleküldatenbanken kommerzieller Anbieter ein Molekülfragment als Suchanfrage. Aus dem identifizierten Molekülsatz wurden Verbindungen unterschied-lichster struktureller Klassen für nachfolgende Dockingexperimente ausgewählt. Die berechneten Bindeposen wurden einem Re-Scoringverfahren für eine zusätzliche Abschätzung der Bindungsaffinität unterzogen. Schließlich wurden die fünf vielver-sprechendsten Verbindungen für nachfolgende experimentelle Untersuchungen kommerziell bezogen. Die Ergebnisse der nachfolgenden röntgenkristallographischen Aufklärung der Protein-Ligand-Komplexe lagen bei der Anfertigung der vorliegenden Dissertation noch nicht abschließend vor und sind Bestandteil aktueller Forschungarbeiten.
Mit den durchgeführten virtuellen Screeningverfahren konnten erstmals potenzielle Liganden des Hsp70-Interdomäneninterfaces als eine neuartige Klasse von Hsp70-Inhibitoren identifiziert werden. Weiterhin können die identifizierten, zytotoxisch aktiven Verbindungen als Leitstrukturen zukünftiger Inhibitordesignstudien dienen, mit dem Ziel sowohl die Zytotoxizität dieser Moleküle zu optimieren, als auch Struktur-Wirkungsbeziehungen für die Entwicklung von Inhibitoren mit verbesserten biologischen Aktivitätsprofilen abzuleiten.
Ein weiterer Schwerpunkt der Arbeit lag auf der computerbasierten Charakterisierung der Proteinflexibilität von Hsp70 mit Hilfe von MD Simulationen. In diesem Zusammenhang erfolgte eine Untersuchung intrinsischer Proteinbewegungen sowie des Konformations-raumes anhand von verschiedenen Hsp70-Enzymstrukturen. Die durchgeführten MD Simulationen waren zum Zeitpunkt der Arbeit die ersten Untersuchungen dieser Art, die nicht nur an einer einzelnen Domäne, sondern an ganzen Zweidomänenstrukturen von Hsp70 erfolgten. Die generierten Trajektorien bestätigten die überdurchschnittlich hohe Flexibilität der Zielstruktur Hsp70. Die im Rahmen der Studie identifizierten, zum Zeitpunkt der Arbeit noch nicht beschriebenen Proteinkonformere erweiterten das Spektrum der bekannten Hsp70-Proteinkonformationen erheblich und lieferten mögliche Enzymkonformationen, die als Templatstrukturen für zukünftige strukturbasierte Wirkstoffdesignstudien dienen können. Darüber hinaus stützten die Beobachtungen die Hypothese der prinzipiellen Eignung des Interdomäneninterfaces von Hsp70 als eine Bindestelle für neue Inhibitoren. Auf der Grundlage der gewonnenen Informationen war es weiterhin möglich, eine erste Hypothese hinsichtlich eines potenziellen inhibitorischen Wirkmechanismus der Liganden des Interdomäneninterfaces zu formulieren.
Abschließend lässt sich festhalten, dass durch die vorliegende Arbeit viele neue strukturbiologische Erkenntnisse über Hsp70 gewonnen wurden. Dennoch besteht weiterer Forschungsbedarf, um die Strukturbiologie von Hsp70 umfassend aufzuklären. Möglicher-weise können in zukünftigen Studien Enzymstrukturen aufgeklärt werden, die die Existenz der in silico erzeugten und in der Arbeit beschriebenen Proteinkonformere bestätigen.