@phdthesis{Zilian2014, author = {Zilian, David}, title = {Neuartige, empirische Scoring-Modelle f{\"u}r Protein-Ligand-Komplexe und computergest{\"u}tzte Entwicklung von Hsp70-Inhibitoren}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-105055}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2014}, abstract = {Techniken des computergest{\"u}tzten Wirkstoffdesigns spielen eine wichtige Rolle bei der Entwicklung neuer Wirkstoffe. Die vorliegende Arbeit befasst sich sowohl mit der Entwicklung als auch mit der praktischen Anwendung von Methoden des strukturbasierten Wirkstoffdesigns. Die Arbeit glieder sich daher in zwei Teile. Der erste Teil besch{\"a}ftigt sich mit der Entwicklung von empirischen Scoring-Funktionen, die eine Schl{\"u}sselrolle im strukturbasierten computergest{\"u}tzen Wirkstoffdesign einnehmen. Grundlage dieser Arbeiten sind die empirischen Deskriptoren und Scoring-Funktionen aus dem SFCscore-Programmpaket. Dabei wurde zun{\"a}chst untersucht, wie sich die Zusammensetzung der Trainingsdaten auf die Vorhersagen von empirischen Scoring-Funktionen auswirkt. Durch die gezielte Zusammenstellung eines neuen Trainingsdatensatzes wurde versucht, die Spannweite der Vorhersagen zu vergr{\"o}ßern, um so vor allem eine bessere Erkennung von hoch- und niedrig-affinen Komplexen zu erreichen. Die resultierende Funktion erzielte vor allem im niedrig-affinen Bereich verbesserte Vorhersagen. Der zweite Themenkomplex besch{\"a}ftigt sich ebenfalls mit der verbesserten Separierung von aktiven und inaktiven Verbindungen. Durch den Einsatz der Machine Learning-Methode RandomForest wurden dazu Klassifizierungsmodelle abgeleitet, die im Unterschied zu den klassischen Scoring-Funktionen keinen genauen Score liefern, sondern die Verbindungen nach ihrer potentiellen Aktivit{\"a}t klassifizieren. Am Beispiel des mykobakteriellen Enzyms InhA konnte gezeigt werden, dass derartige Modelle den klassischen Scoring-Funktionen im Bezug auf die Erkennung von aktiven Verbindungen deutlich {\"u}berlegen sind. Der RandomForest-Algorithmus wurde im n{\"a}chsten Schritt auch verwendet, um eine neue Scoring-Funktion zur Vorhersage von Bindungsaffinit{\"a}ten abzuleiten. Diese Funktion wurde unter dem Namen SFCscoreRF in das SFCscore-Programmpaket implementiert. Die Funktion unterschiedet sich in einigen wesentlichen Punkten von den urspr{\"u}nglichen SFCscore-Funktionen. Zum einen handelt es sich beim RF-Algorithmus um eine nicht-lineare Methode, die im Unterschied zu den klassischen Methoden, die zur Ableitung von Scoring-Funktionen eingesetzt werden, nicht von der Additivit{\"a}t der einzelnen Deskriptoren ausgeht. Der Algorithmus erlaubt außerdem die Verwendung aller verf{\"u}gbaren SFCscore-Deskriptoren, was eine deutlich umfassendere Repr{\"a}sentation von Protein-Ligand-Komplexen als Grundlage des Scorings erm{\"o}glicht. F{\"u}r die Ableitung von SFCscoreRF wurden insgesamt 1005 Komplexe im Trainingsdatensatz verwendet. Dieser Datensatz ist somit einer der gr{\"o}ßten, die bisher f{\"u}r die Ableitung einer empirischen Scoring-Funktion verwendet wurden. Die Evaluierung gegen zwei Benchmark-Datens{\"a}tze ergab deutlich bessere Vorhersagen von SFCscoreRF im Vergleich zu den urspr{\"u}nglichen SFCscore-Funktionen. Auch im internationalen Vergleich mit anderen Scoring-Funktion konnten f{\"u}r beide Datens{\"a}tze Spitzenwerte erreicht werden. Weitere ausgiebige Testungen im Rahmen einer Leave-Cluster-Out-Validierung und die Teilnahme am CSAR 2012 Benchmark Exercise ergaben, dass auch SFCscoreRF Performanceschwankungen bei der Anwendung an proteinspezifischen Datens{\"a}tzen zeigt - ein Ph{\"a}nomen, dass bei Scoring-Funktionen immer beobachtet wird. Die Analyse der CSAR 2012-Datens{\"a}tze ergab dar{\"u}ber hinaus wichtige Erkenntnisse im Bezug auf Vorhersage von gedockten Posen sowie {\"u}ber die statistische Signifikanz bei der Evaluierung von Scoring-Funktionen. Die Tatsache, dass empirische Scoring-Funktionen innerhalb eines bestimmten chemischen Raums trainiert wurden, ist ein wichtiger Faktor f{\"u}r die protein-abh{\"a}ngigen Leistungsschwankungen, die in dieser Arbeit beobachtet wurden. Verl{\"a}ssliche Vorhersagen sind nur innerhalb des kalibrierten chemischen Raums m{\"o}glich. In dieser Arbeit wurden verschiedene Ans{\"a}tze untersucht, mit denen sich diese ``Applicability Domain'' f{\"u}r die SFCscore-Funktionen definieren l{\"a}sst. Mit Hilfe von PCA-Analysen ist es gelungen die ``Applicability Domain'' einzelner Funktionen zu visualisieren. Zus{\"a}tzlich wurden eine Reihe numerischer Deskriptoren getestet, mit den die Vorhersageverl{\"a}sslichkeit basierend auf der ``Applicability Domain'' abgesch{\"a}tzt werden k{\"o}nnte. Die RF-Proximity hat sich hier als vielversprechender Ausgangspunkt f{\"u}r weitere Entwicklungen erwiesen. Der zweite Teil der Arbeit besch{\"a}ftigt sich mit der Entwicklung neuer Inhibitoren f{\"u}r das Chaperon Hsp70, welches eine vielversprechende Zielstruktur f{\"u}r die Therapie des multiplen Myeloms darstellt. Grundlage dieser Arbeiten war eine Leitstruktur, die in einer vorhergehenden Arbeit entdeckt wurde und die vermutlich an einer neuartigen Bindestelle in der Interface-Region zwischen den beiden großen Dom{\"a}nen von Hsp70 angreift. Die Weiterentwicklung und Optimierung dieser Leitstruktur, eines Tetrahydroisochinolinon-Derivats, stand zun{\"a}chst im Vordergrund. Anhand detaillierter Docking-Analysen wurde der potentielle Bindemodus der Leitstruktur in der Interfaceregion von Hsp70 untersucht. Basierend auf diesen Ergebnissen wurde eine Substanzbibliothek erstellt, die von Kooperationspartnern innerhalb der KFO 216 synthetisiert und biologisch getestet wurde. Die Struktur-Wirkungsbeziehungen, die sich aus diesen experimentellen Daten ableiten lassen, konnten teilweise gut mit den erstellten Docking-Modellen korreliert werden. Andere Effekte konnten anhand der Docking-Posen jedoch nicht erkl{\"a}rt werden. F{\"u}r die Entwicklung neuer Derivate ist deswegen eine umfassendere experimentelle Charakterisierung und darauf aufbauend eine Verfeinerung der Bindungsmodelle notwendig. Strukturell handelt es sich bei Hsp70 um ein Zwei-Dom{\"a}nen-System, dass verschiedene allostere Zust{\"a}nde einnehmen kann. Um die Auswirkungen der daraus folgenden Flexibilit{\"a}t auf die Stabilit{\"a}t der Struktur und die Bindung von Inhibitoren zu untersuchen, wurden molekulardynamische Simulationen f{\"u}r das Protein durchgef{\"u}hrt. Diese zeigen, dass das Protein tats{\"a}chlich eine {\"u}berdurchschnittlich hohe Flexibilit{\"a}t aufweist, die vor allem durch die relative Bewegung der beiden großen Dom{\"a}nen zueinander dominiert wird. Die Proteinkonformation die in der Kristallstruktur hscaz beobachtet wird, bleibt jedoch in ihrer Grundstruktur in allen vier durchgef{\"u}hrten Simulationen erhalten. Es konnten hingegen keine Hinweise daf{\"u}r gefunden werden, dass die Mutationen, welche die f{\"u}r die strukturbasierten Arbeiten verwendete Kristallstruktur im Vergleich zum Wildtyp aufweist, einen kritischen Einfluss auf die Gesamtstabilit{\"a}t des Systems haben. Obwohl die Interface-Region zwischen NBD und SBD also in allen Simulationen erhalten bleibt, wird die Konformation in diesem Bereich doch wesentlich durch die Dom{\"a}nenbewegung beeinflusst und variiert. Da dieser Proteinbereich den wahrscheinlichsten Angriffspunkt der Tetrahydroisochinolinone darstellt, wurde der Konformationsraum detailliert untersucht. Wie erwartet weist die Region eine nicht unerhebliche Flexibilit{\"a}t auf, welche zudem, im Sinne eines ``Induced-Fit''-Mechanismus, durch die Gegenwart eines Liganden (Apoptozol) stark beeinflusst wird. Es ist daher als sehr wahrscheinlich anzusehen, dass die Dynamik der Interface-Region auch einen wesentlichen Einfluss auf die Bindung der Tetrahydroisochinolinone hat. Molekuardynamische Berechnungen werden deswegen auch in zuk{\"u}nftige Arbeiten auf diesem Gebiet eine wichtige Rolle spielen. Die Analysen zeigen zudem, dass die Konformation der Interface-Region eng mit der Konformation des gesamten Proteins - vor allem im Bezug auf die relative Stellung von SBD und NBD zueinander - verkn{\"u}pft ist. Das untermauert die Hypothese, dass die Interface-Bindetasche einen Angriffspunkt f{\"u}r die Inhibtion des Proteins darstellt.}, subject = {Arzneimittelforschung}, language = {de} }