TY - THES A1 - Peinz, Ulrich T1 - Strukturbasiertes computergestütztes Wirkstoffdesign an flexiblen Proteintargets: Aldose Reduktase und Hsp70 T1 - Structure-based computer-aided drug design on flexible protein targets: aldose reductase and Hsp70 N2 - Proteine sind dynamische makromolekulare Systeme, die nativ in verschiedenen Konfor-mationen vorliegen. Besonders Proteine mit einer ausgeprägten intrinsischen Flexibilität stellen als biologische Zielstrukturen für das computergestützte strukturbasierte Wirkstoff-design auch heute noch eine große Herausforderung dar. Die vorliegende Arbeit thematisiert die computergestützte Identifizierung neuer Liganden mit inhibitorischer Aktivität für zwei strukturell sehr flexible Enzyme, die bei verschiedenen Krankheiten eine pathophysio-logische Rolle spielen. Ein Schwerpunkt lag in diesem Zusammenhang auf der Entwicklung virtueller Screeningverfahren, die es ermöglichten, die Flexibilität der Proteine adäquat zu berücksichtigen. Der erste Teil der Arbeit beschreibt ein virtuelles Screeningverfahren für die Identifizierung von Liganden einer neuen, durch Molekulardynamik (MD) Simulationen generierten Proteinkonformation der Aldose Reduktase (AR), einem Enzym, das im Zusammenhang mit der Entstehung von Folgeerkrankungen bei Diabetes mellitus steht. Die angewandte Vorgehensweise zeigt Möglichkeiten auf, wie eine ausgeprägte Proteinflexibilität mit Hilfe computerbasierter Methoden im Rahmen eines virtuellen Screenings explizit berücksichtigt werden kann. Die Studie war auf der einen Seite hinsichtlich methodischer Aspekte von Interesse, da dadurch sowohl eine Beurteilung der Aussagekraft computergenerierter Proteinkonformationen, als auch eine Überprüfung der prinzipiellen Eignung MD-generierter Enzymkonformationen als Template für strukturbasierten Ligandendesignstudien, erfolgen konnte. Auf der anderen Seite war diese Studie aufgrund einer möglichen Erweiterung des bekannten Konformationsraumes der AR auch aus strukturbiologischer Sicht von Interesse. Bei der Suche nach geeigneten Liganden in Moleküldatenbanken kommerziell erhältlicher Verbindungen wurde eine protein- und eine ligandbasierte Strategie verfolgt. Im Rahmen des proteinbasierten Ansatzes erfolgte zunächst eine vergleichende Strukturanalyse verschiedener AR-Ligand-Komplexstrukturen, um Informationen hinsichtlich experimentell aufgeklärter Bindemotive, Protein-Ligand-Interaktionen sowie bestehender struktureller Differenzen zwischen der MD-Konformation und anderen Bindetaschenkonformationen der AR zu sammeln. Anschließend wurde die Bindetasche der MD-generierten Proteinstruktur hinsichtlich günstiger Interaktionspunkte analysiert, um aus den Erkenntnissen Pharmako-phormodelle als Filter für die nachfolgenden virtuellen Datenbanksuchen zu entwickeln. Als Ergänzung zum proteinbasierten Ansatz wurde eine ligandbasierte Strategie für die Identifizierung potenzieller Kandidatenmoleküle verfolgt. Dabei diente ein bekannter AR-Inhibitor als Templatstruktur, bei dem aufgrund zuvor durchgeführter Dockingexperimente die begründete Annahme bestand, dass dieser die Bindetaschenform der MD-Proteinkonfor-mation stabilisieren könnte. Hierbei wurde zunächst eine Moleküldatenbank aus kommerziell erhältlichen Verbindungen, die alle über eine bestimmte Substruktur als Ankergruppe verfügten, aufgebaut und anschließend durch Berechnung molekularer Ähnlichkeiten zu der Templatstruktur auf mögliche Kandidatenmoleküle durchsucht. Die virtuell identifizierten Moleküle der beiden Ansätze wurden im Anschluss mit Hilfe von Dockingsimulationen in die Bindetasche der MD-generierten Proteinkonformation gedockt und die berechneten Bindeposen mit einem Re- und Consensus-Scoringverfahren bewertet. Im nächsten Schritt erfolgte eine Untersuchung der Selektivität der Kandidatenmoleküle anhand eines Cross-Dockingexperiments an verschiedenen Bindetaschenkonformationen der AR. Auf der Grundlage aller durch das virtuelle Screeningverfahren gesammelten Informationen wurde eine finale Molekülauswahl getroffen und sechs kommerziell verfügbare Moleküle für experimentelle Untersuchungen bezogen. Die experimentelle Bestimmung der Enzyminhibition wurde dabei von Kooperationspartnern mit Hilfe eines in vitro Assays untersucht. Aufgrund einer unzureichenden Löslichkeit von vier Substanzen unter den Assaybedingungen konnte lediglich das Inhibitionspotenzial von zwei Verbindungen untersucht werden. Eine der Verbindungen zeigte bemerkenswerterweise eine inhibitorische Aktivität im einstelligen mikromolaren Bereich. Eine finale Beurteilung, ob die Zielsetzung dieser Studie, eine neue computergenerierte Bindetaschenkonformation der AR experi-mentell zugänglich zu machen, durch die vorgeschlagenen Verbindungen erfüllt werden konnte, konnte zum Zeitpunkt der Anfertigung der Dissertation aufgrund ausstehender Kristallstrukturen der jeweiligen AR-Ligand-Komplexe nicht erfolgen und bleibt das Ziel zukünftiger Arbeiten. Die Studie zeigte jedoch deutlich, dass nicht nur experimentell aufgeklärte Proteinstrukturen sondern auch die Nutzung von mit Hilfe computerbasierter Verfahren, wie z.B. mittels MD Simulationen, berechneter Proteinkonformationen als Templatstrukturen für die Identifi-zierung neuer Liganden hilfreich sein kann und daher deren Verwendung für diese Zielsetzung ihre Berechtigung hat. Der zweite Teil der Arbeit handelt von der computergestützten Identifizierung nieder-molekularer Liganden einer neuen potenziellen Bindestelle der biologischen Zielstruktur Hitzeschockprotein 70 (Hsp70), als eine neuartige Klasse von Hsp70-Inhibitoren. Hsp70 spielt eine pathophysiologische Rolle bei verschiedenen Krebserkrankungen sowie diversen weiteren Erkrankungen, wie z.B. neurodegenerativen Erkrankungen und Infektions-krankheiten. Bei der neuen potenziellen Bindestelle, die im Rahmen der vorliegenden Arbeit näher untersucht wurde, handelte es sich um das Interdomäneninterface, der Schnittstelle zwischen der Nukleotid- und Substratbindedomäne von Hsp70. Zum Zeitpunkt der Arbeit waren keine Liganden dieser Proteinregion in der Literatur beschrieben, weshalb es zunächst galt, die Hypothese der Adressierbarkeit dieser Zielregion durch niedermolekulare Liganden zu verifizieren. Hierfür wurde ein virtuelles Screening durchgeführt, bei dem protein- sowie ligandbasierte Suchstrategien zum Einsatz kamen. Im Rahmen des proteinbasierten Ansatzes erfolgte zunächst eine Analyse der Hsp70 Tertiär-struktur auf potenziell vorhandene Ligandenbindestellen. Im Anschluss wurde das Interdomäneninterface auf günstige Interaktionspunkte für bestimmte Atomtypen und funktionelle Gruppen zukünftiger Liganden untersucht. Basierend auf diesen Informationen wurde ein Pharmakophormodell als Filter für nachfolgende virtuelle Datenbanksuchen entwickelt. Bei dem ligandbasierten Ansatz fungierte der bekannte Hsp70-Ligand Apoptozol als Templatstruktur für die virtuelle Datenbanksuche, da die Ergebnisse eines vorab durchge-führten Cross-Dockingexperiments deutlich auf eine Bindung des Moleküls an das Interdomäneninterface hinwiesen. Diese Dockingstudie lieferte erste wertvolle Hinweise hinsichtlich der Bindestelle und potenzieller Bindemodi des Moleküls an Hsp70. Im Anschluss an die virtuellen Datenbanksuchen wurden die identifizierten Kandidaten-moleküle hinsichtlich möglicher Bindemodi und Bindungsaffinitäten mittels Docking-simulationen in Verbindung mit einem Re- und Consensus-Scoringverfahren untersucht. Abschließend wurden neun ausgewählte Kandidatenmoleküle von kommerziellen Anbietern bezogen und mit Hilfe von in vitro Assays von Kooperationspartnern innerhalb der Klinischen Forschergruppe 216 auf ihre zytotoxische Aktivität gegenüber Multiplen Myelomzellen untersucht. Dabei konnte für fünf der neun getesteten Verbindungen bereits bei Konzentrationen im ein- bzw. zweistelligen mikromolaren Bereich eine Aktivität gemessen werden, was einer formalen Trefferquote von 56% entspricht. Weiterhin wurde und wird in Folgearbeiten von Kooperationspartnern versucht, eine Bindung der ausgewählten Kandidatenmoleküle an Hsp70 näher zu charakterisieren und sowohl am separierten Protein, als auch in der Targetzelle nachzuweisen. Darüber hinaus wurde zusätzlich ein fragmentbasierter Ansatz, basierend auf einer bestimmten Substruktur, die als eine Art Ankergruppe fungieren sollte, verfolgt. Dabei diente bei der virtuellen Suche in Moleküldatenbanken kommerzieller Anbieter ein Molekülfragment als Suchanfrage. Aus dem identifizierten Molekülsatz wurden Verbindungen unterschied-lichster struktureller Klassen für nachfolgende Dockingexperimente ausgewählt. Die berechneten Bindeposen wurden einem Re-Scoringverfahren für eine zusätzliche Abschätzung der Bindungsaffinität unterzogen. Schließlich wurden die fünf vielver-sprechendsten Verbindungen für nachfolgende experimentelle Untersuchungen kommerziell bezogen. Die Ergebnisse der nachfolgenden röntgenkristallographischen Aufklärung der Protein-Ligand-Komplexe lagen bei der Anfertigung der vorliegenden Dissertation noch nicht abschließend vor und sind Bestandteil aktueller Forschungarbeiten. Mit den durchgeführten virtuellen Screeningverfahren konnten erstmals potenzielle Liganden des Hsp70-Interdomäneninterfaces als eine neuartige Klasse von Hsp70-Inhibitoren identifiziert werden. Weiterhin können die identifizierten, zytotoxisch aktiven Verbindungen als Leitstrukturen zukünftiger Inhibitordesignstudien dienen, mit dem Ziel sowohl die Zytotoxizität dieser Moleküle zu optimieren, als auch Struktur-Wirkungsbeziehungen für die Entwicklung von Inhibitoren mit verbesserten biologischen Aktivitätsprofilen abzuleiten. Ein weiterer Schwerpunkt der Arbeit lag auf der computerbasierten Charakterisierung der Proteinflexibilität von Hsp70 mit Hilfe von MD Simulationen. In diesem Zusammenhang erfolgte eine Untersuchung intrinsischer Proteinbewegungen sowie des Konformations-raumes anhand von verschiedenen Hsp70-Enzymstrukturen. Die durchgeführten MD Simulationen waren zum Zeitpunkt der Arbeit die ersten Untersuchungen dieser Art, die nicht nur an einer einzelnen Domäne, sondern an ganzen Zweidomänenstrukturen von Hsp70 erfolgten. Die generierten Trajektorien bestätigten die überdurchschnittlich hohe Flexibilität der Zielstruktur Hsp70. Die im Rahmen der Studie identifizierten, zum Zeitpunkt der Arbeit noch nicht beschriebenen Proteinkonformere erweiterten das Spektrum der bekannten Hsp70-Proteinkonformationen erheblich und lieferten mögliche Enzymkonformationen, die als Templatstrukturen für zukünftige strukturbasierte Wirkstoffdesignstudien dienen können. Darüber hinaus stützten die Beobachtungen die Hypothese der prinzipiellen Eignung des Interdomäneninterfaces von Hsp70 als eine Bindestelle für neue Inhibitoren. Auf der Grundlage der gewonnenen Informationen war es weiterhin möglich, eine erste Hypothese hinsichtlich eines potenziellen inhibitorischen Wirkmechanismus der Liganden des Interdomäneninterfaces zu formulieren. Abschließend lässt sich festhalten, dass durch die vorliegende Arbeit viele neue strukturbiologische Erkenntnisse über Hsp70 gewonnen wurden. Dennoch besteht weiterer Forschungsbedarf, um die Strukturbiologie von Hsp70 umfassend aufzuklären. Möglicher-weise können in zukünftigen Studien Enzymstrukturen aufgeklärt werden, die die Existenz der in silico erzeugten und in der Arbeit beschriebenen Proteinkonformere bestätigen. N2 - Proteins are dynamic macromolecular systems, natively existing in different conformations. Particularly proteins with a marked intrinsic flexibility serving as biological targets issue a challenge to computational structure-based drug design even today. This thesis addresses the computer-aided identification of new inhibitors of two structurally highly flexible enzymes which are playing a pathophysiological role in different diseases. Thus, the focus was on the development of virtual screenings that enable considering the protein flexibility adequately. The first part of this thesis describes a virtual screening aiming to identify ligands of a new protein conformation of aldose reductase (AR) that was generated by molecular dynamics (MD) simulations. AR is an enzyme that is related to secondary diseases of diabetes mellitus. The conducted strategy reveals possibilities how pronounced protein flexibility can explicitly be considered by computer-based methods within the scope of a virtual screening. On the one hand, the study was of special interest because of methodical aspects as both an assessment of the significance of computer-generated protein conformations and an examination of the suitability of MD-generated enzyme conformations as templates for structure-based ligand design studies could be made. On the other hand, the study was of interest with regard to structural biology due to a possible expansion of the known conformational space of the enzyme. The identification of suitable ligands out of a database of commercially available compounds was performed with the help of a protein-based as well as a ligand-based approach. During the protein-based approach a comparative structural analysis of different AR-ligand complexes was first done to collect information about experimentally elucidated binding motives, protein-ligand interactions and existing structural differences between the MD-conformation and other existing AR-binding pocket conformations. Afterwards, the binding pocket of the MD-generated protein structure was analysed with regard to favoured interaction sites. These findings served as basis for the development of pharmacophore models serving as a filter in subsequent in silico database screenings. In addition to the protein-based approach a ligand-based strategy was followed to identify potential candidate molecules. A well-known inhibitor of AR served as template structure. Based on previously conducted docking experiments one may assume that this compound might be able to stabilise the binding pocket of the MD-conformation. Consequently, a database of commercially available compounds all containing a certain substructure as anchor group was generated and feasible candidate molecules were searched via calculation of molecular similarities between database molecules and the template structure. All identified compounds were subsequently docked into the binding pocket of the MD-generated protein conformation and predicted binding poses were assessed by a re- and consensus scoring procedure. In the next step selectivity investigations at different AR binding pocket conformations were performed on the basis of a cross-docking experiment. In accordance with all information received during the virtual screening process a final compound selection was made and six commercially available molecules were ordered for further experimental analyses. These experiments were performed by cooperation partners using a well established in vitro assay. As a result of an insufficient solubility of four compounds under the assay conditions, the inhibitory potency of only two molecules could be determined. Remarkably, one compound showed an inhibitory activity at a one-digit micromolar concentration. However, as crystal structures of the particular AR-ligand complexes were pending at the time of preparing the thesis, it was not possible to finally conclude whether the purpose of this study to make a new computationally generated binding pocket conformation of AR experimentally accessible could be achieved. This task remains the aim of future projects. The study clearly demonstrated that not only the use of experimentally elucidated protein structures as template structures can be useful for the identification of new ligands but also the use of structures generated by computer-based procedures like MD simulations. The second part of this thesis is about the computer-aided identification of small ligands of a new potential binding site of the biological target heat shock protein 70 (Hsp70), as a novel Hsp70 inhibitor class. Hsp70 plays a pathophysiological role in different cancer diseases and other diseases such as neuro-degenerative disorders and infectious diseases. The interdomain interface between the nucleotide and the substrate binding domain of Hsp70 represents the new potential binding site and was comprehensively investigated as part of the present thesis. At the time of the study no ligand of this protein region was described in the literature. Thus, the hypothesis whether the target site represents an addressable binding site was needed to be proven by small ligands. For this purpose a virtual screening was conducted by using both protein- and ligand-based search strategies. During the protein-based approach, the tertiary structure of Hsp70 was analysed with regard to potentially existing ligand binding sites. Subsequently, the interdomain interface was scanned to identify favourable interaction sites of specific atom types and functional groups of future ligands. Based on the gathered information a pharmacophore model was developed, serving as a query in following in silico database screenings. The known Hsp70 ligand Apoptozol was of use as template structure for virtual database screenings as results of a previously performed cross-docking experiment indicated that the molecule binds to the interdomain interface. The study provided initial valuable hints about the binding site and potential binding modes of the molecule at Hsp70. After database screenings the identified candidate molecules were tested with regard to their possible binding modes and binding affinities by docking simulations combined with a re- and a consensus scoring procedure. Finally, nine selected compounds were purchased from commercial suppliers and their cytotoxic activity towards multiple myeloma cells was tested in an in vitro assay by cooperation partners of the clinical research group 216. Thereby, five out of nine tested compounds showed a cytotxic activity at one- to two-digit micromolar concentrations, resulting in a formal hit rate of 56%. Ongoing research projects are being made to further characterise the binding of the chosen molecules to Hsp70 and to verify the binding to both the isolated protein and the protein inside the target cells. Furthermore, a fragment-based approach was followed based on a specific substructure that might be serving as an anchor group for a targeted binding to the interdomain interface. A molecular fragment served as query during the virtual search in several compound databases of commercial suppliers. Out of the resulting molecule collection, only members of different, most diverse structural classes were chosen for subsequent docking experiments. As a next step, the calculated binding poses were submitted to a re-scoring procedure to verify the particular binding affinities. Finally, the five most promising compounds were purchased for further experimental analyses. The results of the X-ray crystallography to determine the respective protein-ligand complexes were not finally available at the time of preparing the present thesis and related experiments are still the subject of current research work. With the performed virtual screenings it was possible for the first time to identify potential ligands of the Hsp70 interdomain interfaces as a novel class of Hsp70 inhibitors. Further on, the identified, cytotoxic active compounds might serve as lead structures in future inhibitor design studies that aim to optimise the cytoxicity of these molecules as well as to deduce structure-activity relationships from ligand series for the development of inhibitors that have more favourable biological activity profiles. Another emphasis of the thesis was on the computer-based characterisation of the protein flexibility of Hsp70 with the help of MD simulations. In this context an analysis of intrinsic protein dynamics together with the conformational space was done on the basis of different Hsp70 enzyme structures. At the time of the work, the conducted MD simulations were the first of this type which addressed Hsp70 two-domain-structures instead of structures of separated protein domains. Thus, this thesis provided initial insights into potential intrinsic protein movements. The evaluation of the generated trajectories confirmed the high flexibility of Hsp70. Thereby, at the time of the study so far unknown protein conformations could be identified that considerably expanded the spectrum of known Hsp70 protein conformations and proposed possible enzyme conformations that might be used as template structures for future structure-based drug design studies. Furthermore, the observations supported the hypothesis that the Hsp70 interdomain interface may principally be suitable as a binding site for new inhibitors. In the light of all this information, it was possible to postulate a first hypothesis about a potential mechanism of action of an enzyme inhibition by ligands of the interdomain interface. In summary, the present thesis revealed various aspects with regard to the structural biological elucidation of Hsp70. Nevertheless, structural analyses of Hsp70 will be ongoing in the future. It might be possible that in future studies enzyme structures will be identified that confirm the existence of the in silico generated protein conformers, described in the present thesis. KW - Arzneimittelforschung KW - Hitzeschock-Proteine KW - Enzyminhibitor KW - Molekulardesign KW - Strukturbasiertes Wirkstoffdesign KW - molekulardynamische Simulationen KW - virtuelles Screening KW - structure-based drug design KW - molecular dynamics KW - virtual screening Y1 - 2016 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-147103 ER - TY - THES A1 - Zilian, David T1 - Neuartige, empirische Scoring-Modelle für Protein-Ligand-Komplexe und computergestützte Entwicklung von Hsp70-Inhibitoren T1 - Novel empirical scoring-functions for protein-ligand complexes and computer-aided development of Hsp70 inhibitors N2 - Techniken des computergestützten Wirkstoffdesigns spielen eine wichtige Rolle bei der Entwicklung neuer Wirkstoffe. Die vorliegende Arbeit befasst sich sowohl mit der Entwicklung als auch mit der praktischen Anwendung von Methoden des strukturbasierten Wirkstoffdesigns. Die Arbeit glieder sich daher in zwei Teile. Der erste Teil beschäftigt sich mit der Entwicklung von empirischen Scoring-Funktionen, die eine Schlüsselrolle im strukturbasierten computergestützen Wirkstoffdesign einnehmen. Grundlage dieser Arbeiten sind die empirischen Deskriptoren und Scoring-Funktionen aus dem SFCscore-Programmpaket. Dabei wurde zunächst untersucht, wie sich die Zusammensetzung der Trainingsdaten auf die Vorhersagen von empirischen Scoring-Funktionen auswirkt. Durch die gezielte Zusammenstellung eines neuen Trainingsdatensatzes wurde versucht, die Spannweite der Vorhersagen zu vergrößern, um so vor allem eine bessere Erkennung von hoch- und niedrig-affinen Komplexen zu erreichen. Die resultierende Funktion erzielte vor allem im niedrig-affinen Bereich verbesserte Vorhersagen. Der zweite Themenkomplex beschäftigt sich ebenfalls mit der verbesserten Separierung von aktiven und inaktiven Verbindungen. Durch den Einsatz der Machine Learning-Methode RandomForest wurden dazu Klassifizierungsmodelle abgeleitet, die im Unterschied zu den klassischen Scoring-Funktionen keinen genauen Score liefern, sondern die Verbindungen nach ihrer potentiellen Aktivität klassifizieren. Am Beispiel des mykobakteriellen Enzyms InhA konnte gezeigt werden, dass derartige Modelle den klassischen Scoring-Funktionen im Bezug auf die Erkennung von aktiven Verbindungen deutlich überlegen sind. Der RandomForest-Algorithmus wurde im nächsten Schritt auch verwendet, um eine neue Scoring-Funktion zur Vorhersage von Bindungsaffinitäten abzuleiten. Diese Funktion wurde unter dem Namen SFCscoreRF in das SFCscore-Programmpaket implementiert. Die Funktion unterschiedet sich in einigen wesentlichen Punkten von den ursprünglichen SFCscore-Funktionen. Zum einen handelt es sich beim RF-Algorithmus um eine nicht-lineare Methode, die im Unterschied zu den klassischen Methoden, die zur Ableitung von Scoring-Funktionen eingesetzt werden, nicht von der Additivität der einzelnen Deskriptoren ausgeht. Der Algorithmus erlaubt außerdem die Verwendung aller verfügbaren SFCscore-Deskriptoren, was eine deutlich umfassendere Repräsentation von Protein-Ligand-Komplexen als Grundlage des Scorings ermöglicht. Für die Ableitung von SFCscoreRF wurden insgesamt 1005 Komplexe im Trainingsdatensatz verwendet. Dieser Datensatz ist somit einer der größten, die bisher für die Ableitung einer empirischen Scoring-Funktion verwendet wurden. Die Evaluierung gegen zwei Benchmark-Datensätze ergab deutlich bessere Vorhersagen von SFCscoreRF im Vergleich zu den ursprünglichen SFCscore-Funktionen. Auch im internationalen Vergleich mit anderen Scoring-Funktion konnten für beide Datensätze Spitzenwerte erreicht werden. Weitere ausgiebige Testungen im Rahmen einer Leave-Cluster-Out-Validierung und die Teilnahme am CSAR 2012 Benchmark Exercise ergaben, dass auch SFCscoreRF Performanceschwankungen bei der Anwendung an proteinspezifischen Datensätzen zeigt - ein Phänomen, dass bei Scoring-Funktionen immer beobachtet wird. Die Analyse der CSAR 2012-Datensätze ergab darüber hinaus wichtige Erkenntnisse im Bezug auf Vorhersage von gedockten Posen sowie über die statistische Signifikanz bei der Evaluierung von Scoring-Funktionen. Die Tatsache, dass empirische Scoring-Funktionen innerhalb eines bestimmten chemischen Raums trainiert wurden, ist ein wichtiger Faktor für die protein-abhängigen Leistungsschwankungen, die in dieser Arbeit beobachtet wurden. Verlässliche Vorhersagen sind nur innerhalb des kalibrierten chemischen Raums möglich. In dieser Arbeit wurden verschiedene Ansätze untersucht, mit denen sich diese ``Applicability Domain'' für die SFCscore-Funktionen definieren lässt. Mit Hilfe von PCA-Analysen ist es gelungen die ``Applicability Domain'' einzelner Funktionen zu visualisieren. Zusätzlich wurden eine Reihe numerischer Deskriptoren getestet, mit den die Vorhersageverlässlichkeit basierend auf der ``Applicability Domain'' abgeschätzt werden könnte. Die RF-Proximity hat sich hier als vielversprechender Ausgangspunkt für weitere Entwicklungen erwiesen. Der zweite Teil der Arbeit beschäftigt sich mit der Entwicklung neuer Inhibitoren für das Chaperon Hsp70, welches eine vielversprechende Zielstruktur für die Therapie des multiplen Myeloms darstellt. Grundlage dieser Arbeiten war eine Leitstruktur, die in einer vorhergehenden Arbeit entdeckt wurde und die vermutlich an einer neuartigen Bindestelle in der Interface-Region zwischen den beiden großen Domänen von Hsp70 angreift. Die Weiterentwicklung und Optimierung dieser Leitstruktur, eines Tetrahydroisochinolinon-Derivats, stand zunächst im Vordergrund. Anhand detaillierter Docking-Analysen wurde der potentielle Bindemodus der Leitstruktur in der Interfaceregion von Hsp70 untersucht. Basierend auf diesen Ergebnissen wurde eine Substanzbibliothek erstellt, die von Kooperationspartnern innerhalb der KFO 216 synthetisiert und biologisch getestet wurde. Die Struktur-Wirkungsbeziehungen, die sich aus diesen experimentellen Daten ableiten lassen, konnten teilweise gut mit den erstellten Docking-Modellen korreliert werden. Andere Effekte konnten anhand der Docking-Posen jedoch nicht erklärt werden. Für die Entwicklung neuer Derivate ist deswegen eine umfassendere experimentelle Charakterisierung und darauf aufbauend eine Verfeinerung der Bindungsmodelle notwendig. Strukturell handelt es sich bei Hsp70 um ein Zwei-Domänen-System, dass verschiedene allostere Zustände einnehmen kann. Um die Auswirkungen der daraus folgenden Flexibilität auf die Stabilität der Struktur und die Bindung von Inhibitoren zu untersuchen, wurden molekulardynamische Simulationen für das Protein durchgeführt. Diese zeigen, dass das Protein tatsächlich eine überdurchschnittlich hohe Flexibilität aufweist, die vor allem durch die relative Bewegung der beiden großen Domänen zueinander dominiert wird. Die Proteinkonformation die in der Kristallstruktur hscaz beobachtet wird, bleibt jedoch in ihrer Grundstruktur in allen vier durchgeführten Simulationen erhalten. Es konnten hingegen keine Hinweise dafür gefunden werden, dass die Mutationen, welche die für die strukturbasierten Arbeiten verwendete Kristallstruktur im Vergleich zum Wildtyp aufweist, einen kritischen Einfluss auf die Gesamtstabilität des Systems haben. Obwohl die Interface-Region zwischen NBD und SBD also in allen Simulationen erhalten bleibt, wird die Konformation in diesem Bereich doch wesentlich durch die Domänenbewegung beeinflusst und variiert. Da dieser Proteinbereich den wahrscheinlichsten Angriffspunkt der Tetrahydroisochinolinone darstellt, wurde der Konformationsraum detailliert untersucht. Wie erwartet weist die Region eine nicht unerhebliche Flexibilität auf, welche zudem, im Sinne eines ``Induced-Fit''-Mechanismus, durch die Gegenwart eines Liganden (Apoptozol) stark beeinflusst wird. Es ist daher als sehr wahrscheinlich anzusehen, dass die Dynamik der Interface-Region auch einen wesentlichen Einfluss auf die Bindung der Tetrahydroisochinolinone hat. Molekuardynamische Berechnungen werden deswegen auch in zukünftige Arbeiten auf diesem Gebiet eine wichtige Rolle spielen. Die Analysen zeigen zudem, dass die Konformation der Interface-Region eng mit der Konformation des gesamten Proteins - vor allem im Bezug auf die relative Stellung von SBD und NBD zueinander - verknüpft ist. Das untermauert die Hypothese, dass die Interface-Bindetasche einen Angriffspunkt für die Inhibtion des Proteins darstellt. N2 - Methods of computational drug design play a crucial role in the development of new pharmaceutical drugs. The work presented here comprises the methodological development and the practical application of structure-based techniques in computational drug design. The first part of this dissertation focuses on the development of empirical scoring functions, which play an essential part in structure-based computer-aided drug design. The basis for this work are the empirical descriptors and scoring functions of the SFCscore software package. First, the influence of the training data composition on the prediction of empirical scoring functions was analyzed. A new training data set was created to spread the prediction range of the function and thus achieve a better separation of high and low affinity binders. The resulting function indeed yielded better predictions in the low affinity area compared to the original functions. In another approach, which also addresses the issue of discriminating active and inactive compounds, the Machine Learning method RandomForest (RF) was used to derive a classification model. Different to classical empirical scoring functions, this model no longer predicts a precise value but classifies the compounds according to their potential affinity as 'active' or 'inactive'. The example of the mycobacterial enzyme InhA showed that such models are clearly superior to different classical scoring function in terms of separating active and inactive compounds. The RandomForest algorithm was also used to derive a new scoring function for the prediction of binding affinities. This new function was implemented into the SFCscore software package under the name SFCscoreRF. This new function differs from the original SFCscore functions in several essentials points. On the one hand, the RF-algorithm is a non-linear method, which - in contrast to classical methods used for the derivation of empirical scoring functions - does not assume the additivity of the single descriptors. On the other hand, the algorithm allowes for using the whole set of available SFCscore descriptors and is therefore able to utilize a more comprehensive representation of a protein ligand complex as the basis for the prediction. Additionally, the training data set used to derive SFCscoreRF comprised 1005 complexes. This training set is one of the largest data sets used to train an empirical scoring function. The evaluation against two widely-used benchmark sets confirmed that SFCscoreRF yields superior predicitons as compared to the original functions. The comparison with other functions tested for these benchmarks shows that SFCscoreRF also achieves top results on an international level. Further analyses using a leave-cluster-out validation scheme and the participation in the CSAR 2012 Benchmark Exercise revealed that - similar to other scoring functions - SFCscoreRF shows varying performances when applied to protein-specific data sets. Additionally, by analysing the results of the CSAR 2012 data sets, valuable insight were gained regarding the prediction of docking poses and the statistical significance for the evaluation and comparison of scoring functions. The fact that empirical scoring functions are trained within a certain chemical space, is an important reason for the target-dependent performance observed in this work. Reliable predictions can only be expected within the calibrated area. Different approaches for the definition of this ``applicability domain'' are presented in this work. PCA analyses have been used to create a two dimensional representation of the ``applicability domain''. Additionally, different numerical descriptors have been tested to estimate the reliability of SFCscore predicitons. The RF-proximity has been found to be a promising starting point for future research. The development of new inhibitors for the molecular chaperone Hsp70 - a promising target in the therapy of multiple myeloma - comprises the second part of this dissertation. The basis for this work was a lead structure that was found in a previous work and attacks a novel binding pocket in the interface between the two domains of the Hsp70 protein. The optimization and development of that lead structure - a tetrahydroisochinolinone - was the primary focus of the present work. Potential binding poses in the interface were elucidated by detailed docking analyses. Based on that information, a compound library was compiled, which was synthezised and biologically analyzed by cooperation partners within the CRU 216. The resulting structure activity relationships can partially be explained on the basis of the corresponding docking poses. However, some of the effects remain unexplained. For the further development of new derivatives a comprehensive experimental characterization of the current compounds is needed. This information can be used as a basis for the refinement of the existing binding models. Hsp70 is a two-domain system, which can visit different allosteric states. To further investigate the effects of the resulting flexibility on the stability of the structure and on inhibitor binding, molecular dynamics simulations were conducted. These simulations show an above-average felxibility of the protein, which is primarily dominated by the movement of the two domains NBD and SBD relatively to each other. However, the basic conformation that is observed in the crystal structure hscaz, which was used in this work, remains stable in all simulations. Furthermore, the trajectories showed no evidence that the mutations, in which hscaz differs from the wild type protein, have a significant effect on the overall protein conformation. Although, the overall conformation of the interface between NDB and SBD remains stable, the exact conformation in this area is signficantly influenced by the domain movement. As this region includes the binding pocket of the tetrahydroisochinolinones, the conformational space of this area was analyzed in detail. The analyses expectedly reveal a high flexibility in the interface area that is dominated by the SBD-NBD movement. Furthermore, it could be shown that the conformation and dynamics can be influenced by a bound ligand (apoptozole), in terms of an induced fit mechanism. It is highly probable that the binding of the tetrahydroisochinolinones trigger similar effects, influencing the binding mechanism of this compound class. Thus, molecular dynamics simulations should play a crucial role in the future development of new compounds. The analyses also show that the dynamics of the interface region have large effects on the overall structure of the protein and vice versa. Especially, the relative orientation of NBD and SBD has a large impact on the binding pocket. This underlines the hypothesis that the interface region constitutes a promising target area for the inhibition of Hsp70. KW - Arzneimittelforschung KW - Strukturbasiertes Wirkstoffdesign KW - Structure-based drug design KW - Computational chemistry KW - Molekulardesign KW - Proteine KW - Hitzeschock-Proteine KW - Scoring-Funktionen KW - Docking KW - molekulardynamische Simulationen KW - Hsp70 KW - Strukturoptimierung KW - scoring functions KW - molecular dynamics KW - lead structure optimization KW - Ligand KW - Maschinelles Lernen Y1 - 2014 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-105055 ER - TY - THES A1 - Hein, Michael T1 - Entwicklung computergestützter Methoden zur Bewertung von Docking-Lösungen und Entwurf niedermolekularer MIP-Inhibitoren T1 - Development of computer-aided methods for the evaluation of docking poses and design of small-molecule MIP inhibitors N2 - Dockingbasierte Ansätze zählen zu den wichtigsten Komponenten im virtuellen Screening. Sie dienen der Vorhersage der Ligandposition und -konformation in der Bindetasche sowie der Abschätzung der Bindungsaffinität zum Protein. Bis heute stellt die korrekte Identifizierung proteingebundener Ligandkonformationen ein noch nicht vollständig gelöstes Problem für Scoringfunktionen dar. Der erste Teil der vorliegenden Arbeit ist daher der Entwicklung computergestützter Methoden zur Bewertung von Docking-Lösungen gewidmet. Der Fokus eines ersten Teilprojektes lag auf der Berücksichtigung der Absättigung vergrabener Wasserstoffbrückenakzeptoren (HBA) und -donoren (HBD) bei der Bewertung von Docking-Lösungen. Nicht-abgesättigte vergrabene HBA und HBD stellen einen der Bindungsaffinität abträglichen Beitrag dar, der bis dato aufgrund fehlender Struktur- bzw. Affinitätsdaten in Scoringfunktionen vernachlässigt wird. Im Rahmen der vorliegenden Arbeit wurde auf der Basis einer detaillierten Untersuchung zur Häufigkeit vergrabener nicht-abgesättigter HBA und HBD in hochaufgelösten Protein-Ligand-Komplexen des Hartshorn-Datensatzes eine empirische Filterfunktion („vnaHB“-Filterfunktion) entwickelt, die unerwünschte Ligandbindeposen erkennt und von der Bewertung mittels Scoringfunktionen ausschließt. Der praktische Nutzen der empirischen Filterfunktion wurde für die Scoringfunktionen SFCscore und DSX anhand vorgenerierter Docking-Lösungen des Cheng-Datensatzes untersucht. Die Häufigkeitsuntersuchung zeigt, dass eine Absättigung vergrabener polarer Gruppen in Protein-Ligand-Komplexen für eine hochaffine Protein-Ligand-Bindung notwendig ist, da vergrabene nicht-abgesättigte HBA und HBD nur selten auftreten. Eine vollständige Absättigung durch entsprechende Proteinpartner wird für ca. 48 % der untersuchten Komplexe beobachtet, ca. 92 % weisen weniger als drei hauptsächlich schwache, nicht-abgesättigte HBA bzw. HBD (z. B. Etherfunktionen) auf. Unter Einbeziehung von Wassermolekülen in die Häufigkeitsanalyse sind sogar für ca. 61 % aller Komplexe alle wasserstoffbrückenbindenden Gruppen abgesättigt. Im Gegensatz zu DSX werden für SFCscore nach Anwendung der empirischen Filterfunktion erhöhte Erfolgsraten für das Auffinden einer kristallnahen Pose (≤ 2.0 Å Abweichung) unter den am besten bewerteten Docking-Posen erzielt. Für die beste SFCscore-Funktion (SFCscore::229m) werden Steigerungen dieses als „Docking Power“ bezeichneten Kriteriums für die Top-3-Posen (Erfolgsrate für die Identifizierung einer kristallnahen 2.0 Å Pose unter den besten drei Docking-Lösungen) von 63.1 % auf 64.2 % beobachtet. In einem weiteren Teilprojekt wurden repulsive Protein-Ligand-Kontakte infolge sterischer Überlappungen der Bindungspartner bei der Bewertung von Docking-Lösungen berücksichtigt. Die adäquate Einbeziehung solcher repulsiver Kontakte im Scoring ist für die Identifizierung proteingebundener Ligandkonformationen entscheidend, jedoch aufgrund fehlender Affinitäts- bzw. Strukturdaten problematisch. Im Rahmen der vorliegenden Arbeit wurde auf der Basis des Lennard-Jones-Potentiales des AMBER-Kraftfeldes zunächst ein neuer Deskriptor zur Beschreibung repulsiver Kontakte („Clash“-Deskriptor) entwickelt und zur Untersuchung der Häufigkeit ungünstiger Protein-Ligand-Kontakte in hochaufgelösten Protein-Ligand-Komplexen des Hartshorn-Datensatzes herangezogen. Eine aus der Häufigkeitsverteilung abgeleitete empirische Filterfunktion („Clash“-Filterfunktion) wurde anschließend der Bewertung von Docking-Lösungen des Cheng-Datensatzes mittels der Scoringfunktionen SFCscore und DSX vorgeschaltet, um unerwünschte Ligandbindeposen auszuschließen. Die Häufigkeitsuntersuchung zeigt, dass vorwiegend schwache repulsive Kontakte in Protein-Ligand-Komplexen auftreten. So werden in 75 % der Komplexe des Hartshorn-Datensatzes abstoßende Potentiale unter 0.462 kcal/mol beobachtet. Zwar betragen die ungünstigen Beiträge pro Komplex für 50 % aller Strukturen ca. 0.8 kcal/mol bis 2.5 kcal/mol, jedoch können diese auf Ungenauigkeiten der Kristallstrukturen zurückzuführen sein bzw. durch günstige Protein-Ligand-Wechselwirkungen kompensiert werden. Die Anwendung der „Clash“-Filterfunktion zeigt signifikante Verbesserungen der Docking Power für SFCscore. Für die beste SFCscore-Funktion (SFCscore::frag) werden Steigerungen der Erfolgsraten für das Auffinden einer kristallnahen Pose unter den drei am besten bewerteten Docking-Lösungen von 61.4 % auf 86.9 % erzielt, was an die Docking Power der bis dato besten Scoringfunktionen aus der Literatur (z. B. DSX, GlideScore::SP) heranreicht (Docking Power (DSX): 92.6 %; Docking Power (GlideScore::SP): 86.9 %). Die „Clash“-Filterfunktion allein ist auch der Kombination der „Clash“- und der „vnaHB“-Filterfunktion überlegen. Ein weiterer Schwerpunkt der vorliegenden Arbeit wurde auf die Einbeziehung von Decoy-Daten (Struktur- und Affinitätsdaten schwach affiner und inaktiver Liganden) im Zuge der Entwicklung computergestützter Methoden zur Bewertung von Docking-Lösungen gelegt. Dadurch soll eine adäquate Berücksichtigung ungünstiger Beiträge zur Bindungsaffinität ermöglicht werden, die für die Richtigkeit und Zuverlässigkeit ermittelter Vorhersagen essentiell ist. In der vorliegenden Arbeit wurden binäre Klassifizierungsmodelle zur Bewertung von Docking-Lösungen entwickelt, die die Einbeziehung von Decoy-Daten ohne die Verfügbarkeit von Affinitätsdaten erlauben. Der Random-Forest-Algorithmus (RF), SFCscore-Deskriptoren, der neu entwickelte „Clash“-Deskriptor, und die Decoy-Datensätze von Cheng und Huang (Trainingsdaten) bilden die Grundlage des leistungsfähigsten Klassifizierungsmodells. Der praktische Nutzen des „besten“ RF-Modells wurde nach Kombination mit der Scoringfunktion DSX anhand der Docking Power für das Auffinden einer kristallnahen Pose auf Rang 1 am unabhängigen Cheng-/Huang- (Komplexe, die nicht in den Trainingsdaten enthalten sind) und CSAR-2012-Testdatensatz untersucht. Gegenüber einer alleinigen Anwendung von DSX werden an beiden Testdatensätzen weitere Verbesserungen der Docking Power erzielt (Cheng-/Huang-Testdatensatz: DSX 84.24 %, RF 87.27 %; CSAR-2012-Testdatensatz: DSX 87.93 %, RF 91.38 %). Das „beste“ Modell zeichnet sich durch die zuverlässige Vorhersage richtig-positiver Docking-Lösungen für einige wenige Komplexe aus, für die DSX keine kristallnahe Ligandkonformation identifizieren kann. Ein visueller Vergleich der jeweils am besten bewerteten RF- und DSX-Pose für diese Komplexe zeigt Vorteile des RF-Modells hinsichtlich der Erkennung für die Protein-Ligand-Bindung essentieller Wechselwirkungen. Die Untersuchung der Bedeutung einzelner SFCscore-Deskriptoren für die Klassifizierung von Docking-Lösungen sowie die Analyse der Misserfolge nach Anwendung des Modells geben wertvolle Hinweise zur weiteren Optimierung der bestehenden Methode. Hinsichtlich der zu bewertenden Eigenschaften ausgeglichenere Trainingsdaten, Weiterentwicklungen bestehender SFCscore-Deskriptoren sowie die Implementierung neuer Deskriptoren zur Beschreibung bis dato nicht-berücksichtigter Beiträge zur Bindungsaffinität stellen Ansatzpunkte zur Verbesserung dar. Der zweite Teil der vorliegenden Arbeit umfasst die Anwendung dockingbasierter Methoden im Rahmen der Entwicklung neuer Inhibitoren des „Macrophage Infectivity Potentiator“-(MIP)-Proteins von Legionella pneumophila und Burkholderia pseudomallei. Das MIP-Protein von Legionella pneumophila stellt einen wichtigen Virulenzfaktor und daher ein attraktives Zielprotein für die Therapie der Legionellose dar. Im Rahmen der vorliegenden Arbeit erfolgten systematische Optimierungen des Pipecolinsäure-Sulfonamides 1, des bis dato besten niedermolekularen MIP-Inhibitors (IC50 (1): 9 ± 0.7 µM). Nach Hot-Spot-Analysen der Bindetasche wurden Docking-Studien zur Auswahl aussichtsreicher Kandidaten für die Synthese und Testung auf MIP-Inhibition durchgeführt. Die Ergebnisse der Hot-Spot-Analysen zeigen günstige Wechselwirkungsbereiche für Donorgruppen und hydrophobe Substituenten in meta-Position sowie Akzeptorgruppen in para-Position des Benzylringes von 1 auf. Die Einführung einer Nitrofunktion in para-Position des Benzylringes von 1 (2h) resultiert in einer erhöhten MIP-Inhibition (IC50 (2h): 5 ± 1.5 µM), was wahrscheinlich auf die Ausbildung einer zusätzlichen Wasserstoffbrücke zu Gly116 zurückzuführen ist. Selektivitätsverbesserungen gegenüber dem strukturverwandten humanen FKBP12-Protein werden insbesondere für das para-Aminoderivat von 1 (2n) erzielt (Selektivitätsindex (1): 45, Selektivitätsindex (2n): 4.2; mit Selektivitätsindex = IC50 (MIP)/IC50 (FKBP12)). Der Ersatz des hydrophoben Trimethoxyphenylrestes von 1 durch einen Pyridinring (2s) führt zu einer verbesserten Löslichkeit bei vergleichbarer MIP-Inhibition. Das MIP-Protein von Burkholderia pseudomallei spielt eine wichtige Rolle in der Pathogenese der Melioidose und stellt daher ein attraktives Zielprotein für die Entwicklung neuer Arzneistoffe dar. In der vorliegenden Arbeit erfolgten Optimierungen des bis dato besten niedermolekularen MIP-Inhibitors 1. Ausgehend von einem Strukturvergleich von Burkholderia pseudomallei MIP mit Legionella pneumophila MIP und einer Hot-Spot-Analyse der Burkholderia pseudomallei MIP-Bindetasche wurden Docking-Studien zur Auswahl aussichtsreicher Kandidaten für die Synthese und Testung auf MIP-Inhibition durchgeführt. Der Strukturvergleich zeigt eine hohe Homologie beider Bindetaschen. Größere konformelle Änderungen werden lediglich für den von Ala94, Gly95, Val97 und Ile98 geformten Bindetaschenbereich beobachtet, was unterschiedliche Optimierungsstrategien für 1 erforderlich macht. Günstige Wechselwirkungsbereiche der Burkholderia pseudomallei MIP-Bindetasche finden sich einerseits für Donorgruppen oder hydrophobe Substituenten in para-Position des Benzylringes (Region A) von 1, andererseits für Akzeptor- bzw. Donorgruppen in para- bzw. meta-/para-Position des Trimethoxyphenylringes (Region B). Anhand von Docking-Studien konnten sowohl für Variationen in Region A als auch in Region B aussichtsreiche Kandidaten identifiziert werden. Initiale MIP-Inhibitionsmessungen der bis dato synthetisierten Derivate deuten auf erhöhte Hemmungen im Vergleich zu 1 hin. Der Ersatz des hydrophoben Trimethoxyphenylrestes von 1 durch einen Pyridinring führt auch hier zu vergleichbarer MIP-Inhibition bei verbesserter Löslichkeit. Derzeit sind weitere Synthesen und Testungen aussichtsreicher Liganden durch die Kooperationspartner geplant. Die Ergebnisse der Inhibitionsmessungen sollen deren Nutzen als MIP-Inhibitoren aufzeigen und wertvolle Informationen für weitere Zyklen des strukturbasierten Wirkstoffdesigns liefern. N2 - Docking-based approaches belong to important virtual screening components and aim at predicting both the ligand position and conformation within the protein binding site as well as the binding affinity. To date scoring functions are still not fully reliable in correctly identifying near-native ligand conformations generated by docking. Thus, the first part of the current work is dedicated to the development of computer-aided methods for the evaluation of docking poses. A first project focused on considering the saturation of hydrogen bond acceptors (HBA) and donors (HBD) for the evaluation of docking poses. Since structural and affinity data are missing, current scoring functions neglect unpaired buried HBA and HBD, which strongly disfavour high-affinity binding. Based on a detailed frequency analysis of unpaired buried HBA and HBD within high-quality protein-ligand complexes of the Hartshorn dataset, an empirical filter function (“vnaHB” filter function) was developed to remove unfavourable ligand binding poses prior to the ranking with scoring functions. The practical benefit of the filter function was investigated for the scoring functions SFCscore and DSX using pre-generated docking poses of the Cheng dataset. As shown in the frequency analysis, the saturation of buried polar groups is of utmost importance for high-affinity binding, as unpaired buried HBA and HBD are extremely rare. A complete saturation by proper protein counterparts is observed for about 48 % of all complexes under study, whereas approximately 92 % have less than three, mostly weak unpaired buried HBA or HBD (e.g. ether functions). Including also the saturation by water molecules reveals that actually for about 61 % of all complexes every hydrogen bonding group is saturated. Unlike DSX, the application of the filter function with SFCscore results in higher success rates for identifying a near-native 2.0 Å pose under the top scored poses, a criterion termed “Docking Power”. For the best SFCscore function (SFCscore::229m) the Docking Power with respect to the top three poses increases from 63.1 % to 64.2 %. A further project focused on considering repulsive intermolecular contacts due to sterical overlap of the protein-ligand binding partners for the evaluation of docking poses. Although an inclusion of such repulsive contacts in scoring is of utmost importance for the identification of protein-bound ligand conformations, it remains challenging because of missing structural and affinity data. Based on the Lennard-Jones potential of the AMBER force field a new descriptor accounting for repulsive protein-ligand contacts (“clash” descriptor) was developed and used for analysing the frequency of unfavourable protein-ligand contacts among high-quality structures of the Hartshorn dataset. An empirical filter function (“clash” filter function) derived from the frequency distribution was applied to pre-generated docking poses of the Cheng dataset to remove unfavourable ligand binding poses prior to the ranking with SFCscore and DSX. As shown in the frequency analysis, mostly weakly repulsive contacts occur within protein-ligand complexes. For 75 % of the complexes of the Hartshorn dataset repulsive potentials of less than 0.462 kcal/mol are observed. Indeed, unfavourable contributions add up to not more than 0.8 kcal/mol to 2.5 kcal/mol per complex for 50 % of all structures; values in this range may be attributed to inaccuracies of crystal structures or could be counterbalanced by favourable protein-ligand interactions. The application of the “clash” filter function shows significant improvements of the Docking Power of SFCscore. For the best SFCscore function (SFCscore::frag) the success rates for identifying a near-native 2.0 Å pose under the three top scored poses increases from 61.4 % to 86.9 %, which is comparable to the Docking Power of the best scoring functions (e.g. DSX, GlideScore::SP) currently available in literature (Docking Power (DSX): 92.6 %; Docking Power (GlideScore::SP): 86.9 %). The “clash” filter function alone is also superior to the combination of the “clash” and the “vnaHB” filter function. Another focus of the work was the inclusion of decoy data (structure and affinity data of weakly active and inactive ligands) in scoring function development. Thus, unfavourable contributions to the binding affinity should be adequately considered, which appears essential for improving accuracy and reliability of the predictions. Within the scope of this work a binary classification model was developed for the evaluation of docking poses, allowing the inclusion of decoy poses without affinity data. The random forest algorithm (RF), SFCscore descriptors, the new “clash” descriptor, and the decoy datasets of Cheng and Huang (training data) provide the basis of the best-performing model. The practical benefit of the “best” RF model was investigated after combination with the scoring function DSX based on the Docking Power for identifying a near-native pose on rank 1 using the independent Cheng/Huang (only complexes not used for training) and the CSAR-2012 dataset. With respect to the standalone application of DSX, improvements of the Docking Power regarding both test sets are achieved (Cheng/Huang test set: DSX 84.24 %, RF 87.27 %; CSAR-2012 test set: DSX 87.93 %, RF 91.38 %). A key feature of the “best” model are reliable predictions of true positive docking poses for those complexes for which DSX fails to identify a near-native ligand conformation. A visual comparison of the best RF and DSX pose highlights advantages of the RF model regarding the recognition of interactions crucial for protein-ligand binding. The importance analysis of SFCscore descriptors for the classification of docking poses as well as the investigation of failures after model application provide useful hints for further improvements. Thus, more property-balanced training data, the further development of established SFCscore descriptors, and the implementation of new descriptors accounting for neglected contributions to the binding affinity constitute possible starting points for future improvements. The second part of this work is dedicated to the application of docking-based methods for the development of new inhibitors of the "`Macrophage Infectivity Potentiator"'-(MIP) proteins of Legionella pneumophila and Burkholderia pseudomallei. The MIP protein of Legionella pneumophila constitutes an important virulence factor and thus an attractive target for the treatment of legionellosis. Within the scope of this work the pipecolic acid sulfonamide 1, one of the best small-molecule MIP inhibitors to date (IC50 (1): 9 ± 0.7 µM), was systematically optimised. After hot spot analysis of the binding pocket, docking studies were conducted to select promising candidates for synthesis and testing MIP inhibition. The results of the hot spot analysis show favourable interaction fields for donor groups and hydrophobic substituents in meta position as well as acceptor groups in para position of the benzyl ring of 1. Introducing a nitro function in para position of the benzyl ring of 1 (2h) results in an increased MIP inhibition (IC50 (2h): 5 ± 1.5 µM), which is likely due to the formation of an additional hydrogen bond to Gly116. An improvement in the selectivity compared to the structurally related human FKBP12 protein is achieved particularly with the para amino derivative of 1 (2n) (selectivity index (1): 45, selectivity index (2n): 4.2, where the selectivity index = IC50 (MIP)/IC50 (FKBP12)). Replacing the hydrophobic trimethoxyphenyl residue of 1 with a pyridine ring (2s) leads to improved solubility and comparable MIP inhibition. The MIP protein of Burkholderia pseudomallei plays an important role in the pathogenesis of melioidosis and thus constitutes an attractive target for the development of new drugs against this disease. Within the scope of this work the currently best small-molecule MIP inhibitor 1 was optimised. Starting with a structural comparison of Burkholderia pseudomallei MIP and Legionella pneumophila MIP, as well as a hot spot analysis of the Burkholderia pseudomallei MIP binding pocket, docking studies were conducted to select promising candidates for synthesis and testing for MIP inhibition. The structural comparison reveals a high homology of the two binding pockets. Major conformational changes are observed for the binding pocket region formed by Ala94, Gly95, Val97 and Ile98, which necessitates different optimisation strategies for 1. Favourable interaction fields for the Burkholderia pseudomallei MIP binding pocket are found for donor groups or hydrophobic substituents in para position of the benzyl ring (region A) of 1 as well as for acceptor or donor groups in para or meta/para position of the trimethoxyphenyl ring (region B). On the basis of the docking studies promising candidates could be identified for variations in both regions. Initial MIP inhibition measurements of synthesised derivatives indicate increased inhibition compared to 1. Replacing the hydrophobic trimethoxyphenyl residue of 1 with a pyridine ring (yielding a more soluble derivative) leads again to comparable MIP inhibition. Further syntheses and tests of promising ligands are currently being planned by the collaboration partners. The results of the inhibition measurements should demonstrate their suitability as MIP inhibitors and provide useful information for future structure-based drug design cycles. KW - Arzneimitteldesign KW - Computational chemistry KW - Legionella pneumophila KW - Burkholderia KW - Strukturbasiertes Wirkstoffdesign KW - Docking KW - Scoringfunktionen KW - Legionella pneumophila KW - Burkholderia pseudomallei KW - Structure-based drug design KW - Docking KW - Scoring functions KW - Legionella pneumophila KW - Burkholderia pseudomallei KW - Maschinelles Lernen Y1 - 2014 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-101585 ER -