TY - THES A1 - Bothe, Sebastian Helmut T1 - Fragmentbasiertes Design von p97-Liganden: Identifizierung von Startstrukturen zur Entwicklung von Protein-Protein-Interaktionsinhibitoren für die SHP-Bindestelle der AAA+ ATPase p97 T1 - Fragment-based design of p97-ligands: Identification of starting points for the development of protein-protein-interaction inhibitors targeting the SHP-binding site of the AAA+ ATPase p97 N2 - Die AAA+ ATPase p97 ist ein essenzielles Protein, das an einer Vielzahl zellulärer Prozesse beteiligt ist und eine Schlüsselrolle in der Protein-Homöostase spielt. Die funktionale Diversität von p97 beruht auf der Interaktion zahlreicher unterschiedlicher Kofaktoren, die vorwiegend an die N-Domäne von p97 binden. Aufgrund seiner Bedeutung in der Regulierung diverser physiologischer und pathologischer Prozesse stellt p97 eine interessante Zielstruktur für die Entwicklung neuer Wirkstoffe dar, die insbesondere in der Krebstherapie von Bedeutung sein könnte. Bekannte p97-Inhibitoren greifen vor allem die ATPase-Funktion des Proteins an. Ein neuer pharmakologischer Ansatz stellt die Inhibierung der Kofaktorbindung an die N-Domäne dar. Ein solcher Protein-Protein-Interaktionsinhibitor wäre nicht nur von therapeutischem Interesse, sondern hätte auch einen besonderen Nutzen für die Entschlüsselung molekularer und zellulärer Funktionen von p97-Kofaktoren. In dieser Arbeit wurde ein fragmentbasierter Ansatz für die Identifizierung von chemischen Startstrukturen für die Entwicklung eines Protein-Protein- Interaktionsinhibitors verfolgt. Als Zielstruktur wurde die SHP-Bindestelle in der N-Domäne gewählt. Die Identifizierung von Liganden erfolgte sowohl durch computergestützte Methoden (insbesondere virtuelles Screening und Molekulardynamik-Simulationen) als auch experimentell durch biophysikalische Techniken (wie Biolayer-Interferometrie, Röntgenstrukturanalyse und ligandbasierte NMR-Techniken). Die Grundlage des computerbasierten Designs stellte eine Analyse der bekannten Kristallstrukturen der p97-Komplexe mit den SHP-Motiven der Kofaktoren UFD1 und Derlin-1 dar. Darüber hinaus dienten Molekulardynamik-Simulationen der Analyse der Wassereigenschaften innerhalb der SHP-Bindestelle. Darauf aufbauend wurden verschiedene Pharmakophormodelle entwickelt, die die Grundlage des im Anschluss durchgeführten virtuellen Screenings und Dockings bildeten. Anhand der Ergebnisse von Molekulardynamik-Simulationen wurden zehn Verbindungen für die experimentelle Validierung ausgewählt. Hiervon konnten zwei Fragmente in STD-NMR- und Biolayer-Interferometrie-Experimenten als Liganden bestätigt werden. In einem parallel durchgeführten biophysikalischen Fragmentscreening mittels Biolayer-Interferometrie wurden unter mehr als 650 Verbindungen 22 identifiziert, die an die N-Domäne binden. 15 dieser Fragmente wurden durch einen orthogonalen STD-NMR-Assay bestätigt. Fünf dieser Verbindungen zeigten Affinitäten mit KD-Werten kleiner 500μMund günstigen Ligandeffizienzen. Des Weiteren konnte die Bindungskinetik und Affinität des in der Literatur als p97-Inhibitor berichteten Naturstoffes Xanthohumol bestimmt und eine Bindung an die N-Domäne bestätigt werden. Zur Identifizierung möglicher Bindestellen dieser fünf Fragmente wurden mixed-solvent Molekulardynamik-Simulationen durchgeführt. Diese ergaben, dass alle Verbindungen die SHP-Bindestelle in der N-Domäne adressieren. Die Regionen fielen mit hot spots der Kofaktorwechselwirkungen zusammen und stellen somit mögliche Ankerpunkte für die Weiterentwicklung dar. Für zwei Fragmente konnten die postulierten Bindestellen mittels Röntgenstrukturanalyse bzw. STD-NMR-Messungen an p97-Alanin-Mutanten bestätigt werden. Die erhaltene Röntgenstruktur ist die erste p97-Struktur, die ein gebundenes Fragment an der N-Domäne zeigt. N2 - The AAA+ATPase p97 is an essential protein involved in numerous cellular pro-cesses and plays a key role in multiple aspects of protein homeostasis. Its functio-nal diversity is mediated through the interaction with a large number of distinctcofactors binding to the N-domain of p97. Due to its significant role in regulatinga variety of physiological responses, p97 has emerged as a potential therapeu-tic target. A small molecule inhibiting the cofactor binding would be importantto dissect the molecular and cellular functions of p97 cofactors, thus helping tounravel their specific role in controlling p97 activity. Such compounds may alsoopen routes to new cancer therapies.In this work, a fragment-based approach was pursued for the identification ofchemical starting points for the development of a protein-protein interaction in-hibitor addressing the SHP binding site. Therefore, computer-assisted methods,such as virtual screenings and molecular dynamics simulations, as well as bio-physical techniques including biolayer interferometry, X-ray crystallography, andligand-based NMR techniques, were applied.The computer-based design started with an analysis of the known p97 crystalstructures in complex with the SHP motifs of cofactors UFD1 and Derlin-1. In ad-dition, molecular dynamics simulations were used to analyze the water proper-ties within the SHP binding site. Based on these results, pharmacophore modelswere developed and utilized in the subsequent virtual screening and dockingprocess. With the help of molecular dynamics simulations, ten compounds wereselected for experimental validation. Two of these were confirmed as ligands inSTD-NMR and biolayer interferometry experiments.In parallel, a biophysical fragment screening of over 650 compounds was perfor-med using the biolayer interferometry method. This led to the identification of22 compounds binding to the N-domain. Fifteen of these fragments were con-firmed in an orthogonal STD-NMR assay. Five compounds showed affinities withKDvalues below 500 μM and favourable ligand efficiencies for further optimiza-tion. Furthermore, the binding kinetics and affinity of xanthohumol, a naturalproduct reported in the literature as a p97 inhibitor, were determined and bin-ding to the N-domain was confirmed. xToidentify possible binding sites of these five fragments, mixed solvent mole-cular dynamics simulations were performed. These revealed that all compoundsaddress the SHP binding site in the N-domain. The regions coincide with hotspots of the cofactor binding and, thus, represent potential anchor points for aprotein-protein interaction inhibitor. For two fragments, the postulated bindingsites were confirmed by X-ray crystallography and STD-NMR measurements onp97 alanine mutants, respectively. The X-ray structure obtained is the first p97structure showing a fragment bound to the N-domain. KW - Arzneimitteldesign KW - Fragmentscreening KW - p97 KW - Biolayerinterferometrie KW - Protein-Protein-Interaktion KW - Kofaktorbindung KW - fragment screening KW - p97 KW - biolayerinterferometry KW - protein-protein-interaction KW - cofactorbinding KW - Protein-Protein-Wechselwirkung KW - Wirkstoffdesign Y1 - 2021 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-239112 ER - TY - THES A1 - Busemann, Matthias T1 - Entwicklung chemometrischer Methoden für das in-silico-Wirkstoffdesign T1 - Development of chemometric techniques for the in-silico drug design N2 - Diese Dissertation beschreibt Methoden zur Lösung wichtiger anwendungsorientierter Aspekte des struktur- und ligandbasierten in-silico-Wirkstoffdesigns. Dabei liegt der Fokus auf der Entwicklung chemometrischer Verfahren und der Überprüfung ihrer Leistungsfähigkeit. Die vorgeschlagenen Algorithmen werden mit entsprechenden etablierten Techniken verglichen. Die folgenden Abschnitte fassen die Vorgehensweisen und Resultate in den einzelnen Projektbereichen zusammen. Identifizierung von Outliern. Die Untersuchung eines QSAR-Datensatzes mit dem Ziel der Outlier-Identifizierung wird in der Praxis häufig vernachlässigt. Dabei ist es offensichtlich, daß kein QSAR-Modell auf jede nur denkbare chemische Verbindung anwendbar sein kann. Vielmehr handelt es sich um empirische mathematische Modelle, die nur innerhalb jenes Datenraums Gültigkeit besitzen, der von den Trainingsobjekten aufgespannt wird. Daher ist jedes Modell auf gewisse Grenzen beschränkt, außerhalb derer eine verläßliche Vorhersage unmöglich ist. Die in dieser Arbeit entwickelte Methode ODD dient der Ermittlung dieser Grenzen und damit der Identifizierung von Outliern, also Objekten außerhalb des Anwendungsbereichs des Modells. Ziel der Entwicklung war ein nur auf den unabhängigen Variablen (X-Daten) basierendes Verfahren, das auch auf hochdimensionaleDatensätze anwendbar ist undweitestgehend auf den Eingriff des Benutzers (etwa die Definition von Grenzwerten) verzichtet. Ebenfalls wünschenswert war die Fähigkeit zur Identifikation von Inliern. Eine ausreichend hohe Geschwindigkeit sollte die Einsetzbarkeit im virtuellen Screening gewährleisten. Die Methode mußte der Überprüfung standhalten, den Vorhersagefehler eines Modells bei Vorhandensein extremer Outlier zu reduzieren, gleichzeitig aber unkritische Datensätze unbeeinflußt zu lassen. ODD basiert auf der Beurteilung der euklidischen Distanz eines Testobjekts zu seinem am nächsten benachbarten Trainingsobjekt. Der Schwellenwert für die Betrachtung eines Objekts als Outlier wird dabei aus der Verteilung der Nächster-Nachbar-Distanzen der Trainingsobjekte berechnet. Durch dieses intrinsische Maß ergibt sich die gewünschte Dimensionsunabhängigkeit und vor allem die automatische Anpassung des Grenzwerts an die Charakteristik des Kalibrierdatensatzes ohne Eingriff des Benutzers. Die Validierung zeigt, daß ODD extreme Outlier zuverlässig erkennt und sich gleichzeitig durch eine im Vergleich zu anderen gebräuchlichen Verfahren geringere Anzahl falsch positiver Identifizierungen auszeichnet. Ensemble-Techniken. In einer vergleichenden Studie wurde die Leistungsfähigkeit verschiedener Ensemble-Techniken hinsichtlich ihres Einflusses auf den Vorhersagefehler untersucht. Dazu wurden umfangreiche Simulationen anhand mehrerer realer QSAR-Datensätze durchgeführt. Die Verwendung von Ensembles (d. h. einer Sammlung vielerModelle, diemit geringfügigmanipulierten Varianten des Trainingsdatensatzes kalibriert wurden) wirkt sich im allgemeinen positiv auf den Vorhersagefehler (RMSEP) aus. Diese Reduzierung des RMSEP wurde hier ermittelt und für verschiedenen Ansätze zur Ensemble-Generierung verglichen. Insgesamt betrachtet erwiesen sich die Methoden der konvexen Pseudodaten und des Baggings als die effektivsten Verfahren zur Ensemble-Generierung, da sie den Vorhersagefehler am deutlichsten verbesserten. Die konvexen Pseudodaten wurden erstmalig zur Erzeugung von Ensembles in der QSAR-Analyse eingesetzt; sie werden als neuer Standard zur Reduzierung des RMSEP bei QSAR-Problemen vorgeschlagen, die Regressionsmodelle auf Basis von latenten Variablen verwenden. Darüber hinaus bieten die Studien eine Abschätzung dermit Hilfe von Ensembles zu erzielenden Reduktion des Vorhersagefehlers bei typischen QSAR-Datensätzen. Virtuelles Screening. Beim virtuellen Screening handelt es sich um eine Technik zum Durchsuchen großer (virtueller)Molekülbibliotheken—oftmehrere Millionen Verbindungen — nach den aussichtsreichsten Wirkstoffkandidaten. Dies kann sowohl durch strukturbasierte als auch mit Hilfe ligandbasierter Verfahren geschehen. Es wurden umfangreiche Simulationen anhand sechs verschiedener Targets und einer Bibliothek von mehr als 90 000 Molekülen durchgeführt, um das Potential strukturbasierter (Docking mit FLEXX) und ligandbasierter (Ähnlichkeitssuchemitmehreren Referenzen) Verfahren zu vergleichen. Darüber hinauswurde durch Berechnung von Interaktionsfingerprints eineMöglichkeit geschaffen, die Information der beiden sonst getrennten Herangehensweisen zu kombinieren. Um den Einfluß des Klassifizierungsalgorithmus zu untersuchen, wurden verschiedene statistische Methoden zur Datenauswertung herangezogen. Als Bewertungskriterium für die Leistungsfähigkeit eines Verfahrens diente jeweils die Anzahl der wiedergefundenen aktiven Moleküle in der simulierten Screeningdatenbank. Die Resultate führen zu dem Schluß, daß ligandbasierte Verfahren, die einfacher einzusetzen sind aber mehr a-priori -Information benötigen, dem strukturbasierten virtuellen Screening hinsichtlich der Datenbankanreicherung überlegen sind. Weiterhin konnte gezeigt werden, wie nutzbringend die Zusammenführung von strukturbasierter Information und solcher über das Interaktionsmuster bekanntermaßen aktiver Verbindungen für die Erhöhung der Wiederfindungsrate ist. Bei der Datenanalyse stellte sich heraus, daß im Mittel bestimmte statistische Methoden (minimale euklidische Distanz ED/Min bzw. Tanimoto-Ähnlichkeit der Integer-Fingerprints Int/Min) zu bevorzugen sind. Kovalentes Docking von Cathepsin-Inhibitoren. Die Cysteinproteasen Cathepsin B und L sind interessante pharmakologische Targets. Geeignete Inhibitoren stammen u. a. aus der Strukturklasse der Aziridine. Ein nukleophiler Angriff des Cysteinrests des Enzyms auf den elektrophilen Aziridinring führt hier zur Ausbildung einer kovalenten Ligand-Rezeptor-Bindung. Praktisch alle erhältlichen Dockingprogramme konzentrieren sich jedoch auf nicht-kovalente Ligand-Rezeptor-Interaktionen und lassen kein uneingeschränktes kovalentes Docking zu. Daher wurde für FLEXX ein Dockingprotokoll entworfen, das den entscheidenden nicht-kovalenten Zustand vor Ausbildung der kovalenten Bindung simulieren kann. Auf dieseWeise konnte untersucht werden, ob sich die Reaktionszentren von Ligand und Enzym ausreichend nahe für die Ausbildung einer kovalenten Bindung kommen. Der vorgestellte Ansatz läßt sich leicht auf andere kovalente Ligand-Rezeptor- Systeme übertragen und bietet somit eine breite Anwendbarkeit. Weiterhin wurde die Parametrisierung der in FLEXX vorgesehenen Interaktionsgeometrien an die strukturellen Eigenheiten der zu dockenden Aziridide angepaßt. Diese weisen nämlich formal eine Amidbindung auf, deren geometrische und elektronische Eigenschaften jedoch deutlich von den Werten eines typischen Amids abweichen. Die Ergebnisse der Dockingstudien liefern wertvolle Einblicke für das Verständnis der Selektivität der untersuchten Liganden bezüglich Cathepsin B beziehungsweise L. Umgekehrt erbringt die gute Übereinstimmung der FLEXX-Resultate mit den experimentell bestimmten Inhibitionskonstanten den Nachweis für die Validität des verwendeten Dockingprotokolls. N2 - This thesis describes methods for solving important application-oriented aspects of structure-based and ligand-based in silico drug design. The proposed algorithms are compared to well established techniques. The focus is particularly on the development and benchmarking of different chemometric techniques. In the following, the approaches and results within the different project areas are summarised. Outlier Identification. The inspection of QSAR datasets in order to identify prediction outliers is often omitted in practice. However, it is clear that no QSAR model is applicable to every conceivable chemical compound. Since QSAR models represent empirical mathematical models, these are only valid within the data space spanned by the training data. Hence, every model is restricted to certain borders beyond which a reliable prediction is impossible. The method ODD developed in this work can be used to determine these borders and thus to identify outliers. Those are objects outside the data space spanned by the training data (i.e. the applicability domain of the model). The aim of the method is to detect outliers solely based on the predictor variables (X data). Moreover, the method must be capable to handle high-dimensional datasetswithminimal user interference (e.g. setting of cut-offs). Furthermore, the ability to identify inliers would be preferable. The computational speed should be high enough to apply the method to virtual screening. The developed technique had to prove that it provides a reduction of the model’s error of prediction if extreme outliers are present. At the same time, it should leave non-critical datasets unaffected. ODD is based on the evaluation of the Euclidean distance of a test object towards its nearest neighbouring training object. The cut-off for deeming an object as outlier is calculated from the distribution of the nearest neighbour distances of the training set. This intrinsic value leads to the desired independence from data dimensionality and, above all, to an automatic adjustment of the cut-off to the characteristics of the calibration dataset without any user intervention. The validation shows that ODD reliably identifies extreme outliers. On the other hand, it offers a low rate of false positives compared to other common techniques for outlier identification. Ensemble Techniques. In a benchmark study, the impact of different ensemble techniques on the prediction error was investigated. For this purpose, comprehensive simulations on several real QSAR datasets were carried out. The application of ensembles (i.e. a collection of many models trained with sligthly perturbed versions of the training set) usually lowers the error of prediction (RMSEP). The RMSEP reduction was determined and compared for different approaches of ensemble generation. Overall, the methods of convex pseudo data and bagging proved to be the most efficient ways for ensemble generation (i.e. they resulted in the largest reduction of the prediction error). Convex pseudo data, which were applied toQSAR data sets for the first time as ensemble technique, are proposed as the new standard for lowering RMSEP in QSAR problems using latent variable regression models. Furthermore, the effect size of ensemble averaging was quantified for typical QSAR data sets. Virtual Screening. Virtual screening is a technique to screen large (virtual) molecular databases — often several million compounds — for the most promising drug candidates. This can be done by structure-based as well as by ligand-based approaches. Comprehensive computations on six different targets and a library of more than 90 000 compounds were carried out to compare the potential of structure-based techniques (docking with FLEXX) and ligand-based techniques (similarity searching with multiple queries). In addition to that, interaction fingerprints were computed in order to combine the information of the otherwise distinct approaches. Several statistical methods were applied for data analysis to investigate the impact of the machine learning algorithm. Figure of merit for each approach was the number of active compounds retrieved from the assembled screening database with known actives. The results lead to the following conclusions: Ligand-based approaches, which are simpler to use but require more a priori information, turned out to be superior to structure-based virtual screening techniques in terms of database enrichment. In addition, it could be shown that combination of structure-based information with information of the interaction pattern of known actives is beneficial for increasing retrieval rates. Data analysis revealed that certain statistical methods (minimum Euclidean distance ED/Min, and Tanimoto similarity of integer fingerprints Int/Min, respectively) are on average to be preferred. Covalent Docking of Cathepsin Inhibitors. Cysteine proteases Cathepsin B and L are interesting pharmacological targets. Suitable inhibitors, amongst others, come from the structural class of aziridines. A nucleophilic attack of the enzyme’s active site cysteine moiety on the electrophilic aziridine ring leads to formation of a covalent bond between ligand and receptor. However, virtually all available docking programs concentrate on noncovalent ligand-receptor interactions and do not provide sophisticated, unrestricted covalent docking. Thus, a docking protocol for FLEXX was designed which is able to represent the essential non-covalent state before formation of the covalent bond. That way, it could be studied whether or not the reaction centres of both ligand and receptor adopt a position close enough to each other to actually form the covalent bond. The approach presented here can easily be transferred to other covalent ligand-receptor systems and therefore provides a broad applicability. Furthermore, the parametrisation of the FLEXX interaction geometries was adapted to account for the special structural features of aziridides. Those show a formal amide bond, but its geometric and electronic properties differ noticeably from a typical amide. The results of the docking studies provide valuable insights for understanding the Cathepsin B/L selectivity of the ligands under scrutiny. Vice versa, the good correspondence of the FLEXX results and the inhibition constants obtained experimentally provide evidence for the validity of the applied docking protocol. KW - Arzneimitteldesign KW - Chemometrie KW - Chemometrie KW - Outlier-Identifizierung KW - virtuelles Screening KW - Docking KW - Chemometrics KW - Outlier Detection KW - virtual screening KW - docking Y1 - 2006 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-18777 ER - TY - THES A1 - Diebold, Mathias T1 - Virtuelles Screening und Entwicklung selektiver Liganden des Aurora-A – MYCN Komplexes und computergestützte Methoden zur Analyse und Design von PROTACs T1 - Virtual screening and development of selective ligands for the Aurora-A - MYCN complex and computational methods for analysis and design of PROTACs N2 - Die Interaktion des onkogenen Transkriptionsfaktors MYCN mit der Ser/Thr Kinase Aurora-A verhindert dessen Abbau über das Ubiquitin Proteasomsystem indem die Rekrutierung des SCF FbxW7 Komplexes verhindert wird. Die Kinase nimmt mit der Bindung an MYCN eine aktive Konformation ein und erhält somit die Fähigkeit zur Kinaseaktivität ohne die sonst notwendige Phosphorylierung von Thr288 oder die Anwesenheit eines Aktivators wie TPX2. Da hohe MYCN Konzentrationen Tumore wie Neuroblastome antreiben, ist die Störung der Komplexbildung mit Aurora-A eine valide Strategie zur Entwicklung von Chemotherapeutika. Einige Inhibitoren von Aurora-A wie Alisertib (MLN8237) sind in der Lage, eine Konformationsänderung in der Kinase zu verursachen, die mit der Bindung von MYCN inkompatibel ist und auf diese Weise den Abbau des Transkriptionsfaktors induziert. Da Aurora-A wichtige Funktionen in der Mitose übernimmt, könnte eine direkte Adressierung des Komplexes anstelle einer systemischen Inhibition der Kinase vielversprechender sein. Ziel des Projektes war die Identifizierung von Molekülen, die selektiv an das Interface des Aurora-A – MYCN Komplexes binden und weiter optimiert werden können, um einen gezielten Abbau des Transkriptionsfaktors über einen PROTAC Ansatz zu ermöglichen. Virtuelle Screenings und molekulardynamische Simulationen wurden durchgeführt, um kommerziell erhältliche Verbindungen zu identifizieren, welche mit einer Bindetasche des Komplexes interagieren, die nur zustande kommt, wenn beide Proteine miteinander interagieren. Aus einem ersten Set von zehn potentiellen Liganden wurde für vier eine selektive Interaktion mit dem Protein – Protein Komplex gegenüber Aurora-A oder MYCN alleine in STD-NMR Experimenten bestätigt. Zwei der Hits besaßen ein identisches Grundgerüst und wurden als Ausganspunkt für die Optimierung zu potenteren Liganden genutzt. Das Gerüst wurde fragmentweise vergrößert und in Richtung besserer in-silico Ergebnisse und Funktionalisierung zur Anbringung von E3-Ligase-Liganden optimiert. Neun dieser Liganden der zweiten Generation wurden synthetisiert. Um quantitative Bindungsdaten zu erhalten, wurde ein kovalent verknüpftes Aurora-A – MYCN Konstrukt entworfen. Die strukturelle und funktionale Integrität wurde in STD-NMR und BLI Experimenten mit bekannten Aurora-A Inhibitoren bestätigt, sowie in NMR-basierten ATPase Assays. Zusätzlich konnte die Kristallstruktur des Konstrukts gelöst und damit die Validität des Designs bestätigt werden. Quantitative Messungen der synthetisierten Moleküle identifizierten HD19S als Hit mit einer zehnfach höheren Affinität für das Aurora-A – MYCN Konstrukt im Vergleich zu der Kinase allein. Zusätzlich wurden in-silico Untersuchungen zu PROTACs der Aurora-A Kinase durchgeführt. Interaktionen zwischen Aurora-A, der E3-Ligase Cereblon und den Liganden wurden modelliert und für die Erklärung unterschiedlicher Aktivitäten der eingesetzten PROTACs verwendet. Zudem zeigte das aktivste PROTAC eine hohe Selektivität für Aurora-A gegenüber Aurora-B, obwohl die verwendete Erkennungseinheit (Alisertib) an beide Aurora-Proteine bindet. Dieser Umstand konnte durch energetische Analysen von molekulardynamischen Simulationen der ternären Komplexe erklärt werden. Optimierungsmöglichkeiten für eine effizientere Degradation von Aurora-A durch die PROTACs wurden basierend auf modifizierten Erkennungseinheiten und verbesserten Linkern untersucht. N2 - The association of the oncogenic transcription factor MYCN with the Ser/Thr kinase Aurora-A prevents its degradation via the ubiquitin proteasome system by preventing the SCF FbxW7 complex from binding. The kinase adopts an active conformation when bound to MYCN, enabling kinase activity without prior phosphorylation on Thr288 or the presence of an activator like TPX2, and therefore at inappropriate times during the cell cycle. As high levels of MYCN have been shown to drive cancers like neuroblastoma, disrupting the complex formation is thought to be a viable development strategy for chemotherapeutics. Several small-molecule inhibitors of Aurora-A, like Alisertib (MLN8237), are able to induce a conformational change in the kinase, preventing the formation of the protein – protein complex and therefore promoting MYCN degradation. However, since Aurora-A has important roles during mitosis targeting only the complex could be a more promising approach than the systemic inhibition of the kinase. This project aimed to identify small molecules which selectively bind at the Aurora-A – MYCN interface and can be further optimized to induce targeted degradation via a PROTAC approach. Virtual screenings and molecular dynamics simulations were performed to identify commercially available compounds which should bind to a pocket formed only when the two proteins come together. Of a first set of ten potential binders, four showed binding to the Aurora-A – MYCN complex but not the individual proteins in STD-NMR experiments. Two of these hit molecules contained the same scaffold and were used as a starting point for optimization towards more potent ligands. In a fragment-based fashion, the scaffold was grown to achieve better affinity in-silico and provide linkage points for functionalization such as the attachment of E3 ligase ligands to create PROTACs. Nine of these second-generation compounds were then synthesized. In order to obtain quantitative binding data a covalently linked Aurora-A – MYCN construct was designed. Its structural and functional validity was shown in STD-NMR and BLI experiments with known Aurora-A inhibitors and in NMR-based ATPase assays. In addition, a crystal structure of the construct was solved, validating the designed structure. Quantitative measurements with the synthesized compounds revealed a positive hit (HD19S) with a ten-fold higher affinity to the covalently linked AuroraA – MYCN as compared to Aurora-A alone. Additionally, effects of PROTACs designed to degrade Aurora-A were studied in-silico. Interactions between Aurora-A, the E3-ligase Cereblon and small molecules were modelled and successfully used to explain the differences in activities observed with different PROTACs. The most active PROTAC also showed a high selectivity for Aurora-A over Aurora-B, even though the recognition unit (Alisertib) can bind both family members. Through energetic analysis of molecular dynamics simulations of the ternary complexes, these differences could be explained. Optimizations for a more efficient degradation of Aurora-A by the PROTACs were examined by changing the recognition unit and improving linkers. KW - Arzneimitteldesign KW - Protein-Protein-Wechselwirkung KW - Vernetzung KW - Wirkstoffdesign KW - PROTAC KW - Proteolysis-Targeting-Chimera KW - Aurora-A KW - MYCN KW - Aurora-A-MYCN-Komplex Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-317594 ER - TY - THES A1 - Hein, Michael T1 - Entwicklung computergestützter Methoden zur Bewertung von Docking-Lösungen und Entwurf niedermolekularer MIP-Inhibitoren T1 - Development of computer-aided methods for the evaluation of docking poses and design of small-molecule MIP inhibitors N2 - Dockingbasierte Ansätze zählen zu den wichtigsten Komponenten im virtuellen Screening. Sie dienen der Vorhersage der Ligandposition und -konformation in der Bindetasche sowie der Abschätzung der Bindungsaffinität zum Protein. Bis heute stellt die korrekte Identifizierung proteingebundener Ligandkonformationen ein noch nicht vollständig gelöstes Problem für Scoringfunktionen dar. Der erste Teil der vorliegenden Arbeit ist daher der Entwicklung computergestützter Methoden zur Bewertung von Docking-Lösungen gewidmet. Der Fokus eines ersten Teilprojektes lag auf der Berücksichtigung der Absättigung vergrabener Wasserstoffbrückenakzeptoren (HBA) und -donoren (HBD) bei der Bewertung von Docking-Lösungen. Nicht-abgesättigte vergrabene HBA und HBD stellen einen der Bindungsaffinität abträglichen Beitrag dar, der bis dato aufgrund fehlender Struktur- bzw. Affinitätsdaten in Scoringfunktionen vernachlässigt wird. Im Rahmen der vorliegenden Arbeit wurde auf der Basis einer detaillierten Untersuchung zur Häufigkeit vergrabener nicht-abgesättigter HBA und HBD in hochaufgelösten Protein-Ligand-Komplexen des Hartshorn-Datensatzes eine empirische Filterfunktion („vnaHB“-Filterfunktion) entwickelt, die unerwünschte Ligandbindeposen erkennt und von der Bewertung mittels Scoringfunktionen ausschließt. Der praktische Nutzen der empirischen Filterfunktion wurde für die Scoringfunktionen SFCscore und DSX anhand vorgenerierter Docking-Lösungen des Cheng-Datensatzes untersucht. Die Häufigkeitsuntersuchung zeigt, dass eine Absättigung vergrabener polarer Gruppen in Protein-Ligand-Komplexen für eine hochaffine Protein-Ligand-Bindung notwendig ist, da vergrabene nicht-abgesättigte HBA und HBD nur selten auftreten. Eine vollständige Absättigung durch entsprechende Proteinpartner wird für ca. 48 % der untersuchten Komplexe beobachtet, ca. 92 % weisen weniger als drei hauptsächlich schwache, nicht-abgesättigte HBA bzw. HBD (z. B. Etherfunktionen) auf. Unter Einbeziehung von Wassermolekülen in die Häufigkeitsanalyse sind sogar für ca. 61 % aller Komplexe alle wasserstoffbrückenbindenden Gruppen abgesättigt. Im Gegensatz zu DSX werden für SFCscore nach Anwendung der empirischen Filterfunktion erhöhte Erfolgsraten für das Auffinden einer kristallnahen Pose (≤ 2.0 Å Abweichung) unter den am besten bewerteten Docking-Posen erzielt. Für die beste SFCscore-Funktion (SFCscore::229m) werden Steigerungen dieses als „Docking Power“ bezeichneten Kriteriums für die Top-3-Posen (Erfolgsrate für die Identifizierung einer kristallnahen 2.0 Å Pose unter den besten drei Docking-Lösungen) von 63.1 % auf 64.2 % beobachtet. In einem weiteren Teilprojekt wurden repulsive Protein-Ligand-Kontakte infolge sterischer Überlappungen der Bindungspartner bei der Bewertung von Docking-Lösungen berücksichtigt. Die adäquate Einbeziehung solcher repulsiver Kontakte im Scoring ist für die Identifizierung proteingebundener Ligandkonformationen entscheidend, jedoch aufgrund fehlender Affinitäts- bzw. Strukturdaten problematisch. Im Rahmen der vorliegenden Arbeit wurde auf der Basis des Lennard-Jones-Potentiales des AMBER-Kraftfeldes zunächst ein neuer Deskriptor zur Beschreibung repulsiver Kontakte („Clash“-Deskriptor) entwickelt und zur Untersuchung der Häufigkeit ungünstiger Protein-Ligand-Kontakte in hochaufgelösten Protein-Ligand-Komplexen des Hartshorn-Datensatzes herangezogen. Eine aus der Häufigkeitsverteilung abgeleitete empirische Filterfunktion („Clash“-Filterfunktion) wurde anschließend der Bewertung von Docking-Lösungen des Cheng-Datensatzes mittels der Scoringfunktionen SFCscore und DSX vorgeschaltet, um unerwünschte Ligandbindeposen auszuschließen. Die Häufigkeitsuntersuchung zeigt, dass vorwiegend schwache repulsive Kontakte in Protein-Ligand-Komplexen auftreten. So werden in 75 % der Komplexe des Hartshorn-Datensatzes abstoßende Potentiale unter 0.462 kcal/mol beobachtet. Zwar betragen die ungünstigen Beiträge pro Komplex für 50 % aller Strukturen ca. 0.8 kcal/mol bis 2.5 kcal/mol, jedoch können diese auf Ungenauigkeiten der Kristallstrukturen zurückzuführen sein bzw. durch günstige Protein-Ligand-Wechselwirkungen kompensiert werden. Die Anwendung der „Clash“-Filterfunktion zeigt signifikante Verbesserungen der Docking Power für SFCscore. Für die beste SFCscore-Funktion (SFCscore::frag) werden Steigerungen der Erfolgsraten für das Auffinden einer kristallnahen Pose unter den drei am besten bewerteten Docking-Lösungen von 61.4 % auf 86.9 % erzielt, was an die Docking Power der bis dato besten Scoringfunktionen aus der Literatur (z. B. DSX, GlideScore::SP) heranreicht (Docking Power (DSX): 92.6 %; Docking Power (GlideScore::SP): 86.9 %). Die „Clash“-Filterfunktion allein ist auch der Kombination der „Clash“- und der „vnaHB“-Filterfunktion überlegen. Ein weiterer Schwerpunkt der vorliegenden Arbeit wurde auf die Einbeziehung von Decoy-Daten (Struktur- und Affinitätsdaten schwach affiner und inaktiver Liganden) im Zuge der Entwicklung computergestützter Methoden zur Bewertung von Docking-Lösungen gelegt. Dadurch soll eine adäquate Berücksichtigung ungünstiger Beiträge zur Bindungsaffinität ermöglicht werden, die für die Richtigkeit und Zuverlässigkeit ermittelter Vorhersagen essentiell ist. In der vorliegenden Arbeit wurden binäre Klassifizierungsmodelle zur Bewertung von Docking-Lösungen entwickelt, die die Einbeziehung von Decoy-Daten ohne die Verfügbarkeit von Affinitätsdaten erlauben. Der Random-Forest-Algorithmus (RF), SFCscore-Deskriptoren, der neu entwickelte „Clash“-Deskriptor, und die Decoy-Datensätze von Cheng und Huang (Trainingsdaten) bilden die Grundlage des leistungsfähigsten Klassifizierungsmodells. Der praktische Nutzen des „besten“ RF-Modells wurde nach Kombination mit der Scoringfunktion DSX anhand der Docking Power für das Auffinden einer kristallnahen Pose auf Rang 1 am unabhängigen Cheng-/Huang- (Komplexe, die nicht in den Trainingsdaten enthalten sind) und CSAR-2012-Testdatensatz untersucht. Gegenüber einer alleinigen Anwendung von DSX werden an beiden Testdatensätzen weitere Verbesserungen der Docking Power erzielt (Cheng-/Huang-Testdatensatz: DSX 84.24 %, RF 87.27 %; CSAR-2012-Testdatensatz: DSX 87.93 %, RF 91.38 %). Das „beste“ Modell zeichnet sich durch die zuverlässige Vorhersage richtig-positiver Docking-Lösungen für einige wenige Komplexe aus, für die DSX keine kristallnahe Ligandkonformation identifizieren kann. Ein visueller Vergleich der jeweils am besten bewerteten RF- und DSX-Pose für diese Komplexe zeigt Vorteile des RF-Modells hinsichtlich der Erkennung für die Protein-Ligand-Bindung essentieller Wechselwirkungen. Die Untersuchung der Bedeutung einzelner SFCscore-Deskriptoren für die Klassifizierung von Docking-Lösungen sowie die Analyse der Misserfolge nach Anwendung des Modells geben wertvolle Hinweise zur weiteren Optimierung der bestehenden Methode. Hinsichtlich der zu bewertenden Eigenschaften ausgeglichenere Trainingsdaten, Weiterentwicklungen bestehender SFCscore-Deskriptoren sowie die Implementierung neuer Deskriptoren zur Beschreibung bis dato nicht-berücksichtigter Beiträge zur Bindungsaffinität stellen Ansatzpunkte zur Verbesserung dar. Der zweite Teil der vorliegenden Arbeit umfasst die Anwendung dockingbasierter Methoden im Rahmen der Entwicklung neuer Inhibitoren des „Macrophage Infectivity Potentiator“-(MIP)-Proteins von Legionella pneumophila und Burkholderia pseudomallei. Das MIP-Protein von Legionella pneumophila stellt einen wichtigen Virulenzfaktor und daher ein attraktives Zielprotein für die Therapie der Legionellose dar. Im Rahmen der vorliegenden Arbeit erfolgten systematische Optimierungen des Pipecolinsäure-Sulfonamides 1, des bis dato besten niedermolekularen MIP-Inhibitors (IC50 (1): 9 ± 0.7 µM). Nach Hot-Spot-Analysen der Bindetasche wurden Docking-Studien zur Auswahl aussichtsreicher Kandidaten für die Synthese und Testung auf MIP-Inhibition durchgeführt. Die Ergebnisse der Hot-Spot-Analysen zeigen günstige Wechselwirkungsbereiche für Donorgruppen und hydrophobe Substituenten in meta-Position sowie Akzeptorgruppen in para-Position des Benzylringes von 1 auf. Die Einführung einer Nitrofunktion in para-Position des Benzylringes von 1 (2h) resultiert in einer erhöhten MIP-Inhibition (IC50 (2h): 5 ± 1.5 µM), was wahrscheinlich auf die Ausbildung einer zusätzlichen Wasserstoffbrücke zu Gly116 zurückzuführen ist. Selektivitätsverbesserungen gegenüber dem strukturverwandten humanen FKBP12-Protein werden insbesondere für das para-Aminoderivat von 1 (2n) erzielt (Selektivitätsindex (1): 45, Selektivitätsindex (2n): 4.2; mit Selektivitätsindex = IC50 (MIP)/IC50 (FKBP12)). Der Ersatz des hydrophoben Trimethoxyphenylrestes von 1 durch einen Pyridinring (2s) führt zu einer verbesserten Löslichkeit bei vergleichbarer MIP-Inhibition. Das MIP-Protein von Burkholderia pseudomallei spielt eine wichtige Rolle in der Pathogenese der Melioidose und stellt daher ein attraktives Zielprotein für die Entwicklung neuer Arzneistoffe dar. In der vorliegenden Arbeit erfolgten Optimierungen des bis dato besten niedermolekularen MIP-Inhibitors 1. Ausgehend von einem Strukturvergleich von Burkholderia pseudomallei MIP mit Legionella pneumophila MIP und einer Hot-Spot-Analyse der Burkholderia pseudomallei MIP-Bindetasche wurden Docking-Studien zur Auswahl aussichtsreicher Kandidaten für die Synthese und Testung auf MIP-Inhibition durchgeführt. Der Strukturvergleich zeigt eine hohe Homologie beider Bindetaschen. Größere konformelle Änderungen werden lediglich für den von Ala94, Gly95, Val97 und Ile98 geformten Bindetaschenbereich beobachtet, was unterschiedliche Optimierungsstrategien für 1 erforderlich macht. Günstige Wechselwirkungsbereiche der Burkholderia pseudomallei MIP-Bindetasche finden sich einerseits für Donorgruppen oder hydrophobe Substituenten in para-Position des Benzylringes (Region A) von 1, andererseits für Akzeptor- bzw. Donorgruppen in para- bzw. meta-/para-Position des Trimethoxyphenylringes (Region B). Anhand von Docking-Studien konnten sowohl für Variationen in Region A als auch in Region B aussichtsreiche Kandidaten identifiziert werden. Initiale MIP-Inhibitionsmessungen der bis dato synthetisierten Derivate deuten auf erhöhte Hemmungen im Vergleich zu 1 hin. Der Ersatz des hydrophoben Trimethoxyphenylrestes von 1 durch einen Pyridinring führt auch hier zu vergleichbarer MIP-Inhibition bei verbesserter Löslichkeit. Derzeit sind weitere Synthesen und Testungen aussichtsreicher Liganden durch die Kooperationspartner geplant. Die Ergebnisse der Inhibitionsmessungen sollen deren Nutzen als MIP-Inhibitoren aufzeigen und wertvolle Informationen für weitere Zyklen des strukturbasierten Wirkstoffdesigns liefern. N2 - Docking-based approaches belong to important virtual screening components and aim at predicting both the ligand position and conformation within the protein binding site as well as the binding affinity. To date scoring functions are still not fully reliable in correctly identifying near-native ligand conformations generated by docking. Thus, the first part of the current work is dedicated to the development of computer-aided methods for the evaluation of docking poses. A first project focused on considering the saturation of hydrogen bond acceptors (HBA) and donors (HBD) for the evaluation of docking poses. Since structural and affinity data are missing, current scoring functions neglect unpaired buried HBA and HBD, which strongly disfavour high-affinity binding. Based on a detailed frequency analysis of unpaired buried HBA and HBD within high-quality protein-ligand complexes of the Hartshorn dataset, an empirical filter function (“vnaHB” filter function) was developed to remove unfavourable ligand binding poses prior to the ranking with scoring functions. The practical benefit of the filter function was investigated for the scoring functions SFCscore and DSX using pre-generated docking poses of the Cheng dataset. As shown in the frequency analysis, the saturation of buried polar groups is of utmost importance for high-affinity binding, as unpaired buried HBA and HBD are extremely rare. A complete saturation by proper protein counterparts is observed for about 48 % of all complexes under study, whereas approximately 92 % have less than three, mostly weak unpaired buried HBA or HBD (e.g. ether functions). Including also the saturation by water molecules reveals that actually for about 61 % of all complexes every hydrogen bonding group is saturated. Unlike DSX, the application of the filter function with SFCscore results in higher success rates for identifying a near-native 2.0 Å pose under the top scored poses, a criterion termed “Docking Power”. For the best SFCscore function (SFCscore::229m) the Docking Power with respect to the top three poses increases from 63.1 % to 64.2 %. A further project focused on considering repulsive intermolecular contacts due to sterical overlap of the protein-ligand binding partners for the evaluation of docking poses. Although an inclusion of such repulsive contacts in scoring is of utmost importance for the identification of protein-bound ligand conformations, it remains challenging because of missing structural and affinity data. Based on the Lennard-Jones potential of the AMBER force field a new descriptor accounting for repulsive protein-ligand contacts (“clash” descriptor) was developed and used for analysing the frequency of unfavourable protein-ligand contacts among high-quality structures of the Hartshorn dataset. An empirical filter function (“clash” filter function) derived from the frequency distribution was applied to pre-generated docking poses of the Cheng dataset to remove unfavourable ligand binding poses prior to the ranking with SFCscore and DSX. As shown in the frequency analysis, mostly weakly repulsive contacts occur within protein-ligand complexes. For 75 % of the complexes of the Hartshorn dataset repulsive potentials of less than 0.462 kcal/mol are observed. Indeed, unfavourable contributions add up to not more than 0.8 kcal/mol to 2.5 kcal/mol per complex for 50 % of all structures; values in this range may be attributed to inaccuracies of crystal structures or could be counterbalanced by favourable protein-ligand interactions. The application of the “clash” filter function shows significant improvements of the Docking Power of SFCscore. For the best SFCscore function (SFCscore::frag) the success rates for identifying a near-native 2.0 Å pose under the three top scored poses increases from 61.4 % to 86.9 %, which is comparable to the Docking Power of the best scoring functions (e.g. DSX, GlideScore::SP) currently available in literature (Docking Power (DSX): 92.6 %; Docking Power (GlideScore::SP): 86.9 %). The “clash” filter function alone is also superior to the combination of the “clash” and the “vnaHB” filter function. Another focus of the work was the inclusion of decoy data (structure and affinity data of weakly active and inactive ligands) in scoring function development. Thus, unfavourable contributions to the binding affinity should be adequately considered, which appears essential for improving accuracy and reliability of the predictions. Within the scope of this work a binary classification model was developed for the evaluation of docking poses, allowing the inclusion of decoy poses without affinity data. The random forest algorithm (RF), SFCscore descriptors, the new “clash” descriptor, and the decoy datasets of Cheng and Huang (training data) provide the basis of the best-performing model. The practical benefit of the “best” RF model was investigated after combination with the scoring function DSX based on the Docking Power for identifying a near-native pose on rank 1 using the independent Cheng/Huang (only complexes not used for training) and the CSAR-2012 dataset. With respect to the standalone application of DSX, improvements of the Docking Power regarding both test sets are achieved (Cheng/Huang test set: DSX 84.24 %, RF 87.27 %; CSAR-2012 test set: DSX 87.93 %, RF 91.38 %). A key feature of the “best” model are reliable predictions of true positive docking poses for those complexes for which DSX fails to identify a near-native ligand conformation. A visual comparison of the best RF and DSX pose highlights advantages of the RF model regarding the recognition of interactions crucial for protein-ligand binding. The importance analysis of SFCscore descriptors for the classification of docking poses as well as the investigation of failures after model application provide useful hints for further improvements. Thus, more property-balanced training data, the further development of established SFCscore descriptors, and the implementation of new descriptors accounting for neglected contributions to the binding affinity constitute possible starting points for future improvements. The second part of this work is dedicated to the application of docking-based methods for the development of new inhibitors of the "`Macrophage Infectivity Potentiator"'-(MIP) proteins of Legionella pneumophila and Burkholderia pseudomallei. The MIP protein of Legionella pneumophila constitutes an important virulence factor and thus an attractive target for the treatment of legionellosis. Within the scope of this work the pipecolic acid sulfonamide 1, one of the best small-molecule MIP inhibitors to date (IC50 (1): 9 ± 0.7 µM), was systematically optimised. After hot spot analysis of the binding pocket, docking studies were conducted to select promising candidates for synthesis and testing MIP inhibition. The results of the hot spot analysis show favourable interaction fields for donor groups and hydrophobic substituents in meta position as well as acceptor groups in para position of the benzyl ring of 1. Introducing a nitro function in para position of the benzyl ring of 1 (2h) results in an increased MIP inhibition (IC50 (2h): 5 ± 1.5 µM), which is likely due to the formation of an additional hydrogen bond to Gly116. An improvement in the selectivity compared to the structurally related human FKBP12 protein is achieved particularly with the para amino derivative of 1 (2n) (selectivity index (1): 45, selectivity index (2n): 4.2, where the selectivity index = IC50 (MIP)/IC50 (FKBP12)). Replacing the hydrophobic trimethoxyphenyl residue of 1 with a pyridine ring (2s) leads to improved solubility and comparable MIP inhibition. The MIP protein of Burkholderia pseudomallei plays an important role in the pathogenesis of melioidosis and thus constitutes an attractive target for the development of new drugs against this disease. Within the scope of this work the currently best small-molecule MIP inhibitor 1 was optimised. Starting with a structural comparison of Burkholderia pseudomallei MIP and Legionella pneumophila MIP, as well as a hot spot analysis of the Burkholderia pseudomallei MIP binding pocket, docking studies were conducted to select promising candidates for synthesis and testing for MIP inhibition. The structural comparison reveals a high homology of the two binding pockets. Major conformational changes are observed for the binding pocket region formed by Ala94, Gly95, Val97 and Ile98, which necessitates different optimisation strategies for 1. Favourable interaction fields for the Burkholderia pseudomallei MIP binding pocket are found for donor groups or hydrophobic substituents in para position of the benzyl ring (region A) of 1 as well as for acceptor or donor groups in para or meta/para position of the trimethoxyphenyl ring (region B). On the basis of the docking studies promising candidates could be identified for variations in both regions. Initial MIP inhibition measurements of synthesised derivatives indicate increased inhibition compared to 1. Replacing the hydrophobic trimethoxyphenyl residue of 1 with a pyridine ring (yielding a more soluble derivative) leads again to comparable MIP inhibition. Further syntheses and tests of promising ligands are currently being planned by the collaboration partners. The results of the inhibition measurements should demonstrate their suitability as MIP inhibitors and provide useful information for future structure-based drug design cycles. KW - Arzneimitteldesign KW - Computational chemistry KW - Legionella pneumophila KW - Burkholderia KW - Strukturbasiertes Wirkstoffdesign KW - Docking KW - Scoringfunktionen KW - Legionella pneumophila KW - Burkholderia pseudomallei KW - Structure-based drug design KW - Docking KW - Scoring functions KW - Legionella pneumophila KW - Burkholderia pseudomallei KW - Maschinelles Lernen Y1 - 2014 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-101585 ER - TY - THES A1 - Kuhn, Maximilian T1 - Strukturbasiertes Design von MIP-Inhibitoren und computergestützte Selektivitätsuntersuchung gegenüber MIP- und humanen FKB-Proteinen T1 - Structure-based design of MIP-Inhibitors and computer-aided selectivity studies towards MIP and human FKB proteins N2 - Bakterielle und parasitäre MIP-Proteine stellen wichtige Virulenzfaktoren dar, deren Inhibition das Überleben der Erreger sowie deren Penetration in menschliche Zellen stark einschränken kann. In dieser Arbeit standen die MIP-Proteine von Burkholderia pseudomallei (Auslöser der Melioidose) und Legionella pneumophila (Legionärskrankheit) im Fokus. Außerdem wurde das MIP-Protein von Trypanosoma cruzi (Chagas-Krankheit) untersucht. Die strukturverwandten humanen FKB-Proteine FKBP12 und FKBP52 sind relevante „off-targets“, wie Experimente mit Knockout-Mäusen gezeigt haben. Ziel dieser Arbeit war die Verbesserung von bekannten MIP-Inhibitoren im Hinblick auf ihre Affinität und Selektivität für MIP-Proteine gegenüber den beiden genannten FKB-Proteinen bei gleichzeitig verbesserter Löslichkeit, mit Hilfe von in silico Methoden. Ausgangspunkt waren hierbei zwei von Dr. Christina Juli und Dr. Florian Seufert entwickelte Leitstrukturen, welche ein Pipecolinsäuregrundgerüst aufweisen. Diese Referenzliganden beinhalten einen 3,4,5-Trimethoxyphenylring (TMPR, vgl. Ref_t) bzw. einen Pyridinylring (Ref_p). Beim Vergleich von insgesamt 32 MIP- und FKB-Proteinen konnten in zwei Loop-Bereichen, welche 50er bzw. 80er Loop genannt werden, relevante Unterschiede in der Aminosäuresequenz identifiziert werden. Die Nummerierung bezieht sich stets auf FKBP12. Diese Unterschiede ließen sich zum Design von vergleichsweise selektiv an MIP-Proteine bindenden Molekülen nutzen. Der 50er Loop ist in nahezu allen MIP-Proteinen (jedoch nicht in BpsMIP) im Vergleich zu den FKB-Proteinen um zwei Aminosäuren verkürzt. Dadurch befindet sich das Proteinrückgrat von LpnMIP (Gln49) und TcrMIP (Arg49) näher am Zentrum der Bindetasche (definiert als Ile56, welches durch die Pipecolinsäureesterfunktion der Liganden adressiert wird). MD-Simulationen der beiden Apoproteine belegten, dass die geringere Distanz nicht durch Artefakte beim Modellieren der Strukturen bedingt ist. Aufbauend auf dieser Erkenntnis wurde gezeigt, dass der Pyridinylring von Ref_p eine Wasserstoffbrücke zu Gln49 ausbildet. Experimentell wurde dieser Befund durch eine entsprechende chemische Verschiebung der Aminosäure im NMR-Experiment von Dr. Kristian Schweimer bestätigt. Durch Überbrückung des Pipecolinsäurerings (Ligand 6bp) konnte die Wasserstoffbrücke in MD-Simulationen weiter stabilisiert werden. Durch Rechnungen zur Abschätzung der freien Bindungsenthalpien (mittels LIE und MM/GBSA) wurde eine erhöhte Affinität von 6bp im Vergleich zu Ref_p in LpnMIP ermittelt. Im Laufe der Arbeit wurde anhand von pIC50-Werten, welche von Dr. Mathias Weiwad bestimmt wurden, erkannt, dass Liganden mit Pyridinylring oftmals eine bessere Affinität in LpnMIP aufweisen als die entsprechenden Liganden mit TMPR. Durch MD Simulationen wurde nachgewiesen, dass der TMPR in LpnMIP nur schwer an der in den anderen Proteinen bevorzugten Position binden kann. Grund hierfür ist die Mutation einer Aminosäure (zu Pro57) in diesem Bereich von LpnMIP: Diese verfügt über eine wenig flexible Seiten-kette, an welche sich der TMPR auf Grund seiner Rigidität nicht anpassen kann, was die Interaktion zwischen Protein und Ligand stört. Der Pyridinylring von Ref_p ist hiervon nicht betroffen, da er bevorzugt an einer anderen Stelle (Gln49, s. o.) bindet. Der 80er Loop weist in vielen MIP-Proteinen deutlich hydrophobere Aminosäuren auf als in FKB-Proteinen. Von besonderem Interesse ist die Position 90, da hier in BpsMIP und LpnMIP sterisch weniger anspruchsvolle Aminosäuren (Val, Pro) vorliegen als in den bei-den FKB-Proteinen (Ile, Lys). Dieser Unterschied wurde mit kleinen hydrophoben Substituenten am Phenylring der Liganden adressiert. Bereits im Docking zeigten sich die positiven Effekte der para-Substitution durch Halogenatome oder eine Methylgruppe. Die von Dr. Mathias Weiwad und Dr. Mirella Vivoli ermittelten pIC50- bzw. pKi-Werte bestätigten diesen Trend. Zugleich nahm die Affinität zu FKBP12 deutlich ab. Bei der Untersuchung der Referenzliganden sowie deren Chlor- und Bromderivate in MD-Simulationen zeigte sich, dass der Phenylring der Liganden in den MIP-Proteinen bevorzugt in Richtung des 80er Loops orientiert ist; in den FKB-Proteinen liegt er hingegen um etwa 110° gedreht vor und kann somit schlechter mit der Bindetasche interagieren. Besonders ausgeprägt ist dieser Effekt in FKBP12. Basierend auf diesen Ergebnissen wurde der Phenylring durch einen 4-Bromo-1H-imidazol-2-ylsubstituenten ersetzt (Ligand 8ap). Dieser ist in der Lage, in der erwarteten Orientierung im Bereich des 80er Loops von BpsMIP zu binden und gleichzeitig eine stabile Wasserstoffbrücke zu Asp37 auszubilden. Hieraus resultiert für den Liganden eine deutlich höhere Affinität in LIE- und MM/GBSA-Rechnungen; in FKBP12 blieb sie auf Grund der dort instabilen Interaktion unverändert. Die berechneten Energien können unmittelbar für einen relativen Vergleich verschiedener Liganden in einer Bindetasche verwendet werden. Für die Vorhersage von pKi- bzw. pIC50-Werten in den verschiedenen Proteinen ist eine Kalibrierung gegen die gemessenen Affinitäten erforderlich. Dies wurde für BpsMIP durchgeführt, indem eine lineare Korrelation zwischen den pKi- bzw. pIC50-Werten und den mit MM/GBSA ermittelten Energien aufgestellt wurde. Für LIE wurde auf publizierte Werte von Lamb et al. zurückgegriffen. Die berechneten Affinitäten stimmen für die bereits getesteten Inhibitoren gut mit den experimentellen pKi- und pIC50-Werten überein. Anhand der Modelle werden für 8ap Werte vorhergesagt, die besser als die experimentellen Affinitäten bekannter Liganden sind. Idealerweise können auch aus den Scores, die durch Docking erhalten werden, bereits Rückschlüsse auf die Affinitäten der Liganden gezogen werden. Für die untersuchten Proteine war dies, auf Grund des engen Bereichs der experimentell ermittelten pKi- und pIC50-Werte, nicht mit hinreichender Richtigkeit möglich. Um die Scores dennoch für die Beurteilung neuer Liganden verwenden zu können, wurden logistische Regressionsmodelle erstellt. Anhand dieser kann abgeschätzt werden, ob ein Molekül in BpsMIP submikromolare Affinität aufweist. Die Richtigkeit dieser Vorhersagemodelle konnte durch die Berücksichtigung dreier weiterer Deskriptoren (Konfiguration am Stereozentrum der Pipecolinsäure, Molekulargewicht und logD-Wert) deutlich verbessert werden, wobei die AUC der entsprechenden ROC-Kurven Werte bis zu 0.9 erreichte. Diese Modelle können für die Postprozessierung eines Dockings angewendet werden, um die vielversprechendsten Kandidaten zu identifizieren und anschließend in rechnerisch anspruchsvolleren MD-Simulationen genauer zu untersuchen. Mit dieser Arbeit wurde zur Weiterentwicklung der Leitstrukturen Ref_t und Ref_p beigetragen. Viele der getesteten Derivate wiesen deutlich verbesserte Löslichkeit bei gleichbleibender Affinität auf. Ferner wurden erstmalig detailliert die Unterschiede in den Bindetaschen zwischen 32 MIP- und FKB-Proteinen evaluiert. Hiervon wurden fünf in MD-Simulationen als Apoprotein und im Komplex mit verschiedenen Inhibitoren verglichen. Anhand dieser Simulationen wurde nachgewiesen, dass jeweils eine Aminosäure in BpsMIP und LpnMIP im Vergleich zum wichtigsten „off-target“ FKBP12 selektiv durch eine Wasserstoffbrücke adressiert werden kann. Durch LIE- und MM/GBSA-Rechnungen konnte gezeigt werden, dass in diesen hochkonservierten Bindetaschen eine bedeutende Modulation der Affinität zugunsten von BpsMIP möglich ist. N2 - Bacterial and parasitic MIP proteins constitute important virulence factors. Inhibiting these proteins can considerably reduce the survival of the pathogens as well as their penetration into human host cells. The work presented in this thesis focused on the MIP proteins of Burkholderia pseudomallei (the causative agent of melioidosis) and Legionella pneumophila (Legionnaires’ disease). Furthermore, the MIP protein of Trypanosoma cruzi (Chagas disease) was also investigated. The structurally homologous human FKB proteins FKBP12 and FKBP52 were taken into account as relevant off-targets. The aim of this thesis was to improve MIP inhibitors by means of in silico methods with respect to affinity and selectivity (for MIP proteins over FKBP12 and FKBP52) as well as solubility. The starting point for this task were two lead structures with a pipecolic acid scaffold from the work of Dr. Christina Juli and Dr. Florian Seufert. These reference ligands contain a 3,4,5-trimethoxyphenyl ring (TMPR, cf. Ref_t) or a pyridinyl ring (Ref_p). By comparison of 32 MIP and FKB proteins major differences with regard to the amino acid sequence could be identified in two loop regions, the so called 50s and 80s loop (numbering always with respect to FKBP12). It was possible to utilise these differences for the design of molecules with preferential binding to MIP proteins. The 50s loop is truncated by two amino acids in nearly all MIP proteins compared to the FKB proteins, except for BpsMIP. Thus, the protein backbone of LpnMIP (Gln49) and TcrMIP (Arg49) is located closer to the centre of the binding pocket. The centre is defined as Ile56, which is binding to the pipecolic ester function of the ligands. MD simulations of both apoproteins proved that the smaller distance is not caused by artefacts introduced during modelling of the structures. Expanding on this knowledge, it could be shown that the pyridinyl ring of Ref_p forms a hydrogen bond to Gln49. This finding was proven ex-perimentally by a corresponding chemical shift of the amino acid in an NMR experiment conducted by Dr. Kristian Schweimer. The hydrogen bond was stabilised further in MD simulations via bridging of the pipecolic acid ring (ligand 6bp). Calculations by MM/GBSA and LIE, estimating the binding free energies of the ligands, yielded im-proved affinity for 6bp compared to Ref_p in LpnMIP. It was noted in the course of this work, based on pIC50 measurements conducted by Dr. Mathias Weiwad, that ligands containing a pyridinyl ring often exhibit better affinity in LpnMIP than their corresponding counterparts with a TMPR. It could be shown with MD simulations that the TMPR is barely able to bind to LpnMIP at the position preferred in the other proteins. This is caused by mutation of an amino acid (to Pro57) in this region of LpnMIP. Due to its rigidity, the TMPR is not able to adjust to the hardly flexible side chain of proline. Consequently, the interaction between protein and ligand is disrupted. The pyridinyl ring of Ref_p is not affected by this mutation since it binds at another position (Gln49, see above). The 80s loop contains more hydrophobic amino acids in MIP proteins than in FKB proteins. Position 90 is of particular interest, as there are sterically less demanding amino acids in BpsMIP and LpnMIP (Val, Pro) than in both FKB proteins (Ile, Lys). This difference was addressed with small hydrophobic substituents at the ligands’ phenyl ring. The favourable effects of the substitution in para-position by halogen atoms or a methyl group could be observed in initial docking experiments. pIC50 and pKi values measured by Dr. Mathias Weiwad und Dr. Mirella Vivoli confirmed this trend. Furthermore, the affinity for FKBP12 clearly decreased. MD simulations of both reference ligands as well as their derivatives substituted with chlorine or bromine showed that the phenyl ring preferentially adopts a conformation pointing towards the 80s loop in MIP proteins. In contrast, the phenyl ring is rotated by approximately 110° in FKB proteins, leading to decreased interactions with the binding pocket. This effect is especially pronounced in FKBP12. Based on these results, the phenyl ring was substituted by 4-Bromo-1H-imidazol-2-yl (ligand 8ap). A ligand containing this substituent can bind next to the 80s loop of BpsMIP maintaining the previously described orientation and simultaneously form a stable hydrogen bond to Asp37. Hence, a considerably higher binding affinity of this ligand to BpsMIP was predicted via LIE and MM/GBSA calculations. There were no changes in affinity for FKBP12 due to the instable interaction in this protein. The calculated energies can directly be used to rank different ligands in a binding pocket. In order to predict pIC50 and pKi values in different proteins, these energies require calibration versus experimentally measured affinities. Such a calibration was carried out for BpsMIP by linearly correlating pIC50 and pKi values with energies gained from MM/GBSA calculations. For the LIE method, parameters published by Lamb et al. were used. Both computational approaches yielded affinities in good agreement with experimentally measured pIC50 and pKi values of known ligands. The affinities predicted by these models for 8ap are better than the inhibition constants of all currently known inhibitors. Ideally, scores obtained by docking can directly be used to gain insights into the ligands’ affinities. However, sufficient accuracy for the proteins investigated could not be gained, due to the narrow range of the experimental pIC50 and pKi values. Consequently, logistic regression models were created to allow for assessment of the ligands based on their score. These models predict whether a ligand is likely to show submicromolar affinity in BpsMIP. The accuracy of these models was considerably increased by implementing three other descriptors (configuration at the stereo centre of the pipecolic acid, molecular weight and logD value). Thus, AUCs up to 0.9 could be achieved in the corresponding ROC curves. The models can be used for postprocessing a docking calculation in order to identify the most promising ligands and subsequently investigating them with computationally more demanding MD simulations. This work contributed to the improvement of the lead structures Ref_t and Ref_p. Many of the tested derivatives exhibited increased solubility while affinity was maintained. Furthermore, differences in the binding pockets of 32 MIP and FKB proteins were evaluated in detail for the first time. Five of these proteins were compared in MD simulations, both as apoproteins as well as complexed with different inhibitors. It was proven by these simulations that one amino acid in BpsMIP as well as in LpnMIP can selectively be addressed with a hydrogen bond. These interactions cannot be formed in the most prominent off-target FKBP12. LIE and MM/GBSA calculations proved that considerable modulation of the binding affinity towards BpsMIP is possible in these highly conserved binding pockets. KW - Computational chemistry KW - Macrophage Infectivity Potentiator Protein KW - Arzneimitteldesign KW - MIP protein KW - FKBP KW - docking KW - MD simulation KW - Burkholderia pseudomallei KW - Legionella pneumophila KW - Trypanosoma cruzi KW - Drug design KW - molecular dynamics Y1 - 2019 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-165757 ER - TY - THES A1 - Schaefer, Benjamin T1 - Computergestützte Untersuchungen zur Inhibition und Dynamik der ß-Ketoacyl-ACP-Synthase I (KasA) aus Mycobacterium tuberculosis T1 - Computer-based Investigations on Inhibition and Dynamics of Mycobacterium tuberculosis ß-Ketoacyl-ACP-Synthase I (KasA) N2 - Die vorliegende Arbeit beschreibt die Durchführung computergestützter Untersuchungen an den Wildtyp-Kristallstrukturen dieses Enzyms – einerseits zur Suche nach neuen Inhibitoren im Rahmen von virtuellen Screening- (VS-) Studien, andererseits zur Charakterisierung der strukturellen Flexibilität mit Hilfe von Molekulardynamik- (MD-) Simulationen. Für ein erstes VS wurde zunächst eine Datenbank von mehreren Millionen kommerziell erhältlichen Verbindungen mit Arzneistoff-ähnlichen physikochemischen Eigenschaften erstellt. Als Ausgangspunkt der Screening-Studie diente ein Teildatensatz, welcher mit Hilfe eines auf dem nativen Bindemodus des KasA-Inhibitors Thiolactomycin (TLM) beruhenden Pharmakophormodells erhalten wurde. Diese Verbindungen wurden in die Bindetasche von KasA gedockt und die Qualität der erhaltenen Posen in einem Re- und Konsensus-Scoring-Verfahren bewertet. Schließlich wurden 14 Substanzen käuflich erworben und im Rahmen einer Fluoreszenz-Bindungsstudie experimentell getestet. Für sechs Moleküle war gegenüber KasA eine schwache, zu TLM vergleichbare Aktivität zu verzeichnen. Eine zweite VS-Studie befasste sich mit der Bewertung der Bindungsaffinität synthetisch leicht zugänglicher Derivate von GS95, einem gegenüber dem KasA-Wildtyp aktiven Molekül mit einer 1-Benzyluracil-Grundstruktur. Anhand geeigneter Synthesebausteine wurde eine virtuelle Datenbank von insgesamt 16 Derivaten erstellt, welche in die Bindetasche des Enzyms gedockt wurden. Für die vorhergesagten Bindemodi erfolgte dann eine Abschätzung der freien Bindungsenthalpie. Nach einer Bewertung der Orientierungen auf Basis der errechneten ΔG-Werte sowie einer visuellen Analyse wurden schließlich elf Verbindungen synthetisiert und im Fluoreszenz-Experiment getestet, wobei für alle Uracilderivate eine Aktivität zu beobachten war. Die Kd-Werte fallen jedoch ähnlich hoch aus wie bei GS95. Zur Untersuchung der Strukturdynamik des KasA-Wildtyps wurden drei MD-Simulationen des homodimeren Proteins von je 15 ns Länge durchgeführt. Mit Hilfe von 2D-RMSD-Berechnungen und einer hierarchischen Clusteranalyse wurden aus den drei Simulationen insgesamt zehn repräsentative Snapshots entnommen, welche die im Rahmen der Simulationszeit von insgesamt 90 ns produzierte strukturelle Vielfalt der Bindetasche von KasA wiedergeben. Wie die Analysen zeigen, wird ein dualer Charakter hinsichtlich der Flexibilität der unmittelbaren Taschenreste beobachtet. Hierbei zeigt Phe404 eine besonders ausgeprägte strukturelle Vielfalt; diese Beobachtung deckt sich mit der gatekeeper-Rolle der Aminosäure zwischen der Malonyl-Bindetasche und dem Acyl-Bindekanal, welcher für die Unterbringung der wachsenden Fettsäurekette im Enzym während der Katalyse verantwortlich zeichnet. Darüber hinaus erklärt die hohe Flexibilität von Phe404 möglicherweise die recht schwache Bindungsaffinität von TLM gegenüber dem Wildtyp von KasA, da die gatekeeper–Aminosäure nur in der geschlossenen Form einen stabilisierenden Effekt auf den Liganden ausübt. Besondere Bedeutung kommt hierbei einem Wassermolekül zu, welches als eine Art molekularer Schalter für die Flexibilität von Phe404 betrachtet werden kann und somit die Fixierung von TLM in der Bindetasche maßgeblich beeinflusst. Des Weiteren wurden innerhalb der Tasche hohe Besetzungsraten für je ein Wassermolekül identifiziert. Die aus den MD-Simulationen gewonnenen Erkenntnisse wurden anschließend zur Aufstellung von Empfehlungen für das Design neuartiger KasA-Inhibitoren verwendet. Des Weiteren wurde die Dynamik des oben erwähnten Acyl-Bindekanals, welcher sich aus den Aminosäuren 115-147 zusammensetzt, näher charakterisiert. Hierbei wurden die Reste 115-119 und insbesondere Leu116 als zweiter gatekeeper identifiziert, welcher die Öffnung des Acyl-Bindekanals zur Oberfläche des Proteins reguliert und somit eine entscheidende Funktion bei der Unterbringung der langkettigen Fettsäuresubstrate übernimmt. Schließlich wurden zwei repräsentative Bindetaschenkonformationen aus den MD-Simulationen hinsichtlich einer Verwendung in strukturbasierten VS-Studien näher untersucht. Mit Hilfe von hot spot Analysen und unter Berücksichtigung oben genannter Empfehlungen für das Design neuartiger KasA-Inhibitoren wurden verschiedene Pharmakophormodelle erstellt, welche nach Durchsuchung der zu Anfang dieses Kapitels erwähnten virtuellen Moleküldatenbank zwischen 149 und 420 verschiedene hit-Strukturen lieferten. Folglich scheint eine Adressierung der beiden Konformationen durch arzneistoffartige Verbindungen prinzipiell möglich. Unter den erhaltenen Verbindungen herrscht eine hohe strukturelle Vielfalt; außerdem unterscheiden sich diese im Allgemeinen deutlich von den Molekülen aus den vorangegangenen VS Studien, was das Potential der beiden Bindetaschenkonformationen zur Identifizierung von potentiellen KasA-Inhibitoren mit neuartigen Grundstrukturen zum Ausdruck bringt. N2 - In the present study, computer-based investigations were applied to the wildtype crystal structures of this enzyme – on one hand, to identify new inhibitors in virtual screening (VS) studies and, on the other, to gather information about the dynamic behavior of KasA by means of molecular dynamics (MD) simulations. In a first VS, an in silico database containing several millions of commercially available drug-like compounds was built. This collection was screened via a pharmacophore model following the native binding mode of the KasA inhibitor thiolactomycin (TLM. The resulting subset then served as starting point for consequent docking studies and the predicted binding modes within the catalytic pocket of the protein were ranked by a re- and consensus-scoring approach. After additional visual inspection, 14 compounds were purchased and tested by means of direct binding fluorescence titrations. Six substances turned out to be active, even though only moderate dissociation constants similar to the data obtained for TLM (244.7 µM / 255.0 µM) were observed. In a second VS approach, the binding affinity was assessed for readily synthesizeable analogues of GS95, a 1 benzyluracil derivative showing an activity of 107.2 µM against wildtype KasA in the above mentioned fluorescence experiments. Based on appropriate building blocks which were in stock at the laboratory of Prof. Holzgrabe’s working group, a virtual library of 16 benzyl- and phenylethyluracil derivatives was created. The molecule structures were docked to the active site of KasA and the free energy of binding was estimated for the generated poses. By means of the ΔG values and visual analysis, a total of eleven compounds were selected to be synthesized and experimentally tested. All substances proved active in the fluorescence assay, yet showed only Kd values comparable to GS95. Moreover, no correlation was observed between experimentally determined and predicted free energies of binding. To probe the dynamic behavior of wildtype KasA (PDB codes 2WGD and 2WGE), three 15-ns MD simulations were performed of the homodimeric. By means of 2D RMSD calculations and a hierarchical cluster analysis, ten representative snapshots were extracted, reflecting the con-formational space of the binding pocket over a timescale of 90 ns in total. The analysis reveals a dual nature of the binding pocket in terms of flexibility. While the residues of the catalytic triad, Cys171, His311, and His345, plus Phe237, constitute the rather rigid part, a more flexible behavior is observed for the remaining residues. Among those, Phe404 presents the largest conformational alterations, which complies with its known role as a gatekeeper between the active site and the acyl-binding channel that accommodates the long-chain fatty acid substrates during catalysis. Furthermore, the high flexibility of Phe404 may account for the weak binding affinity of TLM to wildtype KasA, as only closed conformations of the gatekeeper side chain turned out to have a stabilizing effect on the ligand. In this regard, a water molecule between Ala209 and Ser138 was found to be of functional relevance, acting as a molecular switch that toggles the flexible behavior of the Phe404 side chain and, thereby, the fixation of TLM in the binding pocket. Also, high occupancy rates for a water molecule were registered at two positions within the active. Following the above findings, suggestions for the design of new KasA inhibitors were derived. Furthermore, the dynamics of the aforementioned acyl-binding channel comprising residues 115 147 were analyzed. Residues 115 119 and, in particular, Leu116 were identified as a second gatekeeper which regulates the opening between the acyl channel and the outside of the protein. Finally, two representative MD-snapshots of the binding were further examined in terms of their applicability in structure-based VS studies. Using hot-spot analyses and taking account of the above suggestions for the design of new KasA inhibitors, different pharmacophore models were created and applied to the virtual database mentioned at the beginning of this summary. The searches yielded between 149 and 420 different hit compounds, which indicates that addressing BK1 and BK2 by drug-like molecules is, in principle, possible. A fingerprint-based cluster analysis revealed a high structural diversity among the hits which, in general, also differ significantly from the scaffolds found in the two previous VS studies, pointing out the potential value of the two binding-pocket conformations for identifying putative KasA inhibitors with novel scaffolds. KW - Tuberkelbakterium KW - Arzneimitteldesign KW - Molekulardynamik KW - KasA KW - virtuelles Screening KW - Molekulardynamiksimulationen KW - MD-Simulationen KW - KasA KW - virtual screening KW - molecular dynamics simulations KW - MD simulations Y1 - 2012 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-74635 ER - TY - THES A1 - Scheiber, Josef Heinrich T1 - Entwicklung, Validierung und Anwendung einer interpretierbaren und alignment-freien 4D-QSAR Methodik T1 - Development, Validation and Application of an interpretable and alignment-free 4D-QSAR technique N2 - Die vorliegende Arbeit beschreibt die Entwicklung, Validierung und erfolgreiche Anwendung der interpretierbaren 4D-QSAR Methodik xMaP. Die neue Methode benötigt weder die Auswahl des vermuteten bioaktiven Konformers noch eine Überlagerung der Moleküle im Raum, sie ist also alignment-frei. xMaP ist invariant gegenüber Rotation, Translation und kodiert die Flexibilität der Moleküle. Dadurch wird der Einfluss durch den Benutzer praktisch ausgeschaltet. N2 - This thesis describes the development, validation and successful application of the interpretable 4D-QSAR technique xMaP. The novel method does neither rely on the selection of a presumed bioactive conformer nor on a spatial superimposition of the molecules which means that it is so-called alignment-free. Put differently, xMaP is invariant to rotation and translation and encodes the flexibility of the molecules under scrutiny. By combining these features a possible user bias is almost completely eliminated. KW - QSAR KW - Arzneimitteldesign KW - 4D-QSAR KW - Wirkstoffdesign KW - interpretierbar KW - alignment-frei KW - 4D-QSAR KW - drug design KW - interpretable KW - alignment-free Y1 - 2006 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-21273 ER - TY - THES A1 - Topf, Christine T1 - Design, Synthese und biologische Testung von KasA-Inhibitoren als potentielle Wirkstoffe gegen Mycobacterium tuberculosis T1 - Design, synthesis and biological testing of KasA-inhibitors as potential drugs against mycobacterium tuberculosis N2 - Im Mittelpunkt dieser Arbeit stand die Entwicklung neuer Wirkstoffe gegen Tuberkulose, einer schwerwiegenden bakteriellen Infektionskrankheit, die am häufigsten die Lunge befällt. Die Entwicklung neuer Arzneistoffe gegen diese Erkrankung ist immens wichtig, da nach Angaben der WHO weltweit jährlich über 1 Million Menschen an den Folgen der Tuberkulose sterben, derzeit kein effizienter Impfstoff zur Verfügung steht und sich die Therapiemöglichkeiten auf wenige Arzneistoffe beschränken. Zudem steigt weltweit das Auftreten von arzneistoff- und totalresistenten Tuberkuloseformen. Tuberkulose wird vorwiegend durch das Mycobacterium tuberculosis erregt. Eine Besonderheit des M. tuberculosis stellt die mykobakterielle Zellwand dar, da diese durch einen hohen Anteil an Fettsäuren besonders wachsartig und dick ist. Die mykobakterielle Fettsäuresynthese unterscheidet sich signifikant von der Synthese eukaryotischer Fettsäuren. Daher besteht die Möglichkeit, Inhibitoren der mykobakteriellen Fettsäuresynthese als effektive und selektive neue Antituberkulotika zu entwickeln. Zielstruktur dieser Arbeit ist KasA (β-Ketoacylsynthase), ein Enzym der mykobakteriellen Fettsäuresynthese II, das die Kondensation zwischen der wachsenden Fettsäurekette und Malonyl-ACP katalysiert. Ein literaturbekannter KasA-Inhibitor ist Thiolactomycin, ein Thiolacton-Derivat mit einer schwachen inhibitorischen Aktivität (IC50: 242 µM; Kd 226 µM), für den eine KasA-Komplexstruktur verfügbar ist. Ziel der Arbeit war es, mittels computergestützten Wirkstoffdesigns neue Leitstrukturen für KasA-Inhibitoren zu entwickeln und davon abgeleitet Substanzbibliotheken kleiner Moleküle zu synthetisieren. Zur Bestimmung der In-vitro-Aktivitäten sollte KasA exprimiert und ein Assay etabliert werden. Theoretische und experimentelle Affinitäten sollten anschließend analysiert und bewertet werden. Zur Identifizierung neuer potenzieller KasA-Inhibitoren wurde mit Hilfe des Thiolactomycin-Bindemodus ein Pharmakophor-Modell erstellt. In diesem wurden die essentielle Wasserstoffbrücke zwischen den Histidinen und dem Carbonyl-Sauerstoff des Thiolactonrings, zwei hydrophobe Bereiche und ein verbindendes Strukturelement definiert und das Volumen des Pharmakophors begrenzt. Das Screening der Datenbank erfolgte mit GOLD4.0 und GOLDscore. Zur Identifizierung der 16 aussichtsreichsten Verbindungen wurden Rescorings mit ChemScore und sfc_score290m durchgeführt, sowie verschiedene physikochemische Deskriptoren und der errechnete Bindungsmodus einbezogen. Ausgewählte Verbindungen des Screenings wurden synthetisiert. Weitere Variationen wurden durch Einführung von Substituenten und Bromierung und Nitrierung der Grundgerüste erhalten. Zur biologischen Testung dieser Verbindungen konnte KasA in M. smegmatis exprimiert werden. Die Reinigung des Proteins erfolgte mittels Affinitäts- und Größenausschlusschromatographie. Affinitätswerte an KasA konnten mit einem Fluoreszenzassays bestimmt werden, da in jedem KasA-Monomer vier Tryptophane zur intrinsischen Fluoreszenz beitragen. Die Bindung eines Inhibitors in die TLM-Bindetasche führte zum Quenching der Fluoreszenz von KasA und konnte unter Berücksichtigung von Verdünnungs- und inneren Filtereffekten zur Berechnung der Dissoziationskonstante Kd herangezogen werden. Die In-vitro-Untersuchungen der Inhibitoren von KasA zeigten im Vergleich zu TLM eine Verbesserung der Affinität bis zu einem Faktor von 11, die beste Verbindung war das Nitroisatin-Derivat 2l (22.1 µM). Einen Hinweis auf Hemmung des Wachstums von Mykobakterien war für die Verbindungen 2e (5-Nitro-1-phenethyl-2,3-indolindion) und 3a (5,7-Dibrom-1-(4-chlorbenzyl)indolin-2,3-dion) ersichtlich. Die übrigen Verbindungen zeigten keine Aktivität, was dadurch bedingt sein kann, dass sie Substanzen nicht lipophil genug sind (clogP-Werte zwischen 1 und 3), um die mykobakterielle Zellwand zu durchdringen. Analog dem Docking im Rahmen des virtuellen Screenings wurde ein Docking mit GOLD4.0 und GOLDscore für die Substanzbibliothek durchgeführt. Verglichen mit den In-vitro-Affinitäten konnte eine gute Übereinstimmung in der Differenzierung der Substanzklassen gefunden werden. Da kleine Moleküle mit großer biologischer Aktivität zu bevorzugen sind, wurde die „ligand efficiency“, die inhibitorische Potenz unabhängig vom Molekulargewicht, für die Verbindungen berechnet. Für die Substanzbibliothek wurde eine gute Korrelation von „ligand efficiency“ und GOLDscore pro Schweratom erzielt (R2=0.65), beste Substanzgruppen waren monoalkylierte Uracil- und Isatin-Derivate. Der beste Wert wurde für das Isatin-Derivat 1a erzielt. Mit den erarbeiteten theoretischen und experimentellen Ergebnissen und den etablierten Methoden bietet diese Arbeit eine wichtige Grundlage, um erste „hits“ von KasA-Inhibitoren zu neuen Leitstrukturen für Wirkstoffe gegen Mycobakterium tuberculosis zu entwickeln. N2 - This work focused on the development of new antibiotics against tuberculosis, a severe bacterial infection mainly affecting the lung. Currently, according to the WHO more than 1 million people annually die from tuberculosis. Furthermore, the therapy is limited to inefficient vaccines and a small number of antibiotics, and complicated by multi- or even totally resistant mycobacterial strains occurring worldwide. Thus, new active compounds against tuberculosis are urgently needed. Tuberculosis is mainly caused by Mycobacterium tuberculosis, which is characterized by a unique thick and waxy cell wall containing a high percentage of mycolic acids. Due to the fact that the biosynthesis of mycolic acids is not carried out in eukaryotes, it is a reasonable strategy to design inhibitors of the FAS II system as effective and selective antibiotics against mycobacteria. The enzyme of interest in our work is the β-keto-acyl ACP synthase (KasA), an elongating enzyme in the FAS II system of Mycobacterium tuberculosis which catalyses the condensation between the mycolic acid and malonyl-ACP. Recently, a crystal structure of KasA in complex with Thiolactomycin, a weak thiolactone-type inhibitor (IC50: 242 µM; Kd 226 µM), was solved. Aim of this work was to identify new potential lead structures for KasA-inhibitors by virtual screening. A library of small molecules was synthesized and tested for ability to inhibit KasA, therefore KasA was expressed. In silico and in vitro affinities were analyzed and compared. To identify new lead structures for potential KasA inhibitors, a pharmacophore model based on TLM was developed. This contained the essential H-bond between the carbonyl-oxygen of TLM with the histidines, two hydrophobic features and a linker feature between them. Additionally, volume constraints were applied to limit the size of molecules matching the pharmacophore model. Screening of a database of commercially available compounds was performed with GOLD4.0 and GOLDscore. 16 Promising structures were identified by implementation of rescorings with ChemScore and sfc_score290m, by calculation of physicochemical descriptors and by visual inspection of the predicted binding mode. Selected substances of the virtual screening were synthesized. Based on these substances the core fragments were varied by bromination and nitration. Via subsequent introduction of substituents a small library of compounds was created. For biological testings KasA was expressed in M. smegmatis. Purification of the protein was achieved by affinity and size exclusion chromatography. Dissociation constants were determined by a fluorescence assay: In each KasA monomer four tryptophanes cause intrinsic fluorescence, thus binding of inhibitors led to quenching of the fluorescence. Therefore, dissociation constants of ligands were calculated considering the dilution and inner filter effects. The in vitro studies of the KasA inhibitors showed, in comparison to TLM, a 11fold improvement of the affinity. The best inhibitor was the nitroisatine derivative 2l (22.1 µM). 2e (5-Nitro-1-phenethyl-2,3-indolindione) and 3a (5,7-Dibromo-1-(4-chlorbenzyl)indolin-2,3-dione) were able to inhibit the growth of mycobacteria. No other substances showed any antimycobacterial activity, which might be due to their low lipophilicity (clogP varies from 1 to 3), hence which hinders an efficient penetration through the highly lipophilic mycobacterial cell wall. In the future, the precise cause of this fact has to be determined to counteract with systematic structural modifications. The compound library was docked into KasA by using GOLD4.0 and GOLDscore with analogous settings as in the virtual screening. The analysis of the results showed an agreement between in vitro and in silico outcomes for the substance classes. As small molecules of high activity are preferred in drug development, ligand efficiencies of the inhibitors were calculated which describe inhibitory potency independent of molecular weight. A good correlation between ligand efficiency and GOLDscore per heavy atom was observed. Best ligand efficiencies were obtained by the classes of monoalkylated uracile- and isatine-derivatives, the best substance was the isatine-derivative 1a. Due to the established methods combined with computer-based and experimental results, this work provides an important foundation for the future development of first “hits” of KasA-inhibitors to new lead structures of new drugs against mycobacterium tuberculosis. KW - Tuberkelbakterium KW - Arzneimitteldesign KW - Ketoacyl-ACP-Synthase KW - Inhibitor KW - Virtuelles Screening KW - Fettsäuresynthese-II KW - KasA KW - Mykobakterien KW - virtual screening KW - fatty acid synthesis II KW - KasA Y1 - 2013 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-77865 ER -