TY  - THES
A1  - Diebold, Mathias
T1  - Virtuelles Screening und Entwicklung selektiver Liganden des Aurora-A – MYCN Komplexes und computergestützte Methoden zur Analyse und Design von PROTACs
T1  - Virtual screening and development of selective ligands for the Aurora-A - MYCN complex and computational methods for analysis and design of PROTACs
N2  - Die Interaktion des onkogenen Transkriptionsfaktors MYCN mit der Ser/Thr Kinase Aurora-A verhindert
dessen Abbau über das Ubiquitin Proteasomsystem indem die Rekrutierung des SCF FbxW7 Komplexes
verhindert wird. Die Kinase nimmt mit der Bindung an MYCN eine aktive Konformation ein und erhält
somit die Fähigkeit zur Kinaseaktivität ohne die sonst notwendige Phosphorylierung von Thr288 oder
die Anwesenheit eines Aktivators wie TPX2. Da hohe MYCN Konzentrationen Tumore wie
Neuroblastome antreiben, ist die Störung der Komplexbildung mit Aurora-A eine valide Strategie zur
Entwicklung von Chemotherapeutika. Einige Inhibitoren von Aurora-A wie Alisertib (MLN8237) sind in
der Lage, eine Konformationsänderung in der Kinase zu verursachen, die mit der Bindung von MYCN
inkompatibel ist und auf diese Weise den Abbau des Transkriptionsfaktors induziert. Da Aurora-A
wichtige Funktionen in der Mitose übernimmt, könnte eine direkte Adressierung des Komplexes anstelle
einer systemischen Inhibition der Kinase vielversprechender sein.
Ziel des Projektes war die Identifizierung von Molekülen, die selektiv an das Interface des
Aurora-A – MYCN Komplexes binden und weiter optimiert werden können, um einen gezielten Abbau
des Transkriptionsfaktors über einen PROTAC Ansatz zu ermöglichen. Virtuelle Screenings und
molekulardynamische Simulationen wurden durchgeführt, um kommerziell erhältliche Verbindungen zu
identifizieren, welche mit einer Bindetasche des Komplexes interagieren, die nur zustande kommt, wenn
beide Proteine miteinander interagieren. Aus einem ersten Set von zehn potentiellen Liganden wurde
für vier eine selektive Interaktion mit dem Protein – Protein Komplex gegenüber Aurora-A oder MYCN
alleine in STD-NMR Experimenten bestätigt. Zwei der Hits besaßen ein identisches Grundgerüst und
wurden als Ausganspunkt für die Optimierung zu potenteren Liganden genutzt. Das Gerüst wurde
fragmentweise vergrößert und in Richtung besserer in-silico Ergebnisse und Funktionalisierung zur
Anbringung von E3-Ligase-Liganden optimiert. Neun dieser Liganden der zweiten Generation wurden
synthetisiert.
Um quantitative Bindungsdaten zu erhalten, wurde ein kovalent verknüpftes Aurora-A – MYCN
Konstrukt entworfen. Die strukturelle und funktionale Integrität wurde in STD-NMR und BLI
Experimenten mit bekannten Aurora-A Inhibitoren bestätigt, sowie in NMR-basierten ATPase Assays.
Zusätzlich konnte die Kristallstruktur des Konstrukts gelöst und damit die Validität des Designs bestätigt
werden. Quantitative Messungen der synthetisierten Moleküle identifizierten HD19S als Hit mit einer
zehnfach höheren Affinität für das Aurora-A – MYCN Konstrukt im Vergleich zu der Kinase allein.
Zusätzlich wurden in-silico Untersuchungen zu PROTACs der Aurora-A Kinase durchgeführt.
Interaktionen zwischen Aurora-A, der E3-Ligase Cereblon und den Liganden wurden modelliert und für
die Erklärung unterschiedlicher Aktivitäten der eingesetzten PROTACs verwendet. Zudem zeigte das
aktivste PROTAC eine hohe Selektivität für Aurora-A gegenüber Aurora-B, obwohl die verwendete
Erkennungseinheit (Alisertib) an beide Aurora-Proteine bindet. Dieser Umstand konnte durch
energetische Analysen von molekulardynamischen Simulationen der ternären Komplexe erklärt werden.
Optimierungsmöglichkeiten für eine effizientere Degradation von Aurora-A durch die PROTACs wurden
basierend auf modifizierten Erkennungseinheiten und verbesserten Linkern untersucht.
N2  - The association of the oncogenic transcription factor MYCN with the Ser/Thr kinase Aurora-A prevents
its degradation via the ubiquitin proteasome system by preventing the SCF FbxW7 complex from binding.
The kinase adopts an active conformation when bound to MYCN, enabling kinase activity without prior
phosphorylation on Thr288 or the presence of an activator like TPX2, and therefore at inappropriate
times during the cell cycle. As high levels of MYCN have been shown to drive cancers like
neuroblastoma, disrupting the complex formation is thought to be a viable development strategy for
chemotherapeutics. Several small-molecule inhibitors of Aurora-A, like Alisertib (MLN8237), are able to
induce a conformational change in the kinase, preventing the formation of the protein – protein complex
and therefore promoting MYCN degradation. However, since Aurora-A has important roles during
mitosis targeting only the complex could be a more promising approach than the systemic inhibition of
the kinase.
This project aimed to identify small molecules which selectively bind at the Aurora-A – MYCN interface
and can be further optimized to induce targeted degradation via a PROTAC approach. Virtual screenings
and molecular dynamics simulations were performed to identify commercially available compounds
which should bind to a pocket formed only when the two proteins come together. Of a first set of ten
potential binders, four showed binding to the Aurora-A – MYCN complex but not the individual proteins
in STD-NMR experiments. Two of these hit molecules contained the same scaffold and were used as a
starting point for optimization towards more potent ligands. In a fragment-based fashion, the scaffold
was grown to achieve better affinity in-silico and provide linkage points for functionalization such as the
attachment of E3 ligase ligands to create PROTACs. Nine of these second-generation compounds were
then synthesized.
In order to obtain quantitative binding data a covalently linked Aurora-A – MYCN construct was
designed. Its structural and functional validity was shown in STD-NMR and BLI experiments with known
Aurora-A inhibitors and in NMR-based ATPase assays. In addition, a crystal structure of the construct
was solved, validating the designed structure. Quantitative measurements with the synthesized
compounds revealed a positive hit (HD19S) with a ten-fold higher affinity to the covalently linked AuroraA – MYCN as compared to Aurora-A alone.
Additionally, effects of PROTACs designed to degrade Aurora-A were studied in-silico. Interactions
between Aurora-A, the E3-ligase Cereblon and small molecules were modelled and successfully used
to explain the differences in activities observed with different PROTACs. The most active PROTAC also
showed a high selectivity for Aurora-A over Aurora-B, even though the recognition unit (Alisertib) can
bind both family members. Through energetic analysis of molecular dynamics simulations of the ternary
complexes, these differences could be explained. Optimizations for a more efficient degradation of
Aurora-A by the PROTACs were examined by changing the recognition unit and improving linkers.
KW  - Arzneimitteldesign
KW  - Protein-Protein-Wechselwirkung
KW  - Vernetzung <Chemie>
KW  - Wirkstoffdesign
KW  - PROTAC
KW  - Proteolysis-Targeting-Chimera
KW  - Aurora-A
KW  - MYCN
KW  - Aurora-A-MYCN-Komplex
Y1  - 2023
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-317594
ER  - 
TY  - THES
A1  - Kuhn, Maximilian
T1  - Strukturbasiertes Design von MIP-Inhibitoren und computergestützte Selektivitätsuntersuchung gegenüber MIP- und humanen FKB-Proteinen
T1  - Structure-based design of MIP-Inhibitors and computer-aided selectivity studies towards MIP and human FKB proteins
N2  - Bakterielle und parasitäre MIP-Proteine stellen wichtige Virulenzfaktoren dar, deren Inhibition das Überleben der Erreger sowie deren Penetration in menschliche Zellen stark einschränken kann. In dieser Arbeit standen die MIP-Proteine von Burkholderia pseudomallei (Auslöser der Melioidose) und Legionella pneumophila (Legionärskrankheit) im Fokus. Außerdem wurde das MIP-Protein von Trypanosoma cruzi (Chagas-Krankheit) untersucht. Die strukturverwandten humanen FKB-Proteine FKBP12 und FKBP52 sind relevante „off-targets“, wie Experimente mit Knockout-Mäusen gezeigt haben.
Ziel dieser Arbeit war die Verbesserung von bekannten MIP-Inhibitoren im Hinblick auf ihre Affinität und Selektivität für MIP-Proteine gegenüber den beiden genannten FKB-Proteinen bei gleichzeitig verbesserter Löslichkeit, mit Hilfe von in silico Methoden. Ausgangspunkt waren hierbei zwei von Dr. Christina Juli und Dr. Florian Seufert entwickelte Leitstrukturen, welche ein Pipecolinsäuregrundgerüst aufweisen. Diese Referenzliganden beinhalten einen 3,4,5-Trimethoxyphenylring (TMPR, vgl. Ref_t) bzw. einen Pyridinylring (Ref_p).
Beim Vergleich von insgesamt 32 MIP- und FKB-Proteinen konnten in zwei Loop-Bereichen, welche 50er bzw. 80er Loop genannt werden, relevante Unterschiede in der Aminosäuresequenz identifiziert werden. Die Nummerierung bezieht sich stets auf FKBP12. Diese Unterschiede ließen sich zum Design von vergleichsweise selektiv an MIP-Proteine bindenden Molekülen nutzen.
Der 50er Loop ist in nahezu allen MIP-Proteinen (jedoch nicht in BpsMIP) im Vergleich zu den FKB-Proteinen um zwei Aminosäuren verkürzt. Dadurch befindet sich das Proteinrückgrat von LpnMIP (Gln49) und TcrMIP (Arg49) näher am Zentrum der Bindetasche (definiert als Ile56, welches durch die Pipecolinsäureesterfunktion der Liganden adressiert wird). MD-Simulationen der beiden Apoproteine belegten, dass die geringere Distanz nicht durch Artefakte beim Modellieren der Strukturen bedingt ist. Aufbauend auf dieser Erkenntnis wurde gezeigt, dass der Pyridinylring von Ref_p eine Wasserstoffbrücke zu Gln49 ausbildet. Experimentell wurde dieser Befund durch eine entsprechende chemische Verschiebung der Aminosäure im NMR-Experiment von Dr. Kristian Schweimer bestätigt. Durch Überbrückung des Pipecolinsäurerings (Ligand 6bp) konnte die Wasserstoffbrücke in MD-Simulationen weiter stabilisiert werden. Durch Rechnungen zur Abschätzung der freien Bindungsenthalpien (mittels LIE und MM/GBSA) wurde eine erhöhte Affinität von 6bp im Vergleich zu Ref_p in LpnMIP ermittelt.
Im Laufe der Arbeit wurde anhand von pIC50-Werten, welche von Dr. Mathias Weiwad bestimmt wurden, erkannt, dass Liganden mit Pyridinylring oftmals eine bessere Affinität in LpnMIP aufweisen als die entsprechenden Liganden mit TMPR. Durch MD Simulationen wurde nachgewiesen, dass der TMPR in LpnMIP nur schwer an der in den anderen Proteinen bevorzugten Position binden kann. Grund hierfür ist die Mutation einer Aminosäure (zu Pro57) in diesem Bereich von LpnMIP: Diese verfügt über eine wenig flexible Seiten-kette, an welche sich der TMPR auf Grund seiner Rigidität nicht anpassen kann, was die Interaktion zwischen Protein und Ligand stört. Der Pyridinylring von Ref_p ist hiervon nicht betroffen, da er bevorzugt an einer anderen Stelle (Gln49, s. o.) bindet.
Der 80er Loop weist in vielen MIP-Proteinen deutlich hydrophobere Aminosäuren auf als in FKB-Proteinen. Von besonderem Interesse ist die Position 90, da hier in BpsMIP und LpnMIP sterisch weniger anspruchsvolle Aminosäuren (Val, Pro) vorliegen als in den bei-den FKB-Proteinen (Ile, Lys). Dieser Unterschied wurde mit kleinen hydrophoben Substituenten am Phenylring der Liganden adressiert. Bereits im Docking zeigten sich die positiven Effekte der para-Substitution durch Halogenatome oder eine Methylgruppe. Die von Dr. Mathias Weiwad und Dr. Mirella Vivoli ermittelten pIC50- bzw. pKi-Werte bestätigten diesen Trend. Zugleich nahm die Affinität zu FKBP12 deutlich ab. Bei der Untersuchung der Referenzliganden sowie deren Chlor- und Bromderivate in MD-Simulationen zeigte sich, dass der Phenylring der Liganden in den MIP-Proteinen bevorzugt in Richtung des 80er Loops orientiert ist; in den FKB-Proteinen liegt er hingegen um etwa 110° gedreht vor und kann somit schlechter mit der Bindetasche interagieren. Besonders ausgeprägt ist dieser Effekt in FKBP12. Basierend auf diesen Ergebnissen wurde der Phenylring durch einen 4-Bromo-1H-imidazol-2-ylsubstituenten ersetzt (Ligand 8ap). Dieser ist in der Lage, in der erwarteten Orientierung im Bereich des 80er Loops von BpsMIP zu binden und gleichzeitig eine stabile Wasserstoffbrücke zu Asp37 auszubilden. Hieraus resultiert für den Liganden eine deutlich höhere Affinität in LIE- und MM/GBSA-Rechnungen; in FKBP12 blieb sie auf Grund der dort instabilen Interaktion unverändert.
Die berechneten Energien können unmittelbar für einen relativen Vergleich verschiedener Liganden in einer Bindetasche verwendet werden. Für die Vorhersage von pKi- bzw. pIC50-Werten in den verschiedenen Proteinen ist eine Kalibrierung gegen die gemessenen Affinitäten erforderlich. Dies wurde für BpsMIP durchgeführt, indem eine lineare Korrelation zwischen den pKi- bzw. pIC50-Werten und den mit MM/GBSA ermittelten Energien aufgestellt wurde. Für LIE wurde auf publizierte Werte von Lamb et al. zurückgegriffen. Die berechneten Affinitäten stimmen für die bereits getesteten Inhibitoren gut mit den experimentellen pKi- und pIC50-Werten überein. Anhand der Modelle werden für 8ap Werte vorhergesagt, die besser als die experimentellen Affinitäten bekannter Liganden sind.
Idealerweise können auch aus den Scores, die durch Docking erhalten werden, bereits Rückschlüsse auf die Affinitäten der Liganden gezogen werden. Für die untersuchten Proteine war dies, auf Grund des engen Bereichs der experimentell ermittelten pKi- und pIC50-Werte, nicht mit hinreichender Richtigkeit möglich. Um die Scores dennoch für die Beurteilung neuer Liganden verwenden zu können, wurden logistische Regressionsmodelle erstellt. Anhand dieser kann abgeschätzt werden, ob ein Molekül in BpsMIP submikromolare Affinität aufweist. Die Richtigkeit dieser Vorhersagemodelle konnte durch die Berücksichtigung dreier weiterer Deskriptoren (Konfiguration am Stereozentrum der Pipecolinsäure, Molekulargewicht und logD-Wert) deutlich verbessert werden, wobei die AUC der entsprechenden ROC-Kurven Werte bis zu 0.9 erreichte. Diese Modelle können für die Postprozessierung eines Dockings angewendet werden, um die vielversprechendsten Kandidaten zu identifizieren und anschließend in rechnerisch anspruchsvolleren MD-Simulationen genauer zu untersuchen.
Mit dieser Arbeit wurde zur Weiterentwicklung der Leitstrukturen Ref_t und Ref_p beigetragen. Viele der getesteten Derivate wiesen deutlich verbesserte Löslichkeit bei gleichbleibender Affinität auf. Ferner wurden erstmalig detailliert die Unterschiede in den Bindetaschen zwischen 32 MIP- und FKB-Proteinen evaluiert. Hiervon wurden fünf in MD-Simulationen als Apoprotein und im Komplex mit verschiedenen Inhibitoren verglichen. Anhand dieser Simulationen wurde nachgewiesen, dass jeweils eine Aminosäure in BpsMIP und LpnMIP im Vergleich zum wichtigsten „off-target“ FKBP12 selektiv durch eine Wasserstoffbrücke adressiert werden kann. Durch LIE- und MM/GBSA-Rechnungen konnte gezeigt werden, dass in diesen hochkonservierten Bindetaschen eine bedeutende Modulation der Affinität zugunsten von BpsMIP möglich ist.
N2  - Bacterial and parasitic MIP proteins constitute important virulence factors. Inhibiting these proteins can considerably reduce the survival of the pathogens as well as their penetration into human host cells. The work presented in this thesis focused on the MIP proteins of Burkholderia pseudomallei (the causative agent of melioidosis) and Legionella pneumophila (Legionnaires’ disease). Furthermore, the MIP protein of Trypanosoma cruzi (Chagas disease) was also investigated. The structurally homologous human FKB proteins FKBP12 and FKBP52 were taken into account as relevant off-targets.
The aim of this thesis was to improve MIP inhibitors by means of in silico methods with respect to affinity and selectivity (for MIP proteins over FKBP12 and FKBP52) as well as solubility. The starting point for this task were two lead structures with a pipecolic acid scaffold from the work of Dr. Christina Juli and Dr. Florian Seufert. These reference ligands contain a 3,4,5-trimethoxyphenyl ring (TMPR, cf. Ref_t) or a pyridinyl ring (Ref_p).
By comparison of 32 MIP and FKB proteins major differences with regard to the amino acid sequence could be identified in two loop regions, the so called 50s and 80s loop (numbering always with respect to FKBP12). It was possible to utilise these differences for the design of molecules with preferential binding to MIP proteins.
The 50s loop is truncated by two amino acids in nearly all MIP proteins compared to the FKB proteins, except for BpsMIP. Thus, the protein backbone of LpnMIP (Gln49) and TcrMIP (Arg49) is located closer to the centre of the binding pocket. The centre is defined as Ile56, which is binding to the pipecolic ester function of the ligands. MD simulations of both apoproteins proved that the smaller distance is not caused by artefacts introduced during modelling of the structures. Expanding on this knowledge, it could be shown that the pyridinyl ring of Ref_p forms a hydrogen bond to Gln49. This finding was proven ex-perimentally by a corresponding chemical shift of the amino acid in an NMR experiment conducted by Dr. Kristian Schweimer. The hydrogen bond was stabilised further in MD simulations via bridging of the pipecolic acid ring (ligand 6bp). Calculations by MM/GBSA and LIE, estimating the binding free energies of the ligands, yielded im-proved affinity for 6bp compared to Ref_p in LpnMIP.
It was noted in the course of this work, based on pIC50 measurements conducted by Dr. Mathias Weiwad, that ligands containing a pyridinyl ring often exhibit better affinity in LpnMIP than their corresponding counterparts with a TMPR. It could be shown with MD simulations that the TMPR is barely able to bind to LpnMIP at the position preferred in the other proteins. This is caused by mutation of an amino acid (to Pro57) in this region of LpnMIP. Due to its rigidity, the TMPR is not able to adjust to the hardly flexible side chain of proline. Consequently, the interaction between protein and ligand is disrupted. The pyridinyl ring of Ref_p is not affected by this mutation since it binds at another position (Gln49, see above).
The 80s loop contains more hydrophobic amino acids in MIP proteins than in FKB proteins. Position 90 is of particular interest, as there are sterically less demanding amino acids in BpsMIP and LpnMIP (Val, Pro) than in both FKB proteins (Ile, Lys). This difference was addressed with small hydrophobic substituents at the ligands’ phenyl ring. The favourable effects of the substitution in para-position by halogen atoms or a methyl group could be observed in initial docking experiments. pIC50 and pKi values measured by Dr. Mathias Weiwad und Dr. Mirella Vivoli confirmed this trend. Furthermore, the affinity for FKBP12 clearly decreased. MD simulations of both reference ligands as well as their derivatives substituted with chlorine or bromine showed that the phenyl ring preferentially adopts a conformation pointing towards the 80s loop in MIP proteins. In contrast, the phenyl ring is rotated by approximately 110° in FKB proteins, leading to decreased interactions with the binding pocket. This effect is especially pronounced in FKBP12. Based on these results, the phenyl ring was substituted by 4-Bromo-1H-imidazol-2-yl (ligand 8ap). A ligand containing this substituent can bind next to the 80s loop of BpsMIP maintaining the previously described orientation and simultaneously form a stable hydrogen bond to Asp37. Hence, a considerably higher binding affinity of this ligand to BpsMIP was predicted via LIE and MM/GBSA calculations. There were no changes in affinity for FKBP12 due to the instable interaction in this protein.
The calculated energies can directly be used to rank different ligands in a binding pocket. In order to predict pIC50 and pKi values in different proteins, these energies require calibration versus experimentally measured affinities. Such a calibration was carried out for BpsMIP by linearly correlating pIC50 and pKi values with energies gained from MM/GBSA calculations. For the LIE method, parameters published by Lamb et al. were used. Both computational approaches yielded affinities in good agreement with experimentally measured pIC50 and pKi values of known ligands. The affinities predicted by these models for 8ap are better than the inhibition constants of all currently known inhibitors.
Ideally, scores obtained by docking can directly be used to gain insights into the ligands’ affinities. However, sufficient accuracy for the proteins investigated could not be gained, due to the narrow range of the experimental pIC50 and pKi values. Consequently, logistic regression models were created to allow for assessment of the ligands based on their score. These models predict whether a ligand is likely to show submicromolar affinity in BpsMIP. The accuracy of these models was considerably increased by implementing three other descriptors (configuration at the stereo centre of the pipecolic acid, molecular weight and logD value). Thus, AUCs up to 0.9 could be achieved in the corresponding ROC curves. The models can be used for postprocessing a docking calculation in order to identify the most promising ligands and subsequently investigating them with computationally more demanding MD simulations.
This work contributed to the improvement of the lead structures Ref_t and Ref_p. Many of the tested derivatives exhibited increased solubility while affinity was maintained. Furthermore, differences in the binding pockets of 32 MIP and FKB proteins were evaluated in detail for the first time. Five of these proteins were compared in MD simulations, both as apoproteins as well as complexed with different inhibitors. It was proven by these simulations that one amino acid in BpsMIP as well as in LpnMIP can selectively be addressed with a hydrogen bond. These interactions cannot be formed in the most prominent off-target FKBP12. LIE and MM/GBSA calculations proved that considerable modulation of the binding affinity towards BpsMIP is possible in these highly conserved binding pockets.
KW  - Computational chemistry
KW  - Macrophage Infectivity Potentiator Protein
KW  - Arzneimitteldesign
KW  - MIP protein
KW  - FKBP
KW  - docking
KW  - MD simulation
KW  - Burkholderia pseudomallei
KW  - Legionella pneumophila
KW  - Trypanosoma cruzi
KW  - Drug design
KW  - molecular dynamics
Y1  - 2019
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-165757
ER  - 
TY  - THES
A1  - Kesetovic, Diana
T1  - Synthesis and biological testing of potential anti-tuberculosis drugs targeting the β-ketoacyl ACP synthase
T1  - Synthese und biologische Untersuchung von β-ketoacyl-ACP-Synthase-Inhibitoren als potentielle Antituberkulotika
N2  - With 9.6 million new cases and 1.5 million deaths in 2014, tuberculosis (TB) is alongside with AIDS the most deadly infection.‎ Foremost, the increased prevalence of resistant strains of M. tuberculosis among the TB-infected population represents a serious thread. Hence, in the last decades, novel drug targets have been investigated worldwide. So far a relatively unexplored target is the cell wall enzyme β-ketoacyl-ACP-synthase “KasA”, which plays a crucial role in maintaining the membrane impermeability and hence the cell ability to resist to the immune response and drug therapy. KasA is a key enzyme in the fatty acid synthase “FAS-II” elongation cycle, responsible for the extension of the growing acyl chain within the biosynthesis of precursors for the most hydrophobic constituents of the cell wall – mycolic acids. Design of the novel KasA inhibitors, performed in the research group of Prof. Sotriffer by C. Topf and B. Schaefer, was based on the recently published crystal structure of KasA‎ in complex with its known inhibitor thiolactomycin (TLM). Considering the essential ligand-enzyme interactions, a pharmacophore model was built and applied in the virtual screening of a modified ZINC database. Selected hits with the best in silico affinity data have been reported by Topf‎ and Schaefer‎.

In this work, two of the obtained hits were synthesized and their structure was systematically varied. First, a virtual screening hit, chromone-2-carboxamide derivative GS-71, was modified in the amide part. Since the most of the products possessed a very low solubility in the aqueous buffer medium used in biological assays, polar groups (nitro, succinamidyl and trimethyl-amino substituent in position 6 of the chromone ring or hydroxyl group on the benzene ring in the amide part have been inserted to the molecule. Further variations yielded diaryl ketones, diaryl ketone bearing a succinamidyl substituent, carboxamide bearing a methylpiperazinyl-4-oxobutanamido group and methyl-malonyl ester amides. Basically, the essential structural features necessary for the ligand-enzyme interactions have been maintained. The latter virtual screening hit, a pyrimidinone derivative VS-8‎ was synthesized and the structure was modified by substitution in positions 2, 4, 5 and 6 of the pyrimidine ring. Due to autofluorescence, detected in most of the products, this model structure was not further varied. 

Simultaneously, experiments on solubilization of the first chromone-2-carboxamides with cyclodextrins, cyclic oligosacharides known to form water-soluble inclusion complexes, were performed. Although the assessed solubility of the chromone 3b/DIMEB (1:3) mixture exceeded 14-fold the intrinsic one, the achieved 100 µM solubility was still not sufficient to be used as a stock solution in the binding assay. The experiments with cyclodextrin in combination with DMSO were ineffective. Owing to high material costs necessary for the appropriate cyclodextrin amounts, the aim focused on structural modification of the hydrophobic products.

Precise structural data have been obtained from the solved crystal structures of three chromone derivatives: the screening hit GS-71 (3b), its trimethylammonium salt (18) and 6-nitro-substituted N-benzyl-N-methyl-chromone-2-carboxamide (9i). The first two compounds are nearly planar with an anti-/trans-rotamer configuration. In the latter structure, the carboxamide bridge is bent out of the chromone plane, showing an anti-rotamer, too. Considering the relatively low partition coefficient of compound 3b (cLogP = 2.32), the compound planarity and correlating tight molecular packing might be the factors significantly affecting its poor solubility. 
Regarding the biological results of the chromone-based compounds, similar structure-activity correlations could be drawn from the binding assay and the whole cell activity testing on M. tuberculosis. In both cases, the introduction of a nitro group to position 6 of the chromone ring and the presence of a flexible substituent in the amide part showed a positive effect. In the binding study, the nitro group at position 4 on the N-benzyl residue was of advantage, too. The highest enzyme affinity was observed for N-(4-nitrobenzyl)-chromone-2-carboxamide 4c (KD = 34 µM), 6-nitro substituted N-benzyl-chromone-2-carboxamide 9g (KD = 40 µM) and 6‑nitro-substituted N-(4-nitrobenzyl)-chromone-2-carboxamide 9j (KD = 31 µM), which could not be attributed to the fluorescence quenching potential of the nitro group. The assay interference potential of chromones, due to a covalent binding on the enzyme sulfhydryl groups, was found to be negligible at the assay conditions. Moderate in vivo activity was detected for 6‑nitro-substituted N-benzyl-chromone-2-carboxamide 9g and its N-benzyl-N-methyl-, N‑furylmethyl-, N-cyclohexyl- and N-cyclohexylmethyl derivatives 9i, 9d, 9e, 9f, for which MIC values 20 – 40 µM were assessed. Cytotoxicity was increased in the N‑cyclohexylmethyl derivative only. None of the pyrimidine-based compounds showed activity in vivo. The affinity of the model structure, VS-8, surpassed with KD = 97 µM the assessed affinity of TLM (KD = 142 µM). 

Since for the model chromone compound GS-71 no reliable KasA binding data could be obtained, a newly synthesized chromone derivative 9i was docked into the KasA binding site, in order to derive correlation between the in silico and in vitro assessed affinity. For the 6‑nitro-derivative 9i a moderate in vivo activity on M. tuberculosis was obtained. The in silico predicted pKi values for TLM and 9i were higher than the corresponding in vitro results, maintaining though a similar tendency, i.e., the both affinity values for compound 9i (pKi predicted = 6.64, pKD experimental = 4.02) surpassed those obtained for TLM (pKi predicted = 5.27, pKD experimental = 3.84). Nevertheless, the experimental pKD values are considered preliminary results. 

The binding assay method has been improved in order to acquire more accurate data. Owing to the method development, limited enzyme batches and solubility issues, only selected compounds could be evaluated. The best hits, together with the compounds active on the whole cells of M. tuberculosis, will be submitted to the kinetic enzyme assay, in order to confirm the TLM-like binding mechanism. Regarding the in vivo testing results, no correlations could be drawn between the predicted membrane permeability values and the experimental data, as for the most active compounds 9e  and 9f, a very low permeability was anticipated (0.4 and 0.7 %, respectively). Further biological tests would be required to investigate the action- or transport mode.
N2  - Mit 9.6 Millionen Neuerkrankungen und 1.5 Millionen Todesfällen im Jahr 2014 ist Tuberkulose (TB) neben AIDS die häufigste Todesursache unter Infektionskrankheiten.‎ Insbesondere die zunehmende Verbreitung resistenter Stämme von M. tuberculosis stellt eine ernste Gefahr dar. In den letzten Jahrzehnten wurde daher weltweit nach neuen möglichen Wirkstoff-Zielen gesucht. Bisher noch relativ unerforschtes Ziel ist das Zellwand-Enzym β Ketoacyl-ACP-Synthase "KasA", das eine entscheidende Rolle bei der Aufrechterhaltung der Membran-Dichtigkeit spielt, und somit den Zellen ermöglicht, gegen den Immunabwehr und Arzneimitteltherapie Resistenz zu zeigen. KasA ist ein Schlüsselenzym in der Fettsäure-Synthase-(FAS-II)-Elongationsrunde, die für die Erweiterung der wachsenden Acylkette während der Biosynthese der Vorstufen der hydrophobesten Zellwand-Bestandteilen – der Mykolsäuren, verantwortlich ist. Das Design der neuen KasA-Hemmer, das im Arbeitskreis von Prof. Sotriffer von C. Topf und B. Schäfer durchgeführt wurde, basiert auf der kürzlich veröffentlichten Kristallstruktur von KasA im Komplex mit seinem bekannten Inhibitor Thiolactomycin (TLM)‎. In Anbetracht der essentiellen Ligand-Enzym-Wechselwirkungen wurde ein Pharmakophor-Modell erstellt und im virtuellen Screening einer modifizierten ZINC-Datenbank angewendet. Die ausgewählten “Hits“ mit den besten In-silico-Affinitätsdaten wurden in den Doktorarbeiten von Topf‎ und Schaefer‎ veröffentlicht.

In Rahmen dieser Arbeit wurden zwei der erhaltenen “Hits“ synthetisiert und ihre Struktur systematisch variiert. Erste Modellstruktur, das Chromon-2-Carboxamid-Derivat GS-71‎. wurde zunächst in dem Amid-Rest modifiziert. Da die meisten Produkte (3a-p, 4a-k) eine sehr geringe Löslichkeit im wässrigen Puffermedium aufwiesen, wurden polare Gruppen in das Molekül eingefügt (Nitro, Succinamidyl- und Trimethyl-Amino-Substituenten in der 6 Stellung des Chromon-Rings, oder eine Hydroxyl-Gruppe am Benzolring im Amid-Teil. Weitere Variationen ergaben Diarylketone, ein Diarylketon mit der Succinamidyl Kette, ein Carboxamid mit dem Methylpiperazinyl-4-oxobutanamido-Substituenten und Methyl-Malonyl-Ester-Amide. Grundsätzlich wurden alle Strukturmerkmale notwendig für die Ligand-Enzym-Wechselwirkungen beibehalten. Die letztere Modellstruktur aus dem virtuellen Screening, das Pyrimidinon Derivat VS-8‎ wurde synthetisiert, und die Struktur wurde durch Substitution in den Positionen 2, 4, 5 und 6 des Pyrimidin-Rings modifiziert. Wegen Eigenfluoreszenz, detektiert in den meisten Produkten, wurde diese Modellstruktur nicht weiter variiert. 

Gleichzeitig wurden Experimente zur Solubilisierung der ersten Chromon-2-Carbonsäureamide mit Cyclodextrinen, cyclischen Oligosacchariden, die bekanntlich wasserlösliche Einschlusskomplexe bilden, durchgeführt. Obwohl die gemessene Löslichkeit des 3b/DIMEB (1:3)-Gemisches die intrinsische Löslichkeit um das 14-fache überschritt, war die erzielte Löslichkeit von 100 µM noch nicht ausreichend, um diese Lösung als Stammlösung im Assay zu verwenden. Die Experimente mit Cyclodextrin in Kombination mit DMSO waren unproduktiv. Aufgrund der hohen Materialkosten für die benötigten Cyclodextrinmengen wurden die Löslichkeit-Tests an dieser Stelle abgebrochen und eine strukturelle Modifizierung der hydrophoben Produkte stand in Vordergrund des Interesses.

Genaue Strukturdaten wurden aus den aufgeklärten Kristallstrukturen von drei Chromon-Derivaten, der Modellstruktur GS-71 (3b), seiner Trimethylammoniumsalz (18) und dem 6‑Nitro-substituierten N-Benzyl-N-methyl-Chromon-2-Carboxamid (9i), erhalten. Die ersten beiden Verbindungen sind mit einer anti-/trans-Rotamer Konfiguration fast planar. Die Carbonsäureamid-Brücke der letzteren Struktur, die ebenso ein anti-Rotamer darstellt, wird aus der Chromon Ebene gebogen. Angesichts des relativ geringen Verteilungskoeffizientes der Verbindung 3b (clogP = 2.32), die Ebenheit des Moleküls und das damit verbundene enge Molekülpackung könnten die wesentlich schlechtere Löslichkeit begründen. 
In Bezug auf die biologischen Ergebnisse der Chromon-basierten Verbindungen, ähnliche Struktur-Aktivitäts-Beziehungen können aus dem Bindungs-Assay, sowie aus dem Ganzzellaktivitätstests auf M. tuberculosis gezogen werden. In beiden Fällen zeigte die Einführung einer Nitrogruppe in die Position 6 des Chromon-Rings und das Vorhandensein eines flexiblen Substituents im Amidrest einen positiven Effekt. In dem Bindungs-Assay war die Nitrogruppe in Position 4 des N-Benzyl-Rests ebenso vorteilhaft. Die höchste Enzymaffinität wurde im Falle des N-(4-Nitrobenzyl)-Chromon-2-Carboxamid 4c (KD = 34 µM), des substituierten 6-nitro-N-Benzyl-Chromon-2-Carboxamid 9g (KD = 40 µM) und des 6-Nitro-substituierten N-(4-Nitrobenzyl)-Chromon-2-Carboxamid 9j (KD = 31 µM), beobachtet, allerdings konnte sie nicht dem Fluoreszenzlöschungspotenzial der Nitrogruppe zugeschrieben werden. Das Assay-Störpotential der Chromonverbindungen aufgrund einer kovalenten Bindung an die Sulfhydryl-Gruppen des Enzyms zeigte sich in den Assay-Bedingungen als vernachlässigbar. Moderate in vivo-Aktivitäten wurden für den 6-nitro substituierten N‑Benzyl-Chromon-2-Carboxamid 9g und dessen N-Benzyl-N-Methyl- (9i), N‑Furfurylmethyl-(9d), N-Cyclohexyl- (9e) und N-Cyclohexylmethyl- (9f) Derivate, für denen die MIC-Werte zwischen 20 und 40 µM erhalten wurden (siehe Tab. 17). Die Zytotoxizität wurde erhöht nur im Falle des N-Cyclohexylmethyl Derivates. Keine der Pyrimidin-basierten Verbindungen wies eine Aktivität in vivo auf. Die KasA-Affinität der Modellstruktur VS-8 übertraf mit KD = 97 µM die gemessene Affinität von TLM (KD = 142 µM).

Da für die Modell Chromon-Verbindung GS-71 keine zuverlässigen KasA Bindungsdaten erhalten werden konnten, ein neu-synthetisierte Chromon-Derivat 9i wurde in die KasA Bindungsstelle gedockt, um die Korrelation zwischen den In-silico- und In-vitro-Affinitätswerten abzuleiten. Für den 6-Nitroderivat 9i wurde eine mäßige Aktivität in vivo auf M. tuberculosis bestimmt. Die in silico-vorhergesagten pKi-Werte für TLM und 9i waren allgemein höher als die entsprechenden experimentellen Ergebnisse. Sie bewiesen allerdings eine ähnliche Tendenz, d.h. die beiden Affinitätswerte für die Verbindung 9i (pKi vorhergesagt = 6.64, pKD experimentell = 4.02) übertrafen die Werte von TLM (pKi vorhergesagt = 5.27, pKD experimentell = 3.84). Dennoch sind die experimentellen Affinitätsdaten nur als vorläufige Resultate zu betrachten, solange die Bindungsweise mittels des kinetischen Enzymassays verifiziert wird.

Die Assay-Methode wurde verbessert, um zuverlässigere Daten zu erhalten. Aufgrund der Verfahrensentwicklung, den limitierten Enzymchargen und Löslichkeitsprobleme konnten nur ausgewählte Verbindungen bewertet werden. Die besten “Hits“, zusammen mit den Verbindungen, die auf den ganzen Zellen von M. tuberculosis aktiv waren, werden dem kinetischen Enzymtest vorgelegt. In Bezug auf die In-vivo-Testergebnisse, es konnten keine Korrelationen zwischen den vorhergesagten Membranpermeabilität-Werten und den experimentellen Daten gezogen werden, da bei den wirksamsten Verbindungen 9e und 9f nur eine sehr geringe Permeabilität erwartet wurde (zu 0.4 und 0.7 %). Weitere biologische Tests wären erforderlich, um das Wirkungsmechanismus oder die Transportweise zu untersuchen.
KW  - Tuberkelbakterium
KW  - Inhibitor
KW  - Ketoacyl-ACP-Synthase <beta->
KW  - Arzneimitteldesign
KW  - Tuberculosis
KW  - Enzyme inhibitor
KW  - Synthesis
KW  - Ketoacyl-ACP-synthase
KW  - Chromone
KW  - Pyrimidinone
KW  - Tuberkulose
KW  - Synthese
KW  - Zellwand
KW  - Enzym
Y1  - 2016
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-131301
ER  - 
TY  - THES
A1  - Merget, Benjamin
T1  - Computational methods for assessing drug-target residence times in bacterial enoyl-ACP reductases and predicting small-molecule permeability for the \(Mycobacterium\)  \(tuberculosis\) cell wall
T1  - Computermethoden zur Bestimmung von Protein-Ligand Verweilzeiten in bakteriellen Enoyl-ACP Reduktasen und Vorhersage der Permeabilitätswahrscheinlichkeit kleiner Moleküle gegenüber der \(Mycobacterium\)  \(tuberculosis\) Zellwand
N2  - \textbf{Molecular Determinants of Drug-Target Residence Times of Bacterial Enoyl-ACP Reductases.} Whereas optimization processes of early drug discovery campaigns are often affinity-driven, the drug-target residence time $t_R$ should also be considered due to an often strong correlation with \textit{in vivo} efficacy of compounds. However, rational optimization of $t_R$ is not straightforward and generally hampered by the lack of structural information about the transition states of ligand association and dissociation. The enoyl-ACP reductase FabI of the fatty acid synthesis (FAS) type II is an important drug-target in antibiotic research. InhA is the FabI enzyme of \textit{Mycobacterium tuberculosis}, which is known to be inhibited by various compound classes. Slow-onset inhibition of InhA is assumed to be associated with the ordering of the most flexible protein region, the substrate binding loop (SBL). Diphenylethers are one class of InhA inhibitors that can promote such SBL ordering, resulting in long drug-target residence times. Although these inhibitors are energetically and kinetically well characterized, it is still unclear how the structural features of a ligand affect $t_R$.

Using classical molecular dynamics (MD) simulations, recurring conformational families of InhA protein-ligand complexes were detected and structural determinants of drug-target residence time of diphenyl\-ethers with different kinetic profiles were described. This information was used to deduce guidelines for efficacy improvement of InhA inhibitors, including 5'-substitution on the diphenylether B-ring. The validity of this suggestion was then analyzed by means of MD simulations.

Moreover, Steered MD (SMD) simulations were employed to analyze ligand dissociation of diphenylethers from the FabI enzyme of \textit{Staphylococcus aureus}. This approach resulted in a very accurate and quantitative linear regression model of the experimental $ln(t_R)$ of these inhibitors as a function of the calculated maximum free energy change of induced ligand extraction. This model can be used to predict the residence times of new potential inhibitors from crystal structures or valid docking poses.

Since correct structural characterization of the intermediate enzyme-inhibitor state (EI) and the final state (EI*) of two-step slow-onset inhibition is crucial for rational residence time optimization, the current view of the EI and EI* states of InhA was revisited by means of crystal structure analysis, MD and SMD simulations. Overall, the analyses affirmed that the EI* state is a conformation resembling the 2X23 crystal structure (with slow-onset inhibitor \textbf{PT70}), whereas a twist of residues Ile202 and Val203 with a further opened helix $\alpha 6$ corresponds to the EI state. Furthermore, MD simulations emphasized the influence of close contacts to symmetry mates in the SBL region on SBL stability, underlined by the observation that an MD simulation of \textbf{PT155} chain A with chain B' of a symmetry mate in close proximity of the SBL region showed significantly more stable loops, than a simulation of the tetrameric assembly. Closing Part I, SMD simulations were employed which allow the delimitation of slow-onset InhA inhibitors from rapid reversible ligands.

\textbf{Prediction of \textit{Mycobacterium tuberculosis} Cell Wall Permeability.} The cell wall of \textit{M. tuberculosis} hampers antimycobacterial drug design due to its unique composition, providing intrinsic antibiotic resistance against lipophilic and hydrophilic compounds. To assess the druggability space of this pathogen, a large-scale data mining endeavor was conducted, based on multivariate statistical analysis of differences in the physico-chemical composition of a normally distributed drug-like chemical space and a database of antimycobacterial--and thus very likely permeable--compounds. The approach resulted in the logistic regression model MycPermCheck, which is able to predict the permeability probability of small organic molecules based on their physico-chemical properties. Evaluation of MycPermCheck suggests a high predictive power. The model was implemented as a freely accessible online service and as a local stand-alone command-line version.

Methodologies and findings from both parts of this thesis were combined to conduct a virtual screening for antimycobacterial substances. MycPermCheck was employed to screen the chemical permeability space of \textit{M. tuberculosis} from the entire ZINC12 drug-like database. After subsequent filtering steps regarding ADMET properties, InhA was chosen as an exemplary target. Docking to InhA led to a principal hit compound, which was further optimized. The quality of the interaction of selected derivatives with InhA was subsequently evaluated using MD and SMD simulations in terms of protein and ligand stability, as well as maximum free energy change of induced ligand egress. The results of the presented computational experiments suggest that compounds with an indole-3-acethydrazide scaffold might constitute a novel class of InhA inhibitors, worthwhile of further investigation.
N2  - \textbf{Molekulare Determinanten von Wirkstoff-Angriffsziel Verweilzeiten bakterieller Enoyl-ACP Reduktasen.} In frühen Phasen der Wirkstoffentwicklung sind Optimierungsprozesse häufig affini\-täts\-geleitet. Darüber hinaus sollte zusätzlich die Wirkstoff-Angriffsziel Verweilzeit $t_R$ berücksichtigt werden, da diese oft eine starke Korrelation zur \textit{in vivo} Wirksamkeit der Substanzen aufweist. Rationale Optimierung von $t_R$ ist jedoch auf Grund eines Mangels an struktureller Information über den Übergangszustand der Ligandbindung und Dissoziierung nicht einfach umsetzbar. Die Enoyl-ACP Reduktase FabI der Fettsäurebio\-synthese (FAS) Typ II ist ein wichtiger Angriffspunkt in der Antibiotikaforschung. InhA ist das FabI Enzym des Organismus \textit{Mycobacterium tuberculosis} und kann durch Substanzen diverser Klassen gehemmt werden. Es wird vermutet, dass Hemmung von InhA durch langsam-bindende (``slow-onset'') Inhibitoren mit der Ordnung der flexibelsten Region des Enzyms assoziiert ist, dem Substratbindungsloop (SBL). Diphenylether sind eine InhA Inhibitorenklasse, die eine solche SBL Ordnung fördern und dadurch lange Verweilzeiten im Angriffsziel aufweisen. Obwohl diese Inhibitoren energetisch und kinetisch gut charakterisiert sind, ist noch immer unklar, wie die strukturellen Eigenschaften eines Liganden $t_R$ beeinflussen.

Durch die Verwendung klassischer Molekulardynamik (MD) Simulationen wurden wiederkehrende Konformationsfamilien von InhA Protein-Ligand Komplexen entdeckt und strukturelle Determinanten der Wirkstoff-Angriffsziel Verweilzeit von Diphenylethern mit verschiedenen kinetischen Profilen beschrieben. Anhand dieser Ergebnisse wurden Richtlinien zur Wirksamkeitsoptimierung von InhA Inhibitoren abgeleitet, einschließlich einer 5'-Substitution am Diphenylether B-Ring. Die Validität dieses Vorschlags wurde mittels MD Simulationen nachfolgend analysiert.

Darüber hinaus wurden ``Steered MD'' (SMD) Simulationen als MD Technik für umfangreicheres Sampling verwendet um die Liganddissoziation von Diphenylethern aus dem FabI Enzym von \textit{Staphylococcus aureus} zu untersuchen. Dieser Ansatz resultierte in einem sehr akkuraten, quantitativen linearen Regressionsmodell der experimentellen Verweilzeit $ln(t_R)$ dieser Inhibitoren als Funktion der berechneten maximalen freien Energieänderung induzierter Ligandextraktion. Dieses Modell kann genutzt werden um die Verweilzeiten neuer potentieller Inhibitoren aus Kristallstrukturen oder validen Dockingposen vorherzusagen.

Die korrekte strukturelle Charakterisierung des intermediären und des finalen Zustandes (EI und EI*-Zustand) eines Enzym-Inhibitor Komplexes bei einem zweistufigen Inhibitionsmechanismus durch langsam-bindende Hemmstoffe ist essentiell für rationale Verweilzeitoptimierung. Daher wurde die gegenwärtige Ansicht des EI und EI*-Zustandes von InhA mittels Kristallstrukturanalyse, MD und SMD Simulationen erneut aufgegriffen. Insgesamt bestätigten die Analysen, dass der EI*-Zustand einer Konformation ähnlich der 2X23 Kristallstruktur (mit langsam-bindenden Inhibitor \textbf{PT70}) gleicht, während eine Drehung der Reste Ile202 und Val203 mit einer weiter geöffneten Helix $\alpha 6$ dem EI-Zustand entspricht. Des Weiteren zeigten MD Simulationen den Einfluss naher Kristallkontakte zu Symmetrie-Nachbarn in der SBL Region auf die SBL Stabilität. Dies wird durch die Beobachtung hervorgehoben, dass die Ketten A und B' eines InhA-\textbf{PT155}-Komplexes und des angrenzenden Symmetrie-Nachbars, welche in engem Kontakt in der SBL Region stehen, signifikant stabilere SBLs aufweisen, als die Ketten A und B in einer Simulation des Tetramers. Zum Abschluss von Teil I wurden SMD Simulationen angewandt, auf deren Basis es möglich war, langsam-bindende InhA Inhibitoren von schnell-reversiblen (``rapid reversible'') Liganden zu unterscheiden.

\textbf{Vorhersage von \textit{Mycobacterium tuberculosis} Zellwand Permeabilität.} Die Zellwand von \textit{M.~tuberculosis} erschwert die antimycobakterielle Wirkstofffindung auf Grund ihrer einzigartigen Zusammensetzung und bietet eine intrinsische Antibiotikaresistenz gegenüber lipophilen und hydrophilen Substanzen. Um den chemischen Raum wirkstoffähnlicher Moleküle gegen diesen Erreger (``Druggability Space'') einzugrenzen, wurde eine groß angelegte Dataminingstudie durchgeführt, welche auf multivariater statistischer Analyse der Unterschiede der physikochemischen Zusammensetzung eines normalverteilten wirkstoffähnlichen chemischen Raumes und einer Datenbank von antimycobakteriellen -- und somit höchstwahrscheinlich permeablen -- Substanzen beruht. Dieser Ansatz resultierte in dem logistischen Regressionsmodell MycPermCheck, welches in der Lage ist die Permeabilitätswahrscheinlichkeit kleiner organischer Moleküle anhand ihrer physikochemischen Eigenschaften vorherzusagen. Die Evaluation von MycPermCheck deutet auf eine große Vorhersagekraft hin. Das Modell wurde als frei zugänglicher online Service und als lokale Kommandozeilenversion implementiert.

Methodiken und Ergebnisse aus beiden Teilen dieser Dissertation wurden kombiniert um ein virtuelles Screening nach antimycobakteriellen Substanzen durchzuführen. Myc\-PermCheck wurde verwendet um den chemischen Permeabilitätsraum von \textit{M.~tuberculosis} anhand der gesamten ZINC12 Datenbank wirkstoffähnlicher Moleküle abzuschätzen. Nach weiteren Filterschritten mit Bezug auf ADMET Eigenschaften, wurde InhA als exemplarisches Angriffsziel ausgewählt. Docking nach InhA führte schließlich zu einer Treffersubstanz, welche in darauffolgenden Schritten weiter optimiert wurde. Die Interaktionsqualität ausgewählter Derivate mit InhA wurde daraufhin mittels MD und SMD Simulationen in Bezug auf Protein und Ligand Stabilität, sowie auch der maximalen freien Energieänderung induzierter Ligandextraktion, untersucht. Die Ergebnisse der vorgestellten computerbasierten Experimente legen nahe, dass Substanzen mit einem Indol-3-Acethydrazid Gerüst eine neuartige Klasse von InhA Inhibitoren darstellen könnten. Weiterführende Untersuchungen könnten sich somit als lohnenswert erweisen.
KW  - Computational chemistry
KW  - Arzneimitteldesign
KW  - Molekulardynamik
KW  - Permeabilität
KW  - Tuberkelbakterium
KW  - Computational drug-design
KW  - steered molecular dynamics
KW  - molecular dynamics
KW  - residence time
KW  - mycobacterium tuberculosis
KW  - staphylococcus aureus
KW  - permeability
KW  - InhA
KW  - FabI
KW  - Enoyl-acyl-carrier-protein-Reductase <Enoyl-[acyl-carrier-protein]-Reductase>
KW  - Drug design
KW  - Computational chemistry
Y1  - 2015
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-127386
ER  - 
TY  - THES
A1  - Hein, Michael
T1  - Entwicklung computergestützter Methoden zur Bewertung von Docking-Lösungen und Entwurf niedermolekularer MIP-Inhibitoren
T1  - Development of computer-aided methods for the evaluation of docking poses and design of small-molecule MIP inhibitors
N2  - Dockingbasierte Ansätze zählen zu den wichtigsten Komponenten im virtuellen Screening. Sie dienen der Vorhersage der Ligandposition und -konformation in der Bindetasche sowie der Abschätzung der Bindungsaffinität zum Protein. Bis heute stellt die korrekte Identifizierung proteingebundener Ligandkonformationen ein noch nicht vollständig gelöstes Problem für Scoringfunktionen dar. Der erste Teil der vorliegenden Arbeit ist daher der Entwicklung computergestützter Methoden zur Bewertung von Docking-Lösungen gewidmet.

Der Fokus eines ersten Teilprojektes lag auf der Berücksichtigung der Absättigung vergrabener Wasserstoffbrückenakzeptoren (HBA) und -donoren (HBD) bei der Bewertung von Docking-Lösungen. Nicht-abgesättigte vergrabene HBA und HBD stellen einen der Bindungsaffinität abträglichen Beitrag dar, der bis dato aufgrund fehlender Struktur- bzw. Affinitätsdaten in Scoringfunktionen vernachlässigt wird. Im Rahmen der vorliegenden Arbeit wurde auf der Basis einer detaillierten Untersuchung zur Häufigkeit vergrabener nicht-abgesättigter HBA und HBD in hochaufgelösten Protein-Ligand-Komplexen des Hartshorn-Datensatzes eine empirische Filterfunktion („vnaHB“-Filterfunktion) entwickelt, die unerwünschte Ligandbindeposen erkennt und von der Bewertung mittels Scoringfunktionen ausschließt. Der praktische Nutzen der empirischen Filterfunktion wurde für die Scoringfunktionen SFCscore und DSX anhand vorgenerierter Docking-Lösungen des Cheng-Datensatzes untersucht. Die Häufigkeitsuntersuchung zeigt, dass eine Absättigung vergrabener polarer Gruppen in Protein-Ligand-Komplexen für eine hochaffine Protein-Ligand-Bindung notwendig ist, da vergrabene nicht-abgesättigte HBA und HBD nur selten auftreten. Eine vollständige Absättigung durch entsprechende Proteinpartner wird für ca. 48 % der untersuchten Komplexe beobachtet, ca. 92 % weisen weniger als drei hauptsächlich schwache, nicht-abgesättigte HBA bzw. HBD (z. B. Etherfunktionen) auf. Unter Einbeziehung von Wassermolekülen in die Häufigkeitsanalyse sind sogar für ca. 61 % aller Komplexe alle wasserstoffbrückenbindenden Gruppen abgesättigt. Im Gegensatz zu DSX werden für SFCscore nach Anwendung der empirischen Filterfunktion erhöhte Erfolgsraten für das Auffinden einer kristallnahen Pose (≤ 2.0 Å Abweichung) unter den am besten bewerteten Docking-Posen erzielt. Für die beste SFCscore-Funktion (SFCscore::229m) werden Steigerungen dieses als „Docking Power“ bezeichneten Kriteriums für die Top-3-Posen (Erfolgsrate für die Identifizierung einer kristallnahen 2.0 Å Pose unter den besten drei Docking-Lösungen) von 63.1 % auf 64.2 % beobachtet.

In einem weiteren Teilprojekt wurden repulsive Protein-Ligand-Kontakte infolge sterischer Überlappungen der Bindungspartner bei der Bewertung von Docking-Lösungen berücksichtigt. Die adäquate Einbeziehung solcher repulsiver Kontakte im Scoring ist für die Identifizierung proteingebundener Ligandkonformationen entscheidend, jedoch aufgrund fehlender Affinitäts- bzw. Strukturdaten problematisch. Im Rahmen der vorliegenden Arbeit wurde auf der Basis des Lennard-Jones-Potentiales des AMBER-Kraftfeldes zunächst ein neuer Deskriptor zur Beschreibung repulsiver Kontakte („Clash“-Deskriptor) entwickelt und zur Untersuchung der Häufigkeit ungünstiger Protein-Ligand-Kontakte in hochaufgelösten Protein-Ligand-Komplexen des Hartshorn-Datensatzes herangezogen. Eine aus der Häufigkeitsverteilung abgeleitete empirische Filterfunktion („Clash“-Filterfunktion) wurde anschließend der Bewertung von Docking-Lösungen des Cheng-Datensatzes mittels der Scoringfunktionen SFCscore und DSX vorgeschaltet, um unerwünschte Ligandbindeposen auszuschließen. Die Häufigkeitsuntersuchung zeigt, dass vorwiegend schwache repulsive Kontakte in Protein-Ligand-Komplexen auftreten. So werden in 75 % der Komplexe des Hartshorn-Datensatzes abstoßende Potentiale unter 0.462 kcal/mol beobachtet. Zwar betragen die ungünstigen Beiträge pro Komplex für 50 % aller Strukturen ca. 0.8 kcal/mol bis 2.5 kcal/mol, jedoch können diese auf Ungenauigkeiten der Kristallstrukturen zurückzuführen sein bzw. durch günstige Protein-Ligand-Wechselwirkungen kompensiert werden. Die Anwendung der „Clash“-Filterfunktion zeigt signifikante Verbesserungen der Docking Power für SFCscore. Für die beste SFCscore-Funktion (SFCscore::frag) werden Steigerungen der Erfolgsraten für das Auffinden einer kristallnahen Pose unter den drei am besten bewerteten Docking-Lösungen von 61.4 % auf 86.9 % erzielt, was an die Docking Power der bis dato besten Scoringfunktionen aus der Literatur (z. B. DSX, GlideScore::SP) heranreicht (Docking Power (DSX): 92.6 %; Docking Power (GlideScore::SP): 86.9 %). Die „Clash“-Filterfunktion allein ist auch der Kombination der „Clash“- und der „vnaHB“-Filterfunktion überlegen.

Ein weiterer Schwerpunkt der vorliegenden Arbeit wurde auf die Einbeziehung von Decoy-Daten (Struktur- und Affinitätsdaten schwach affiner und inaktiver Liganden) im Zuge der Entwicklung computergestützter Methoden zur Bewertung von Docking-Lösungen gelegt. Dadurch soll eine adäquate Berücksichtigung ungünstiger Beiträge zur Bindungsaffinität ermöglicht werden, die für die Richtigkeit und Zuverlässigkeit ermittelter Vorhersagen essentiell ist. In der vorliegenden Arbeit wurden binäre Klassifizierungsmodelle zur Bewertung von Docking-Lösungen entwickelt, die die Einbeziehung von Decoy-Daten ohne die Verfügbarkeit von Affinitätsdaten erlauben. Der Random-Forest-Algorithmus (RF), SFCscore-Deskriptoren, der neu entwickelte „Clash“-Deskriptor, und die Decoy-Datensätze von Cheng und Huang (Trainingsdaten) bilden die Grundlage des leistungsfähigsten Klassifizierungsmodells. Der praktische Nutzen des „besten“ RF-Modells wurde nach Kombination mit der Scoringfunktion DSX anhand der Docking Power für das Auffinden einer kristallnahen Pose auf Rang 1 am unabhängigen Cheng-/Huang- (Komplexe, die nicht in den Trainingsdaten enthalten sind) und CSAR-2012-Testdatensatz untersucht. Gegenüber einer alleinigen Anwendung von DSX werden an beiden Testdatensätzen weitere Verbesserungen der Docking Power erzielt (Cheng-/Huang-Testdatensatz: DSX 84.24 %, RF 87.27 %; CSAR-2012-Testdatensatz: DSX 87.93 %, RF 91.38 %). Das „beste“ Modell zeichnet sich durch die zuverlässige Vorhersage richtig-positiver Docking-Lösungen für einige wenige Komplexe aus, für die DSX keine kristallnahe Ligandkonformation identifizieren kann. Ein visueller Vergleich der jeweils am besten bewerteten RF- und DSX-Pose für diese Komplexe zeigt Vorteile des RF-Modells hinsichtlich der Erkennung für die Protein-Ligand-Bindung essentieller Wechselwirkungen. Die Untersuchung der Bedeutung einzelner SFCscore-Deskriptoren für die Klassifizierung von Docking-Lösungen sowie die Analyse der Misserfolge nach Anwendung des Modells geben wertvolle Hinweise zur weiteren Optimierung der bestehenden Methode. Hinsichtlich der zu bewertenden Eigenschaften ausgeglichenere Trainingsdaten, Weiterentwicklungen bestehender SFCscore-Deskriptoren sowie die Implementierung neuer Deskriptoren zur Beschreibung bis dato nicht-berücksichtigter Beiträge zur Bindungsaffinität stellen Ansatzpunkte zur Verbesserung dar.

Der zweite Teil der vorliegenden Arbeit umfasst die Anwendung dockingbasierter Methoden im Rahmen der Entwicklung neuer Inhibitoren des „Macrophage Infectivity Potentiator“-(MIP)-Proteins von Legionella pneumophila und Burkholderia pseudomallei.

Das MIP-Protein von Legionella pneumophila stellt einen wichtigen Virulenzfaktor und daher ein attraktives Zielprotein für die Therapie der Legionellose dar. Im Rahmen der vorliegenden Arbeit erfolgten systematische Optimierungen des Pipecolinsäure-Sulfonamides 1, des bis dato besten niedermolekularen MIP-Inhibitors (IC50 (1): 9 ± 0.7 µM). Nach Hot-Spot-Analysen der Bindetasche wurden Docking-Studien zur Auswahl aussichtsreicher Kandidaten für die Synthese und Testung auf MIP-Inhibition durchgeführt. Die Ergebnisse der Hot-Spot-Analysen zeigen günstige Wechselwirkungsbereiche für Donorgruppen und hydrophobe Substituenten in meta-Position sowie Akzeptorgruppen in para-Position des Benzylringes von 1 auf. Die Einführung einer Nitrofunktion in para-Position des Benzylringes von 1 (2h) resultiert in einer erhöhten MIP-Inhibition (IC50 (2h): 5 ± 1.5 µM), was wahrscheinlich auf die Ausbildung einer zusätzlichen Wasserstoffbrücke zu Gly116 zurückzuführen ist. Selektivitätsverbesserungen gegenüber dem strukturverwandten humanen FKBP12-Protein werden insbesondere für das para-Aminoderivat von 1 (2n) erzielt (Selektivitätsindex (1): 45, Selektivitätsindex (2n): 4.2; mit Selektivitätsindex = IC50 (MIP)/IC50 (FKBP12)). Der Ersatz des hydrophoben Trimethoxyphenylrestes von 1 durch einen Pyridinring (2s) führt zu einer verbesserten Löslichkeit bei vergleichbarer MIP-Inhibition.

Das MIP-Protein von Burkholderia pseudomallei spielt eine wichtige Rolle in der Pathogenese der Melioidose und stellt daher ein attraktives Zielprotein für die Entwicklung neuer Arzneistoffe dar. In der vorliegenden Arbeit erfolgten Optimierungen des bis dato besten niedermolekularen MIP-Inhibitors 1. Ausgehend von einem Strukturvergleich von Burkholderia pseudomallei MIP mit Legionella pneumophila MIP und einer Hot-Spot-Analyse der Burkholderia pseudomallei MIP-Bindetasche wurden Docking-Studien zur Auswahl aussichtsreicher Kandidaten für die Synthese und Testung auf MIP-Inhibition durchgeführt. Der Strukturvergleich zeigt eine hohe Homologie beider Bindetaschen. Größere konformelle Änderungen werden lediglich für den von Ala94, Gly95, Val97 und Ile98 geformten Bindetaschenbereich beobachtet, was unterschiedliche Optimierungsstrategien für 1 erforderlich macht. Günstige Wechselwirkungsbereiche der Burkholderia pseudomallei MIP-Bindetasche finden sich einerseits für Donorgruppen oder hydrophobe Substituenten in para-Position des Benzylringes (Region A) von 1, andererseits für Akzeptor- bzw. Donorgruppen in para- bzw. meta-/para-Position des Trimethoxyphenylringes (Region B). Anhand von Docking-Studien konnten sowohl für Variationen in Region A als auch in Region B aussichtsreiche Kandidaten identifiziert werden. Initiale MIP-Inhibitionsmessungen der bis dato synthetisierten Derivate deuten auf erhöhte Hemmungen im Vergleich zu 1 hin. Der Ersatz des hydrophoben Trimethoxyphenylrestes von 1 durch einen Pyridinring führt auch hier zu vergleichbarer MIP-Inhibition bei verbesserter Löslichkeit. Derzeit sind weitere Synthesen und Testungen aussichtsreicher Liganden durch die Kooperationspartner geplant. Die Ergebnisse der Inhibitionsmessungen sollen deren Nutzen als MIP-Inhibitoren aufzeigen und wertvolle Informationen für weitere Zyklen des strukturbasierten Wirkstoffdesigns liefern.
N2  - Docking-based approaches belong to important virtual screening components and aim at predicting both the ligand position and conformation within the protein binding site as well as the binding affinity. To date scoring functions are still not fully reliable in correctly identifying near-native ligand conformations generated by docking. Thus, the first part of the current work is dedicated to the development of computer-aided methods for the evaluation of docking poses.

A first project focused on considering the saturation of hydrogen bond acceptors (HBA) and donors (HBD) for the evaluation of docking poses. Since structural and affinity data are missing, current scoring functions neglect unpaired buried HBA and HBD, which strongly disfavour high-affinity binding. Based on a detailed frequency analysis of unpaired buried HBA and HBD within high-quality protein-ligand complexes of the Hartshorn dataset, an empirical filter function (“vnaHB” filter function) was developed to remove unfavourable ligand binding poses prior to the ranking with scoring functions. The practical benefit of the filter function was investigated for the scoring functions SFCscore and DSX using pre-generated docking poses of the Cheng dataset. As shown in the frequency analysis, the saturation of buried polar groups is of utmost importance for high-affinity binding, as unpaired buried HBA and HBD are extremely rare. A complete saturation by proper protein counterparts is observed for about 48 % of all complexes under study, whereas approximately 92 % have less than three, mostly weak unpaired buried HBA or HBD (e.g. ether functions). Including also the saturation by water molecules reveals that actually for about 61 % of all complexes every hydrogen bonding group is saturated. Unlike DSX, the application of the filter function with SFCscore results in higher success rates for identifying a near-native 2.0 Å pose under the top scored poses, a criterion termed “Docking Power”. For the best SFCscore function (SFCscore::229m) the Docking Power with respect to the top three poses increases from 63.1 % to 64.2 %.

A further project focused on considering repulsive intermolecular contacts due to sterical overlap of the protein-ligand binding partners for the evaluation of docking poses. Although an inclusion of such repulsive contacts in scoring is of utmost importance for the identification of protein-bound ligand conformations, it remains challenging because of missing structural and affinity data. Based on the Lennard-Jones potential of the AMBER force field a new descriptor accounting for repulsive protein-ligand contacts (“clash” descriptor) was developed and used for analysing the frequency of unfavourable protein-ligand contacts among high-quality structures of the Hartshorn dataset. An empirical filter function (“clash” filter function) derived from the frequency distribution was applied to pre-generated docking poses of the Cheng dataset to remove unfavourable ligand binding poses prior to the ranking with SFCscore and DSX. As shown in the frequency analysis, mostly weakly repulsive contacts occur within protein-ligand complexes. For 75 % of the complexes of the Hartshorn dataset repulsive potentials of less than 0.462 kcal/mol are observed. Indeed, unfavourable contributions add up to not more than 0.8 kcal/mol to 2.5 kcal/mol per complex for 50 % of all structures; values in this range may be attributed to inaccuracies of crystal structures or could be counterbalanced by favourable protein-ligand interactions. The application of the “clash” filter function shows significant improvements of the Docking Power of SFCscore. For the best SFCscore function (SFCscore::frag) the success rates for identifying a near-native 2.0 Å pose under the three top scored poses increases from 61.4 % to 86.9 %, which is comparable to the Docking Power of the best scoring functions (e.g. DSX, GlideScore::SP) currently available in literature (Docking Power (DSX): 92.6 %; Docking Power (GlideScore::SP): 86.9 %). The “clash” filter function alone is also superior to the combination of the “clash” and the “vnaHB” filter function.

Another focus of the work was the inclusion of decoy data (structure and affinity data of weakly active and inactive ligands) in scoring function development. Thus, unfavourable contributions to the binding affinity should be adequately considered, which appears essential for improving accuracy and reliability of the predictions. Within the scope of this work a binary classification model was developed for the evaluation of docking poses, allowing the inclusion of decoy poses without affinity data. The random forest algorithm (RF), SFCscore descriptors, the new “clash” descriptor, and the decoy datasets of Cheng and Huang (training data) provide the basis of the best-performing model. The practical benefit of the “best” RF model was investigated after combination with the scoring function DSX based on the Docking Power for identifying a near-native pose on rank 1 using the independent Cheng/Huang (only complexes not used for training) and the CSAR-2012 dataset. With respect to the standalone application of DSX, improvements of the Docking Power regarding both test sets are achieved (Cheng/Huang test set: DSX 84.24 %, RF 87.27 %; CSAR-2012 test set: DSX 87.93 %, RF 91.38 %). A key feature of the “best” model are reliable predictions of true positive docking poses for those complexes for which DSX fails to identify a near-native ligand conformation. A visual comparison of the best RF and DSX pose highlights advantages of the RF model regarding the recognition of interactions crucial for protein-ligand binding. The importance analysis of SFCscore descriptors for the classification of docking poses as well as the investigation of failures after model application provide useful hints for further improvements. Thus, more property-balanced training data, the further development of established SFCscore descriptors, and the implementation of new descriptors accounting for neglected contributions to the binding affinity constitute possible starting points for future improvements.

The second part of this work is dedicated to the application of docking-based methods for the development of new inhibitors of the "`Macrophage Infectivity Potentiator"'-(MIP) proteins of Legionella pneumophila and Burkholderia pseudomallei.

The MIP protein of Legionella pneumophila constitutes an important virulence factor and thus an attractive target for the treatment of legionellosis. Within the scope of this work the pipecolic acid sulfonamide 1, one of the best small-molecule MIP inhibitors to date (IC50 (1): 9 ± 0.7 µM), was systematically optimised. After hot spot analysis of the binding pocket, docking studies were conducted to select promising candidates for synthesis and testing MIP inhibition. The results of the hot spot analysis show favourable interaction fields for donor groups and hydrophobic substituents in meta position as well as acceptor groups in para position of the benzyl ring of 1. Introducing a nitro function in para position of the benzyl ring of 1 (2h) results in an increased MIP inhibition (IC50 (2h): 5 ± 1.5 µM), which is likely due to the formation of an additional hydrogen bond to Gly116. An improvement in the selectivity compared to the structurally related human FKBP12 protein is achieved particularly with the para amino derivative of 1 (2n) (selectivity index (1): 45, selectivity index (2n): 4.2, where the selectivity index = IC50 (MIP)/IC50 (FKBP12)). Replacing the hydrophobic trimethoxyphenyl residue of 1 with a pyridine ring (2s) leads to improved solubility and comparable MIP inhibition.

The MIP protein of Burkholderia pseudomallei plays an important role in the pathogenesis of melioidosis and thus constitutes an attractive target for the development of new drugs against this disease. Within the scope of this work the currently best small-molecule MIP inhibitor 1 was optimised. Starting with a structural comparison of Burkholderia pseudomallei MIP and Legionella pneumophila MIP, as well as a hot spot analysis of the Burkholderia pseudomallei MIP binding pocket, docking studies were conducted to select promising candidates for synthesis and testing for MIP inhibition. The structural comparison reveals a high homology of the two binding pockets. Major conformational changes are observed for the binding pocket region formed by Ala94, Gly95, Val97 and Ile98, which necessitates different optimisation strategies for 1. Favourable interaction fields for the Burkholderia pseudomallei MIP binding pocket are found for donor groups or hydrophobic substituents in para position of the benzyl ring (region A) of 1 as well as for acceptor or donor groups in para or meta/para position of the trimethoxyphenyl ring (region B). On the basis of the docking studies promising candidates could be identified for variations in both regions. Initial MIP inhibition measurements of synthesised derivatives indicate increased inhibition compared to 1. Replacing the hydrophobic trimethoxyphenyl residue of 1 with a pyridine ring (yielding a more soluble derivative) leads again to comparable MIP inhibition. Further syntheses and tests of promising ligands are currently being planned by the collaboration partners. The results of the inhibition measurements should demonstrate their suitability as MIP inhibitors and provide useful information for future structure-based drug design cycles.
KW  - Arzneimitteldesign
KW  - Computational chemistry
KW  - Legionella pneumophila
KW  - Burkholderia
KW  - Strukturbasiertes Wirkstoffdesign
KW  - Docking
KW  - Scoringfunktionen
KW  - Legionella pneumophila
KW  - Burkholderia pseudomallei
KW  - Structure-based drug design
KW  - Docking
KW  - Scoring functions
KW  - Legionella pneumophila
KW  - Burkholderia pseudomallei
KW  - Maschinelles Lernen
Y1  - 2014
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-101585
ER  - 
TY  - THES
A1  - Topf, Christine
T1  - Design, Synthese und biologische Testung von KasA-Inhibitoren als potentielle Wirkstoffe gegen Mycobacterium tuberculosis
T1  - Design, synthesis and biological testing of KasA-inhibitors as potential drugs against mycobacterium tuberculosis
N2  - Im Mittelpunkt dieser Arbeit stand die Entwicklung neuer Wirkstoffe gegen Tuberkulose, einer schwerwiegenden bakteriellen Infektionskrankheit, die am häufigsten die Lunge befällt. Die Entwicklung neuer Arzneistoffe gegen diese Erkrankung ist immens wichtig, da nach Angaben der WHO weltweit jährlich über 1 Million Menschen an den Folgen der Tuberkulose sterben, derzeit kein effizienter Impfstoff zur Verfügung steht und sich die Therapiemöglichkeiten auf wenige Arzneistoffe beschränken. Zudem steigt weltweit das Auftreten von arzneistoff- und totalresistenten Tuberkuloseformen. Tuberkulose wird vorwiegend durch das Mycobacterium tuberculosis erregt. Eine Besonderheit des M. tuberculosis stellt die mykobakterielle Zellwand dar, da diese durch einen hohen Anteil an Fettsäuren besonders wachsartig und dick ist. Die mykobakterielle Fettsäuresynthese unterscheidet sich signifikant von der Synthese eukaryotischer Fettsäuren. Daher besteht die Möglichkeit, Inhibitoren der mykobakteriellen Fettsäuresynthese als effektive und selektive neue Antituberkulotika zu entwickeln. Zielstruktur dieser Arbeit ist KasA (β-Ketoacylsynthase), ein Enzym der mykobakteriellen Fettsäuresynthese II, das die Kondensation zwischen der wachsenden Fettsäurekette und Malonyl-ACP katalysiert. Ein literaturbekannter KasA-Inhibitor ist Thiolactomycin, ein Thiolacton-Derivat mit einer schwachen inhibitorischen Aktivität (IC50: 242 µM; Kd 226 µM), für den eine KasA-Komplexstruktur verfügbar ist. Ziel der Arbeit war es, mittels computergestützten Wirkstoffdesigns neue Leitstrukturen für KasA-Inhibitoren zu entwickeln und davon abgeleitet Substanzbibliotheken kleiner Moleküle zu synthetisieren. Zur Bestimmung der In-vitro-Aktivitäten sollte KasA exprimiert und ein Assay etabliert werden. Theoretische und experimentelle Affinitäten sollten anschließend analysiert und bewertet werden. Zur Identifizierung neuer potenzieller KasA-Inhibitoren wurde mit Hilfe des Thiolactomycin-Bindemodus ein Pharmakophor-Modell erstellt. In diesem wurden die essentielle Wasserstoffbrücke zwischen den Histidinen und dem Carbonyl-Sauerstoff des Thiolactonrings, zwei hydrophobe Bereiche und ein verbindendes Strukturelement definiert und das Volumen des Pharmakophors begrenzt. Das Screening der Datenbank erfolgte mit GOLD4.0 und GOLDscore. Zur Identifizierung der 16 aussichtsreichsten Verbindungen wurden Rescorings mit ChemScore und sfc_score290m durchgeführt, sowie verschiedene physikochemische Deskriptoren und der errechnete Bindungsmodus einbezogen. Ausgewählte Verbindungen des Screenings wurden synthetisiert. Weitere Variationen wurden durch Einführung von Substituenten und Bromierung und Nitrierung der Grundgerüste erhalten. Zur biologischen Testung dieser Verbindungen konnte KasA in M. smegmatis exprimiert werden. Die Reinigung des Proteins erfolgte mittels Affinitäts- und Größenausschlusschromatographie. Affinitätswerte an KasA konnten mit einem Fluoreszenzassays bestimmt werden, da in jedem KasA-Monomer vier Tryptophane zur intrinsischen Fluoreszenz beitragen. Die Bindung eines Inhibitors in die TLM-Bindetasche führte zum Quenching der Fluoreszenz von KasA und konnte unter Berücksichtigung von Verdünnungs- und inneren Filtereffekten zur Berechnung der Dissoziationskonstante Kd herangezogen werden. Die In-vitro-Untersuchungen der Inhibitoren von KasA zeigten im Vergleich zu TLM eine Verbesserung der Affinität bis zu einem Faktor von 11, die beste Verbindung war das Nitroisatin-Derivat 2l (22.1 µM). Einen Hinweis auf Hemmung des Wachstums von Mykobakterien war für die Verbindungen 2e (5-Nitro-1-phenethyl-2,3-indolindion) und 3a (5,7-Dibrom-1-(4-chlorbenzyl)indolin-2,3-dion) ersichtlich. Die übrigen Verbindungen zeigten keine Aktivität, was dadurch bedingt sein kann, dass sie Substanzen nicht lipophil genug sind (clogP-Werte zwischen 1 und 3), um die mykobakterielle Zellwand zu durchdringen. Analog dem Docking im Rahmen des virtuellen Screenings wurde ein Docking mit GOLD4.0 und GOLDscore für die Substanzbibliothek durchgeführt. Verglichen mit den In-vitro-Affinitäten konnte eine gute Übereinstimmung in der Differenzierung der Substanzklassen gefunden werden. Da kleine Moleküle mit großer biologischer Aktivität zu bevorzugen sind, wurde die „ligand efficiency“, die inhibitorische Potenz unabhängig vom Molekulargewicht, für die Verbindungen berechnet. Für die Substanzbibliothek wurde eine gute Korrelation von „ligand efficiency“ und GOLDscore pro Schweratom erzielt (R2=0.65), beste Substanzgruppen waren monoalkylierte Uracil- und Isatin-Derivate. Der beste Wert wurde für das Isatin-Derivat 1a erzielt. Mit den erarbeiteten theoretischen und experimentellen Ergebnissen und den etablierten Methoden bietet diese Arbeit eine wichtige Grundlage, um erste „hits“ von KasA-Inhibitoren zu neuen Leitstrukturen für Wirkstoffe gegen Mycobakterium tuberculosis zu entwickeln.
N2  - This work focused on the development of new antibiotics against tuberculosis, a severe bacterial infection mainly affecting the lung. Currently, according to the WHO more than 1 million people annually die from tuberculosis. Furthermore, the therapy is limited to inefficient vaccines and a small number of antibiotics, and complicated by multi- or even totally resistant mycobacterial strains occurring worldwide. Thus, new active compounds against tuberculosis are urgently needed. Tuberculosis is mainly caused by Mycobacterium tuberculosis, which is characterized by a unique thick and waxy cell wall containing a high percentage of mycolic acids. Due to the fact that the biosynthesis of mycolic acids is not carried out in eukaryotes, it is a reasonable strategy to design inhibitors of the FAS II system as effective and selective antibiotics against mycobacteria. The enzyme of interest in our work is the β-keto-acyl ACP synthase (KasA), an elongating enzyme in the FAS II system of Mycobacterium tuberculosis which catalyses the condensation between the mycolic acid and malonyl-ACP. Recently, a crystal structure of KasA in complex with Thiolactomycin, a weak thiolactone-type inhibitor (IC50: 242 µM; Kd 226 µM), was solved. Aim of this work was to identify new potential lead structures for KasA-inhibitors by virtual screening. A library of small molecules was synthesized and tested for ability to inhibit KasA, therefore KasA was expressed. In silico and in vitro affinities were analyzed and compared. To identify new lead structures for potential KasA inhibitors, a pharmacophore model based on TLM was developed. This contained the essential H-bond between the carbonyl-oxygen of TLM with the histidines, two hydrophobic features and a linker feature between them. Additionally, volume constraints were applied to limit the size of molecules matching the pharmacophore model. Screening of a database of commercially available compounds was performed with GOLD4.0 and GOLDscore. 16 Promising structures were identified by implementation of rescorings with ChemScore and sfc_score290m, by calculation of physicochemical descriptors and by visual inspection of the predicted binding mode. Selected substances of the virtual screening were synthesized. Based on these substances the core fragments were varied by bromination and nitration. Via subsequent introduction of substituents a small library of compounds was created. For biological testings KasA was expressed in M. smegmatis. Purification of the protein was achieved by affinity and size exclusion chromatography. Dissociation constants were determined by a fluorescence assay: In each KasA monomer four tryptophanes cause intrinsic fluorescence, thus binding of inhibitors led to quenching of the fluorescence. Therefore, dissociation constants of ligands were calculated considering the dilution and inner filter effects. The in vitro studies of the KasA inhibitors showed, in comparison to TLM, a 11fold improvement of the affinity. The best inhibitor was the nitroisatine derivative 2l (22.1 µM). 2e (5-Nitro-1-phenethyl-2,3-indolindione) and 3a (5,7-Dibromo-1-(4-chlorbenzyl)indolin-2,3-dione) were able to inhibit the growth of mycobacteria. No other substances showed any antimycobacterial activity, which might be due to their low lipophilicity (clogP varies from 1 to 3), hence which hinders an efficient penetration through the highly lipophilic mycobacterial cell wall. In the future, the precise cause of this fact has to be determined to counteract with systematic structural modifications. The compound library was docked into KasA by using GOLD4.0 and GOLDscore with analogous settings as in the virtual screening. The analysis of the results showed an agreement between in vitro and in silico outcomes for the substance classes. As small molecules of high activity are preferred in drug development, ligand efficiencies of the inhibitors were calculated which describe inhibitory potency independent of molecular weight. A good correlation between ligand efficiency and GOLDscore per heavy atom was observed. Best ligand efficiencies were obtained by the classes of monoalkylated uracile- and isatine-derivatives, the best substance was the isatine-derivative 1a. Due to the established methods combined with computer-based and experimental results, this work provides an important foundation for the future development of first “hits” of KasA-inhibitors to new lead structures of new drugs against mycobacterium tuberculosis.
KW  - Tuberkelbakterium
KW  - Arzneimitteldesign
KW  - Ketoacyl-ACP-Synthase <beta>
KW  - Inhibitor
KW  - Virtuelles Screening
KW  - Fettsäuresynthese-II
KW  - KasA
KW  - Mykobakterien
KW  - virtual screening
KW  - fatty acid synthesis II
KW  - KasA
Y1  - 2013
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-77865
ER  - 
TY  - THES
A1  - Schaefer, Benjamin
T1  - Computergestützte Untersuchungen zur Inhibition und Dynamik der ß-Ketoacyl-ACP-Synthase I (KasA) aus Mycobacterium tuberculosis
T1  - Computer-based Investigations on Inhibition and Dynamics of Mycobacterium tuberculosis ß-Ketoacyl-ACP-Synthase I (KasA)
N2  - Die vorliegende Arbeit beschreibt die Durchführung computergestützter Untersuchungen an den Wildtyp-Kristallstrukturen dieses Enzyms – einerseits zur Suche nach neuen Inhibitoren im Rahmen von virtuellen Screening- (VS-) Studien, andererseits zur Charakterisierung der strukturellen Flexibilität mit Hilfe von Molekulardynamik- (MD-) Simulationen. Für ein erstes VS wurde zunächst eine Datenbank von mehreren Millionen kommerziell erhältlichen Verbindungen mit Arzneistoff-ähnlichen physikochemischen Eigenschaften erstellt. Als Ausgangspunkt der Screening-Studie diente ein Teildatensatz, welcher mit Hilfe eines auf dem nativen Bindemodus des KasA-Inhibitors Thiolactomycin (TLM) beruhenden Pharmakophormodells erhalten wurde. Diese Verbindungen wurden in die Bindetasche von KasA gedockt und die Qualität der erhaltenen Posen in einem Re- und Konsensus-Scoring-Verfahren bewertet. Schließlich wurden 14 Substanzen käuflich erworben und im Rahmen einer Fluoreszenz-Bindungsstudie experimentell getestet. Für sechs Moleküle war gegenüber KasA eine schwache, zu TLM vergleichbare Aktivität zu verzeichnen. Eine zweite VS-Studie befasste sich mit der Bewertung der Bindungsaffinität synthetisch leicht zugänglicher Derivate von GS95, einem gegenüber dem KasA-Wildtyp aktiven Molekül mit einer 1-Benzyluracil-Grundstruktur. Anhand geeigneter Synthesebausteine wurde eine virtuelle Datenbank von insgesamt 16 Derivaten erstellt, welche in die Bindetasche des Enzyms gedockt wurden. Für die vorhergesagten Bindemodi erfolgte dann eine Abschätzung der freien Bindungsenthalpie. Nach einer Bewertung der Orientierungen auf Basis der errechneten ΔG-Werte sowie einer visuellen Analyse wurden schließlich elf Verbindungen synthetisiert und im Fluoreszenz-Experiment getestet, wobei für alle Uracilderivate eine Aktivität zu beobachten war. Die Kd-Werte fallen jedoch ähnlich hoch aus wie bei GS95. Zur Untersuchung der Strukturdynamik des KasA-Wildtyps wurden drei MD-Simulationen des homodimeren Proteins von je 15 ns Länge durchgeführt. Mit Hilfe von 2D-RMSD-Berechnungen und einer hierarchischen Clusteranalyse wurden aus den drei Simulationen insgesamt zehn repräsentative Snapshots entnommen, welche die im Rahmen der Simulationszeit von insgesamt 90 ns produzierte strukturelle Vielfalt der Bindetasche von KasA wiedergeben. Wie die Analysen zeigen, wird ein dualer Charakter hinsichtlich der Flexibilität der unmittelbaren Taschenreste beobachtet. Hierbei zeigt Phe404 eine besonders ausgeprägte strukturelle Vielfalt; diese Beobachtung deckt sich mit der gatekeeper-Rolle der Aminosäure zwischen der Malonyl-Bindetasche und dem Acyl-Bindekanal, welcher für die Unterbringung der wachsenden Fettsäurekette im Enzym während der Katalyse verantwortlich zeichnet. Darüber hinaus erklärt die hohe Flexibilität von Phe404 möglicherweise die recht schwache Bindungsaffinität von TLM gegenüber dem Wildtyp von KasA, da die gatekeeper–Aminosäure nur in der geschlossenen Form einen stabilisierenden Effekt auf den Liganden ausübt. Besondere Bedeutung kommt hierbei einem Wassermolekül zu, welches als eine Art molekularer Schalter für die Flexibilität von Phe404 betrachtet werden kann und somit die Fixierung von TLM in der Bindetasche maßgeblich beeinflusst. Des Weiteren wurden innerhalb der Tasche hohe Besetzungsraten für je ein Wassermolekül identifiziert. Die aus den MD-Simulationen gewonnenen Erkenntnisse wurden anschließend zur Aufstellung von Empfehlungen für das Design neuartiger KasA-Inhibitoren verwendet. Des Weiteren wurde die Dynamik des oben erwähnten Acyl-Bindekanals, welcher sich aus den Aminosäuren 115-147 zusammensetzt, näher charakterisiert. Hierbei wurden die Reste 115-119 und insbesondere Leu116 als zweiter gatekeeper identifiziert, welcher die Öffnung des Acyl-Bindekanals zur Oberfläche des Proteins reguliert und somit eine entscheidende Funktion bei der Unterbringung der langkettigen Fettsäuresubstrate übernimmt. Schließlich wurden zwei repräsentative Bindetaschenkonformationen aus den MD-Simulationen hinsichtlich einer Verwendung in strukturbasierten VS-Studien näher untersucht. Mit Hilfe von hot spot Analysen und unter Berücksichtigung oben genannter Empfehlungen für das Design neuartiger KasA-Inhibitoren wurden verschiedene Pharmakophormodelle erstellt, welche nach Durchsuchung der zu Anfang dieses Kapitels erwähnten virtuellen Moleküldatenbank zwischen 149 und 420 verschiedene hit-Strukturen lieferten. Folglich scheint eine Adressierung der beiden Konformationen durch arzneistoffartige Verbindungen prinzipiell möglich. Unter den erhaltenen Verbindungen herrscht eine hohe strukturelle Vielfalt; außerdem unterscheiden sich diese im Allgemeinen deutlich von den Molekülen aus den vorangegangenen VS Studien, was das Potential der beiden Bindetaschenkonformationen zur Identifizierung von potentiellen KasA-Inhibitoren mit neuartigen Grundstrukturen zum Ausdruck bringt.
N2  - In the present study, computer-based investigations were applied to the wildtype crystal structures of this enzyme – on one hand, to identify new inhibitors in virtual screening (VS) studies and, on the other, to gather information about the dynamic behavior of KasA by means of molecular dynamics (MD) simulations. In a first VS, an in silico database containing several millions of commercially available drug-like compounds was built. This collection was screened via a pharmacophore model following the native binding mode of the KasA inhibitor thiolactomycin (TLM. The resulting subset then served as starting point for consequent docking studies and the predicted binding modes within the catalytic pocket of the protein were ranked by a re- and consensus-scoring approach. After additional visual inspection, 14 compounds were purchased and tested by means of direct binding fluorescence titrations. Six substances turned out to be active, even though only moderate dissociation constants similar to the data obtained for TLM (244.7 µM / 255.0 µM) were observed. In a second VS approach, the binding affinity was assessed for readily synthesizeable analogues of GS95, a 1 benzyluracil derivative showing an activity of 107.2 µM against wildtype KasA in the above mentioned fluorescence experiments. Based on appropriate building blocks which were in stock at the laboratory of Prof. Holzgrabe’s working group, a virtual library of 16 benzyl- and phenylethyluracil derivatives was created. The molecule structures were docked to the active site of KasA and the free energy of binding was estimated for the generated poses. By means of the ΔG values and visual analysis, a total of eleven compounds were selected to be synthesized and experimentally tested. All substances proved active in the fluorescence assay, yet showed only Kd values comparable to GS95. Moreover, no correlation was observed between experimentally determined and predicted free energies of binding. To probe the dynamic behavior of wildtype KasA (PDB codes 2WGD and 2WGE), three 15-ns MD simulations were performed of the homodimeric. By means of 2D RMSD calculations and a hierarchical cluster analysis, ten representative snapshots were extracted, reflecting the con-formational space of the binding pocket over a timescale of 90 ns in total. The analysis reveals a dual nature of the binding pocket in terms of flexibility. While the residues of the catalytic triad, Cys171, His311, and His345, plus Phe237, constitute the rather rigid part, a more flexible behavior is observed for the remaining residues. Among those, Phe404 presents the largest conformational alterations, which complies with its known role as a gatekeeper between the active site and the acyl-binding channel that accommodates the long-chain fatty acid substrates during catalysis. Furthermore, the high flexibility of Phe404 may account for the weak binding affinity of TLM to wildtype KasA, as only closed conformations of the gatekeeper side chain turned out to have a stabilizing effect on the ligand. In this regard, a water molecule between Ala209 and Ser138 was found to be of functional relevance, acting as a molecular switch that toggles the flexible behavior of the Phe404 side chain and, thereby, the fixation of TLM in the binding pocket. Also, high occupancy rates for a water molecule were registered at two positions within the active. Following the above findings, suggestions for the design of new KasA inhibitors were derived. Furthermore, the dynamics of the aforementioned acyl-binding channel comprising residues 115 147 were analyzed. Residues 115 119 and, in particular, Leu116 were identified as a second gatekeeper which regulates the opening between the acyl channel and the outside of the protein. Finally, two representative MD-snapshots of the binding were further examined in terms of their applicability in structure-based VS studies. Using hot-spot analyses and taking account of the above suggestions for the design of new KasA inhibitors, different pharmacophore models were created and applied to the virtual database mentioned at the beginning of this summary. The searches yielded between 149 and 420 different hit compounds, which indicates that addressing BK1 and BK2 by drug-like molecules is, in principle, possible. A fingerprint-based cluster analysis revealed a high structural diversity among the hits which, in general, also differ significantly from the scaffolds found in the two previous VS studies, pointing out the potential value of the two binding-pocket conformations for identifying putative KasA inhibitors with novel scaffolds.
KW  - Tuberkelbakterium
KW  - Arzneimitteldesign
KW  - Molekulardynamik
KW  - KasA
KW  - virtuelles Screening
KW  - Molekulardynamiksimulationen
KW  - MD-Simulationen
KW  - KasA
KW  - virtual screening
KW  - molecular dynamics simulations
KW  - MD simulations
Y1  - 2012
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-74635
ER  - 
TY  - THES
A1  - Sippel, Martin
T1  - Computational Structure-based Design Approaches: Targeting HIV-1 Integrase and the Macrophage Infectivity Potentiator of Legionella pneumophila
T1  - Computergestütztes strukturbasiertes Design bei HIV-1 Integrase und dem Macrophage Infectivity Potentiator (MIP) von Legionella pneumophila
N2  - Die vorliegende Arbeit thematisiert das computergestützte strukturbasierte Design auf dem Gebiet der HIV-1-Integrase und des Macrophage Infectivity Potentiator (MIP) von Legionella pneumophila. Die durchgeführten Studien geben wertvolle Aufschlüsse über den Wirk-mechanismus einer bekannten Integrase-Inhibitorenklasse and zeigt darüber hinaus einen neuartigen Ansatz zur Integrase-Inhibition auf. Im Falle des MIP-Enzyms konnten zwei niedermolekulare Inhibitoren ermittelt werden. Die Integrase-Studien ergaben wertvolle Informationen im Hinblick auf das Design neuer Inhibitoren. Docking-Experimente konnten die Hypothese weiter untermauern, nach der die Klasse der Diketosäure-Inhibitoren nicht als freie Liganden, sondern als Metallion-Komplexe an das aktive Zentrum der Integrase binden. Die Ergebnisse dieser Studie helfen dabei, das Verständnis über den Wirkmechanismus dieser wichtigen Klasse von Integrase-Inhibitoren weiter zu vertiefen. Um der Entwicklung von Integrase-Inhibitoren einen neuen Impuls zu geben, wurde eine neue Strategie zur Inhibition dargelegt: Anstatt an das aktive Zentrum soll eine neue Inhibitor-Klasse an das Dimerisierungs-Interface eines Integrase-Monomers binden, die katalytisch notwendige Dimerisierung verhindern und somit die enzymatische Aktivität stören. Das Hauptproblem hierbei bestand in den fehlenden Strukturdaten des freien Monomers. Hierzu wurden Molekulardynamik-Simulationen durchgeführt, um nähere strukturelle Informationen zu erhalten. Momentaufnahmen unterschiedlicher Konformationen dienten als Input-Strukturen für eine Docking-Studie mit dem peptidischen Inhibitor YFLLKL, um dessen Bindemodus aufzuklären. Hierbei zeigte sich, dass dieser Ligand an eine Interface-Konformation bindet, die durch eine Y-förmige Bindestelle charakterisiert ist. Im nächsten Schritt sollte diese Protein-Konformation mit kleinen, nicht-peptidischen Molekülen adressiert werden. Die erste Strategie bestand darin, ein Pharmakophor-Modell zu erstellen, das zur Suche nach Molekülen mit einer guten Komplementarität zur Y-förmigen Bindetasche geeignet ist. Das folgende virtuelle Screening ergab zehn Verbindungen, die eine gute Komplementarität und günstige hydrophobe Wechselwirkungen aufwiesen. Leider zeigte keine der Verbindungen eine reproduzierbare Aktivität im Integrase-Assay. Hierbei verbleiben jedoch gewisse Zweifel, da in dem Assay die Zugabe von BSA vorgeschrieben war, das möglicherweise die hydrophoben Inhibitor-Kandidaten gebunden hat. Die erwähnte erste Strategie wurde überdacht: In einem zweiten Ansatz galt die Hauptaufmerksamkeit der Absättigung von wasserstoffbrückenbildenden Resten. Diese waren zuvor von den eher hydrophoben Verbindungen nicht optimal abgesättigt worden. Zwei Pharmakophor-Modelle wurden erstellt und in einem virtuellen Screening eingesetzt: Docking-Studien der Hits zeigten jedoch, dass nach wie vor viele wasserstoffbrückenbildende Reste des Proteins nicht vom Liganden abgesättigt wurden. Nach abschließender eingehender Betrachtung der Bindemoden der verbliebenen Moleküle aus dem virtuellen Screening konnten nur acht für weitere Testungen ausgewählt werden (Ergebnisse der experimentellen Testung durch Kooperationspartner stehen noch aus). Diese geringe „Ausbeute“ an geeigneten Verbindungen für das Integrase-Dimerisierungsinterface zeigt, wie schwer dieses Target zu adressieren ist: Das Interface weist eine schnell wechselnde Abfolge von basischen, sauren und hydrophoben Resten auf. Im Gegensatz zu anderen Protein-Protein-Interfaces zeigt das Integrase-Interface keine „aufgeräumte“ Bindetasche mit klar voneinander getrennten hydrophoben und hydrophilen Bereichen. Für das zweite Enzym, MIP, konnten mit Hilfe des strukturbasierten Designs zwei niedermolekulare Inhibitoren gefunden werden. Beide Verbindungen führten zu einer deutlichen Abnahme der katalytischen Aktivität. Soweit bekannt, sind bisher keinerlei niedermolekulare MIP-Inhibitoren veröffentlicht. Der Vergleich von MIP mit der humanen PPIase FKBP12 zeigte eine größtenteils ähnliche Tasche, die jedoch einen entscheidenden Unterschied aufweist, nämlich in der Orientierung des Restes Tyr109. Die detaillierte Betrachtung der Strukturdaten beider Enzyme konnte schließlich eine Erklärung liefern, warum ein ketoacyl-substituiertes Pipecolinderivat nicht an MIP bindet, ein sulfonsubstituiertes Pipecolinderivat hingegen das Enzym inhibiert. Die Erkenntnisse über das Inhibitoren-Design für Legionella-MIP können auch auf andere Organismen (z.B. Trypanosomen) übertragen werden, bei denen ebenfalls (homologes) MIP ein Pathogenitätsfaktor ist.
N2  - In this thesis, computational structure-based design approaches were employed to target the HIV-1 integrase and the macrophage infectivity potentiator (MIP) of Legionella pneumophila. The thesis yields valuable information about the mechanism of action of a known class of integrase inhibitors and a novel approach towards enzyme inhibition, which still is mainly unaddressed in current integrase research. For the MIP enzyme, two small-molecule MIP inhibitors were discovered. The computational studies of HIV-1 integrase have provided valuable information for IN inhibitor design. Docking experiments supported the hypothesis that the well-known diketo acid inhibitors enter the IN active site not as free ligands, but rather as metal complexes. These results help to reveal the mechanism of action of this important class of IN inhibitors.To give an impulse for the development of a novel class of inhibitors, a new strategy towards IN inhibition was introduced: An alternative binding site, the dimerization interface of an IN catalytic core domain monomer, was explored for inhibitor design. The lack of structural data of the free monomer was overcome by extensive MD studies. Snapshots derived from the MD simulation were used as protein input structures in a docking study with the inhibitory peptide YFLLKL to reveal its potential binding mode. The docking procedure showed that the peptidic ligand binds to a dimerization interface conformation which shows a Y-shaped binding site.. The next step was to address this protein conformation with small, non-peptidic molecules. The first strategy towards finding small-molecule interface binders was to create a pharmacophore model with hydrophobic features and shape constraints, aiming to find molecules with a good complementarity to the Y-shaped dimerization interface. Virtual screening yielded a total of 10 compounds, which all displayed good shape complementarity and favorable hydrophobic interactions. Unfortunately, none of the compounds showed a reproducible inhibitory activity in biological assays. Some doubts remain about the validity of the assay results: The use of BSA was critical, since it is not unlikely that BSA “intercepted” the hydrophobic candidate compounds. The first strategy towards finding small-molecule dimerization inhibitors was reconsidered: In the second approach, the satisfaction of hydrogen bonding residues at the dimerization interface, was of major interest. Two pharmacophore models were employed, which retrieved several hundred hit molecules. However, docking of these molecules showed that still many hydrogen bonding groups of the protein remained unaddressed by the ligands. Eventually, after visual inspection, only eight molecules were selected as candidate compounds for further testing (results pending). This small “yield” underlines the difficulties in finding interface binders: The IN dimerization interface is a peculiar target with frequently alternating basic, acidic, and hydrophobic residues. It is not a well-ordered binding site with continuous hydrophobic areas and distinct hydrogen bond donors / acceptors. Other protein-protein interfaces show such well-ordered binding sites. Accordingly, the peculiarity of the IN dimerization interface, in addition to the delicate task of disrupting protein-protein interactions at all, makes the development of IN dimerization inhibitors very challenging. For MIP, the studies revealed two experimentally validated MIP inhibitors, which significantly reduce MIP enzymatic activity. To our knowledge, no small-molecule MIP inhibitor has been reported in the literature so far. A detailed analysis of the available structural data of MIP and a comparison to the human PPIase counterpart, FKBP12, pointed out a conformational diversity among the MIP structures and a crucial difference between the two PPIases, which could be traced to mainly one residue (Tyr109). The detailed comparison of FKBP12 and MIP complex structures made it possible to give an explanation, why a ketoacyl-substituted pipecoline derivative most probably does not bind to MIP, but a sulfone-substituted pipecoline derivative does bind to MIP. Knowledge of Legionella MIP inhibitors could be transferred also to other organisms (e.g. trypanosoms), where homologous MIP proteins are also pathological factors.
KW  - Legionella pneumophila
KW  - Integrasen
KW  - HIV
KW  - Arzneimitteldesign
KW  - Molekulardesign
KW  - Legionärskrankheit
KW  - Arzneimitteldesign
KW  - Molecular modelling
KW  - HIV
KW  - Legionnaires' Disease
KW  - drug design
Y1  - 2010
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-51247
ER  - 
TY  - THES
A1  - Busemann, Matthias
T1  - Entwicklung chemometrischer Methoden für das in-silico-Wirkstoffdesign
T1  - Development of chemometric techniques for the in-silico drug design
N2  - Diese Dissertation beschreibt Methoden zur Lösung wichtiger anwendungsorientierter Aspekte des struktur- und ligandbasierten in-silico-Wirkstoffdesigns. Dabei liegt der Fokus auf der Entwicklung chemometrischer Verfahren und der Überprüfung ihrer Leistungsfähigkeit. Die vorgeschlagenen Algorithmen werden mit entsprechenden etablierten Techniken verglichen. Die folgenden Abschnitte fassen die Vorgehensweisen und Resultate in den einzelnen Projektbereichen zusammen. Identifizierung von Outliern. Die Untersuchung eines QSAR-Datensatzes mit dem Ziel der Outlier-Identifizierung wird in der Praxis häufig vernachlässigt. Dabei ist es offensichtlich, daß kein QSAR-Modell auf jede nur denkbare chemische Verbindung anwendbar sein kann. Vielmehr handelt es sich um empirische mathematische Modelle, die nur innerhalb jenes Datenraums Gültigkeit besitzen, der von den Trainingsobjekten aufgespannt wird. Daher ist jedes Modell auf gewisse Grenzen beschränkt, außerhalb derer eine verläßliche Vorhersage unmöglich ist. Die in dieser Arbeit entwickelte Methode ODD dient der Ermittlung dieser Grenzen und damit der Identifizierung von Outliern, also Objekten außerhalb des Anwendungsbereichs des Modells. Ziel der Entwicklung war ein nur auf den unabhängigen Variablen (X-Daten) basierendes Verfahren, das auch auf hochdimensionaleDatensätze anwendbar ist undweitestgehend auf den Eingriff des Benutzers (etwa die Definition von Grenzwerten) verzichtet. Ebenfalls wünschenswert war die Fähigkeit zur Identifikation von Inliern. Eine ausreichend hohe Geschwindigkeit sollte die Einsetzbarkeit im virtuellen Screening gewährleisten. Die Methode mußte der Überprüfung standhalten, den Vorhersagefehler eines Modells bei Vorhandensein extremer Outlier zu reduzieren, gleichzeitig aber unkritische Datensätze unbeeinflußt zu lassen. ODD basiert auf der Beurteilung der euklidischen Distanz eines Testobjekts zu seinem am nächsten benachbarten Trainingsobjekt. Der Schwellenwert für die Betrachtung eines Objekts als Outlier wird dabei aus der Verteilung der Nächster-Nachbar-Distanzen der Trainingsobjekte berechnet. Durch dieses intrinsische Maß ergibt sich die gewünschte Dimensionsunabhängigkeit und vor allem die automatische Anpassung des Grenzwerts an die Charakteristik des Kalibrierdatensatzes ohne Eingriff des Benutzers. Die Validierung zeigt, daß ODD extreme Outlier zuverlässig erkennt und sich gleichzeitig durch eine im Vergleich zu anderen gebräuchlichen Verfahren geringere Anzahl falsch positiver Identifizierungen auszeichnet. Ensemble-Techniken. In einer vergleichenden Studie wurde die Leistungsfähigkeit verschiedener Ensemble-Techniken hinsichtlich ihres Einflusses auf den Vorhersagefehler untersucht. Dazu wurden umfangreiche Simulationen anhand mehrerer realer QSAR-Datensätze durchgeführt. Die Verwendung von Ensembles (d. h. einer Sammlung vielerModelle, diemit geringfügigmanipulierten Varianten des Trainingsdatensatzes kalibriert wurden) wirkt sich im allgemeinen positiv auf den Vorhersagefehler (RMSEP) aus. Diese Reduzierung des RMSEP wurde hier ermittelt und für verschiedenen Ansätze zur Ensemble-Generierung verglichen. Insgesamt betrachtet erwiesen sich die Methoden der konvexen Pseudodaten und des Baggings als die effektivsten Verfahren zur Ensemble-Generierung, da sie den Vorhersagefehler am deutlichsten verbesserten. Die konvexen Pseudodaten wurden erstmalig zur Erzeugung von Ensembles in der QSAR-Analyse eingesetzt; sie werden als neuer Standard zur Reduzierung des RMSEP bei QSAR-Problemen vorgeschlagen, die Regressionsmodelle auf Basis von latenten Variablen verwenden. Darüber hinaus bieten die Studien eine Abschätzung dermit Hilfe von Ensembles zu erzielenden Reduktion des Vorhersagefehlers bei typischen QSAR-Datensätzen. Virtuelles Screening. Beim virtuellen Screening handelt es sich um eine Technik zum Durchsuchen großer (virtueller)Molekülbibliotheken—oftmehrere Millionen Verbindungen — nach den aussichtsreichsten Wirkstoffkandidaten. Dies kann sowohl durch strukturbasierte als auch mit Hilfe ligandbasierter Verfahren geschehen. Es wurden umfangreiche Simulationen anhand sechs verschiedener Targets und einer Bibliothek von mehr als 90 000 Molekülen durchgeführt, um das Potential strukturbasierter (Docking mit FLEXX) und ligandbasierter (Ähnlichkeitssuchemitmehreren Referenzen) Verfahren zu vergleichen. Darüber hinauswurde durch Berechnung von Interaktionsfingerprints eineMöglichkeit geschaffen, die Information der beiden sonst getrennten Herangehensweisen zu kombinieren. Um den Einfluß des Klassifizierungsalgorithmus zu untersuchen, wurden verschiedene statistische Methoden zur Datenauswertung herangezogen. Als Bewertungskriterium für die Leistungsfähigkeit eines Verfahrens diente jeweils die Anzahl der wiedergefundenen aktiven Moleküle in der simulierten Screeningdatenbank. Die Resultate führen zu dem Schluß, daß ligandbasierte Verfahren, die einfacher einzusetzen sind aber mehr a-priori -Information benötigen, dem strukturbasierten virtuellen Screening hinsichtlich der Datenbankanreicherung überlegen sind. Weiterhin konnte gezeigt werden, wie nutzbringend die Zusammenführung von strukturbasierter Information und solcher über das Interaktionsmuster bekanntermaßen aktiver Verbindungen für die Erhöhung der Wiederfindungsrate ist. Bei der Datenanalyse stellte sich heraus, daß im Mittel bestimmte statistische Methoden (minimale euklidische Distanz ED/Min bzw. Tanimoto-Ähnlichkeit der Integer-Fingerprints Int/Min) zu bevorzugen sind. Kovalentes Docking von Cathepsin-Inhibitoren. Die Cysteinproteasen Cathepsin B und L sind interessante pharmakologische Targets. Geeignete Inhibitoren stammen u. a. aus der Strukturklasse der Aziridine. Ein nukleophiler Angriff des Cysteinrests des Enzyms auf den elektrophilen Aziridinring führt hier zur Ausbildung einer kovalenten Ligand-Rezeptor-Bindung. Praktisch alle erhältlichen Dockingprogramme konzentrieren sich jedoch auf nicht-kovalente Ligand-Rezeptor-Interaktionen und lassen kein uneingeschränktes kovalentes Docking zu. Daher wurde für FLEXX ein Dockingprotokoll entworfen, das den entscheidenden nicht-kovalenten Zustand vor Ausbildung der kovalenten Bindung simulieren kann. Auf dieseWeise konnte untersucht werden, ob sich die Reaktionszentren von Ligand und Enzym ausreichend nahe für die Ausbildung einer kovalenten Bindung kommen. Der vorgestellte Ansatz läßt sich leicht auf andere kovalente Ligand-Rezeptor- Systeme übertragen und bietet somit eine breite Anwendbarkeit. Weiterhin wurde die Parametrisierung der in FLEXX vorgesehenen Interaktionsgeometrien an die strukturellen Eigenheiten der zu dockenden Aziridide angepaßt. Diese weisen nämlich formal eine Amidbindung auf, deren geometrische und elektronische Eigenschaften jedoch deutlich von den Werten eines typischen Amids abweichen. Die Ergebnisse der Dockingstudien liefern wertvolle Einblicke für das Verständnis der Selektivität der untersuchten Liganden bezüglich Cathepsin B beziehungsweise L. Umgekehrt erbringt die gute Übereinstimmung der FLEXX-Resultate mit den experimentell bestimmten Inhibitionskonstanten den Nachweis für die Validität des verwendeten Dockingprotokolls.
N2  - This thesis describes methods for solving important application-oriented aspects of structure-based and ligand-based in silico drug design. The proposed algorithms are compared to well established techniques. The focus is particularly on the development and benchmarking of different chemometric techniques. In the following, the approaches and results within the different project areas are summarised. Outlier Identification. The inspection of QSAR datasets in order to identify prediction outliers is often omitted in practice. However, it is clear that no QSAR model is applicable to every conceivable chemical compound. Since QSAR models represent empirical mathematical models, these are only valid within the data space spanned by the training data. Hence, every model is restricted to certain borders beyond which a reliable prediction is impossible. The method ODD developed in this work can be used to determine these borders and thus to identify outliers. Those are objects outside the data space spanned by the training data (i.e. the applicability domain of the model). The aim of the method is to detect outliers solely based on the predictor variables (X data). Moreover, the method must be capable to handle high-dimensional datasetswithminimal user interference (e.g. setting of cut-offs). Furthermore, the ability to identify inliers would be preferable. The computational speed should be high enough to apply the method to virtual screening. The developed technique had to prove that it provides a reduction of the model’s error of prediction if extreme outliers are present. At the same time, it should leave non-critical datasets unaffected. ODD is based on the evaluation of the Euclidean distance of a test object towards its nearest neighbouring training object. The cut-off for deeming an object as outlier is calculated from the distribution of the nearest neighbour distances of the training set. This intrinsic value leads to the desired independence from data dimensionality and, above all, to an automatic adjustment of the cut-off to the characteristics of the calibration dataset without any user intervention. The validation shows that ODD reliably identifies extreme outliers. On the other hand, it offers a low rate of false positives compared to other common techniques for outlier identification. Ensemble Techniques. In a benchmark study, the impact of different ensemble techniques on the prediction error was investigated. For this purpose, comprehensive simulations on several real QSAR datasets were carried out. The application of ensembles (i.e. a collection of many models trained with sligthly perturbed versions of the training set) usually lowers the error of prediction (RMSEP). The RMSEP reduction was determined and compared for different approaches of ensemble generation. Overall, the methods of convex pseudo data and bagging proved to be the most efficient ways for ensemble generation (i.e. they resulted in the largest reduction of the prediction error). Convex pseudo data, which were applied toQSAR data sets for the first time as ensemble technique, are proposed as the new standard for lowering RMSEP in QSAR problems using latent variable regression models. Furthermore, the effect size of ensemble averaging was quantified for typical QSAR data sets. Virtual Screening. Virtual screening is a technique to screen large (virtual) molecular databases — often several million compounds — for the most promising drug candidates. This can be done by structure-based as well as by ligand-based approaches. Comprehensive computations on six different targets and a library of more than 90 000 compounds were carried out to compare the potential of structure-based techniques (docking with FLEXX) and ligand-based techniques (similarity searching with multiple queries). In addition to that, interaction fingerprints were computed in order to combine the information of the otherwise distinct approaches. Several statistical methods were applied for data analysis to investigate the impact of the machine learning algorithm. Figure of merit for each approach was the number of active compounds retrieved from the assembled screening database with known actives. The results lead to the following conclusions: Ligand-based approaches, which are simpler to use but require more a priori information, turned out to be superior to structure-based virtual screening techniques in terms of database enrichment. In addition, it could be shown that combination of structure-based information with information of the interaction pattern of known actives is beneficial for increasing retrieval rates. Data analysis revealed that certain statistical methods (minimum Euclidean distance ED/Min, and Tanimoto similarity of integer fingerprints Int/Min, respectively) are on average to be preferred. Covalent Docking of Cathepsin Inhibitors. Cysteine proteases Cathepsin B and L are interesting pharmacological targets. Suitable inhibitors, amongst others, come from the structural class of aziridines. A nucleophilic attack of the enzyme’s active site cysteine moiety on the electrophilic aziridine ring leads to formation of a covalent bond between ligand and receptor. However, virtually all available docking programs concentrate on noncovalent ligand-receptor interactions and do not provide sophisticated, unrestricted covalent docking. Thus, a docking protocol for FLEXX was designed which is able to represent the essential non-covalent state before formation of the covalent bond. That way, it could be studied whether or not the reaction centres of both ligand and receptor adopt a position close enough to each other to actually form the covalent bond. The approach presented here can easily be transferred to other covalent ligand-receptor systems and therefore provides a broad applicability. Furthermore, the parametrisation of the FLEXX interaction geometries was adapted to account for the special structural features of aziridides. Those show a formal amide bond, but its geometric and electronic properties differ noticeably from a typical amide. The results of the docking studies provide valuable insights for understanding the Cathepsin B/L selectivity of the ligands under scrutiny. Vice versa, the good correspondence of the FLEXX results and the inhibition constants obtained experimentally provide evidence for the validity of the applied docking protocol.
KW  - Arzneimitteldesign
KW  - Chemometrie
KW  - Chemometrie
KW  - Outlier-Identifizierung
KW  - virtuelles Screening
KW  - Docking
KW  - Chemometrics
KW  - Outlier Detection
KW  - virtual screening
KW  - docking
Y1  - 2006
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-18777
ER  - 
TY  - THES
A1  - Scheiber, Josef Heinrich
T1  - Entwicklung, Validierung und Anwendung einer interpretierbaren und alignment-freien 4D-QSAR Methodik
T1  - Development, Validation and Application of an interpretable and alignment-free 4D-QSAR technique
N2  - Die vorliegende Arbeit beschreibt die Entwicklung, Validierung und erfolgreiche Anwendung der interpretierbaren 4D-QSAR Methodik xMaP. Die neue Methode benötigt weder die Auswahl des vermuteten bioaktiven Konformers noch eine Überlagerung der Moleküle im Raum, sie ist also alignment-frei. xMaP ist invariant gegenüber Rotation, Translation und kodiert die Flexibilität der Moleküle. Dadurch wird der Einfluss durch den Benutzer praktisch ausgeschaltet.
N2  - This thesis describes the development, validation and successful application of the interpretable 4D-QSAR technique xMaP. The novel method does neither rely on the selection of a presumed bioactive conformer nor on a spatial superimposition of the molecules which means that it is so-called alignment-free. Put differently, xMaP is invariant to rotation and translation and encodes the flexibility of the molecules under scrutiny. By combining these features a possible user bias is almost completely eliminated.
KW  - QSAR
KW  - Arzneimitteldesign
KW  - 4D-QSAR
KW  - Wirkstoffdesign
KW  - interpretierbar
KW  - alignment-frei
KW  - 4D-QSAR
KW  - drug design
KW  - interpretable
KW  - alignment-free
Y1  - 2006
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-21273
ER  -