TY  - THES
A1  - Hein, Michael
T1  - Entwicklung computergestützter Methoden zur Bewertung von Docking-Lösungen und Entwurf niedermolekularer MIP-Inhibitoren
T1  - Development of computer-aided methods for the evaluation of docking poses and design of small-molecule MIP inhibitors
N2  - Dockingbasierte Ansätze zählen zu den wichtigsten Komponenten im virtuellen Screening. Sie dienen der Vorhersage der Ligandposition und -konformation in der Bindetasche sowie der Abschätzung der Bindungsaffinität zum Protein. Bis heute stellt die korrekte Identifizierung proteingebundener Ligandkonformationen ein noch nicht vollständig gelöstes Problem für Scoringfunktionen dar. Der erste Teil der vorliegenden Arbeit ist daher der Entwicklung computergestützter Methoden zur Bewertung von Docking-Lösungen gewidmet.

Der Fokus eines ersten Teilprojektes lag auf der Berücksichtigung der Absättigung vergrabener Wasserstoffbrückenakzeptoren (HBA) und -donoren (HBD) bei der Bewertung von Docking-Lösungen. Nicht-abgesättigte vergrabene HBA und HBD stellen einen der Bindungsaffinität abträglichen Beitrag dar, der bis dato aufgrund fehlender Struktur- bzw. Affinitätsdaten in Scoringfunktionen vernachlässigt wird. Im Rahmen der vorliegenden Arbeit wurde auf der Basis einer detaillierten Untersuchung zur Häufigkeit vergrabener nicht-abgesättigter HBA und HBD in hochaufgelösten Protein-Ligand-Komplexen des Hartshorn-Datensatzes eine empirische Filterfunktion („vnaHB“-Filterfunktion) entwickelt, die unerwünschte Ligandbindeposen erkennt und von der Bewertung mittels Scoringfunktionen ausschließt. Der praktische Nutzen der empirischen Filterfunktion wurde für die Scoringfunktionen SFCscore und DSX anhand vorgenerierter Docking-Lösungen des Cheng-Datensatzes untersucht. Die Häufigkeitsuntersuchung zeigt, dass eine Absättigung vergrabener polarer Gruppen in Protein-Ligand-Komplexen für eine hochaffine Protein-Ligand-Bindung notwendig ist, da vergrabene nicht-abgesättigte HBA und HBD nur selten auftreten. Eine vollständige Absättigung durch entsprechende Proteinpartner wird für ca. 48 % der untersuchten Komplexe beobachtet, ca. 92 % weisen weniger als drei hauptsächlich schwache, nicht-abgesättigte HBA bzw. HBD (z. B. Etherfunktionen) auf. Unter Einbeziehung von Wassermolekülen in die Häufigkeitsanalyse sind sogar für ca. 61 % aller Komplexe alle wasserstoffbrückenbindenden Gruppen abgesättigt. Im Gegensatz zu DSX werden für SFCscore nach Anwendung der empirischen Filterfunktion erhöhte Erfolgsraten für das Auffinden einer kristallnahen Pose (≤ 2.0 Å Abweichung) unter den am besten bewerteten Docking-Posen erzielt. Für die beste SFCscore-Funktion (SFCscore::229m) werden Steigerungen dieses als „Docking Power“ bezeichneten Kriteriums für die Top-3-Posen (Erfolgsrate für die Identifizierung einer kristallnahen 2.0 Å Pose unter den besten drei Docking-Lösungen) von 63.1 % auf 64.2 % beobachtet.

In einem weiteren Teilprojekt wurden repulsive Protein-Ligand-Kontakte infolge sterischer Überlappungen der Bindungspartner bei der Bewertung von Docking-Lösungen berücksichtigt. Die adäquate Einbeziehung solcher repulsiver Kontakte im Scoring ist für die Identifizierung proteingebundener Ligandkonformationen entscheidend, jedoch aufgrund fehlender Affinitäts- bzw. Strukturdaten problematisch. Im Rahmen der vorliegenden Arbeit wurde auf der Basis des Lennard-Jones-Potentiales des AMBER-Kraftfeldes zunächst ein neuer Deskriptor zur Beschreibung repulsiver Kontakte („Clash“-Deskriptor) entwickelt und zur Untersuchung der Häufigkeit ungünstiger Protein-Ligand-Kontakte in hochaufgelösten Protein-Ligand-Komplexen des Hartshorn-Datensatzes herangezogen. Eine aus der Häufigkeitsverteilung abgeleitete empirische Filterfunktion („Clash“-Filterfunktion) wurde anschließend der Bewertung von Docking-Lösungen des Cheng-Datensatzes mittels der Scoringfunktionen SFCscore und DSX vorgeschaltet, um unerwünschte Ligandbindeposen auszuschließen. Die Häufigkeitsuntersuchung zeigt, dass vorwiegend schwache repulsive Kontakte in Protein-Ligand-Komplexen auftreten. So werden in 75 % der Komplexe des Hartshorn-Datensatzes abstoßende Potentiale unter 0.462 kcal/mol beobachtet. Zwar betragen die ungünstigen Beiträge pro Komplex für 50 % aller Strukturen ca. 0.8 kcal/mol bis 2.5 kcal/mol, jedoch können diese auf Ungenauigkeiten der Kristallstrukturen zurückzuführen sein bzw. durch günstige Protein-Ligand-Wechselwirkungen kompensiert werden. Die Anwendung der „Clash“-Filterfunktion zeigt signifikante Verbesserungen der Docking Power für SFCscore. Für die beste SFCscore-Funktion (SFCscore::frag) werden Steigerungen der Erfolgsraten für das Auffinden einer kristallnahen Pose unter den drei am besten bewerteten Docking-Lösungen von 61.4 % auf 86.9 % erzielt, was an die Docking Power der bis dato besten Scoringfunktionen aus der Literatur (z. B. DSX, GlideScore::SP) heranreicht (Docking Power (DSX): 92.6 %; Docking Power (GlideScore::SP): 86.9 %). Die „Clash“-Filterfunktion allein ist auch der Kombination der „Clash“- und der „vnaHB“-Filterfunktion überlegen.

Ein weiterer Schwerpunkt der vorliegenden Arbeit wurde auf die Einbeziehung von Decoy-Daten (Struktur- und Affinitätsdaten schwach affiner und inaktiver Liganden) im Zuge der Entwicklung computergestützter Methoden zur Bewertung von Docking-Lösungen gelegt. Dadurch soll eine adäquate Berücksichtigung ungünstiger Beiträge zur Bindungsaffinität ermöglicht werden, die für die Richtigkeit und Zuverlässigkeit ermittelter Vorhersagen essentiell ist. In der vorliegenden Arbeit wurden binäre Klassifizierungsmodelle zur Bewertung von Docking-Lösungen entwickelt, die die Einbeziehung von Decoy-Daten ohne die Verfügbarkeit von Affinitätsdaten erlauben. Der Random-Forest-Algorithmus (RF), SFCscore-Deskriptoren, der neu entwickelte „Clash“-Deskriptor, und die Decoy-Datensätze von Cheng und Huang (Trainingsdaten) bilden die Grundlage des leistungsfähigsten Klassifizierungsmodells. Der praktische Nutzen des „besten“ RF-Modells wurde nach Kombination mit der Scoringfunktion DSX anhand der Docking Power für das Auffinden einer kristallnahen Pose auf Rang 1 am unabhängigen Cheng-/Huang- (Komplexe, die nicht in den Trainingsdaten enthalten sind) und CSAR-2012-Testdatensatz untersucht. Gegenüber einer alleinigen Anwendung von DSX werden an beiden Testdatensätzen weitere Verbesserungen der Docking Power erzielt (Cheng-/Huang-Testdatensatz: DSX 84.24 %, RF 87.27 %; CSAR-2012-Testdatensatz: DSX 87.93 %, RF 91.38 %). Das „beste“ Modell zeichnet sich durch die zuverlässige Vorhersage richtig-positiver Docking-Lösungen für einige wenige Komplexe aus, für die DSX keine kristallnahe Ligandkonformation identifizieren kann. Ein visueller Vergleich der jeweils am besten bewerteten RF- und DSX-Pose für diese Komplexe zeigt Vorteile des RF-Modells hinsichtlich der Erkennung für die Protein-Ligand-Bindung essentieller Wechselwirkungen. Die Untersuchung der Bedeutung einzelner SFCscore-Deskriptoren für die Klassifizierung von Docking-Lösungen sowie die Analyse der Misserfolge nach Anwendung des Modells geben wertvolle Hinweise zur weiteren Optimierung der bestehenden Methode. Hinsichtlich der zu bewertenden Eigenschaften ausgeglichenere Trainingsdaten, Weiterentwicklungen bestehender SFCscore-Deskriptoren sowie die Implementierung neuer Deskriptoren zur Beschreibung bis dato nicht-berücksichtigter Beiträge zur Bindungsaffinität stellen Ansatzpunkte zur Verbesserung dar.

Der zweite Teil der vorliegenden Arbeit umfasst die Anwendung dockingbasierter Methoden im Rahmen der Entwicklung neuer Inhibitoren des „Macrophage Infectivity Potentiator“-(MIP)-Proteins von Legionella pneumophila und Burkholderia pseudomallei.

Das MIP-Protein von Legionella pneumophila stellt einen wichtigen Virulenzfaktor und daher ein attraktives Zielprotein für die Therapie der Legionellose dar. Im Rahmen der vorliegenden Arbeit erfolgten systematische Optimierungen des Pipecolinsäure-Sulfonamides 1, des bis dato besten niedermolekularen MIP-Inhibitors (IC50 (1): 9 ± 0.7 µM). Nach Hot-Spot-Analysen der Bindetasche wurden Docking-Studien zur Auswahl aussichtsreicher Kandidaten für die Synthese und Testung auf MIP-Inhibition durchgeführt. Die Ergebnisse der Hot-Spot-Analysen zeigen günstige Wechselwirkungsbereiche für Donorgruppen und hydrophobe Substituenten in meta-Position sowie Akzeptorgruppen in para-Position des Benzylringes von 1 auf. Die Einführung einer Nitrofunktion in para-Position des Benzylringes von 1 (2h) resultiert in einer erhöhten MIP-Inhibition (IC50 (2h): 5 ± 1.5 µM), was wahrscheinlich auf die Ausbildung einer zusätzlichen Wasserstoffbrücke zu Gly116 zurückzuführen ist. Selektivitätsverbesserungen gegenüber dem strukturverwandten humanen FKBP12-Protein werden insbesondere für das para-Aminoderivat von 1 (2n) erzielt (Selektivitätsindex (1): 45, Selektivitätsindex (2n): 4.2; mit Selektivitätsindex = IC50 (MIP)/IC50 (FKBP12)). Der Ersatz des hydrophoben Trimethoxyphenylrestes von 1 durch einen Pyridinring (2s) führt zu einer verbesserten Löslichkeit bei vergleichbarer MIP-Inhibition.

Das MIP-Protein von Burkholderia pseudomallei spielt eine wichtige Rolle in der Pathogenese der Melioidose und stellt daher ein attraktives Zielprotein für die Entwicklung neuer Arzneistoffe dar. In der vorliegenden Arbeit erfolgten Optimierungen des bis dato besten niedermolekularen MIP-Inhibitors 1. Ausgehend von einem Strukturvergleich von Burkholderia pseudomallei MIP mit Legionella pneumophila MIP und einer Hot-Spot-Analyse der Burkholderia pseudomallei MIP-Bindetasche wurden Docking-Studien zur Auswahl aussichtsreicher Kandidaten für die Synthese und Testung auf MIP-Inhibition durchgeführt. Der Strukturvergleich zeigt eine hohe Homologie beider Bindetaschen. Größere konformelle Änderungen werden lediglich für den von Ala94, Gly95, Val97 und Ile98 geformten Bindetaschenbereich beobachtet, was unterschiedliche Optimierungsstrategien für 1 erforderlich macht. Günstige Wechselwirkungsbereiche der Burkholderia pseudomallei MIP-Bindetasche finden sich einerseits für Donorgruppen oder hydrophobe Substituenten in para-Position des Benzylringes (Region A) von 1, andererseits für Akzeptor- bzw. Donorgruppen in para- bzw. meta-/para-Position des Trimethoxyphenylringes (Region B). Anhand von Docking-Studien konnten sowohl für Variationen in Region A als auch in Region B aussichtsreiche Kandidaten identifiziert werden. Initiale MIP-Inhibitionsmessungen der bis dato synthetisierten Derivate deuten auf erhöhte Hemmungen im Vergleich zu 1 hin. Der Ersatz des hydrophoben Trimethoxyphenylrestes von 1 durch einen Pyridinring führt auch hier zu vergleichbarer MIP-Inhibition bei verbesserter Löslichkeit. Derzeit sind weitere Synthesen und Testungen aussichtsreicher Liganden durch die Kooperationspartner geplant. Die Ergebnisse der Inhibitionsmessungen sollen deren Nutzen als MIP-Inhibitoren aufzeigen und wertvolle Informationen für weitere Zyklen des strukturbasierten Wirkstoffdesigns liefern.
N2  - Docking-based approaches belong to important virtual screening components and aim at predicting both the ligand position and conformation within the protein binding site as well as the binding affinity. To date scoring functions are still not fully reliable in correctly identifying near-native ligand conformations generated by docking. Thus, the first part of the current work is dedicated to the development of computer-aided methods for the evaluation of docking poses.

A first project focused on considering the saturation of hydrogen bond acceptors (HBA) and donors (HBD) for the evaluation of docking poses. Since structural and affinity data are missing, current scoring functions neglect unpaired buried HBA and HBD, which strongly disfavour high-affinity binding. Based on a detailed frequency analysis of unpaired buried HBA and HBD within high-quality protein-ligand complexes of the Hartshorn dataset, an empirical filter function (“vnaHB” filter function) was developed to remove unfavourable ligand binding poses prior to the ranking with scoring functions. The practical benefit of the filter function was investigated for the scoring functions SFCscore and DSX using pre-generated docking poses of the Cheng dataset. As shown in the frequency analysis, the saturation of buried polar groups is of utmost importance for high-affinity binding, as unpaired buried HBA and HBD are extremely rare. A complete saturation by proper protein counterparts is observed for about 48 % of all complexes under study, whereas approximately 92 % have less than three, mostly weak unpaired buried HBA or HBD (e.g. ether functions). Including also the saturation by water molecules reveals that actually for about 61 % of all complexes every hydrogen bonding group is saturated. Unlike DSX, the application of the filter function with SFCscore results in higher success rates for identifying a near-native 2.0 Å pose under the top scored poses, a criterion termed “Docking Power”. For the best SFCscore function (SFCscore::229m) the Docking Power with respect to the top three poses increases from 63.1 % to 64.2 %.

A further project focused on considering repulsive intermolecular contacts due to sterical overlap of the protein-ligand binding partners for the evaluation of docking poses. Although an inclusion of such repulsive contacts in scoring is of utmost importance for the identification of protein-bound ligand conformations, it remains challenging because of missing structural and affinity data. Based on the Lennard-Jones potential of the AMBER force field a new descriptor accounting for repulsive protein-ligand contacts (“clash” descriptor) was developed and used for analysing the frequency of unfavourable protein-ligand contacts among high-quality structures of the Hartshorn dataset. An empirical filter function (“clash” filter function) derived from the frequency distribution was applied to pre-generated docking poses of the Cheng dataset to remove unfavourable ligand binding poses prior to the ranking with SFCscore and DSX. As shown in the frequency analysis, mostly weakly repulsive contacts occur within protein-ligand complexes. For 75 % of the complexes of the Hartshorn dataset repulsive potentials of less than 0.462 kcal/mol are observed. Indeed, unfavourable contributions add up to not more than 0.8 kcal/mol to 2.5 kcal/mol per complex for 50 % of all structures; values in this range may be attributed to inaccuracies of crystal structures or could be counterbalanced by favourable protein-ligand interactions. The application of the “clash” filter function shows significant improvements of the Docking Power of SFCscore. For the best SFCscore function (SFCscore::frag) the success rates for identifying a near-native 2.0 Å pose under the three top scored poses increases from 61.4 % to 86.9 %, which is comparable to the Docking Power of the best scoring functions (e.g. DSX, GlideScore::SP) currently available in literature (Docking Power (DSX): 92.6 %; Docking Power (GlideScore::SP): 86.9 %). The “clash” filter function alone is also superior to the combination of the “clash” and the “vnaHB” filter function.

Another focus of the work was the inclusion of decoy data (structure and affinity data of weakly active and inactive ligands) in scoring function development. Thus, unfavourable contributions to the binding affinity should be adequately considered, which appears essential for improving accuracy and reliability of the predictions. Within the scope of this work a binary classification model was developed for the evaluation of docking poses, allowing the inclusion of decoy poses without affinity data. The random forest algorithm (RF), SFCscore descriptors, the new “clash” descriptor, and the decoy datasets of Cheng and Huang (training data) provide the basis of the best-performing model. The practical benefit of the “best” RF model was investigated after combination with the scoring function DSX based on the Docking Power for identifying a near-native pose on rank 1 using the independent Cheng/Huang (only complexes not used for training) and the CSAR-2012 dataset. With respect to the standalone application of DSX, improvements of the Docking Power regarding both test sets are achieved (Cheng/Huang test set: DSX 84.24 %, RF 87.27 %; CSAR-2012 test set: DSX 87.93 %, RF 91.38 %). A key feature of the “best” model are reliable predictions of true positive docking poses for those complexes for which DSX fails to identify a near-native ligand conformation. A visual comparison of the best RF and DSX pose highlights advantages of the RF model regarding the recognition of interactions crucial for protein-ligand binding. The importance analysis of SFCscore descriptors for the classification of docking poses as well as the investigation of failures after model application provide useful hints for further improvements. Thus, more property-balanced training data, the further development of established SFCscore descriptors, and the implementation of new descriptors accounting for neglected contributions to the binding affinity constitute possible starting points for future improvements.

The second part of this work is dedicated to the application of docking-based methods for the development of new inhibitors of the "`Macrophage Infectivity Potentiator"'-(MIP) proteins of Legionella pneumophila and Burkholderia pseudomallei.

The MIP protein of Legionella pneumophila constitutes an important virulence factor and thus an attractive target for the treatment of legionellosis. Within the scope of this work the pipecolic acid sulfonamide 1, one of the best small-molecule MIP inhibitors to date (IC50 (1): 9 ± 0.7 µM), was systematically optimised. After hot spot analysis of the binding pocket, docking studies were conducted to select promising candidates for synthesis and testing MIP inhibition. The results of the hot spot analysis show favourable interaction fields for donor groups and hydrophobic substituents in meta position as well as acceptor groups in para position of the benzyl ring of 1. Introducing a nitro function in para position of the benzyl ring of 1 (2h) results in an increased MIP inhibition (IC50 (2h): 5 ± 1.5 µM), which is likely due to the formation of an additional hydrogen bond to Gly116. An improvement in the selectivity compared to the structurally related human FKBP12 protein is achieved particularly with the para amino derivative of 1 (2n) (selectivity index (1): 45, selectivity index (2n): 4.2, where the selectivity index = IC50 (MIP)/IC50 (FKBP12)). Replacing the hydrophobic trimethoxyphenyl residue of 1 with a pyridine ring (2s) leads to improved solubility and comparable MIP inhibition.

The MIP protein of Burkholderia pseudomallei plays an important role in the pathogenesis of melioidosis and thus constitutes an attractive target for the development of new drugs against this disease. Within the scope of this work the currently best small-molecule MIP inhibitor 1 was optimised. Starting with a structural comparison of Burkholderia pseudomallei MIP and Legionella pneumophila MIP, as well as a hot spot analysis of the Burkholderia pseudomallei MIP binding pocket, docking studies were conducted to select promising candidates for synthesis and testing for MIP inhibition. The structural comparison reveals a high homology of the two binding pockets. Major conformational changes are observed for the binding pocket region formed by Ala94, Gly95, Val97 and Ile98, which necessitates different optimisation strategies for 1. Favourable interaction fields for the Burkholderia pseudomallei MIP binding pocket are found for donor groups or hydrophobic substituents in para position of the benzyl ring (region A) of 1 as well as for acceptor or donor groups in para or meta/para position of the trimethoxyphenyl ring (region B). On the basis of the docking studies promising candidates could be identified for variations in both regions. Initial MIP inhibition measurements of synthesised derivatives indicate increased inhibition compared to 1. Replacing the hydrophobic trimethoxyphenyl residue of 1 with a pyridine ring (yielding a more soluble derivative) leads again to comparable MIP inhibition. Further syntheses and tests of promising ligands are currently being planned by the collaboration partners. The results of the inhibition measurements should demonstrate their suitability as MIP inhibitors and provide useful information for future structure-based drug design cycles.
KW  - Arzneimitteldesign
KW  - Computational chemistry
KW  - Legionella pneumophila
KW  - Burkholderia
KW  - Strukturbasiertes Wirkstoffdesign
KW  - Docking
KW  - Scoringfunktionen
KW  - Legionella pneumophila
KW  - Burkholderia pseudomallei
KW  - Structure-based drug design
KW  - Docking
KW  - Scoring functions
KW  - Legionella pneumophila
KW  - Burkholderia pseudomallei
KW  - Maschinelles Lernen
Y1  - 2014
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-101585
ER  - 
TY  - THES
A1  - Kuhn, Maximilian
T1  - Strukturbasiertes Design von MIP-Inhibitoren und computergestützte Selektivitätsuntersuchung gegenüber MIP- und humanen FKB-Proteinen
T1  - Structure-based design of MIP-Inhibitors and computer-aided selectivity studies towards MIP and human FKB proteins
N2  - Bakterielle und parasitäre MIP-Proteine stellen wichtige Virulenzfaktoren dar, deren Inhibition das Überleben der Erreger sowie deren Penetration in menschliche Zellen stark einschränken kann. In dieser Arbeit standen die MIP-Proteine von Burkholderia pseudomallei (Auslöser der Melioidose) und Legionella pneumophila (Legionärskrankheit) im Fokus. Außerdem wurde das MIP-Protein von Trypanosoma cruzi (Chagas-Krankheit) untersucht. Die strukturverwandten humanen FKB-Proteine FKBP12 und FKBP52 sind relevante „off-targets“, wie Experimente mit Knockout-Mäusen gezeigt haben.
Ziel dieser Arbeit war die Verbesserung von bekannten MIP-Inhibitoren im Hinblick auf ihre Affinität und Selektivität für MIP-Proteine gegenüber den beiden genannten FKB-Proteinen bei gleichzeitig verbesserter Löslichkeit, mit Hilfe von in silico Methoden. Ausgangspunkt waren hierbei zwei von Dr. Christina Juli und Dr. Florian Seufert entwickelte Leitstrukturen, welche ein Pipecolinsäuregrundgerüst aufweisen. Diese Referenzliganden beinhalten einen 3,4,5-Trimethoxyphenylring (TMPR, vgl. Ref_t) bzw. einen Pyridinylring (Ref_p).
Beim Vergleich von insgesamt 32 MIP- und FKB-Proteinen konnten in zwei Loop-Bereichen, welche 50er bzw. 80er Loop genannt werden, relevante Unterschiede in der Aminosäuresequenz identifiziert werden. Die Nummerierung bezieht sich stets auf FKBP12. Diese Unterschiede ließen sich zum Design von vergleichsweise selektiv an MIP-Proteine bindenden Molekülen nutzen.
Der 50er Loop ist in nahezu allen MIP-Proteinen (jedoch nicht in BpsMIP) im Vergleich zu den FKB-Proteinen um zwei Aminosäuren verkürzt. Dadurch befindet sich das Proteinrückgrat von LpnMIP (Gln49) und TcrMIP (Arg49) näher am Zentrum der Bindetasche (definiert als Ile56, welches durch die Pipecolinsäureesterfunktion der Liganden adressiert wird). MD-Simulationen der beiden Apoproteine belegten, dass die geringere Distanz nicht durch Artefakte beim Modellieren der Strukturen bedingt ist. Aufbauend auf dieser Erkenntnis wurde gezeigt, dass der Pyridinylring von Ref_p eine Wasserstoffbrücke zu Gln49 ausbildet. Experimentell wurde dieser Befund durch eine entsprechende chemische Verschiebung der Aminosäure im NMR-Experiment von Dr. Kristian Schweimer bestätigt. Durch Überbrückung des Pipecolinsäurerings (Ligand 6bp) konnte die Wasserstoffbrücke in MD-Simulationen weiter stabilisiert werden. Durch Rechnungen zur Abschätzung der freien Bindungsenthalpien (mittels LIE und MM/GBSA) wurde eine erhöhte Affinität von 6bp im Vergleich zu Ref_p in LpnMIP ermittelt.
Im Laufe der Arbeit wurde anhand von pIC50-Werten, welche von Dr. Mathias Weiwad bestimmt wurden, erkannt, dass Liganden mit Pyridinylring oftmals eine bessere Affinität in LpnMIP aufweisen als die entsprechenden Liganden mit TMPR. Durch MD Simulationen wurde nachgewiesen, dass der TMPR in LpnMIP nur schwer an der in den anderen Proteinen bevorzugten Position binden kann. Grund hierfür ist die Mutation einer Aminosäure (zu Pro57) in diesem Bereich von LpnMIP: Diese verfügt über eine wenig flexible Seiten-kette, an welche sich der TMPR auf Grund seiner Rigidität nicht anpassen kann, was die Interaktion zwischen Protein und Ligand stört. Der Pyridinylring von Ref_p ist hiervon nicht betroffen, da er bevorzugt an einer anderen Stelle (Gln49, s. o.) bindet.
Der 80er Loop weist in vielen MIP-Proteinen deutlich hydrophobere Aminosäuren auf als in FKB-Proteinen. Von besonderem Interesse ist die Position 90, da hier in BpsMIP und LpnMIP sterisch weniger anspruchsvolle Aminosäuren (Val, Pro) vorliegen als in den bei-den FKB-Proteinen (Ile, Lys). Dieser Unterschied wurde mit kleinen hydrophoben Substituenten am Phenylring der Liganden adressiert. Bereits im Docking zeigten sich die positiven Effekte der para-Substitution durch Halogenatome oder eine Methylgruppe. Die von Dr. Mathias Weiwad und Dr. Mirella Vivoli ermittelten pIC50- bzw. pKi-Werte bestätigten diesen Trend. Zugleich nahm die Affinität zu FKBP12 deutlich ab. Bei der Untersuchung der Referenzliganden sowie deren Chlor- und Bromderivate in MD-Simulationen zeigte sich, dass der Phenylring der Liganden in den MIP-Proteinen bevorzugt in Richtung des 80er Loops orientiert ist; in den FKB-Proteinen liegt er hingegen um etwa 110° gedreht vor und kann somit schlechter mit der Bindetasche interagieren. Besonders ausgeprägt ist dieser Effekt in FKBP12. Basierend auf diesen Ergebnissen wurde der Phenylring durch einen 4-Bromo-1H-imidazol-2-ylsubstituenten ersetzt (Ligand 8ap). Dieser ist in der Lage, in der erwarteten Orientierung im Bereich des 80er Loops von BpsMIP zu binden und gleichzeitig eine stabile Wasserstoffbrücke zu Asp37 auszubilden. Hieraus resultiert für den Liganden eine deutlich höhere Affinität in LIE- und MM/GBSA-Rechnungen; in FKBP12 blieb sie auf Grund der dort instabilen Interaktion unverändert.
Die berechneten Energien können unmittelbar für einen relativen Vergleich verschiedener Liganden in einer Bindetasche verwendet werden. Für die Vorhersage von pKi- bzw. pIC50-Werten in den verschiedenen Proteinen ist eine Kalibrierung gegen die gemessenen Affinitäten erforderlich. Dies wurde für BpsMIP durchgeführt, indem eine lineare Korrelation zwischen den pKi- bzw. pIC50-Werten und den mit MM/GBSA ermittelten Energien aufgestellt wurde. Für LIE wurde auf publizierte Werte von Lamb et al. zurückgegriffen. Die berechneten Affinitäten stimmen für die bereits getesteten Inhibitoren gut mit den experimentellen pKi- und pIC50-Werten überein. Anhand der Modelle werden für 8ap Werte vorhergesagt, die besser als die experimentellen Affinitäten bekannter Liganden sind.
Idealerweise können auch aus den Scores, die durch Docking erhalten werden, bereits Rückschlüsse auf die Affinitäten der Liganden gezogen werden. Für die untersuchten Proteine war dies, auf Grund des engen Bereichs der experimentell ermittelten pKi- und pIC50-Werte, nicht mit hinreichender Richtigkeit möglich. Um die Scores dennoch für die Beurteilung neuer Liganden verwenden zu können, wurden logistische Regressionsmodelle erstellt. Anhand dieser kann abgeschätzt werden, ob ein Molekül in BpsMIP submikromolare Affinität aufweist. Die Richtigkeit dieser Vorhersagemodelle konnte durch die Berücksichtigung dreier weiterer Deskriptoren (Konfiguration am Stereozentrum der Pipecolinsäure, Molekulargewicht und logD-Wert) deutlich verbessert werden, wobei die AUC der entsprechenden ROC-Kurven Werte bis zu 0.9 erreichte. Diese Modelle können für die Postprozessierung eines Dockings angewendet werden, um die vielversprechendsten Kandidaten zu identifizieren und anschließend in rechnerisch anspruchsvolleren MD-Simulationen genauer zu untersuchen.
Mit dieser Arbeit wurde zur Weiterentwicklung der Leitstrukturen Ref_t und Ref_p beigetragen. Viele der getesteten Derivate wiesen deutlich verbesserte Löslichkeit bei gleichbleibender Affinität auf. Ferner wurden erstmalig detailliert die Unterschiede in den Bindetaschen zwischen 32 MIP- und FKB-Proteinen evaluiert. Hiervon wurden fünf in MD-Simulationen als Apoprotein und im Komplex mit verschiedenen Inhibitoren verglichen. Anhand dieser Simulationen wurde nachgewiesen, dass jeweils eine Aminosäure in BpsMIP und LpnMIP im Vergleich zum wichtigsten „off-target“ FKBP12 selektiv durch eine Wasserstoffbrücke adressiert werden kann. Durch LIE- und MM/GBSA-Rechnungen konnte gezeigt werden, dass in diesen hochkonservierten Bindetaschen eine bedeutende Modulation der Affinität zugunsten von BpsMIP möglich ist.
N2  - Bacterial and parasitic MIP proteins constitute important virulence factors. Inhibiting these proteins can considerably reduce the survival of the pathogens as well as their penetration into human host cells. The work presented in this thesis focused on the MIP proteins of Burkholderia pseudomallei (the causative agent of melioidosis) and Legionella pneumophila (Legionnaires’ disease). Furthermore, the MIP protein of Trypanosoma cruzi (Chagas disease) was also investigated. The structurally homologous human FKB proteins FKBP12 and FKBP52 were taken into account as relevant off-targets.
The aim of this thesis was to improve MIP inhibitors by means of in silico methods with respect to affinity and selectivity (for MIP proteins over FKBP12 and FKBP52) as well as solubility. The starting point for this task were two lead structures with a pipecolic acid scaffold from the work of Dr. Christina Juli and Dr. Florian Seufert. These reference ligands contain a 3,4,5-trimethoxyphenyl ring (TMPR, cf. Ref_t) or a pyridinyl ring (Ref_p).
By comparison of 32 MIP and FKB proteins major differences with regard to the amino acid sequence could be identified in two loop regions, the so called 50s and 80s loop (numbering always with respect to FKBP12). It was possible to utilise these differences for the design of molecules with preferential binding to MIP proteins.
The 50s loop is truncated by two amino acids in nearly all MIP proteins compared to the FKB proteins, except for BpsMIP. Thus, the protein backbone of LpnMIP (Gln49) and TcrMIP (Arg49) is located closer to the centre of the binding pocket. The centre is defined as Ile56, which is binding to the pipecolic ester function of the ligands. MD simulations of both apoproteins proved that the smaller distance is not caused by artefacts introduced during modelling of the structures. Expanding on this knowledge, it could be shown that the pyridinyl ring of Ref_p forms a hydrogen bond to Gln49. This finding was proven ex-perimentally by a corresponding chemical shift of the amino acid in an NMR experiment conducted by Dr. Kristian Schweimer. The hydrogen bond was stabilised further in MD simulations via bridging of the pipecolic acid ring (ligand 6bp). Calculations by MM/GBSA and LIE, estimating the binding free energies of the ligands, yielded im-proved affinity for 6bp compared to Ref_p in LpnMIP.
It was noted in the course of this work, based on pIC50 measurements conducted by Dr. Mathias Weiwad, that ligands containing a pyridinyl ring often exhibit better affinity in LpnMIP than their corresponding counterparts with a TMPR. It could be shown with MD simulations that the TMPR is barely able to bind to LpnMIP at the position preferred in the other proteins. This is caused by mutation of an amino acid (to Pro57) in this region of LpnMIP. Due to its rigidity, the TMPR is not able to adjust to the hardly flexible side chain of proline. Consequently, the interaction between protein and ligand is disrupted. The pyridinyl ring of Ref_p is not affected by this mutation since it binds at another position (Gln49, see above).
The 80s loop contains more hydrophobic amino acids in MIP proteins than in FKB proteins. Position 90 is of particular interest, as there are sterically less demanding amino acids in BpsMIP and LpnMIP (Val, Pro) than in both FKB proteins (Ile, Lys). This difference was addressed with small hydrophobic substituents at the ligands’ phenyl ring. The favourable effects of the substitution in para-position by halogen atoms or a methyl group could be observed in initial docking experiments. pIC50 and pKi values measured by Dr. Mathias Weiwad und Dr. Mirella Vivoli confirmed this trend. Furthermore, the affinity for FKBP12 clearly decreased. MD simulations of both reference ligands as well as their derivatives substituted with chlorine or bromine showed that the phenyl ring preferentially adopts a conformation pointing towards the 80s loop in MIP proteins. In contrast, the phenyl ring is rotated by approximately 110° in FKB proteins, leading to decreased interactions with the binding pocket. This effect is especially pronounced in FKBP12. Based on these results, the phenyl ring was substituted by 4-Bromo-1H-imidazol-2-yl (ligand 8ap). A ligand containing this substituent can bind next to the 80s loop of BpsMIP maintaining the previously described orientation and simultaneously form a stable hydrogen bond to Asp37. Hence, a considerably higher binding affinity of this ligand to BpsMIP was predicted via LIE and MM/GBSA calculations. There were no changes in affinity for FKBP12 due to the instable interaction in this protein.
The calculated energies can directly be used to rank different ligands in a binding pocket. In order to predict pIC50 and pKi values in different proteins, these energies require calibration versus experimentally measured affinities. Such a calibration was carried out for BpsMIP by linearly correlating pIC50 and pKi values with energies gained from MM/GBSA calculations. For the LIE method, parameters published by Lamb et al. were used. Both computational approaches yielded affinities in good agreement with experimentally measured pIC50 and pKi values of known ligands. The affinities predicted by these models for 8ap are better than the inhibition constants of all currently known inhibitors.
Ideally, scores obtained by docking can directly be used to gain insights into the ligands’ affinities. However, sufficient accuracy for the proteins investigated could not be gained, due to the narrow range of the experimental pIC50 and pKi values. Consequently, logistic regression models were created to allow for assessment of the ligands based on their score. These models predict whether a ligand is likely to show submicromolar affinity in BpsMIP. The accuracy of these models was considerably increased by implementing three other descriptors (configuration at the stereo centre of the pipecolic acid, molecular weight and logD value). Thus, AUCs up to 0.9 could be achieved in the corresponding ROC curves. The models can be used for postprocessing a docking calculation in order to identify the most promising ligands and subsequently investigating them with computationally more demanding MD simulations.
This work contributed to the improvement of the lead structures Ref_t and Ref_p. Many of the tested derivatives exhibited increased solubility while affinity was maintained. Furthermore, differences in the binding pockets of 32 MIP and FKB proteins were evaluated in detail for the first time. Five of these proteins were compared in MD simulations, both as apoproteins as well as complexed with different inhibitors. It was proven by these simulations that one amino acid in BpsMIP as well as in LpnMIP can selectively be addressed with a hydrogen bond. These interactions cannot be formed in the most prominent off-target FKBP12. LIE and MM/GBSA calculations proved that considerable modulation of the binding affinity towards BpsMIP is possible in these highly conserved binding pockets.
KW  - Computational chemistry
KW  - Macrophage Infectivity Potentiator Protein
KW  - Arzneimitteldesign
KW  - MIP protein
KW  - FKBP
KW  - docking
KW  - MD simulation
KW  - Burkholderia pseudomallei
KW  - Legionella pneumophila
KW  - Trypanosoma cruzi
KW  - Drug design
KW  - molecular dynamics
Y1  - 2019
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-165757
ER  - 
TY  - THES
A1  - Schaumlöffel, Anu Lena
T1  - Quantenchemische Studien der Chiroptischen Eigenschaften ausgedehnter π-Systeme sowie Beiträge zu SpecDis
T1  - Quantum-Chemical Studies of the Chiroptical Properties of Extended π Systems and Contributions to SpecDis
N2  - Für die Aufklärung der absoluten Stereostruktur von chiralen Molekülen, die ein Chromophorsystem besitzen, hat sich die Kombination der experimentellen und theoretischen Spektroskopie des elektronischen Circulardichroismus (ECD) als Methode bewährt. In der vorliegenden Arbeit wurden die chiroptischen Eigenschaften von Bisbibenzyl-Makrocyclen, Mono- und Bis(cycloketo)porphyrinen, der Mohnblütenpigmente Nudicaulin I und II sowie von Bordipyrrol-Dimeren mit quantenchemischen Methoden untersucht. Zu diesem Zweck wurden verschiedene dichtefunktionaltheoretische (DFT) Ansätze und post-HF-Methoden, wie z. B. der Coupled-Cluster-Ansatz RI-CC2, bezüglich ihrer Eignung, die Grund- und angeregten Zustände (UV/vis- und ECD-Eigenschaften) der einzelnen Verbindungen korrekt wiederzugeben, evaluiert. Da bei quantenchemischen UV- und ECD-Rechnungen an ausgedehnten π-Systemen aufgrund energetisch nah beieinander liegender Anregungen die Wahrscheinlichkeit für ghost states und charge-transfer-Übergänge sowie Multireferenz-Problematiken steigt, wurden diese Aspekte genauer betrachtet. Die ersten zwei Phänomene lassen sich bereits auf TD-DFT-Niveau durch genaue Analyse der theoretischen spektroskopischen Daten ermitteln und unter Umständen durch entsprechend korrigierte Funktionale sogar sehr gut beschreiben. Im Gegensatz dazu können Doppelanregungsanteile überhaupt erst durch Rechnungen mit geeigneten Methoden, wie z. B. das hier verwendete SORCI-Verfahren, erfasst werden. Zusätzlich wurde das zur Auswertung von UV und ECD-Daten entwickelte Programm SpecDis um Funktionalitäten erweitert, welche die Berechnung des Übereinstimmungsgrades zweier UV- bzw. ECD-Kurven ermöglichen, und dadurch ein zusätzliches quantitatives Kriterium für die Verlässlichkeit des Spektrenvergleichs und folglich für die Zuordnung der absoluten Konfiguration bieten.
N2  - For the elucidation of the absolute stereostructure of chiral molecules possessing a chromophore, the combination of experimental and theoretical spectroscopy of the electronic circular dichroism (ECD) has proven a valuable tool. In the present work, the chiroptical properties of bisbibenzyl macrocycles, mono- and bis(cycloketo)porphyrins, the poppy-petal pigments nudicaulins I and II, and boron-dipyrrole dimers were investigated with quantum-chemical methods. For this purpose, different density-functional and post-HF methods, for example the coupled-cluster approach RI-CC2, were evaluated regarding their suitability to correctly describe the ground and exited states (UV/vis and ECD properties) of each compound. Since the probability of ghost states, charge-transfer transitions, and multi-reference problems increases for quantum-chemical UV and CD calculations of extended π systems due to energetically close-lying excitations, these aspects were closely examined. The first two phenomena can be detected on TD-DFT level of theory by a thorough analysis of the theoretical spectroscopic data, and can in some cases even be described quite well by specially corrected functionals. By contrast, double excitations can only be included in the calculations by using suitable methods, e.g. the herein used SORCI approach. Additionally, functionalities were added to the program SpecDis which allow for the calculation of the degree of similarity of either two UV or ECD curves, and thus, offer an additional quantitative measure for the comparison of spectra and, in consequence, for the reliability of the assignment of an absolute configuration.
KW  - Chiralität <Chemie>
KW  - Zirkulardichroismus
KW  - CD-Spektroskopie
KW  - Computational chemistry
KW  - Absolute Konfiguration
KW  - Elektronischer Circulardichroismus
KW  - Zeitabhängige Dichtefunktionaltheorie
KW  - Coupled-Cluster-Theorie
KW  - SpecDis
KW  - Absolute Configuration
KW  - Electronic Circular Dichroism
KW  - Time-dependent Density Functional Theory
KW  - Coupled-Cluster Theory
KW  - SpecDis
Y1  - 2014
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-108291
ER  - 
TY  - THES
A1  - Schlee, Christoph
T1  - Untersuchungen zu Cyclodextrinkomplexen von Sulfonamidarzneistoffen
T1  - Investigations of cyclodextrin complexes of sulfa drugs
N2  - Als Hilfsstoffe in der Arzneimittelentwicklung können Cyclodextrine und ihre Derivate aufgrund der Fähigkeit zur Bildung von Wirt-Gast-Komplexen mit organischen Molekülen zu unterschiedlichsten Zwecken verwendet werden. Ein Verständnis aller Einflussfaktoren auf die Komplexbildung wäre von großem Wert, weil man so gegebenenfalls vorab entscheiden könnte, ob ein Einsatz von Cyclodextrinen überhaupt in Betracht käme, und wenn ja, welches Cyclodextrin den beabsichtigten Effekt brächte. In der vorliegenden Arbeit wurden mit Hilfe verschiedener Methoden Informationen zu den Einschlusskomplexen gesammelt, die natürliche Cyclodextrine mit einer Reihe typischer Arzneistoffmoleküle bilden. Als Modellsubstanzen wurden die Sulfonamide Sulfadiazin, Sulfadimidin, Sulfafurazol, Sulfaguanidin, Sulfamerazin, Sulfameter, Sulfamethoxazol, Sulfanilamid und Sulfathiazol gewählt. Aufgrund ihrer Molekülgröße bilden die gewählten Gäste in wässriger Lösung bevorzugt mit dem siebengliedrigen β-Cyclodextrin Komplexe, die Wechselwirkungen sind im Vergleich mit anderen Gastmolekülen jedoch relativ schwach. Im Rahmen von Löslichkeitsstudien wurden verschiedene Einflüsse (pH, Temperatur) auf die Komplexbildung in Lösung untersucht. Mit Hilfe von Van’t Hoff Plots wurden die thermodynamischen Größen der Komplexbildung bestimmt, wo das Phänomen der Enthalpie-Entropie-Kompensation beobachtet werden konnte. Die Stöchiometrie der Komplexe wurde unter anderem in Job’s Plots mit Hilfe der 1H-NMR-Spektroskopie bestimmt. Die Komplexbildung geht im Fall der Sulfonamide meist nicht nur mit einer Löslichkeitssteigerung des Gastes, sondern auch des nur eingeschränkt wasserlöslichen β-Cyclodextrins einher. Dieser Effekt wurde bei verschiedenen pH-Werten quantifiziert und tritt bei allen Gastmolekülen, mit Ausnahme von Sulfathiazol, in vergleichbarem Umfang auf. Unter Ausnutzung dieses Phänomens kann je nach Gast eine Konzentration des Wirtes in Lösung erreicht werden, die ein Vielfaches seiner intrinsischen Löslichkeit beträgt. Sowohl in Lösung als auch im Feststoff wurde die Struktur der Einschlusskomplexe mit spektroskopischen Verfahren untersucht. ROESY-Spektren zeigten, dass die chemisch sehr ähnlichen Gastmoleküle teilweise erheblich von einander abweichende Positionen und Orientierungen in der Kavität des Cyclodextrins einnehmen. FTIR-Spektren fester Komplexzubereitungen unterstützen die detaillierteren NMR-Ergebnisse für die meisten Gäste. Ergänzend wurden mit Hilfe von molekularmechanischen Methoden theoretisch plausible Komplexstrukturen erstellt. Dabei wurde die Flexibilität der Cyclodextrinmoleküle und das mögliche Auftreten eines induced-fit durch die Generierung verschiedenartiger Konformere des β-Cyclodextrins in einer Molekulardynamikstudie berücksichtigt. In Dockingstudien (Autodock 3.0) wurde nach dem Bindungsmodus gesucht. Unter den Versuchsbedingungen dominieren Orientierungen, bei denen die aromatische Aminogruppe und die schwefelgebundenen Sauerstoffatome mit den Hydroxylgruppen des Wirtes Wasserstoffbrückenbindungen aufbauen können. Die resultierende Störung der intra- und intermolekularen Wechselwirkungen des Cyclodextrins stellt eine mögliche Erklärung der synergistischen Löslichkeitseffekte zwischen Wirt und Gast dar. Die gewonnenen Daten stellen eine Grundlage zur Charakterisierung der Komplexbildung von Sulfonamiden mit natürlichen Cyclodextrinen dar. Alle Modellsubstanzen wurden mit denselben Methoden untersucht, was eine vergleichende Betrachtung ermöglicht. Insgesamt wurde durch die Betrachtung einer so großen Gruppe an Modellsubstanzen ähnlicher chemischer Eigenschaften und Molekülstruktur ein Eindruck gewonnen, wie stark die Vorgänge bei der Komplexbildung mit Cyclodextrinen schon innerhalb einer relativ homogenen Gruppe variieren können. Aus den Ergebnissen der vorliegenden Arbeit ist zu folgern, dass Vorhersagen zur Komplexbildung mit Cyclodextrinen anhand von Untersuchungen mit vergleichbaren Modellsubstanzen nicht endgültig zu treffen sind, sondern immer von einem vom Gastmolekül abhängigen Einzelfall auszugehen ist.
N2  - Cyclodextrins and their derivatives with their ability to form host-guest-complexes with organic molecules can be applied for various purposes in drug development. Understanding all effects on complex formation one could be able to predict if the use of cyclodextrins is indicated and which cyclodextrin is appropriate. In this thesis various methods were applied to gather information about complexes formed by natural cyclodextrins and a set of typical drug molecules. Sulfa drugs - sulfadiazine, sulfadimidine, sulfafurazole, sulfaguanidine, sulfamerazine, sulfameter, sulfamethoxazole, sulfanilamide and sulfathiazole - were chosen as model substances. Owing to their molecular size these guests form complexes preferably with β-cyclodextrin in aqueous solution. The interactions are relatively weak compared with other guest molecules. Phase solubility analysis was used to investigate several effects (pH, temperature) on complexation in solution. The thermodynamic parameters for the complexation were derived from linear van’t Hoff plots which indicate the presence of the enthalpy-entropy-compensation phenomenon. The complex stoichiometry was derived amongst others from Job’s plots employing 1H-NMR-spectroscopy. For most sulfa drugs complexation not only results in a solubility enhancement of the guest, but also increases the low intrinsic solubility of β-cyclodextrin itself. This effect was quantified at several pH values. It is of comparable extent for all guest molecules with exception of sulfathiazole. Making use of the described phenomenon one can achieve β-cyclodextrin concentrations many times higher than its intrinsic solubility in solution. The structure of the inclusion complexes was examined in solution and in the solid state using the means of spectroscopy. ROESY spectra of some model substances show that the chemically related molecules occupy considerably different positions and orientations inside the cyclodextrin’s cavity. FTIR spectra of solid complex formulations support the more detailed NMR-results in most cases. In addition, theoretical structures for the inclusion complexes were created by molecular mechanics. Cyclodextrin flexibility and a possible ‘induced-fit’ were simulated by generating multiple conformations of β-cyclodextrin by molecular dynamics. Docking experiments were carried out in order to characterize the inclusion mode of the sulfonamides. Under the experimental conditions we observed those orientations to be predominant where the aromatic amino group and the oxygen atoms of the sulfonamide are able to establish H-bonds to the host’s hydroxyl groups. The resulting disturbance of the intermolecular and intramolecular H-bonds of β-cyclodextrin is one possible explanation for the synergistic solubility effects between host and guest. The data obtained forms a foundation for the characterization of the complexation process of sulfonamides and natural cyclodextrins. All model substances were investigated applying the same methods allowing a comparative interpretation. Overall, studying a larger group of model substances of similar chemical properties und molecular structure showed the variations of the inclusion process even in such a homogenous group of guests. The results of this thesis make it obvious that predictions concerning complex formation with cyclodextrins are not possible by considering investigations of related model substances. Instead, complex formation should always be regarded as an individual case.
KW  - Cyclodextrine
KW  - Löslichkeit
KW  - Protonen-NMR-Spektroskopie
KW  - Computational chemistry
KW  - Sulfonamide
KW  - Löslichkeitsstudien
KW  - Dockingstudien
KW  - Phase solubility
KW  - Molecular Docking
Y1  - 2011
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-64772
ER  - 
TY  - THES
A1  - Zilian, David
T1  - Neuartige, empirische Scoring-Modelle für Protein-Ligand-Komplexe und computergestützte Entwicklung von Hsp70-Inhibitoren
T1  - Novel empirical scoring-functions for protein-ligand complexes and computer-aided development of Hsp70 inhibitors
N2  - Techniken des computergestützten Wirkstoffdesigns spielen eine wichtige Rolle bei der Entwicklung neuer Wirkstoffe. Die vorliegende Arbeit befasst sich sowohl mit der Entwicklung als auch mit der praktischen Anwendung von Methoden des strukturbasierten Wirkstoffdesigns. Die Arbeit glieder sich daher in zwei Teile.

Der erste Teil beschäftigt sich mit der Entwicklung von empirischen Scoring-Funktionen, die eine Schlüsselrolle im strukturbasierten computergestützen Wirkstoffdesign einnehmen. Grundlage dieser Arbeiten sind die empirischen Deskriptoren und Scoring-Funktionen aus dem SFCscore-Programmpaket. 

Dabei wurde zunächst untersucht, wie sich die Zusammensetzung der Trainingsdaten auf die Vorhersagen von empirischen Scoring-Funktionen auswirkt. Durch die gezielte Zusammenstellung eines neuen Trainingsdatensatzes wurde versucht, die Spannweite der Vorhersagen zu vergrößern, um so vor allem eine bessere Erkennung von hoch- und niedrig-affinen Komplexen zu erreichen. Die resultierende Funktion erzielte vor allem im niedrig-affinen Bereich verbesserte Vorhersagen.

Der zweite Themenkomplex beschäftigt sich ebenfalls mit der verbesserten Separierung von aktiven und inaktiven Verbindungen. Durch den Einsatz der Machine Learning-Methode RandomForest wurden dazu Klassifizierungsmodelle abgeleitet, die im Unterschied zu den klassischen Scoring-Funktionen keinen genauen Score liefern, sondern die Verbindungen nach ihrer potentiellen Aktivität klassifizieren. 
Am Beispiel des mykobakteriellen Enzyms InhA konnte gezeigt werden, dass derartige Modelle den klassischen Scoring-Funktionen im Bezug auf die Erkennung von aktiven Verbindungen deutlich überlegen sind. 

Der RandomForest-Algorithmus wurde im nächsten Schritt auch verwendet, um eine neue Scoring-Funktion zur Vorhersage von Bindungsaffinitäten abzuleiten. Diese Funktion wurde unter dem Namen SFCscoreRF in das SFCscore-Programmpaket implementiert. Die Funktion unterschiedet sich in einigen wesentlichen Punkten von den ursprünglichen SFCscore-Funktionen.
Zum einen handelt es sich beim RF-Algorithmus um eine nicht-lineare Methode, die im Unterschied zu den klassischen Methoden, die zur Ableitung von Scoring-Funktionen eingesetzt werden, nicht von der Additivität der einzelnen Deskriptoren ausgeht. Der Algorithmus erlaubt außerdem die Verwendung aller verfügbaren SFCscore-Deskriptoren, was eine deutlich umfassendere Repräsentation von Protein-Ligand-Komplexen als Grundlage des Scorings ermöglicht. Für die Ableitung von SFCscoreRF wurden insgesamt 1005 Komplexe im Trainingsdatensatz verwendet.  Dieser Datensatz ist somit einer der größten, die bisher für die Ableitung einer empirischen Scoring-Funktion verwendet wurden.

Die Evaluierung gegen zwei Benchmark-Datensätze ergab deutlich bessere Vorhersagen von SFCscoreRF im Vergleich zu den ursprünglichen SFCscore-Funktionen. Auch im internationalen Vergleich mit anderen Scoring-Funktion konnten für beide Datensätze Spitzenwerte erreicht werden. 
Weitere ausgiebige Testungen im Rahmen einer Leave-Cluster-Out-Validierung und die Teilnahme am CSAR 2012 Benchmark Exercise ergaben, dass auch SFCscoreRF Performanceschwankungen bei der Anwendung an proteinspezifischen Datensätzen zeigt - ein Phänomen, dass bei Scoring-Funktionen immer beobachtet wird. Die Analyse der CSAR 2012-Datensätze ergab darüber hinaus wichtige Erkenntnisse im Bezug auf Vorhersage von gedockten Posen sowie über die statistische Signifikanz bei der Evaluierung von Scoring-Funktionen.

Die Tatsache, dass empirische Scoring-Funktionen innerhalb eines bestimmten chemischen Raums trainiert wurden, ist ein wichtiger Faktor für die protein-abhängigen Leistungsschwankungen, die in dieser Arbeit beobachtet wurden. Verlässliche Vorhersagen sind nur innerhalb des kalibrierten chemischen Raums möglich. In dieser Arbeit wurden verschiedene Ansätze untersucht, mit denen sich diese ``Applicability Domain'' für die SFCscore-Funktionen definieren lässt. Mit Hilfe von PCA-Analysen ist es gelungen die  ``Applicability Domain'' einzelner Funktionen zu visualisieren. Zusätzlich wurden eine Reihe numerischer Deskriptoren getestet, mit den die Vorhersageverlässlichkeit basierend auf der ``Applicability Domain'' abgeschätzt werden könnte. Die RF-Proximity hat sich hier als vielversprechender Ausgangspunkt für weitere Entwicklungen erwiesen.

Der zweite Teil der Arbeit beschäftigt sich mit der Entwicklung neuer Inhibitoren für das Chaperon Hsp70, welches eine vielversprechende Zielstruktur für die Therapie des multiplen Myeloms darstellt. 
Grundlage dieser Arbeiten war eine Leitstruktur, die in einer vorhergehenden Arbeit entdeckt wurde und die vermutlich an einer neuartigen Bindestelle in der Interface-Region zwischen den beiden großen Domänen von Hsp70 angreift.

Die Weiterentwicklung und Optimierung dieser Leitstruktur, eines Tetrahydroisochinolinon-Derivats, stand zunächst im Vordergrund. Anhand detaillierter Docking-Analysen wurde der potentielle Bindemodus der Leitstruktur in der Interfaceregion von Hsp70 untersucht. Basierend auf diesen Ergebnissen wurde eine Substanzbibliothek erstellt, die von Kooperationspartnern innerhalb der KFO 216 synthetisiert und biologisch getestet wurde. Die Struktur-Wirkungsbeziehungen, die sich aus diesen experimentellen Daten ableiten lassen, konnten teilweise gut mit den erstellten Docking-Modellen korreliert werden. Andere Effekte konnten anhand der Docking-Posen jedoch nicht erklärt werden. Für die Entwicklung neuer Derivate ist deswegen eine umfassendere experimentelle Charakterisierung und darauf aufbauend eine Verfeinerung der Bindungsmodelle notwendig.

Strukturell handelt es sich bei Hsp70 um ein Zwei-Domänen-System, dass verschiedene allostere Zustände einnehmen kann. Um die Auswirkungen der daraus folgenden Flexibilität auf die Stabilität der Struktur und die Bindung von Inhibitoren zu untersuchen, wurden molekulardynamische Simulationen für das Protein durchgeführt.
Diese zeigen, dass das Protein tatsächlich eine überdurchschnittlich hohe Flexibilität aufweist, die vor allem durch die relative Bewegung der beiden großen Domänen zueinander dominiert wird. Die Proteinkonformation die in der Kristallstruktur hscaz beobachtet wird, bleibt jedoch in ihrer Grundstruktur in allen vier durchgeführten Simulationen erhalten. Es konnten hingegen keine Hinweise dafür gefunden werden, dass die Mutationen, welche die für die strukturbasierten Arbeiten verwendete Kristallstruktur im Vergleich zum Wildtyp aufweist, einen kritischen Einfluss auf die Gesamtstabilität des Systems haben. 

Obwohl die Interface-Region zwischen NBD und SBD also in allen Simulationen erhalten bleibt, wird die Konformation in diesem Bereich doch wesentlich durch die Domänenbewegung beeinflusst und variiert. Da dieser Proteinbereich den wahrscheinlichsten Angriffspunkt der Tetrahydroisochinolinone darstellt, wurde der Konformationsraum detailliert untersucht. Wie erwartet weist die Region eine nicht unerhebliche Flexibilität auf, welche zudem, im Sinne eines ``Induced-Fit''-Mechanismus, durch die Gegenwart eines Liganden (Apoptozol) stark beeinflusst wird. Es ist daher als sehr wahrscheinlich anzusehen, dass die Dynamik der Interface-Region auch einen wesentlichen Einfluss auf die Bindung der Tetrahydroisochinolinone hat. Molekuardynamische Berechnungen werden deswegen auch in zukünftige Arbeiten auf diesem Gebiet eine wichtige Rolle spielen.

Die Analysen zeigen zudem, dass die Konformation der Interface-Region eng mit der Konformation des gesamten Proteins - vor allem im Bezug auf die relative Stellung von SBD und NBD zueinander - verknüpft ist. Das untermauert die Hypothese, dass die Interface-Bindetasche einen Angriffspunkt für die Inhibtion des Proteins darstellt.
N2  - Methods of computational drug design play a crucial role in the development of new pharmaceutical drugs. The work presented here comprises the methodological development and the practical application of structure-based techniques in computational drug design. 

The first part of this dissertation focuses on the development of empirical scoring functions, which play an essential part in structure-based computer-aided drug design. The basis for this work are the empirical descriptors and scoring functions of the SFCscore software package.

First, the influence of the training data composition on the prediction of empirical scoring functions was analyzed. A new training data set was created to spread the prediction range of the function and thus achieve a better separation of high and low affinity binders. The resulting function indeed yielded better predictions in the low affinity area compared to the original functions.

In another approach, which also addresses the issue of discriminating active and inactive compounds, the Machine Learning method RandomForest (RF) was used to derive a classification model. Different to classical empirical scoring functions, this model no longer predicts a precise value but classifies the compounds according to their potential affinity as 'active' or 'inactive'.
The example of the mycobacterial enzyme InhA showed that such models are clearly superior to different classical scoring function in terms of separating active and inactive compounds.

The RandomForest algorithm was also used to derive a new scoring function for the prediction of binding affinities. This new function was implemented into the SFCscore software package under the name SFCscoreRF. This new function differs from the original SFCscore functions in several essentials points. On the one hand, the RF-algorithm is a non-linear method, which - in contrast to classical methods used for the derivation of empirical scoring functions - does not assume the additivity of the single descriptors.  On the other hand, the algorithm allowes for using the whole set of available SFCscore descriptors and is therefore able to utilize a more comprehensive representation of a protein ligand complex as the basis for the prediction. Additionally, the training data set used to derive SFCscoreRF comprised 1005 complexes. This training set is one of the largest data sets used to train an empirical scoring function.

The evaluation against two widely-used benchmark sets confirmed that SFCscoreRF yields superior predicitons as compared to the original functions. The comparison with other functions tested for these benchmarks shows that SFCscoreRF also achieves top results on an international level.
Further analyses using a leave-cluster-out validation scheme and the participation in the CSAR 2012 Benchmark Exercise revealed that - similar to other scoring functions - SFCscoreRF shows varying performances when applied to protein-specific data sets. Additionally, by analysing the results of the CSAR 2012 data sets, valuable insight were gained regarding the prediction of docking poses and the statistical significance for the evaluation and comparison of scoring functions.

The fact that empirical scoring functions are trained within a certain chemical space, is an important reason for the target-dependent performance observed in this work. Reliable predictions can only be expected within the calibrated area. Different approaches for the definition of this ``applicability domain'' are presented in this work. PCA analyses have been used to create a two dimensional representation of the ``applicability domain''. Additionally, different numerical descriptors have been tested to estimate the reliability of SFCscore predicitons. The RF-proximity has been found to be a promising starting point for future research.

The development of new inhibitors for the molecular chaperone Hsp70 - a promising target in the therapy of multiple myeloma - comprises the second part of this dissertation. 
The basis for this work was a lead structure that was found in a previous work and attacks a novel binding pocket in the interface between the two domains of the Hsp70 protein.

The optimization and development of that lead structure - a tetrahydroisochinolinone - was the primary focus of the present work. Potential binding poses in the interface were elucidated by detailed docking analyses. Based on that information, a compound library was compiled, which was synthezised and biologically analyzed by cooperation partners within the CRU 216. The resulting structure activity relationships can partially be explained on the basis of the corresponding docking poses. However, some of the effects remain unexplained. For the further development of new derivatives a comprehensive experimental characterization of the current compounds is needed. This information can be used as a basis for the refinement of the existing binding models.

Hsp70 is a two-domain system, which can visit different allosteric states. To further investigate the effects of the resulting flexibility on the stability of the structure and on inhibitor binding, molecular dynamics simulations were conducted.
These simulations show an above-average felxibility of the protein, which is primarily dominated by the movement of the two domains NBD and SBD relatively to each other. However, the basic conformation that is observed in the crystal structure hscaz, which was used in this work, remains stable in all simulations. Furthermore, the trajectories showed no evidence that the mutations, in which hscaz differs from the wild type protein, have a significant effect on the overall protein conformation.

Although, the overall conformation of the interface between NDB and SBD remains stable, the exact conformation in this area is signficantly influenced by the domain movement. As this region includes the binding pocket of the tetrahydroisochinolinones, the conformational space of this area was analyzed in detail.
The analyses expectedly reveal a high flexibility in the interface area that is dominated by the SBD-NBD movement. Furthermore, it could be shown that the conformation and dynamics can be influenced by a bound ligand (apoptozole), in terms of an induced fit mechanism. It is highly probable that the binding of the tetrahydroisochinolinones trigger similar effects, influencing the binding mechanism of this compound class. Thus, molecular dynamics simulations should play a crucial role in the future development of new compounds.

The analyses also show that the dynamics of the interface region have large effects on the overall structure of the protein and vice versa. Especially, the relative orientation of NBD and SBD has a large impact on the binding pocket. This underlines the hypothesis that the interface region constitutes a promising target area for the inhibition of Hsp70.
KW  - Arzneimittelforschung
KW  - Strukturbasiertes Wirkstoffdesign
KW  - Structure-based drug design
KW  - Computational chemistry
KW  - Molekulardesign
KW  - Proteine
KW  - Hitzeschock-Proteine
KW  - Scoring-Funktionen
KW  - Docking
KW  - molekulardynamische Simulationen
KW  - Hsp70
KW  - Strukturoptimierung
KW  - scoring functions
KW  - molecular dynamics
KW  - lead structure optimization
KW  - Ligand <Biochemie>
KW  - Maschinelles Lernen
Y1  - 2014
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-105055
ER  -