Filtern
Volltext vorhanden
- ja (2) (entfernen)
Gehört zur Bibliographie
- ja (2)
Dokumenttyp
- Dissertation (2)
Sprache
- Deutsch (2) (entfernen)
Schlagworte
- docking (2) (entfernen)
Institut
Diese Dissertation beschreibt Methoden zur Lösung wichtiger anwendungsorientierter Aspekte des struktur- und ligandbasierten in-silico-Wirkstoffdesigns. Dabei liegt der Fokus auf der Entwicklung chemometrischer Verfahren und der Überprüfung ihrer Leistungsfähigkeit. Die vorgeschlagenen Algorithmen werden mit entsprechenden etablierten Techniken verglichen. Die folgenden Abschnitte fassen die Vorgehensweisen und Resultate in den einzelnen Projektbereichen zusammen. Identifizierung von Outliern. Die Untersuchung eines QSAR-Datensatzes mit dem Ziel der Outlier-Identifizierung wird in der Praxis häufig vernachlässigt. Dabei ist es offensichtlich, daß kein QSAR-Modell auf jede nur denkbare chemische Verbindung anwendbar sein kann. Vielmehr handelt es sich um empirische mathematische Modelle, die nur innerhalb jenes Datenraums Gültigkeit besitzen, der von den Trainingsobjekten aufgespannt wird. Daher ist jedes Modell auf gewisse Grenzen beschränkt, außerhalb derer eine verläßliche Vorhersage unmöglich ist. Die in dieser Arbeit entwickelte Methode ODD dient der Ermittlung dieser Grenzen und damit der Identifizierung von Outliern, also Objekten außerhalb des Anwendungsbereichs des Modells. Ziel der Entwicklung war ein nur auf den unabhängigen Variablen (X-Daten) basierendes Verfahren, das auch auf hochdimensionaleDatensätze anwendbar ist undweitestgehend auf den Eingriff des Benutzers (etwa die Definition von Grenzwerten) verzichtet. Ebenfalls wünschenswert war die Fähigkeit zur Identifikation von Inliern. Eine ausreichend hohe Geschwindigkeit sollte die Einsetzbarkeit im virtuellen Screening gewährleisten. Die Methode mußte der Überprüfung standhalten, den Vorhersagefehler eines Modells bei Vorhandensein extremer Outlier zu reduzieren, gleichzeitig aber unkritische Datensätze unbeeinflußt zu lassen. ODD basiert auf der Beurteilung der euklidischen Distanz eines Testobjekts zu seinem am nächsten benachbarten Trainingsobjekt. Der Schwellenwert für die Betrachtung eines Objekts als Outlier wird dabei aus der Verteilung der Nächster-Nachbar-Distanzen der Trainingsobjekte berechnet. Durch dieses intrinsische Maß ergibt sich die gewünschte Dimensionsunabhängigkeit und vor allem die automatische Anpassung des Grenzwerts an die Charakteristik des Kalibrierdatensatzes ohne Eingriff des Benutzers. Die Validierung zeigt, daß ODD extreme Outlier zuverlässig erkennt und sich gleichzeitig durch eine im Vergleich zu anderen gebräuchlichen Verfahren geringere Anzahl falsch positiver Identifizierungen auszeichnet. Ensemble-Techniken. In einer vergleichenden Studie wurde die Leistungsfähigkeit verschiedener Ensemble-Techniken hinsichtlich ihres Einflusses auf den Vorhersagefehler untersucht. Dazu wurden umfangreiche Simulationen anhand mehrerer realer QSAR-Datensätze durchgeführt. Die Verwendung von Ensembles (d. h. einer Sammlung vielerModelle, diemit geringfügigmanipulierten Varianten des Trainingsdatensatzes kalibriert wurden) wirkt sich im allgemeinen positiv auf den Vorhersagefehler (RMSEP) aus. Diese Reduzierung des RMSEP wurde hier ermittelt und für verschiedenen Ansätze zur Ensemble-Generierung verglichen. Insgesamt betrachtet erwiesen sich die Methoden der konvexen Pseudodaten und des Baggings als die effektivsten Verfahren zur Ensemble-Generierung, da sie den Vorhersagefehler am deutlichsten verbesserten. Die konvexen Pseudodaten wurden erstmalig zur Erzeugung von Ensembles in der QSAR-Analyse eingesetzt; sie werden als neuer Standard zur Reduzierung des RMSEP bei QSAR-Problemen vorgeschlagen, die Regressionsmodelle auf Basis von latenten Variablen verwenden. Darüber hinaus bieten die Studien eine Abschätzung dermit Hilfe von Ensembles zu erzielenden Reduktion des Vorhersagefehlers bei typischen QSAR-Datensätzen. Virtuelles Screening. Beim virtuellen Screening handelt es sich um eine Technik zum Durchsuchen großer (virtueller)Molekülbibliotheken—oftmehrere Millionen Verbindungen — nach den aussichtsreichsten Wirkstoffkandidaten. Dies kann sowohl durch strukturbasierte als auch mit Hilfe ligandbasierter Verfahren geschehen. Es wurden umfangreiche Simulationen anhand sechs verschiedener Targets und einer Bibliothek von mehr als 90 000 Molekülen durchgeführt, um das Potential strukturbasierter (Docking mit FLEXX) und ligandbasierter (Ähnlichkeitssuchemitmehreren Referenzen) Verfahren zu vergleichen. Darüber hinauswurde durch Berechnung von Interaktionsfingerprints eineMöglichkeit geschaffen, die Information der beiden sonst getrennten Herangehensweisen zu kombinieren. Um den Einfluß des Klassifizierungsalgorithmus zu untersuchen, wurden verschiedene statistische Methoden zur Datenauswertung herangezogen. Als Bewertungskriterium für die Leistungsfähigkeit eines Verfahrens diente jeweils die Anzahl der wiedergefundenen aktiven Moleküle in der simulierten Screeningdatenbank. Die Resultate führen zu dem Schluß, daß ligandbasierte Verfahren, die einfacher einzusetzen sind aber mehr a-priori -Information benötigen, dem strukturbasierten virtuellen Screening hinsichtlich der Datenbankanreicherung überlegen sind. Weiterhin konnte gezeigt werden, wie nutzbringend die Zusammenführung von strukturbasierter Information und solcher über das Interaktionsmuster bekanntermaßen aktiver Verbindungen für die Erhöhung der Wiederfindungsrate ist. Bei der Datenanalyse stellte sich heraus, daß im Mittel bestimmte statistische Methoden (minimale euklidische Distanz ED/Min bzw. Tanimoto-Ähnlichkeit der Integer-Fingerprints Int/Min) zu bevorzugen sind. Kovalentes Docking von Cathepsin-Inhibitoren. Die Cysteinproteasen Cathepsin B und L sind interessante pharmakologische Targets. Geeignete Inhibitoren stammen u. a. aus der Strukturklasse der Aziridine. Ein nukleophiler Angriff des Cysteinrests des Enzyms auf den elektrophilen Aziridinring führt hier zur Ausbildung einer kovalenten Ligand-Rezeptor-Bindung. Praktisch alle erhältlichen Dockingprogramme konzentrieren sich jedoch auf nicht-kovalente Ligand-Rezeptor-Interaktionen und lassen kein uneingeschränktes kovalentes Docking zu. Daher wurde für FLEXX ein Dockingprotokoll entworfen, das den entscheidenden nicht-kovalenten Zustand vor Ausbildung der kovalenten Bindung simulieren kann. Auf dieseWeise konnte untersucht werden, ob sich die Reaktionszentren von Ligand und Enzym ausreichend nahe für die Ausbildung einer kovalenten Bindung kommen. Der vorgestellte Ansatz läßt sich leicht auf andere kovalente Ligand-Rezeptor- Systeme übertragen und bietet somit eine breite Anwendbarkeit. Weiterhin wurde die Parametrisierung der in FLEXX vorgesehenen Interaktionsgeometrien an die strukturellen Eigenheiten der zu dockenden Aziridide angepaßt. Diese weisen nämlich formal eine Amidbindung auf, deren geometrische und elektronische Eigenschaften jedoch deutlich von den Werten eines typischen Amids abweichen. Die Ergebnisse der Dockingstudien liefern wertvolle Einblicke für das Verständnis der Selektivität der untersuchten Liganden bezüglich Cathepsin B beziehungsweise L. Umgekehrt erbringt die gute Übereinstimmung der FLEXX-Resultate mit den experimentell bestimmten Inhibitionskonstanten den Nachweis für die Validität des verwendeten Dockingprotokolls.
Bakterielle und parasitäre MIP-Proteine stellen wichtige Virulenzfaktoren dar, deren Inhibition das Überleben der Erreger sowie deren Penetration in menschliche Zellen stark einschränken kann. In dieser Arbeit standen die MIP-Proteine von Burkholderia pseudomallei (Auslöser der Melioidose) und Legionella pneumophila (Legionärskrankheit) im Fokus. Außerdem wurde das MIP-Protein von Trypanosoma cruzi (Chagas-Krankheit) untersucht. Die strukturverwandten humanen FKB-Proteine FKBP12 und FKBP52 sind relevante „off-targets“, wie Experimente mit Knockout-Mäusen gezeigt haben.
Ziel dieser Arbeit war die Verbesserung von bekannten MIP-Inhibitoren im Hinblick auf ihre Affinität und Selektivität für MIP-Proteine gegenüber den beiden genannten FKB-Proteinen bei gleichzeitig verbesserter Löslichkeit, mit Hilfe von in silico Methoden. Ausgangspunkt waren hierbei zwei von Dr. Christina Juli und Dr. Florian Seufert entwickelte Leitstrukturen, welche ein Pipecolinsäuregrundgerüst aufweisen. Diese Referenzliganden beinhalten einen 3,4,5-Trimethoxyphenylring (TMPR, vgl. Ref_t) bzw. einen Pyridinylring (Ref_p).
Beim Vergleich von insgesamt 32 MIP- und FKB-Proteinen konnten in zwei Loop-Bereichen, welche 50er bzw. 80er Loop genannt werden, relevante Unterschiede in der Aminosäuresequenz identifiziert werden. Die Nummerierung bezieht sich stets auf FKBP12. Diese Unterschiede ließen sich zum Design von vergleichsweise selektiv an MIP-Proteine bindenden Molekülen nutzen.
Der 50er Loop ist in nahezu allen MIP-Proteinen (jedoch nicht in BpsMIP) im Vergleich zu den FKB-Proteinen um zwei Aminosäuren verkürzt. Dadurch befindet sich das Proteinrückgrat von LpnMIP (Gln49) und TcrMIP (Arg49) näher am Zentrum der Bindetasche (definiert als Ile56, welches durch die Pipecolinsäureesterfunktion der Liganden adressiert wird). MD-Simulationen der beiden Apoproteine belegten, dass die geringere Distanz nicht durch Artefakte beim Modellieren der Strukturen bedingt ist. Aufbauend auf dieser Erkenntnis wurde gezeigt, dass der Pyridinylring von Ref_p eine Wasserstoffbrücke zu Gln49 ausbildet. Experimentell wurde dieser Befund durch eine entsprechende chemische Verschiebung der Aminosäure im NMR-Experiment von Dr. Kristian Schweimer bestätigt. Durch Überbrückung des Pipecolinsäurerings (Ligand 6bp) konnte die Wasserstoffbrücke in MD-Simulationen weiter stabilisiert werden. Durch Rechnungen zur Abschätzung der freien Bindungsenthalpien (mittels LIE und MM/GBSA) wurde eine erhöhte Affinität von 6bp im Vergleich zu Ref_p in LpnMIP ermittelt.
Im Laufe der Arbeit wurde anhand von pIC50-Werten, welche von Dr. Mathias Weiwad bestimmt wurden, erkannt, dass Liganden mit Pyridinylring oftmals eine bessere Affinität in LpnMIP aufweisen als die entsprechenden Liganden mit TMPR. Durch MD Simulationen wurde nachgewiesen, dass der TMPR in LpnMIP nur schwer an der in den anderen Proteinen bevorzugten Position binden kann. Grund hierfür ist die Mutation einer Aminosäure (zu Pro57) in diesem Bereich von LpnMIP: Diese verfügt über eine wenig flexible Seiten-kette, an welche sich der TMPR auf Grund seiner Rigidität nicht anpassen kann, was die Interaktion zwischen Protein und Ligand stört. Der Pyridinylring von Ref_p ist hiervon nicht betroffen, da er bevorzugt an einer anderen Stelle (Gln49, s. o.) bindet.
Der 80er Loop weist in vielen MIP-Proteinen deutlich hydrophobere Aminosäuren auf als in FKB-Proteinen. Von besonderem Interesse ist die Position 90, da hier in BpsMIP und LpnMIP sterisch weniger anspruchsvolle Aminosäuren (Val, Pro) vorliegen als in den bei-den FKB-Proteinen (Ile, Lys). Dieser Unterschied wurde mit kleinen hydrophoben Substituenten am Phenylring der Liganden adressiert. Bereits im Docking zeigten sich die positiven Effekte der para-Substitution durch Halogenatome oder eine Methylgruppe. Die von Dr. Mathias Weiwad und Dr. Mirella Vivoli ermittelten pIC50- bzw. pKi-Werte bestätigten diesen Trend. Zugleich nahm die Affinität zu FKBP12 deutlich ab. Bei der Untersuchung der Referenzliganden sowie deren Chlor- und Bromderivate in MD-Simulationen zeigte sich, dass der Phenylring der Liganden in den MIP-Proteinen bevorzugt in Richtung des 80er Loops orientiert ist; in den FKB-Proteinen liegt er hingegen um etwa 110° gedreht vor und kann somit schlechter mit der Bindetasche interagieren. Besonders ausgeprägt ist dieser Effekt in FKBP12. Basierend auf diesen Ergebnissen wurde der Phenylring durch einen 4-Bromo-1H-imidazol-2-ylsubstituenten ersetzt (Ligand 8ap). Dieser ist in der Lage, in der erwarteten Orientierung im Bereich des 80er Loops von BpsMIP zu binden und gleichzeitig eine stabile Wasserstoffbrücke zu Asp37 auszubilden. Hieraus resultiert für den Liganden eine deutlich höhere Affinität in LIE- und MM/GBSA-Rechnungen; in FKBP12 blieb sie auf Grund der dort instabilen Interaktion unverändert.
Die berechneten Energien können unmittelbar für einen relativen Vergleich verschiedener Liganden in einer Bindetasche verwendet werden. Für die Vorhersage von pKi- bzw. pIC50-Werten in den verschiedenen Proteinen ist eine Kalibrierung gegen die gemessenen Affinitäten erforderlich. Dies wurde für BpsMIP durchgeführt, indem eine lineare Korrelation zwischen den pKi- bzw. pIC50-Werten und den mit MM/GBSA ermittelten Energien aufgestellt wurde. Für LIE wurde auf publizierte Werte von Lamb et al. zurückgegriffen. Die berechneten Affinitäten stimmen für die bereits getesteten Inhibitoren gut mit den experimentellen pKi- und pIC50-Werten überein. Anhand der Modelle werden für 8ap Werte vorhergesagt, die besser als die experimentellen Affinitäten bekannter Liganden sind.
Idealerweise können auch aus den Scores, die durch Docking erhalten werden, bereits Rückschlüsse auf die Affinitäten der Liganden gezogen werden. Für die untersuchten Proteine war dies, auf Grund des engen Bereichs der experimentell ermittelten pKi- und pIC50-Werte, nicht mit hinreichender Richtigkeit möglich. Um die Scores dennoch für die Beurteilung neuer Liganden verwenden zu können, wurden logistische Regressionsmodelle erstellt. Anhand dieser kann abgeschätzt werden, ob ein Molekül in BpsMIP submikromolare Affinität aufweist. Die Richtigkeit dieser Vorhersagemodelle konnte durch die Berücksichtigung dreier weiterer Deskriptoren (Konfiguration am Stereozentrum der Pipecolinsäure, Molekulargewicht und logD-Wert) deutlich verbessert werden, wobei die AUC der entsprechenden ROC-Kurven Werte bis zu 0.9 erreichte. Diese Modelle können für die Postprozessierung eines Dockings angewendet werden, um die vielversprechendsten Kandidaten zu identifizieren und anschließend in rechnerisch anspruchsvolleren MD-Simulationen genauer zu untersuchen.
Mit dieser Arbeit wurde zur Weiterentwicklung der Leitstrukturen Ref_t und Ref_p beigetragen. Viele der getesteten Derivate wiesen deutlich verbesserte Löslichkeit bei gleichbleibender Affinität auf. Ferner wurden erstmalig detailliert die Unterschiede in den Bindetaschen zwischen 32 MIP- und FKB-Proteinen evaluiert. Hiervon wurden fünf in MD-Simulationen als Apoprotein und im Komplex mit verschiedenen Inhibitoren verglichen. Anhand dieser Simulationen wurde nachgewiesen, dass jeweils eine Aminosäure in BpsMIP und LpnMIP im Vergleich zum wichtigsten „off-target“ FKBP12 selektiv durch eine Wasserstoffbrücke adressiert werden kann. Durch LIE- und MM/GBSA-Rechnungen konnte gezeigt werden, dass in diesen hochkonservierten Bindetaschen eine bedeutende Modulation der Affinität zugunsten von BpsMIP möglich ist.