@phdthesis{Axmacher2014, author = {Axmacher, Franz}, title = {Die SVM-gest{\"u}tzte Pr{\"a}diktabilit{\"a}t der Bindungsspezifit{\"a}t ‎von SH3-Dom{\"a}nen anhand ihrer Aminos{\"a}uresequenz}, url = {http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-113349}, school = {Universit{\"a}t W{\"u}rzburg}, year = {2014}, abstract = {Die Identifikation der Bindungsspezifit{\"a}ten von Proteininteraktionsdom{\"a}nen und damit letztlich auch ‎die F{\"a}higkeit potentielle Bindungspartner dieser in vivo vorherzusagen bildet ein grundlegendes ‎Element f{\"u}r das Verst{\"a}ndnis der biologischen Funktionen dieser Dom{\"a}nen. In dieser Arbeit wurde ‎untersucht, inwieweit solche Vorhersagen bez{\"u}glich der SH3-Dom{\"a}ne - als Beispiel f{\"u}r eine ‎Proteininteraktionsdom{\"a}ne - mithilfe von Support-Vector-Machines (SVMs) m{\"o}glich sind, wenn ‎diesen als Informationsquelle ausschließlich die innerhalb der Aminos{\"a}uresequenz der Dom{\"a}ne ‎konservierten Informationen zur Verf{\"u}gung stehen. Um den SVM-basierten Klassifikator zu ‎trainieren und zu validieren, wurde ein Satz aus 51 SH3-Dom{\"a}nen verwendet, die zuvor ‎entsprechend ihrer Ligandenpr{\"a}ferenz in ein System aus acht verschiedenen Klassen eingeteilt ‎worden waren. Da die innerhalb der Aminos{\"a}uresequenzen konservierten Informationen in ‎abstrakte Zahlenwerte konvertiert werden mussten (Voraussetzung f{\"u}r mathematisch basierte ‎Klassifikatoren wie SVMs), wurde jede Aminos{\"a}uresequenz durch ihren jeweiligen Fisher-Score-‎Vektor ausgedr{\"u}ckt. Die Ergebnisse erbrachten einen Klassifikationserror, welcher weit unterhalb des ‎Zufallsniveaus lag, was darauf hindeutet, dass sich die Bindungsspezifit{\"a}t (Klasse) einer SH3-Dom{\"a}ne ‎in der Tat von seiner Aminos{\"a}uresequenz ableiten lassen d{\"u}rfte. Mithilfe klassenspezifisch ‎emittierter, artifizieller Sequenzen, implementiert in den Trainingsprozess des Klassifikators, um ‎etwaigen nachteiligen Auswirkungen von Overfitting zu entgegenzuwirken, sowie durch ‎Ber{\"u}cksichtigung taxonomischer Informationen des Klassensystems w{\"a}hrend Training und ‎Validierung, ließ sich der Klassifikationserror sogar noch weiter senken und lag schließlich bei lediglich ‎‎35,29\% (vergleiche Zufall: 7/8 = 87.50\%). Auch die Nutzung von Feature Selections zur Abmilderung ‎Overfitting-bedingter, negativer Effekte lieferte recht vielversprechende Ergebnisse, wenngleich ihr ‎volles Potential aufgrund von Software-Beschr{\"a}nkungen nicht ausgenutzt werden konnte.‎ Die Analyse der Positionen im Sequence-Alignment, welche f{\"u}r den SVM- basierten Klassifikator am ‎relevantesten waren, zeigte, dass diese h{\"a}ufig mit Positionen korrelierten, von denen angenommen ‎wird auch in vivo eine Schl{\"u}sselrolle bei der Determination der Bindungsspezifit{\"a}t (Klasse) zu spielen. ‎Dies unterstreicht nicht nur die Reliabilit{\"a}t des pr{\"a}sentierten Klassifikators, es gibt auch Grund zur ‎Annahme, dass das Verfahren m{\"o}glicherweise auch als Supplement anderer Ans{\"a}tze genutzt werden ‎k{\"o}nnte, welche zum Ziel haben die Positionen zu identifizieren, die die Ligandenpr{\"a}ferenz in vivo ‎determinieren. Informationen, die nicht nur f{\"u}r ein besseres Verst{\"a}ndnis der SH3-Dom{\"a}ne (und ‎m{\"o}glicherweise auch anderer Proteininteraktionsdom{\"a}nen) von grundlegender Bedeutung sind, ‎sondern auch aus pharmakologischer Sicht von großem Interesse sein d{\"u}rften.‎}, subject = {Support-Vektor-Maschine}, language = {de} }