TY - THES A1 - Schmidt, Traudel T1 - Establishment of Hey-triple-KO-ES cells and characterisation of Bre, a Hey binding partner T1 - Etablierung von Hey-triple-KO ES-Zellen und Charakterisierung von Bre, einem Hey Bindepartner N2 - Hey1, Hey2 and HeyL are downstream effectors of the Notch signalling pathway. Hey genes play decisive roles during embryonic development for example in cardiovascular development. However, the precise transcriptional programmes and genes, which are affected by each single Hey gene, are still poorly understood. One drawback for the analysis of Hey1, Hey2 or HeyL single gene function is that these genes are co-expressed in many tissues and share a high degree of functional redundancy. Thus, it was necessary to establish a system, which is either devoid of Hey expression, or just comprises one single Hey gene family member. For this, Hey1(fl/fl)/Hey2(-/-)/HeyL(-/-)- as well as Hey-triple- knock out (KO)-ES cells (embryonic stem cells) were generated in this work, because ES cells and their differentiation as EBs (embryoid bodies) represent a valuable tool for the in vitro analysis of embryonic developmental processes. After the establishment of Hey1(fl/fl)/Hey2(-/-)/HeyL(-/-)- and Hey-triple- KO-ES cells, it could be seen by ALP staining and pluripotency marker expression that loss of Hey expression did not affect ES cell pluripotency features. Thus, these ES cells represent bona fide ES cells and could be further used for the differentiation as EBs. Here, differences in gene expression between Hey1(fl/fl)/Hey2(-/-)/HeyL(-/-)- and Hey-triple- KO-ES cells (after the loss of Hey1) could be observed in realtime-RT-PCR analysis for the endodermal marker AFP as well as for neural and myogenic markers in d10 EBs. However, the establishment of inducible Hey1, Hey2 or HeyL ES cell lines will be essential to confirm these findings and to search for novel Hey target genes. To get further insight into the mode of Hey action, the analysis of Hey interaction partners is necessary. One such binding partner, the Bre protein, has previously been found in a yeast-two-hybrid screen. Bre has been described to be a member of two distinct complexes (i.e. the nuclear BRCA1-A complex with a function in DNA damage response and the cytoplasmic BRISC complex), to directly interact with the TNF-receptor and Fas and to interfere with apoptotic signalling. The Hey-Bre interaction could be further corroborated in this work; yet, it was not possible to narrow down the interaction site of Bre with Hey1. It rather seems that non-overlapping parts of the Bre protein may bind to Hey. This interaction may be direct– pointing to more than one interaction site inside the Bre protein – or via a common binding partner such as the endogenous Bre protein itself. Besides the interaction studies, functional assays were performed for a more detailed characterisation of Hey1 and Bre interaction. Here, it could be shown that Hey1 over-expression did not have any influence on Bre sub-cellular localisation. Interestingly, it could be demonstrated that Bre positively interfered with Hey1 repressive function in luciferase assays at three of four promoters analysed. Moreover, interaction with Bre seems to lead to a stabilisation of Hey1. As Bre has been described to modulate the E3-ligase activity intrinsic to the BRCC complex it was analysed whether Bre over-expression results in an ubiquitination of Hey1. Yet, this could not be observed in the present work. Furthermore, an interaction of Bre with ubiquitinated proteins could not be demonstrated in an ubiquitin binding assay. To obtain a better insight into Bre function, Bre LacZ gene trap-ES cells and animals were generated. However, realtime-RT-analyses revealed that these cells and mice did not show a loss of Bre expression on mRNA level indicating that insertion mutagenesis did not occur as expected. However, embryos derived from these mice could nevertheless be used for the detection of tissues with Bre expression by β-galactosidase staining. Bre deficiency on mRNA levels was only achieved after the deletion of the floxed exon 3 resulting in the generation of Bre del-mice. Bre del-mice were fertile and without any obvious phenotype and they were used for the generation of Bre del- and wt-MEFs (murine embryonic fibroblasts). Characterisation of these cells showed that proliferation was not affected after loss of Bre (neither under normal nor under stress conditions). However, loss of Bre notably resulted in a reduction in the BRCA1 DNA damage response, in a slightly increased sensitivity towards apoptosis induction by FasL treatment and in an increase in the K63-poly-ubiquitin content in Bre del-cytoplasmic fractions, probably linked to a change in the BRISC de-ubiquitinase activity. Even though these results have the same tendencies as observed in former studies, the effects in the present work are less striking. Further studies as well as intercrossing of Bre del- to Hey KO-animals will be necessary to further understand the functional relevance of Hey and Bre interaction. N2 - Hey1, Hey2 und HeyL sind Zielgene des Notch Signalwegs und spielen eine entscheidende Rolle während der Embryonalentwicklung, z. B. bei der Bildung des kardiovaskulären Systems. Die genauen Effekte eines jeden einzelnen Hey Gens auf Transkriptionsprogramme und einzelne Gene sind allerdings noch relativ unbekannt. Einer der Gründe hierfür liegt vermutlich in der Koexpression von Hey-Proteinen in vielen Geweben bzw. in der daraus resultierenden funktionellen Redundanz. Daher sollte in dieser Arbeit ein System entwickelt werden, in dem entweder keines oder jeweils nur eines der Hey-Gene intakt ist. Hierzu wurden Hey1fl/fl/Hey2-/-/HeyL-/- und Hey-triple-knock out (KO) ES-Zellen (embryonale Stammzellen) etabliert. ES-Zellen stellen ein hervorragendes Modellsystem für die Embryonalentwicklung dar, weil ihre in vitro Differenzierung als sog. „embryoid bodies“ (EBs) embryonale Entwicklungsprozesse widerspiegelt. Der Verlust der Hey-Genexpression hatte keinen Einfluss auf den Stammzellcharakter der etablierten Zellen, da sowohl die generierten Hey-triple-KO- als auch die Hey1fl/fl/Hey2-/-/HeyL-/--ES-Zellen eine positive ALP-Färbung sowie eine hohe Expression von Pluripotenzmarkern zeigten. Daher konnten die Zellen im Folgenden als EBs differenziert und auf Genexpressionsunterschiede während der Differenzierung untersucht werden. Zwischen Hey1fl/fl/Hey2-/-/HeyL-/-- (mit intakter Hey1-Expression) und Hey-triple- KO- ES Zellen konnten an EB Tag 10 mittels realtime-RT-PCR Unterschiede in der Genexpression für den endodermalen Marker AFP, sowie für neurale und myogene Marker festgestellt werden. Um diese Ergebnisse zu bestätigen, aber auch, um neue Hey Zielgene ausfindig machen zu können, ist jedoch die Etablierung induzierbarer ES-Zellen (für Hey1, Hey2 bzw. HeyL) notwendig. Um einen tieferen Einblick in die Funktionsweise der Hey-Gene gewinnen zu können ist die Untersuchung von Hey Interaktionspartnern wichtig. Das Bre-Protein ist ein solcher Bindepartner und wurde zuvor in einem Yeast-two-hybrid Assay gefunden. Bre ist in zwei verschiedenen Komplexen beschrieben worden: dem nukleären BRCA1-A-Komplex, der eine Rolle bei der Detektion von DNA-Schäden spielt und dem cytoplasmatischen BRISC-Komplex. Es ist außerdem bekannt, dass Bre direkt mit dem TNF-Rezeptor und mit Fas interagiert und die apoptotische Antwort in der Zelle beeinflusst. Die Interaktion zwischen Bre und Hey1 konnte in dieser Arbeit zunächst bestätigt werden; in weiteren Ko-immunpräzipitations-Experimenten war es aber nicht möglich, den Bereich des Bre-Proteins zu bestimmen, der die Interaktion mit Hey1 vermittelt, da verschiedene nicht überlappende Bereiche des Bre-Proteins eine Interaktion mit Hey1 zeigten. Ob es sich hierbei um direkte Interaktionen handelte und Bre somit mehrere Bindestellen für Hey1 aufweist oder ob die Interaktion indirekt über einen gemeinsamen Bindepartner wie z.B. das endogene Bre-Protein selbst vermittelt wird, ist noch nicht geklärt. Für eine weitere Charakterisierung der Interaktion zwischen den beiden Proteinen wurden funktionelle Versuche durchgeführt. Hierbei konnte gezeigt werden, dass die Überexpression von Hey1 keinen Einfluss auf die subzelluläre Lokalisation des Bre Proteins hat. Mit Hilfe von Luziferase Assays konnte aber interessanterweise nachgewiesen werden, dass Bre bei drei von vier untersuchten Promotern positiv auf die Repression durch Hey1 einwirkte. Außerdem scheint die Überexpression von Bre möglicherweise eine Stabilisierung des Hey1-Proteins zu bewirken. Da Bre eine Verstärkung der E3-Ligasefunktion des BRCC-Komplexes zugeschrieben wird, wurde außerdem untersucht, ob die Überexpression von Bre zu einer Ubiquitinylierung von Hey1 führt. Dies konnte allerdings nicht festgestellt werden. Desweiteren konnte in einem Ubiquitin-Bindeassay keine Interaktion von Bre mit anderen ubiquitinylierten Proteinen gezeigt werden. ... KW - Embryonale Stammzelle KW - Zeitdifferenzierung KW - Gen notch KW - Knockout KW - Hey KW - Bre KW - Hey KW - embryonic stem cells KW - differentiation KW - interaction KW - Bre-knockout KW - Interaktion Y1 - 2012 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-85459 ER - TY - THES A1 - Pinkert, Stefan T1 - The human proteome is shaped by evolution and interactions T1 - Das menschliche Proteom ist geformt durch Evolution und Interaktion N2 - Das menschliche Genom ist seit 2001 komplett sequenziert. Ein Großteil der Proteine wurde mittlerweile beschrieben und täglich werden bioinformatische Vorhersagen praktisch bestätigt. Als weiteres Großprojekt wurde kürzlich die Sequenzierung des Genoms von 1000 Menschen gestartet. Trotzdem ist immer noch wenig über die Evolution des gesamten menschlichen Proteoms bekannt. Proteindomänen und ihre Kombinationen sind teilweise sehr detailliert erforscht, aber es wurden noch nicht alle Domänenarchitekturen des Menschen in ihrer Gesamtheit miteinander verglichen. Der verwendete große hochqualitative Datensatz von Protein-Protein-Interaktionen und Komplexen stammt aus dem Jahr 2006 und ermöglicht es erstmals das menschliche Proteom mit einer vorher nicht möglichen Genauigkeit analysieren zu können. Hochentwickelte Cluster Algorithmen und die Verfügbarkeit von großer Rechenkapazität befähigen uns neue Information über Proteinnetzwerke ohne weitere Laborarbeit zu gewinnen. Die vorliegende Arbeit analysiert das menschliche Proteom auf drei verschiedenen Ebenen. Zuerst wurde der Ursprung von Proteinen basierend auf ihrer Domänenarchitektur analysiert, danach wurden Protein-Protein-Interaktionen untersucht und schließlich erfolgte Einteilung der Proteine nach ihren vorhandenen und fehlenden Interaktionen. Die meisten bekannten Proteine enthalten mindestens eine Domäne und die Proteinfunktion ergibt sich aus der Summe der Funktionen der einzelnen enthaltenen Domänen. Proteine, die auf der gleichen Domänenarchitektur basieren, das heißt die die gleichen Domänen in derselben Reihenfolge besitzen, sind homolog und daher aus einem gemeinsamen ursprünglichen Protein entstanden. Die Domänenarchitekturen der ursprünglichen Proteine wurden für 750000 Proteine aus 1313 Spezies bestimmt. Die Gruppierung von Spezies und ihrer Proteine ergibt sich aus taxonomischen Daten von NCBI-Taxonomy, welche mit zusätzlichen Informationen basierend auf molekularen Markern ergänzt wurden. Der resultierende Datensatz, bestehend aus 5817 Domänen und 32868 Domänenarchitekturen, war die Grundlage für die Bestimmung des Ursprungs der Proteine aufgrund ihrer Domänenarchitekturen. Es wurde festgestellt, dass nur ein kleiner Teil der neu evolvierten Domänenarchitekturen eines Taxons gleichzeitig auch im selben Taxon neu entstandene Proteindomänen enthält. Ein weiteres Ergebnis war, dass Domänenarchitekturen im Verlauf der Evolution länger und komplexer werden, und dass so verschiedene Organismen wie der Fadenwurm, die Fruchtfliege und der Mensch die gleiche Menge an unterschiedlichen Proteinen haben, aber deutliche Unterschiede in der Anzahl ihrer Domänenarchitekturen aufweisen. Der zweite Teil beschäftigt sich mit der Frage wie neu entstandene Proteine Bindungen mit dem schon bestehenden Proteinnetzwerk eingehen. In früheren Arbeiten wurde gezeigt, dass das Protein-Interaktions-Netzwerk ein skalenfreies Netz ist. Skalenfreie Netze, wie zum Beispiel das Internet, bestehen aus wenigen Knoten mit vielen Interaktionen, genannt Hubs, und andererseits aus vielen Knoten mit wenigen Interaktionen. Man vermutet, dass zwei Mechanismen zur Entstehung solcher Netzwerke führen. Erstens müssen neue Proteine um auch Teil des Proteinnetzwerkes zu werden mit Proteinen interagieren, die bereits Teil des Netzwerkes sind. Zweitens interagieren die neuen Proteine, gemäß der Theorie der bevorzugten Bindung, mit höherer Wahrscheinlichkeit mit solchen Proteinen im Netzwerk, die schon an zahlreichen weiteren Protein-Interaktionen beteiligt sind. Die Human Protein Reference Database stellt ein auf Informationen aus in-vivo Experimenten beruhendes Proteinnetzwerk für menschliche Proteine zur Verfügung. Basierend auf den in Kapitel I gewonnenen Informationen wurden die Proteine mit dem Ursprungstaxon ihrer Domänenarchitekturen versehen. Dadurch wurde gezeigt, dass ein Protein häufiger mit Proteinen, die im selben Taxon entstanden sind, interagiert, als mit Proteinen, die in anderen Taxa neu aufgetreten sind. Es stellte sich heraus, dass diese Interaktionsraten für alle Taxa deutlich höher waren, als durch das Zufallsmodel vorhergesagt wurden. Alle Taxa enthalten den gleichen Anteil an Proteinen mit vielen Interaktionen. Diese zwei Ergebnisse sprechen dagegen, dass die bevorzugte Bindung der alleinige Mechanismus ist, der zum heutigen Aufbau des menschlichen Proteininteraktion-Netzwerks beigetragen hat. Im dritten Teil wurden Proteine basierend auf dem Vorhandensein und der Abwesenheit von Interaktionen in Gruppen eingeteilt. Proteinnetzwerke können in kleine hoch vernetzte Teile zerlegt werden, die eine spezifische Funktion ausüben. Diese Gruppen können mit hoher statistischer Signifikanz berechnet werden, haben meistens jedoch keine biologische Relevanz. Mit einem neuen Algorithmus, welcher zusätzlich zu Interaktionen auch Nicht-Interaktionen berücksichtigt, wurde ein Datensatz bestehend aus 8,756 Proteinen und 32,331 Interaktionen neu unterteilt. Eine Einteilung in elf Gruppen zeigte hohe auf Gene Ontology basierte Werte und die Gruppen konnten signifikant einzelnen Zellteilen zugeordnet werden. Eine Gruppe besteht aus Proteinen, welche wenige Interaktionen miteinander aber viele Interaktionen zu zwei benachbarten Gruppen besitzen. Diese Gruppe enthält eine signifikant erhöhte Anzahl an Transportproteinen und die zwei benachbarten Gruppen haben eine erhöhte Anzahl an einerseits extrazellulären und andererseits im Zytoplasma und an der Membran lokalisierten Proteinen. Der Algorithmus hat damit unter Beweis gestellt das die Ergebnisse nicht bloß statistisch sondern auch biologisch relevant sind. Wenn wir auch noch weit vom Verständnis des Ursprungs der Spezies entfernt sind, so hat diese Arbeit doch einen Beitrag zum besseren Verständnis der Evolution auf dem Level der Proteine geleistet. Im Speziellen wurden neue Erkenntnisse über die Beziehung von Proteindomänen und Domänenarchitekturen, sowie ihre Präferenzen für Interaktionspartner im Interaktionsnetzwerk gewonnen. N2 - The human genome has been sequenced since 2001. Most proteins have been characterized now and with everyday more bioinformatical predictions are experimentally verified. A project is underway to sequence thousand humans. But still, little is known about the evolution of the human proteome itself. Domains and their combinations are analysed in detail but not all of the human domain architectures at once. Like no one before, we have large datasets of high quality human protein-protein-protein interactions and complexes available which allow us to characterize the human proteome with unmatched accuracy. Advanced clustering algorithms and computing power enable us to gain new information about protein interactions without touching a pipette. In this work, the human proteome is analysed at three different levels. First, the origin of the different types of proteins was analysed based on their domain architectures. The second part focuses on the protein-protein interactions. Finally, in the third part, proteins are clustered based on their interactions and non-interactions. Most proteins are built of domains and their function is the sum of their domain functions. Proteins that share the same domain architecture, the linear order of domains are homologues and should have originated from one common ancestral protein. This ancestor was calculated for roughly 750 000 proteins from 1313 species. The relations between the species are based on the NCBI Taxonomy and additional molecular data. The resulting data set of 5817 domains and 32868 domain architectures was used to estimate the origin of these proteins based on their architectures. It could be observed, that new domain architectures are only in a small fraction composed of domains arisen at the same taxon. It was also found that domain architectures increase in length and complexity in the course of evolution and that different organisms like worm, and human share nearly the same amount of proteins but differ in their number of distinct domain architectures. The second part of this thesis focuses on protein-protein interactions. This chapter addresses the question how new evolved proteins form connections within the existing network. The network built of protein-protein interactions was shown to be scale free. Scale free networks, like the internet, consist of few hubs with many connections and many nodes with few connections. They are thought to arise by two mechanisms. First, newly emerged proteins interact with proteins of the network. Second, according to the theory of preferential attachment, new proteins have a higher chance to interact with already interaction rich proteins. The Human Protein Reference Database provides an on in-vivo interaction data based network for human. With the data obtained from chapter one, proteins were marked with their taxon of origin based on their domain architectures. The interaction ratio of proteins of the same taxa compared to all interactions was calculated and higher values than the random model showed for nearly every taxa. On the other hand, there was no enrichment of proteins originated at the taxon of cellular organisms for the node degree found. The node degree is the number of links for this node. According to the theorie of preferential attachment the oldest nodes should have the most interactions and newly arisen proteins should be preferably attached to them not together. Both could not be shown in this analysis, preferential attachment could therefore not be the only explanation for the forming of the human protein interaction network. Finally in part three, proteins and all their interactions in the network are analysed. Protein networks can be divided into smaller highly interacting parts carrying out specific functions. This can be done with high statistical significance but still, it does not reflect the biological significance. Proteins were clustered based on their interactions and non-interactions with other proteins. A version with eleven clusters showed high gene ontology based ratings and clusters related to specific cell parts. One cluster consists of proteins having very few interactions together but many to proteins of two other clusters. This first cluster is significantly enriched with transport proteins and the two others are enriched with extracellular and cytoplasm/membrane located proteins. The algorithm seems therefore well suited to reflect the biological importance behind functional modules. Although we are still far from understanding the origin of species, this work has significantly contributed to a better understanding of evolution at the protein level and has, in particular, shown the relation of protein domains and protein architectures and their preferences for binding partners within interaction networks. KW - Evolution KW - Protein KW - Domäne KW - Interaktion KW - evolution KW - protein KW - interaction KW - domain Y1 - 2008 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-35566 ER -