Towards a comprehensive description of the human retinal transcriptome: identification and characterization of differentially expressed genes

Identifizierung und Charakterisierung von differenziell exprimierten Genen - ein Beitrag zur umfassenden Beschreibung des Transkriptoms der menschilchen Netzhaut

Please always quote using this URN: urn:nbn:de:bvb:20-opus-7278
  • The human retina is a multilayered neuroectodermal tissue specialized in the transformation of light energy into electric impulses which can be transmitted to the brain where they are perceived as vision. Since the retina is easily accessible and functional aspects are directly recordable, the study of this tissue has been at the forefront of neuroscience research for over a century. Studies have revealed that the distinct functions of the retina require a large degree of differentiation which is achieved by the coordinated function ofThe human retina is a multilayered neuroectodermal tissue specialized in the transformation of light energy into electric impulses which can be transmitted to the brain where they are perceived as vision. Since the retina is easily accessible and functional aspects are directly recordable, the study of this tissue has been at the forefront of neuroscience research for over a century. Studies have revealed that the distinct functions of the retina require a large degree of differentiation which is achieved by the coordinated function of approximately 55 different cell types. The highly structured anatomy and the functional differentiation of the retina is a result of its distinctive transcriptome and proteome. Due to the complexity of the retina it has been difficult to estimate the number of genes actively transcribed in this tissue. Great efforts in the elucidation of retinal disease genes have led to the identification of 139 retina disease loci with 90 of the corresponding genes cloned thus far . In contrast to the success in the hereditary disorders, efforts to identify the genetic factors conferring manifestations known as age-related macular degeneration (AMD) have revealed sparse results. AMD is a retinal disease affecting a significant percentage of the older population. This disorder is likely due to exogenic as well as genetic factors. To further our understanding of retinal physiology and facilitate the identification of genes underlying retinal degenerations, particularly AMD, our efforts concentrated on the systematic analysis of the retinal transcriptome. Since approximately half of all retinal degeneration-associated genes identified to date are preferentially expressed in retina, it is plausible that the investigation of gene expression profiles and the identification of retina-expressed transcripts could be an important starting point for characterizing candidate genes for the retinal diseases. The expressed sequence tags approach included the assessment of all retinal expressed sequence tags (EST) clusters indexed in the UniGene database and of 1080 single-pass ESTs derived from an in-house generated human retina suppression subtracted hybridization (SSH) cDNA library. In total, 6603 EST clusters were evaluated during this thesis and detailed in-silico analysis was performed on 750 EST clusters. The expression of the genes was evaluated using reverse transcriptase-polymerase chain reaction (RT-PCR), followed by confirmation using quantitative reverse transcriptase-polymerase chain reaction (qRT-PCR), as well as conventional and virtual Northern blot analysis. The expression profiling of 337 selected EST clusters led to the identification of 111 transcripts, of which 60 are specific or abundant to the retina, 3 are expressed at high levels in the retinal pigment epithelium (RPE), and 48 are expressed in brain as well as in retina. The EST approach used to select candidate transcripts allowed us to assess the effectiveness of the two available resources, the UniGene database and the retinal SSH (retSSH) cDNA library. From the results obtained, it is evident that the generation of suppression subtracted libraries to identify cell-specific transcripts constitutes the most straight-forward and efficient strategy. In addition to the high percentage of candidate genes that are identified from an SSH cDNA library, it has the added benefit that genes expressed at low levels can be identified. Furthermore, comparison of our retina-enriched gene set with previously published studies demonstrated only limited overlap of the identified genes further confirming the valuable source of retinal genes from our retinal SSH cDNA library. The effort of our and other groups has resulted in the establishment of the full-length coding sequence of 55 of the 111 genes uniquely or preferentially expressed in the retina. Using various methods such as bioinformatical analysis, EST assembly, cDNA library screening, and rapid amplification of cDNA ends (RACE) a number of genes were cloned in the scope of this thesis including C1orf32, C4orf11, C7orf9, C12orf7, C14orf29, DAPL1, and GRM7. Bioinformatic analyses and cDNA library screening were used to isolate the full-length cDNA sequence and determine the genomic organization of C7orf9, also identified as RFRP. This 1190 bp retina-specific transcript from chromosome 7p15.3 encodes a precursor protein for at least two small neuropeptides, referred to as RFRP-1 and RFRP-3. Since C7orf9 is localized in the critical region for dominant cystoid macular dystrophy (CYMD) its role in the pathology was investigated. Southern blot analysis and sequencing of samples from two affected individuals of the original pedigree used to localize the disease gene excluded the gene from involvement in this disease. Multiple isoforms of the C12orf7 gene were assembled from a number of clones identified from library screenings, PCR amplifications, and RACE experiments. The gene variants, transcribed from chromosome 12q13.13, have been found to be expressed exclusively in retina. Because of the multiple alternative splicing of the gene, we can only speculate about the nature of the protein it encodes. The longest transcript, which includes all six exons plus the last intervening sequence, encodes a 471 aa protein which contains a nuclear localization signal and five ankyrin repeats. The existence of many isoforms is also observed in mouse suggesting that they may have a relevant role in cellular physiology. Five novel splice variants of the glutamate metabotropic receptor 7 (GRM7) resulting from the use of alternative 3’-end exons were identified and characterized. One of the novel variants, GRM7_v3, encodes a 924 aa protein and is therefore the longest putative GRM7 protein reported to date. Even though they are not retina-specific, the isoforms are preferentially expressed in the nervous system. Although the functional properties of the specific carboxyl-termini are still unclear, it is known that axon targeting of GRM7_v1 is mediated by the last 60 aa of the protein. Hence the novel isoforms may direct the protein to specific subcellular localizations. The C1orf32 gene, preferentially expressed in retina, is organized in 10 exons and is transcribed from chromosome 1q24.1. Bioinformatic analyses of the 639 aa putative protein not only identified the mouse and rat orthologous genes but also the LISCH7 gene as a potential member of the same family. Since the LISCH7 protein has been shown to function as a low density lipoprotein receptor, the C1orf32 protein may be involved in retinal lipid homeostasis. Disturbances in lipid metabolism have been proposed as one of the pathways involved in AMD etiology. Thus, the role of C1orf32 in this complex disease should be investigated. Expression analyses of the death-associated protein-like 1 (DAPL1) gene revealed that it is expressed in both the retina and the RPE at high levels. The 552 bp transcript encodes a 107 aa putative protein and is transcribed from chromosome 2q24.1. In-silico analyses identified an additional 12 related proteins from various species which share high similarity constituting a novel protein family. The similarity to the death-associated-protein (DAP) is particularly interesting since this protein has been found to be indispensable for programmed cell death. Therefore, DAPL1 is an excellent candidate for retinal disease as apoptosis is generally the ultimate cause in retinal degeneration. The retina-specific C4orf11 and C14orf29 genes localized on chromosome 4q21.22 and 14q22.1, respectively, are both transcribed in more than one isoform. The encoded proteins do not contain any known domains but because of their retina-specific expression they may be important for proper retinal physiology. As part of the long-term goals of the project, several of the cloned genes are being genotyped to construct single nucleotide polymorphism (SNP) maps. Projects to investigate haplotype frequencies of candidate genes in large cohorts of controls and AMD patients are ongoing. Thus, by establishing a collection of 111 genes expressed exclusively or preferentially in the retina, the present work has laid the foundation for future research in retinal diseases.show moreshow less
  • Die menschliche Retina ist ein mehrschichtiges neuroektodermales Gewebe, das auf die Umwandlung von Lichtenergie in elektrische Impulse spezialisiert ist. Diese Impulse werden zum Gehirn weitergeleitet, wo sie als Bilder gesehen werden. Da die Retina experimentell leicht zugänglich ist und funktionelle Aspekte direkt untersucht werden können, nehmen Experimente an diesem Gewebe in der neurologischen Forschung seit mehr als einem Jahrhundert einen Spitzenplatz ein. Es wurde gezeigt, dass die unterschiedlichen Funktionen der Retina durch eineDie menschliche Retina ist ein mehrschichtiges neuroektodermales Gewebe, das auf die Umwandlung von Lichtenergie in elektrische Impulse spezialisiert ist. Diese Impulse werden zum Gehirn weitergeleitet, wo sie als Bilder gesehen werden. Da die Retina experimentell leicht zugänglich ist und funktionelle Aspekte direkt untersucht werden können, nehmen Experimente an diesem Gewebe in der neurologischen Forschung seit mehr als einem Jahrhundert einen Spitzenplatz ein. Es wurde gezeigt, dass die unterschiedlichen Funktionen der Retina durch eine enorme Differenzierung in mehr als 55 Zelltypen, die koordiniert miteinander in Kontakt treten, ermöglicht wird. Die hohe strukturelle und funktionelle Komplexität der Retina wiederum ist das Resultat ihres Transkriptoms und ihres Proteoms. Die Komplexität der Retina erschwert es, die Zahl aktiv transkribierter Gene in diesem Gewebe zu schätzen. Durch die vielfältigen Bemühungen, Gene zu identifizieren, die mit retinalen Erkrankungen in Zusammenhang stehen, konnten bisher 139 Genloci mit retinalen Krankheiten in Verbindung gebracht werden und in 90 Fällen wurden die jeweiligen Gene bereits kloniert . Während auf dem Gebiet der hereditären Erkrankungen damit bereits große Erfolge erzielt wurden, sind die Resultate, was komplexe Erkrankungen wie die altersabhängige Makuladegeneration (AMD) betrifft, noch spärlich. AMD ist eine retinale Erkrankung, die einen signifikanten Prozentsatz der älteren Bevölkerung betrifft. Es wird angenommen, dass sowohl exogene als auf genetische Faktoren als Auslöser beteiligt sind. Um die Physiologie der Retina besser zu verstehen und die Identifikation von Genen, die in retinale Erkrankungen involviert sind, zu ermöglichen, wurde in dieser Arbeit ein Schwerpunkt auf die systematische Analyse des retinalen Transkriptoms gelegt. Etwa die Hälfte aller Gene, die bei retinalen Erkrankungen eine Rolle spielen und bis heute identifiziert wurden, werden überwiegend in der Retina exprimiert. Das Erstellen von Genexpressionsprofilen und die Identifikation von retina-spezifischen Transkripten ist daher der erste wichtige Schritt für die Charakterisierung von Kandidatengenen für retinale Erkrankungen. Zu diesem Zweck wurde eine „Expressed Sequence Tags“ (ESTs) Analyse durchgeführt, in der alle Retina „Clusters“ der UniGene Datenbank sowie 1080 einzelne ESTs einer laboreigenen, suppressiv-subtraktiv hybridisierten (SSH) cDNA Bank der menschlichen Retina bewertet. Insgesamt wurden 6603 EST „Clusters“ während dieser Arbeit untersucht und für 750 eine detaillierte in-silico Analyse angeschlossen. Die Expression der Gene wurde mittels reverser Transkriptase-Polymerase-Kettenreaktion (RT-PCR) untersucht und mit quantitativer RT-PCR (qRT-PCR) bestätigt. Außerdem wurden konventionelle und virtuelle Northern Blot Hybridisierungen zur Aufklärung der Expressionsprofile eingesetzt. Die Expressionsprofile von 337 EST „clustern“ führte zur Identifikation von 111 Transkripten, von denen 60 abundant oder spezifisch in der Retina exprimiert werden, drei eine hohe Expression im retinalen Pigmentepithel (RPE) zeigen und 48 sowohl in der Retina als auch im Gehirn vorkommen. Die Bewertung der ESTs zur Auswahl von Kandidatengenen erlaubte einen direkten Vergleich der beiden genutzten Datenressoucen, der UniGene Datenbank und der retinalen SSH (retSSH) cDNA Bank. Die Resultate zeigten, dass die Generierung einer SSH Bank zur Identifikation zellspezifischer Transkripte die effektivere Methode darstellt. Durch die Nutzung dieser cDNA Bank konnte nicht nur ein Großteil der Kandidatengene, sondern auch Gene mit einer niedrigen Expression identifiziert werden. Außerdem zeigt die cDNA Bank eine Anreicherung an Retina-Transkripten. Somit stellt die retSSH cDNA Bank eine wertvolle Quelle zu Identifizierung neuer retinaler Gene dar. Durch diese und andere Arbeiten konnte die vollständige kodierende Sequenz von 55 der 111 retinaspezifischen oder –abundanten Gene ermittelt werden. Mittels verschiedener Methoden wie bioinformatische Analysen, „EST assembly“, cDNA Bank „screening“ und „RACE-Experimenten“ konnten im Lauf dieser Arbeit mehrere Gene, darunter C1orf32, C4orf11, C7orf9, C12orf7, C14orf29, DAPL1 und GRM7, kloniert werden. Mit bioinformatischen Analysen und cDNA Bank „screening“ wurde die Volllänge cDNA Sequenz und die genomische Organisation von C7orf9 (alias RFRP), ermittelt. Das 1190 bp retinaspezifische Transkript auf Chromosom 7p15.3 kodiert ein Vorläuferprotein für mindestens zwei kleine Neuropeptide, RFRP-1 und RFRP-3. Da C7orf9 in einer kritischen Region für die dominante zystoide Makuladystrophie liegt, wurde eine mögliche Rolle für die Pathologie der Krankheit untersucht. Mittels Southern Blot Hybridisierungen und der Sequenzierung von C7orf9 zweier betroffener Patienten des gleichen Stammbaums, der für die Lokalisierung des Krankheitsgens verwendet worden war, konnte eine Beteiligung des Genes am Krankheitsbild ausgeschlossen werden. Mehrere Isoformen des C12orf7 Gens konnten mit Hilfe verschiedener Klone aus cDNA Bank „screeining“, PCR Amplifikationen und „RACE-Experimenten“ identifiziert werden. Die von Chromosom 12q13.13 transkribierten Genvarianten zeigen eine retinaspezifische Expression. Aufgrund der vielfältigen Spleißvarianten des Gens kann über die Eigenschaften des kodierten Proteins nur spekuliert werden. Das längste Transkript, das alle sechs Exone und die letzte Intron-Sequenz enthält, kodiert ein Protein mit 471 AS, das ein Kernlokalisierungssignal und fünf Ankyrin „Domains“ aufweist. Die Existenz mehrere Isoformen wurde auch in der Maus nachgewiesen, was auf eine funktionelle Relevanz in der Physiologie der Zelle hinweist. Fünf neue Spleißvarianten des Glutamat metabotropen Rezeptors 7 (GRM7) mit alternativen Exonen am 3´Ende wurden identifiziert und charakterisiert. Eine der neuen Varianten, GRM7_v3 kodiert ein 924 AS-langer Protein und stellt damit das mutmaßlich längste GRM7 Protein dar. Die Isoformen werden nicht retinaspezifisch, sondern verstärkt in neuronalen Gewebe exprimiert. Obwohl die funktionellen Eigenschaften der spezifischen Carboxyl-Enden noch nicht geklärt sind, ist bekannt, dass „axon-targeting“ von GRM7_v1 von den letzten 60 AS des Proteins vermittelt wird. Die neuen Isoformen könnten daher eine Rolle im subzellulären Transport des Proteins spielen. Das C1orf32 Gen, das vorwiegend in der Retina exprimiert wird, besitzt zehn Exone und liegt auf Chromosom 1q24.1. Mit bioinformatische Analysen konnten nicht nur die orthologen Gene des putativen Proteins mit 639 AS in Maus und Ratte, sondern auch das LISCH7 Gen als potentielles Mitglied der Genfamilie identifiziert werden. Für LISCH7 ist eine Funktion als „low density lipoprotein receptor“ bekannt, das C1orf32 Protein ist damit möglicherweise in den retinalen Fettstoffwechsel involviert. Störungen im Fettstoffwechsel sind als Ursache für AMD vorgeschlagen worden, die Rolle von C1orf32 in dieser komplexen Krankheit sollte deshalb untersucht werden. Expressionsanalysen des „death-associated protein-like 1“ (DAPL1) Gens zeigten eine hohe Expression sowohl in Retina als auch im retinales Pigmentepithel. Das 552 bp Transkript kodiert ein Protein mit 107 AS und liegt auf Chromosom 2q24.1. In-silico Analysen identifizierten 12 weitere verwandte Proteine verschiedener Spezies, die eine hohe Ähnlichkeit aufweisen und eine neue Proteinfamilie darstellen. Vor allem die Ähnlichkeit mit dem „death-associated“ Protein, das für den programmierten Zelltod essentiell ist, ist von besonderem Interesse. Apoptose ist meist der ultimative Grund der retinalen Degeneration und somit stellt DAPL1 ein ausgezeichnetes Kandidatengen für Retinopathien dar. C4orf11, lokalisiert auf Chromosom 4q21.22 und C14orf2, lokalisiert auf Chromosom 14q22.1, sind retinaspezifische Genen und werden in mehren Isoformen transkribiert. Die kodierten Proteine enthalten keine bekannten Domänen, wegen ihrer retinaspezifischen Transkription kann allerdings eine wichtige Rolle für die Funktion der Retina nicht ausgeschlossen werden. Als eines der langfristigen Ziele dieses Projekts wurden mehrere der geklonten Gene genotypisiert um „single nucleotide polymorphism“ (SNP) Karten zu erstellen. Die derzeitigen Projekte untersuchen die Haplotypfrequenzen der Kandidatengene in großen Kohorten von AMD Patienten und nicht betroffenen Kontrollpersonen. Die Kollektion von 111 retinaspezifischen oder –abundanten Genen, die in dieser Arbeit identifiziert und charakterisiert wurden, hat damit eine wichtige Grundlage für die weitere Erforschung retinaler Erkrankungen gelegt.show moreshow less

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar Statistics
Metadaten
Author: Heidi Schulz
URN:urn:nbn:de:bvb:20-opus-7278
Document Type:Doctoral Thesis
Granting Institution:Universität Würzburg, Fakultät für Biologie
Faculties:Medizinische Fakultät / Institut für Humangenetik
Date of final exam:2003/10/29
Language:English
Year of Completion:2003
Dewey Decimal Classification:5 Naturwissenschaften und Mathematik / 57 Biowissenschaften; Biologie / 570 Biowissenschaften; Biologie
GND Keyword:Netzhaut; Transkription <Genetik>
Tag:Gen; Netzhaut; Transkriptome
Retina; Retina; Transcriptome
Release Date:2003/12/22
Advisor:Prof. Dr. Bernhard H.F. Weber