TY - THES A1 - Fadl El Mola, Faisal Mohamed T1 - Bioinformatic and molecular approaches for the analysis of the retinal pigment epithelium (RPE) transcriptome N2 - There is substantial interest in the identification of genes underlying susceptibility to complex human diseases because of the potential utility of such genes in disease prediction and therapy. The complex age-related macular degeneration (AMD) is a prevalent cause of legal blindness in industrialized countries and predominantly affects the elderly population over 75 years of age. Although vision loss in AMD results from photoreceptor cell death in the central retina, the initial pathogenesis likely involves processes in the retinal pigment epithelium (RPE) (Liang and Godley, 2003). The goal of the current study was to identify and characterize genes specifically or abundantly expressed in the RPE in order to determine more comprehensively the transcriptome of the RPE. In addition, our aim was to assess the role of these genes in AMD pathogenesis. Towards this end, a bovine cDNA library enriched for RPE transcripts was constructed in-house using a PCR-based suppression subtractive hybridization (SSH) technique (Diatchenko et al., 1996, 1999), which normalizes for sequence abundance and achieves high enrichment for differentially expressed genes. CAP3 (Huang and Madan, 1999) was used to assemble the high quality sequences of all the 2379 ESTs into clusters or singletons. 1.2% of the 2379 RPE-ESTs contains vector sequences and was excluded from further analysis. 5% of the RPE-ESTs showed homology to multipe chromosomes and were not included in further assembly process. The rest of the ESTs (2245) were assembled into 175 contigs and 509 singletons, which revealed approximately 684 unique genes in the dataset. Out of the 684, 343 bovine RPE transcripts did not align to their human orthologues. A large fraction of clones were shown to include a considerable 3´untranslated regions of the gene that are not conserved between bovine and human. It is the coding regions that can be conserved between bovine and human and not the 3’ UTR (Sharma et al., 2002). Therefore, more sequencing from the cDNA library with reclustering of those 343 ESTs together with continuous blasting might reveal their human orthologoues. To handle the large volume of data that the RPE cDNA library project has generated a highly efficient and user-friendly RDBMS was designed. Using RDBMS data storage can be managed efficiently and flexibly. The RDBMS allows displaying the results in query-based form and report format with additional annotations, links and search functions. Out of the 341 known and predicted genes identified in this study, 2 were further analyzed. The RPE or/and retina specificity of these two clones were further confirmed by RT-PCR analysis in adult human tissues. Construction of a single nucleotide polymphism (SNP) map was initiated as a first step in future case/control association studies. SNP genotyping was carried out for one of these two clones (RPE01-D2, now known as RDH12). 12 SNPs were identified from direct sequencing of the 23.4-kb region, of which 5 are of high frequency. In a next step, comparison of allele frequencies between AMD patients and healthy controls is required. Completion of the expression analysis for other predicted genes identified during this study is in progress using real time RT-PCR and will provide additional candidate genes for further analyses. This study is expected to contribute to our understanding of the genetic basis of RPE function and to clarify the role of the RPE-expressed genes in the predisposition to AMD. It may also help reveal the mechanisms and pathways that are involved in the development of AMD or other retinal dystrophies. N2 - Es besteht ein grosses medizinisches Interesse an der Identifizierung von Genen, welche an der Entstehung komplexer, häufiger Krankheiten des Menschen beteiligt sind. Eine solche Krankheit ist die alters-korrelierte Makuladegeneration (AMD). Die AMD ist eine der häufigsten Ursachen für den Verlust der Sehfähigkeit im Alter von über 75 Jahren. Obwohl die Erblindung bei der AMD letztlich durch das Absterben von Photorezeptor-Zellen in der zentralen Retina bedingt wird, gibt es genügend Hinweise dafür, dass die Pathogenese der AMD ihren Ausgang vom retinalen Pigmentepithel (RPE) nimmt (Liang and Godley, 2003). Ziel dieser Arbeit war die Identifizierung und Charakterisierung von RPE-spezifischen Genen als Beitrag zur umfassenden Charakterisierung des RPE-Transkriptoms. Darüberhinaus war es Ziel der Arbeit, die mögliche Rolle der RPE-spezifischen Gene bei der Entstehung der AMD zu explorieren. Ausgangspunkt der Arbeit war eine RPE-spezifische, bovine cDNA Bibliothek, welche in der Arbeitsgruppe auf der Grundlage der SSH-Technik (Diatchenko et al, 1996, 1999) hergestellt worden war. Die SSH-Technik gestattet die Anreicherung von differentiell exprimierten Genen bei gleichzeitiger Normalisierung redundanter Sequenzen. Mit Hilfe des Software-Programms CAP3 (Huang and Madan, 1999) wurden insgesamt 2379 ESTs gruppiert und geordnet. 1,2% der 2379 RPE-ESTs enthielten Vektor Sequenzen und wurden daher von der weiteren Analyse ausgeschlossen. 5% der RPE-ESTs wiesen Homologien zu multiplen Chromosomen auf und wurden daher ebenfalls von der weiteren Analyse ausgeschlossen. Die übrigen 2245 ESTs wurden in 175 Contigs und 509 Singletons gruppiert, woraus sich Hinweise auf insgesamt 684 putative Einzelgene ergaben. 343 dieser 684 Klone zeigten jedoch keine Homologien zu humanen orthologen Sequenzen. Ursache für die fehlende Homologie muss in der grossen Zahl der Klone gesehen werden, bei welchen nur die 3´untranslatierten verglichen wurden. Im Gegensatz zu den kodierenden Sequenzabschnitten kommt es in den nicht-kodierenden Regionen in der Regel zu einer relativ raschen evolutionären Divergenz und damit zum Verlust der Homologie (Sharma et al, 2002). Durch zusätzliche Sequenzierung und Sequenzvergleiche der kodierenden Bereiche dieser 343 Klone lassen sich möglicherweise weitere RPE-spezifische Gene finden. Um die grosse Anzahl der im Rahmen des RPE-Projektes generierten Daten bearbeiten zu können wurde eine sehr effiziente und Benutzer-freundliche Datenbank auf Grundlage des RDBMS-Moduls etabliert. Dieses System gestattet die interaktive Bearbeitung der gespeicherten Daten im Query-Format. Darüberhinaus können die Daten in beliebiger Weise annotiert und verbunden werden. Nach Abzug der 343 nicht-homologen cDNA Klone von den 684 putativen Einzelsequenzen verblieben 341 Kandidaten-Sequenzen. 2 dieser Sequenzen wurden als putative neue RPE-spezifische Gene einer weiteren Analyse zugeführt. Dabei wurde zunächst die RPE- bzw. Retina-Spezifität dieser Kandidaten-Sequenzen mit Hilfe der RT-PCR Analyse bestätigt. Als Basis für zukünftige Fall-Kontroll- und Assoziationsstudien wurde eine SNP-Genotypisierung eines dieser zwei Klone (ursprüngliche Bezeichnung: RPE01-D2; derzeitige Bezeichnung: RDH12) durchgeführt. Die direkte Sequenzanalyse umfasste 23.4 kb und ergab insgesamt 12 SNPs, von denen sich 5 als hoch-informativ erwiesen. Auf dieser Grundlage können zukünftig Allel-Frequenzen zwischen Kontrollpersonen und AMD-Patienten ermittelt und verglichen werden. Zukünftig werden darüberhinaus real-time PCR Methoden zur Expressionsanalyse der verbliebenen Kandidaten-Klone eingesetzt. Zusammenfassend liefert die vorliegende Arbeit einen Beitrag zum Verständnis der genetischen Grundlagen der RPE-Funktionen und trägt zur Aufklärung der Rolle von RPE-spezifischen Genen bei der Disposition zur AMD bei. Zusätzlich ergaben sich Hinweise auf Kandidatengene, welche möglicherweise in der Pathogenese der AMD eine Rolle spielen. KW - Senile Makuladegeneration KW - Netzhaut KW - Pigmentepithel KW - Molekulargenetik KW - RPE KW - Bioinformatics KW - Age-related macular degeneration KW - Molecular approaches Y1 - 2003 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-6877 ER - TY - THES A1 - Schulz, Heidi T1 - Towards a comprehensive description of the human retinal transcriptome: identification and characterization of differentially expressed genes T1 - Identifizierung und Charakterisierung von differenziell exprimierten Genen - ein Beitrag zur umfassenden Beschreibung des Transkriptoms der menschilchen Netzhaut N2 - The human retina is a multilayered neuroectodermal tissue specialized in the transformation of light energy into electric impulses which can be transmitted to the brain where they are perceived as vision. Since the retina is easily accessible and functional aspects are directly recordable, the study of this tissue has been at the forefront of neuroscience research for over a century. Studies have revealed that the distinct functions of the retina require a large degree of differentiation which is achieved by the coordinated function of approximately 55 different cell types. The highly structured anatomy and the functional differentiation of the retina is a result of its distinctive transcriptome and proteome. Due to the complexity of the retina it has been difficult to estimate the number of genes actively transcribed in this tissue. Great efforts in the elucidation of retinal disease genes have led to the identification of 139 retina disease loci with 90 of the corresponding genes cloned thus far . In contrast to the success in the hereditary disorders, efforts to identify the genetic factors conferring manifestations known as age-related macular degeneration (AMD) have revealed sparse results. AMD is a retinal disease affecting a significant percentage of the older population. This disorder is likely due to exogenic as well as genetic factors. To further our understanding of retinal physiology and facilitate the identification of genes underlying retinal degenerations, particularly AMD, our efforts concentrated on the systematic analysis of the retinal transcriptome. Since approximately half of all retinal degeneration-associated genes identified to date are preferentially expressed in retina, it is plausible that the investigation of gene expression profiles and the identification of retina-expressed transcripts could be an important starting point for characterizing candidate genes for the retinal diseases. The expressed sequence tags approach included the assessment of all retinal expressed sequence tags (EST) clusters indexed in the UniGene database and of 1080 single-pass ESTs derived from an in-house generated human retina suppression subtracted hybridization (SSH) cDNA library. In total, 6603 EST clusters were evaluated during this thesis and detailed in-silico analysis was performed on 750 EST clusters. The expression of the genes was evaluated using reverse transcriptase-polymerase chain reaction (RT-PCR), followed by confirmation using quantitative reverse transcriptase-polymerase chain reaction (qRT-PCR), as well as conventional and virtual Northern blot analysis. The expression profiling of 337 selected EST clusters led to the identification of 111 transcripts, of which 60 are specific or abundant to the retina, 3 are expressed at high levels in the retinal pigment epithelium (RPE), and 48 are expressed in brain as well as in retina. The EST approach used to select candidate transcripts allowed us to assess the effectiveness of the two available resources, the UniGene database and the retinal SSH (retSSH) cDNA library. From the results obtained, it is evident that the generation of suppression subtracted libraries to identify cell-specific transcripts constitutes the most straight-forward and efficient strategy. In addition to the high percentage of candidate genes that are identified from an SSH cDNA library, it has the added benefit that genes expressed at low levels can be identified. Furthermore, comparison of our retina-enriched gene set with previously published studies demonstrated only limited overlap of the identified genes further confirming the valuable source of retinal genes from our retinal SSH cDNA library. The effort of our and other groups has resulted in the establishment of the full-length coding sequence of 55 of the 111 genes uniquely or preferentially expressed in the retina. Using various methods such as bioinformatical analysis, EST assembly, cDNA library screening, and rapid amplification of cDNA ends (RACE) a number of genes were cloned in the scope of this thesis including C1orf32, C4orf11, C7orf9, C12orf7, C14orf29, DAPL1, and GRM7. Bioinformatic analyses and cDNA library screening were used to isolate the full-length cDNA sequence and determine the genomic organization of C7orf9, also identified as RFRP. This 1190 bp retina-specific transcript from chromosome 7p15.3 encodes a precursor protein for at least two small neuropeptides, referred to as RFRP-1 and RFRP-3. Since C7orf9 is localized in the critical region for dominant cystoid macular dystrophy (CYMD) its role in the pathology was investigated. Southern blot analysis and sequencing of samples from two affected individuals of the original pedigree used to localize the disease gene excluded the gene from involvement in this disease. Multiple isoforms of the C12orf7 gene were assembled from a number of clones identified from library screenings, PCR amplifications, and RACE experiments. The gene variants, transcribed from chromosome 12q13.13, have been found to be expressed exclusively in retina. Because of the multiple alternative splicing of the gene, we can only speculate about the nature of the protein it encodes. The longest transcript, which includes all six exons plus the last intervening sequence, encodes a 471 aa protein which contains a nuclear localization signal and five ankyrin repeats. The existence of many isoforms is also observed in mouse suggesting that they may have a relevant role in cellular physiology. Five novel splice variants of the glutamate metabotropic receptor 7 (GRM7) resulting from the use of alternative 3’-end exons were identified and characterized. One of the novel variants, GRM7_v3, encodes a 924 aa protein and is therefore the longest putative GRM7 protein reported to date. Even though they are not retina-specific, the isoforms are preferentially expressed in the nervous system. Although the functional properties of the specific carboxyl-termini are still unclear, it is known that axon targeting of GRM7_v1 is mediated by the last 60 aa of the protein. Hence the novel isoforms may direct the protein to specific subcellular localizations. The C1orf32 gene, preferentially expressed in retina, is organized in 10 exons and is transcribed from chromosome 1q24.1. Bioinformatic analyses of the 639 aa putative protein not only identified the mouse and rat orthologous genes but also the LISCH7 gene as a potential member of the same family. Since the LISCH7 protein has been shown to function as a low density lipoprotein receptor, the C1orf32 protein may be involved in retinal lipid homeostasis. Disturbances in lipid metabolism have been proposed as one of the pathways involved in AMD etiology. Thus, the role of C1orf32 in this complex disease should be investigated. Expression analyses of the death-associated protein-like 1 (DAPL1) gene revealed that it is expressed in both the retina and the RPE at high levels. The 552 bp transcript encodes a 107 aa putative protein and is transcribed from chromosome 2q24.1. In-silico analyses identified an additional 12 related proteins from various species which share high similarity constituting a novel protein family. The similarity to the death-associated-protein (DAP) is particularly interesting since this protein has been found to be indispensable for programmed cell death. Therefore, DAPL1 is an excellent candidate for retinal disease as apoptosis is generally the ultimate cause in retinal degeneration. The retina-specific C4orf11 and C14orf29 genes localized on chromosome 4q21.22 and 14q22.1, respectively, are both transcribed in more than one isoform. The encoded proteins do not contain any known domains but because of their retina-specific expression they may be important for proper retinal physiology. As part of the long-term goals of the project, several of the cloned genes are being genotyped to construct single nucleotide polymorphism (SNP) maps. Projects to investigate haplotype frequencies of candidate genes in large cohorts of controls and AMD patients are ongoing. Thus, by establishing a collection of 111 genes expressed exclusively or preferentially in the retina, the present work has laid the foundation for future research in retinal diseases. N2 - Die menschliche Retina ist ein mehrschichtiges neuroektodermales Gewebe, das auf die Umwandlung von Lichtenergie in elektrische Impulse spezialisiert ist. Diese Impulse werden zum Gehirn weitergeleitet, wo sie als Bilder gesehen werden. Da die Retina experimentell leicht zugänglich ist und funktionelle Aspekte direkt untersucht werden können, nehmen Experimente an diesem Gewebe in der neurologischen Forschung seit mehr als einem Jahrhundert einen Spitzenplatz ein. Es wurde gezeigt, dass die unterschiedlichen Funktionen der Retina durch eine enorme Differenzierung in mehr als 55 Zelltypen, die koordiniert miteinander in Kontakt treten, ermöglicht wird. Die hohe strukturelle und funktionelle Komplexität der Retina wiederum ist das Resultat ihres Transkriptoms und ihres Proteoms. Die Komplexität der Retina erschwert es, die Zahl aktiv transkribierter Gene in diesem Gewebe zu schätzen. Durch die vielfältigen Bemühungen, Gene zu identifizieren, die mit retinalen Erkrankungen in Zusammenhang stehen, konnten bisher 139 Genloci mit retinalen Krankheiten in Verbindung gebracht werden und in 90 Fällen wurden die jeweiligen Gene bereits kloniert . Während auf dem Gebiet der hereditären Erkrankungen damit bereits große Erfolge erzielt wurden, sind die Resultate, was komplexe Erkrankungen wie die altersabhängige Makuladegeneration (AMD) betrifft, noch spärlich. AMD ist eine retinale Erkrankung, die einen signifikanten Prozentsatz der älteren Bevölkerung betrifft. Es wird angenommen, dass sowohl exogene als auf genetische Faktoren als Auslöser beteiligt sind. Um die Physiologie der Retina besser zu verstehen und die Identifikation von Genen, die in retinale Erkrankungen involviert sind, zu ermöglichen, wurde in dieser Arbeit ein Schwerpunkt auf die systematische Analyse des retinalen Transkriptoms gelegt. Etwa die Hälfte aller Gene, die bei retinalen Erkrankungen eine Rolle spielen und bis heute identifiziert wurden, werden überwiegend in der Retina exprimiert. Das Erstellen von Genexpressionsprofilen und die Identifikation von retina-spezifischen Transkripten ist daher der erste wichtige Schritt für die Charakterisierung von Kandidatengenen für retinale Erkrankungen. Zu diesem Zweck wurde eine „Expressed Sequence Tags“ (ESTs) Analyse durchgeführt, in der alle Retina „Clusters“ der UniGene Datenbank sowie 1080 einzelne ESTs einer laboreigenen, suppressiv-subtraktiv hybridisierten (SSH) cDNA Bank der menschlichen Retina bewertet. Insgesamt wurden 6603 EST „Clusters“ während dieser Arbeit untersucht und für 750 eine detaillierte in-silico Analyse angeschlossen. Die Expression der Gene wurde mittels reverser Transkriptase-Polymerase-Kettenreaktion (RT-PCR) untersucht und mit quantitativer RT-PCR (qRT-PCR) bestätigt. Außerdem wurden konventionelle und virtuelle Northern Blot Hybridisierungen zur Aufklärung der Expressionsprofile eingesetzt. Die Expressionsprofile von 337 EST „clustern“ führte zur Identifikation von 111 Transkripten, von denen 60 abundant oder spezifisch in der Retina exprimiert werden, drei eine hohe Expression im retinalen Pigmentepithel (RPE) zeigen und 48 sowohl in der Retina als auch im Gehirn vorkommen. Die Bewertung der ESTs zur Auswahl von Kandidatengenen erlaubte einen direkten Vergleich der beiden genutzten Datenressoucen, der UniGene Datenbank und der retinalen SSH (retSSH) cDNA Bank. Die Resultate zeigten, dass die Generierung einer SSH Bank zur Identifikation zellspezifischer Transkripte die effektivere Methode darstellt. Durch die Nutzung dieser cDNA Bank konnte nicht nur ein Großteil der Kandidatengene, sondern auch Gene mit einer niedrigen Expression identifiziert werden. Außerdem zeigt die cDNA Bank eine Anreicherung an Retina-Transkripten. Somit stellt die retSSH cDNA Bank eine wertvolle Quelle zu Identifizierung neuer retinaler Gene dar. Durch diese und andere Arbeiten konnte die vollständige kodierende Sequenz von 55 der 111 retinaspezifischen oder –abundanten Gene ermittelt werden. Mittels verschiedener Methoden wie bioinformatische Analysen, „EST assembly“, cDNA Bank „screening“ und „RACE-Experimenten“ konnten im Lauf dieser Arbeit mehrere Gene, darunter C1orf32, C4orf11, C7orf9, C12orf7, C14orf29, DAPL1 und GRM7, kloniert werden. Mit bioinformatischen Analysen und cDNA Bank „screening“ wurde die Volllänge cDNA Sequenz und die genomische Organisation von C7orf9 (alias RFRP), ermittelt. Das 1190 bp retinaspezifische Transkript auf Chromosom 7p15.3 kodiert ein Vorläuferprotein für mindestens zwei kleine Neuropeptide, RFRP-1 und RFRP-3. Da C7orf9 in einer kritischen Region für die dominante zystoide Makuladystrophie liegt, wurde eine mögliche Rolle für die Pathologie der Krankheit untersucht. Mittels Southern Blot Hybridisierungen und der Sequenzierung von C7orf9 zweier betroffener Patienten des gleichen Stammbaums, der für die Lokalisierung des Krankheitsgens verwendet worden war, konnte eine Beteiligung des Genes am Krankheitsbild ausgeschlossen werden. Mehrere Isoformen des C12orf7 Gens konnten mit Hilfe verschiedener Klone aus cDNA Bank „screeining“, PCR Amplifikationen und „RACE-Experimenten“ identifiziert werden. Die von Chromosom 12q13.13 transkribierten Genvarianten zeigen eine retinaspezifische Expression. Aufgrund der vielfältigen Spleißvarianten des Gens kann über die Eigenschaften des kodierten Proteins nur spekuliert werden. Das längste Transkript, das alle sechs Exone und die letzte Intron-Sequenz enthält, kodiert ein Protein mit 471 AS, das ein Kernlokalisierungssignal und fünf Ankyrin „Domains“ aufweist. Die Existenz mehrere Isoformen wurde auch in der Maus nachgewiesen, was auf eine funktionelle Relevanz in der Physiologie der Zelle hinweist. Fünf neue Spleißvarianten des Glutamat metabotropen Rezeptors 7 (GRM7) mit alternativen Exonen am 3´Ende wurden identifiziert und charakterisiert. Eine der neuen Varianten, GRM7_v3 kodiert ein 924 AS-langer Protein und stellt damit das mutmaßlich längste GRM7 Protein dar. Die Isoformen werden nicht retinaspezifisch, sondern verstärkt in neuronalen Gewebe exprimiert. Obwohl die funktionellen Eigenschaften der spezifischen Carboxyl-Enden noch nicht geklärt sind, ist bekannt, dass „axon-targeting“ von GRM7_v1 von den letzten 60 AS des Proteins vermittelt wird. Die neuen Isoformen könnten daher eine Rolle im subzellulären Transport des Proteins spielen. Das C1orf32 Gen, das vorwiegend in der Retina exprimiert wird, besitzt zehn Exone und liegt auf Chromosom 1q24.1. Mit bioinformatische Analysen konnten nicht nur die orthologen Gene des putativen Proteins mit 639 AS in Maus und Ratte, sondern auch das LISCH7 Gen als potentielles Mitglied der Genfamilie identifiziert werden. Für LISCH7 ist eine Funktion als „low density lipoprotein receptor“ bekannt, das C1orf32 Protein ist damit möglicherweise in den retinalen Fettstoffwechsel involviert. Störungen im Fettstoffwechsel sind als Ursache für AMD vorgeschlagen worden, die Rolle von C1orf32 in dieser komplexen Krankheit sollte deshalb untersucht werden. Expressionsanalysen des „death-associated protein-like 1“ (DAPL1) Gens zeigten eine hohe Expression sowohl in Retina als auch im retinales Pigmentepithel. Das 552 bp Transkript kodiert ein Protein mit 107 AS und liegt auf Chromosom 2q24.1. In-silico Analysen identifizierten 12 weitere verwandte Proteine verschiedener Spezies, die eine hohe Ähnlichkeit aufweisen und eine neue Proteinfamilie darstellen. Vor allem die Ähnlichkeit mit dem „death-associated“ Protein, das für den programmierten Zelltod essentiell ist, ist von besonderem Interesse. Apoptose ist meist der ultimative Grund der retinalen Degeneration und somit stellt DAPL1 ein ausgezeichnetes Kandidatengen für Retinopathien dar. C4orf11, lokalisiert auf Chromosom 4q21.22 und C14orf2, lokalisiert auf Chromosom 14q22.1, sind retinaspezifische Genen und werden in mehren Isoformen transkribiert. Die kodierten Proteine enthalten keine bekannten Domänen, wegen ihrer retinaspezifischen Transkription kann allerdings eine wichtige Rolle für die Funktion der Retina nicht ausgeschlossen werden. Als eines der langfristigen Ziele dieses Projekts wurden mehrere der geklonten Gene genotypisiert um „single nucleotide polymorphism“ (SNP) Karten zu erstellen. Die derzeitigen Projekte untersuchen die Haplotypfrequenzen der Kandidatengene in großen Kohorten von AMD Patienten und nicht betroffenen Kontrollpersonen. Die Kollektion von 111 retinaspezifischen oder –abundanten Genen, die in dieser Arbeit identifiziert und charakterisiert wurden, hat damit eine wichtige Grundlage für die weitere Erforschung retinaler Erkrankungen gelegt. KW - Netzhaut KW - Transkription KW - Gen KW - Netzhaut KW - Transkriptome KW - Retina KW - Transcriptome KW - Retina Y1 - 2003 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:20-opus-7278 ER -