Structural and functional analysis of the ORF1p protein of the human LINE-1 retrotransposon

DSpace Repository


Dateien:

URI: http://nbn-resolving.de/urn:nbn:de:bsz:21-opus-58027
http://hdl.handle.net/10900/49575
Dokumentart: Dissertation
Date: 2010
Language: English
Faculty: 7 Mathematisch-Naturwissenschaftliche Fakultät
Department: Biochemie
Advisor: Stehle, Thilo (Prof.Dr.)
Day of Oral Examination: 2010-12-03
DDC Classifikation: 500 - Natural sciences and mathematics
Keywords: Retrotransposon , Kristallstruktur , RNS-Bindungsproteine , Evolution
Other Keywords:
LINE-1 , RNA-binding protein , Genome evolution , Crystal structure
License: Publishing license including print on demand
Order a printed copy: Print-on-Demand
Show full item record

Inhaltszusammenfassung:

Retrotransposons sind mobile genetische Elemente, die sich über einen "copy-and-paste" Mechanismus replizieren, bei dem eine neue Kopie ihrer DNA im Genom erzeugt wird. Im humanen Genom ist LINE-1 (L1) das am häufigsten vorkommende Retrotransposon, wo es 17% der gesamten genomischen DNA ausmacht. L1 hatte somit einen großen Einfluss auf die Evolution des humanen Genoms und ist auch heute noch aktiv. Es wird als wichtigste Quelle für humane interindividuelle genomische Variation betrachtet. Des Weiteren wird es in Zusammenhang mit verschiedenen menschlichen Krankheiten gebracht. Während die Datenfülle zur Bedeutung des L1 Elements über die letzten Jahre ständig anwuchs, blieben die mechanistischen Grundlagen des Retrotranspositionsprozesses weiterhin weitgehend unverstanden. Die beiden von L1 kodierten Proteine, L1ORF1p und L1ORF2p, sind beide essentiell für die Retrotransposition. L1ORF2p enthält eine Endonukleasedomäne und eine Domäne für die reverse Transkriptase. Die Rolle von L1ORF1p hingegen war zu Beginn dieser Arbeit wesentlich unklarer, da keine Sequenzhomologie zu Proteinen bekannter Funktion erkennbar war. Um die Funktionsweise und Phylogenie des L1ORF1p zu verstehen, beabsichtigten wir deshalb dessen Struktur mittels Röntgenkristallographie zu ermitteln. Im ersten Teil dieser Arbeit identifizierten wir mittels bioinformatischer Methoden eine nicht-kanonische RRM (RNA recognition motif) Domäne sowohl im humanen L1ORF1p Protein als auch in vielen phylogenetisch unverwandten ORF1p Proteinen anderer non-LTR Retrotransposons. Insgesamt besteht das humane L1ORF1p Protein somit aus einer N-terminalen "coiled coil", einer zentralen RRM Domäne und einer zusätzlichen C-terminalen Domäne (CTD). Wir bestimmten die Grenzen der drei genannten Domänen auf experimentelle Weise und zeigten, dass die "coiled coil" sowohl notwendig als auch hinreichend für eine Trimerisierung des Proteins ist. Schließlich haben wir mittels Röntgenkristallografie und NMR Spektroskopie die Strukturen der einzelnen Domänen und auch des trimeren L1ORF1p bestimmt. Diese Studien zeigen L1ORF1p als sehr komplexes RNA-Bindeprotein mit einer beispiellosen Flexibilität in der Anordnung seiner einzelnen Domänen. Zusammen mit in vitro und in vivo Experimenten erlauben diese Strukturen Schlussfolgerungen darüber, wie der Trimer einzelsträngige RNA bindet. Phylogenetische Analysen von L1ORF1p deuten auf einen sehr frühen Ursprung der RRM Domäne hin und sind in Einklang mit einer modularen Evolution der non-LTR Retrotransposons. Von besonderem Interesse ist auch der Vergleich der trimeren L1ORF1p Struktur mit viralen Fibern und Membranfusionsproteinen, welche ähnliche trimere Strukturen aufweisen. Dieser Vergleich verleiht der Diskussion über den Ursprung der non-LTR Retrotransposons neue Denkanstöße.

Abstract:

Retrotransposons are mobile genetic elements, which replicate via a "copy-and-paste" mechanism, thereby creating a new copy of their DNA in the genome. LINE-1 (L1) is the most abundant retrotransposon in the human genome, directly accounting for 17% of the genomic DNA. L1 has shaped the human genome in many ways during evolution and is still active nowadays. It is considered as the major source of human interindividual genetic variation, and has been implicated in several human diseases as well. While data on the impact and significance of the L1 element has been accumulating in recent years, the understanding of the underlying molecular mechanism of retrotransposition has been lagging behind. L1 encodes two proteins called L1ORF1p and L1ORF2p. Both proteins are essential for retrotransposition. L1ORF2p contains a nicking endonuclease and a reverse transcriptase domain. The role of the L1ORF1p in retrotransposition was much more elusive in the beginning of this thesis.To understand the molecular mechanics and phylogeny of L1ORF1p, we decided to obtain a high resolution structure of the protein. First, we used bioinformatics to identify a non-canonical RRM (RNA recognition motif) domain within human L1ORF1p, as well as in the ORF1p proteins from many phylogenetically unrelated non-LTR retrotransposons. In addition to the central RRM domain of the L1ORF1p, we experimentally determined the domain boundaries of the coiled coil and of a C-terminal domain (CTD), and we showed that coiled coil is necessary and sufficient for a trimerization of human L1ORF1p. Then, we used X-ray crystallography and NMR to determine the structures of individual domains, as well as of the trimeric L1ORF1p. From these studies L1ORF1p emerges as a highly sophisticated RNA binding protein that shows an unprecedented flexibility in the arrangement of its individual domains. These structures together with in vitro and in vivo experiments also suggest how single-stranded nucleic acids are bound by the trimer. Phylogenetic analyses of a mammalian L1ORF1p suggest an ancient origin of the RRM domain and support the modular evolution of non-LTR retrotransposons. Finally, the trimeric structure of L1ORF1p is interesting, when compared to viral fibres and membrane fusion proteins, which form similar trimers. This provides a new twist in the discussion about the origin of non-LTR retrotransposons.

This item appears in the following Collection(s)