This doctoral thesis consist of two parts: The first part describes a global survey of cis-regulatory divergence in mammalian translation, where I applied mRNA sequencing and deep sequencing-based polysome profiling to quantify translational efficiency in F1 hybrid mice. The F1 progeny between Mus musculus C57BL/6J and Mus spretus SPRET/EiJ was chosen as a model system because the two have the largest number of genetic variants among all mouse strains with high-quality genome assemblies available. This large genomic divergence 1) provides a large number of potential regulatory variants between the two strains and 2) enables a sequencing-based approach to distinguish allelic RNA transcripts. The high quality of the data was demonstrated by employing two independent validation approaches, PacBio full-length sequencing and ribosome profiling. In total, 1008 genes (14.1%) were identified exhibiting significant allelic difference in translational efficiency. Several sequence features were associated with the observed allelic divergence in translation, including local RNA secondary structure near the start codon and proximal out-of-frame upstream AUGs. Finally, cis-effects are quantitatively comparable between transcriptional and translational regulation and these effects are more frequently compensatory between the two processes, suggesting a role of the translational regulation in buffering transcriptional noise and thereby maintaining the robustness of protein expression. In the second part, I developed novel technology CAPTRE to measure the translational status of distinct mRNA TL isoforms. In mouse fibroblasts, a total of 22,357 TSSs derived from 10,875 protein-coding genes were identified. Among 4153 genes expressing multiple TSSs, 745 exhibited significant TE difference between their alternative TL isoforms. Longer isoforms were more frequently associated with lower TE and the global impact of several regulatory elements was also revisited, such as uORFs, cap-adjacent stable RNA secondary structures as well as 5'-terminal oligopyrimidine tract. In addition, several novel sequence motifs that can affect translation activity were identified and their effect was validated using two reporter systems. Finally, quantitative models combining different features identified in this study explained approximately 60% of the variance of the TE difference observed between TL isoforms. This study provides novel mechanistic insights into translational regulation and characterizes the potential coupling between translational and transcriptional regulation in mammalian cells.
Diese Dissertation setzt sich aus zwei Teilen zusammen: Der erste Teil beschreibt eine globale Studie von cis-regulatorischen Divergenzen in der mRNA Translationseffizienz von Säugetierzellen. Hierzu habe ich Polyribosomen Profile erstellt und anschließend mRNA Sequenzierungstechnologien verwendet, um die Translationseffizienz in einem Maus F1-Hybridmodelystem zu bestimmen. Die F1-Nachkommen von Mus musculus C57BL/6J und Mus spretus SPRET/EiJ wurden hierzu als Modelsystem gewählt, da diese Spezies die größte Zahl an genetischen Variationen in allen Maus Modellen mit qualitativ hochwertigen Genomsequenzierdaten aufweist. Die hohe genomische Divergenz stellt 1) eine große Zahl an potentiell regulatorischen Varianten zwischen beiden Maus Arten dar und ermöglicht 2) eine allelspezifische Zuordnung von mRNA Transkripten durch Sequenzbestimmung. Die hohe Qualität der so gewonnenen Daten wurde mit zwei unabhängigen Methoden validiert: Sequenzbestimmung der mRNA in voller Läng mit Hilfe eines „PacBio“ Instruments, sowie Bestimmung von Translationsraten durch Erstellung von Ribosomen Fußabdrücken (sogenanntes „ribosome profiling“). Insgesamt konnten so 1008 Gene ermittelt werden (14.1%), die einen signifikanten Unterschied in der allelspezifischen Translationsrate aufweisen. Mehrere Sequenzeigenschaften konnten mit allelspezifischen divergenten Translationsraten assoziiert werden: Lokale RNA Sekundärstrukturen in der Nähe des Startcodons, sowie vorgelagerte AUG Startcodons außerhalb des offenen Leserahmens. Schließlich konnte gezeigt werden, dass cis-Effekte auf transkriptionaler sowie translationaler Ebene quantitativ vergleichbar sind und häufig eine kompensatorische Wirkung zwischen beiden Prozessen aufweisen. Dies suggeriert eine Puffer-ähnliche Rolle der Translation, wodurch Schwankungen in Transkriptionsraten kompensiert werden können, was wiederum robuste Genexpressionsmuster gewährleistet. In dem zweiten Teil dieser Arbeit habe ich eine neuartige Technologie namens CAPTRE entwickelt um den Translationsstatus von mRNA Isoformen mit unterschiedlichen vorgelagerten nicht-translatierten Sequenzbereichen zu messen. In Maus Fibroblasten wurde zunächst eine Gesamtzahl von 22.357 Transkriptionsstartpositionen von 10.875 Genen ermittelt. Von 4153 Genen, die alternative Transkriptionsstartpositionen nutzen, zeigten 745 signifikante Unterschiede zwischen Isoformen mit alternativen vorgelagerten nicht- translatierten Sequenzen. Hiervon zeigten längere Isoformen häufig eine Assoziation mit niedrigeren Translationsraten. Weiterhin wurde der globale Einfluss mehrerer regulatorischer Elemente, wie beispielsweise vorgelagerter offener Leserahmen (sogenannte „uORFs“), stabiler RNA Sekundärstrukturen in der Nähe des Transkriptanfangs, sowie terminalen Oligopyrimidin Sequenzen untersucht. Darüberhinaus wurden mehrere neue Sequenzmotive, welche die Translation beeinflussen können identifiziert und deren Einfluss auf Translationsraten mit Hilfe von zwei unterschiedlichen Reportersystemen validiert. Schließlich wurden quantitative Computermodelle entwickelt um die in dieser Studie gefundenen regulatorischen Elemente zu beschreiben. Unter Verwendung dieser Modelle konnten 60% der beobachteten Varianz in Translationsraten zwischen verschiedenen Isoformen, welche alternative vorgelagerte nicht-translatierte Sequenzen aufweisen, erklärt werden. Zusammenfassend konnten in dieser Studie wichtige neue mechanistische Erkenntnisse hinsichtlich der translationalen Genregulation gewonnen werden. Insbesondere konnte auf eine mögliche regulatorische Kopplung zwischen transkriptionaler und translationaler Regulation hingewiesen werden.