The 3’ ends of most eukaryotic mRNAs are cleaved and polyadenylated at the last step of transcription. Recent studies revealed that more than 70% mammalian genes have multiple polyadenylation sites (pAs) leading to the generation of multiple mRNA isoforms with different coding region or 3’ untranslated region (3’ UTR) from the same gene locus and contributes to the complexity of transcriptome and proteome by regulating their stability, localization, translation, and function. Boosted by the large-scale analysis technologies, extensive and dynamic regulation of 3’ UTR by alternative polyadenylation (APA) has been observed in different tissues; different cellular conditions (proliferation, differentiation, and development); and response to stimuli. Although the exact underlying mechanisms of APA remains under investigation, it should be in general regulated via the interaction between cis- regulatory elements residing at the DNA/RNA and trans-factors including polyadenylation cleavage core protein complex as well as other accessory RNA binding proteins (RBP). Change of APA pattern during evolution remains underexplored. Such changes could arise from the divergence in cis- regulatory elements and/or trans- acting RBPs. The divergences of the two factors with different extent of pleiotropic consequences undergo distinct evolutionary trajectories. Therefore, to better understand evolution in APA, it is important to distinguish the relative contribution of cis- and trans- effects. In this project, to comprehensively investigate the contribution of cis-elements and trans-factors in the process of APA in a mammalian system, we identified and quantified pAs usage difference between two parental strains (C57BL/6J and SPRET/EiJ) and between the two alleles in the F1 hybrids with 3’ read capturing and sequencing (3’ READS) and 3’ mRNA-Seq methods, respectively. In total, we identified 3747 parental divergent pAs across five types of APA, between the two parental mouse strains. By comparing the parental divergent pAs with those in F1 hybrids, we observed a predominant contribution of cis-regulatory effect on pAs usage, which is mediated by genetic variants between two species around the pAs. Further sequence feature analysis demonstrated that the unstable secondary structure and a novel hexamer UUUUUU in the upstream region of pAs could enhance and inhibit the pAs usage, respectively.
Die 3’-Enden der meisten eukaryotischen mRNAs werden im letzten Schritt der Transkription geschnitten und polyadenyliert. Jüngere Studien haben gezeigt, dass mehr als 70% der Gene von Säugetieren mehrere Polyadenylierungsstellen (pAs) haben. Diese ermöglichen die Generierung mehrer mRNA-Isoformen mit unterschiedlichen kodierenden oder 3‘-untranslatierten Regionen (3’UTR) aus demselben Genlokus und tragen zur Komplexität des Transkriptoms und des Proteoms bei durch Regulation ihrer Stabilität, Lokalisierung, Translation und Funktion. Mittels Einsatz von „large scale“-Technologien konnte die umfassende und dynamische Regulation des 3’UTRs durch alternative Polyadenylierung (APA) in verschiednenen Geweben gezeigt werden, sowie in verschiedenen zellulären Kontexten (Proliferation, Differenzierung und Entwicklung) und als Antwort auf Stimulation. Obwohl der genaue APA-Mechanismus noch untersucht wird, sollte er generell durch die Interaktion von cis-regulatorischen Elementen innerhalb der DNA oder RNA mit trans-Faktoren inklusive des polyadenylation cleavage core protein complex sowie zusätzlicher RNA-bindender Proteine (RBPs) vermittelt werden. Die Veränderungen von globalen APA-Mustern während der Evolution sind wenig untersucht. Solche Veränderungen können aus der Divergenz von cis- regulatorischen Elementen und/oder trans-agierenden RBPs entstehen. Die Divergenzen der zwei Faktoren mit unterschiedlichem Ausmass an pleiotropen Konsequenzen verlaufen in unterschiedlichen evolutionären Bahnen. Deswegen ist es wichtig, die relativen Beiträge von cis- und trans-Effekten zu unterscheiden, um die Evolution von APA besser zu verstehen. Um den Beitrag von cis-und trans-agierenden Faktoren im APA-Prozess in einem Säugetiersystem umfassend zu untersuchen, haben wir in diesem Projekt pAs usage zwischen zwei parentalen Mausstämmen (C57BL/6J and SPRET/EiJ) und zwischen zwei Allelen von Hybriden der F1-Generation mittels 3’ read capturing and sequencing (3’ READS) and 3’ mRNA sequencing identifiziert und quantifiziert. Insgesamt haben wir 3850 parentale, divergente pAs innerhalb von 5 APA-Typen zwischen den beiden parentalen Mausstämmen identifiziert. Durch den Vergleich der parental- divergenten pAs mit denen der Hybride der F1-Generation konnten wir beobachten, dass vorrangig cis-regulatorische Elemente einen Effekt auf die pAs usage haben, welcher durch genetische Varianten um die pAs herum herbeigeführt wird. Weitere Analysen der Sequenzeigenschaften konnten demonstrieren, dass instabile Sekundärstruktur sowie ein neuartiges UUUUUU- hexamer in der der pAs vorangehenden Region die pAs usage verstärken bzw. inhibieren können.