Eukaryotic gene expression is extensively regulated at the post- transcriptional level. Throughout its lifecycle, mRNA is bound by a dynamic repertoire of RNA-binding proteins (RBPs), which interact with mRNA in a sequence and/or structure dependent manner. The combinatorial binding of RBPs and ribonucleoprotein (RNP) complexes regulates many steps of eukaryotic mRNA processing. Although RBPs are crucial for these processes and malfunctions are often causes of disease, the mRNA-bound proteome was not previously systematically characterized. We developed a photoreactive nucleoside-enhanced in vivo UV crosslinking and oligo(dT) purification approach to identify the mRNA-bound proteome using high-resolution quantitative mass spectrometry. When applied to a human embryonic kidney cell line (HEK293) this method led to the reproducible identification of almost 800 proteins. As expected, known RBPs, as well as the majority of proteins containing RNA-binding domains expressed in HEK293 cells were detected, and represent a large percentage of our data. Surprisingly, nearly one-third of the bound proteins were not previously annotated as RNA-binding, and about half of these were not predictable by computational methods to interact with RNA. We validated direct RNA-binding activity of several putative RNA-interacting proteins by Photoactivatable- Ribonucleoside-Enhanced Crosslinking and Immunoprecipitation (PAR-CLIP). Amongst the identified proteins was IFIT5, a viral response induced protein with enigmatic RNA-binding function. We investigated the RNA-binding activity of IFIT5 using PAR-CLIP, and found that IFIT5 is binding a broad spectrum of RNAs. I also used the method to characterize the mRNA-bound proteome in the Drosophila melanogaster embryo, where many events are driven by post- transcriptional regulation such as mRNA localization and translational regulation. Before maternal-to-zygotic transition, proteins are synthesized from maternal mRNAs, which are already present at fertilization (maternal effect genes). Although we know that some maternal effect genes are bound and regulated by RBPs, we still lack a global picture about the proteins that mediate posttranscriptional regulation. Therefore we set out to characterize the mRNA-bound proteome of Drosophila melanogaster embryos in earliest developmental stages, before the onset of zygotic transcription. We were able to identify about 1000 proteins in oligo(dT) precipitates. In a preliminary analysis we detected a large number of known RBPs and regulators of translation. We consider the identification of the mRNA-bound proteome of a precisely defined developmental stage as a first step towards understanding the post-transcriptional gene regulatory code during development and differentiation.
Genexpression wird in Eukaryonten weitgehend auf post-transkriptioneller Ebene reguliert. Während ihrer gesamten Lebensdauer wird die Boten-RNA (mRNA) durch ein dynamisches Repertoire von RNA-bindenden Proteinen (RBP) gebunden, die sequenz- und / oder strukturabhängig mit ihr interagieren. Kombinatorische Interaktionen von RBPs und Ribonucleoprotein-Komplexen regulieren nahezu alle Schritte der eukaryotischen mRNA-Prozessierung. Obwohl RBPs entscheidend für diese Prozesse sind und Störungen oft Ursachen von Krankheiten sind, wurde das mRNA-gebundene Proteom bisher nicht systematisch charakterisiert. Wir entwickelten einen in vivo-Ansatz, basierend auf UV-induzierten, kovalenten Bindungen zwischen Proteinen und RNA mithilfe photoreaktiver Nucleoside, um das mRNA-gebundene Proteom zu isolieren und untersuchen. Die Protein-RNA- Komplexe lassen sich mittels magnetischen, oligo(dT)-beschichteten Partikeln aus dem Zelllysat isolieren, anschließend werden die Proteine mittels hochauflösender, quantitativer Massenspektrometrie identifiziert. Die Anwendung dieser Methode in einer humanen Zelllinie (HEK293) führte zur Identifizierung von nahezu 800 Proteinen. Wie erwartet wurde die Mehrzahl der in HEK293-Zellen vorhandenen RBPs detektiert. Überraschenderweise war fast ein Drittel der Proteine nicht als RNA-bindend annotiert, und etwa die Hälfte davon konnte nicht mit rechnergestützten, theoretischen Methoden vorhergesagt werden. Für eine große Mehrheit einer Stichprobe dieser Proteine ließ sich in Folgeexperimenten die RNA-Bindung bestätigen. Viele der identifizierten mRNA- bindenden Proteine scheinen Teil von post-transkriptionellen Netzwerken zur Regulation der Genexpression zu sein, darunter IFIT5, ein Protein dass als Antwort auf virale Infektionen vermehrt gebildet wird und dessen Aktivität als RNA-bindendes Protein vor unserer Studie ungewiss war. Der nächste Schritt war die Entwicklung einer Methode, die die Untersuchung des mRNA-gebundenen Proteoms in einem Modellorganismus mit komplexem Entwicklungsprogramm, genauer dem Embryo der Fruchtfliege Drosophila melanogaster, erlaubt. Waehrend der Drosophila-Embryogenese werden viele entscheidende Schritte durch post- transkriptionelle Regulation gesteuert. Vor allem mRNA-Lokalisation und die Regulation der Translation spielen hierbei eine entscheidende Rolle. Im Drosophila-Embryo werden Proteine von mRNAs synthetisiert die bereits bei der Befruchtung vorhanden sind. Es gibt zahlreiche gut untersuchte Einzelbeispiele, die die Notwendigeit der translationalen Regulation in den ersten Stunden der Embryogenese untermauern, jedoch ist die Anzahl der so regulierten Gene und die unterliegenden Mechanismen weitgened unbekannt. Ihnen gemein ist aber die Interaktion von Proteinen mit RNA. Jedoch gab es noch keine Studie, die versucht hat, alle mRNA-interagierenden Proteine in einem präzise definierten Entwicklungsstadium, der frühen Embryogenese, zu identifizieren. Durch eine Anpassung unserer Methode konnten wir etwa 1000 Proteine identifizieren, die vermutlich im Drosophila-Embryo mit mRNA interagieren. In einer vorläufigen Analyse entdeckten wir eine große Anzahl von bekannten RBPs, darunter einige Translations-Regulatoren. Darüber hinaus entdeckten wir auch hier Proteine, die nicht als RNA-bindend bekannt waren. Einige dieser Proteine wurden auch in HEK293 Zellen identifiziert, was auf eine evolutionäre Konservierung der RBP-RNA-Interaktion hindeutet. Die Identifizierung des mRNA-gebundenen Proteoms in einem genau definierten Entwicklungsstadium ist ein erster Schritt zum Verständnis des post- transkriptionellen Codes der Genexpression, und seiner Funktion während der Entwicklung und Differenzierung eines biologischen Organismus.