Genome-wide Determination Of Splicing Efficiency And Dynamics From RNA-Seq Data

Rodrigues de Melo Costa, Verônica

Genome-wide Determination Of Splicing Efficiency And Dynamics From RNA-Seq Data

Metadaten

dc.contributor.author

Rodrigues de Melo Costa, Verônica

dc.date.accessioned

2021-05-12T11:50:55Z

dc.date.available

2021-05-12T11:50:55Z

dc.date.issued

2021

dc.identifier.uri

https://refubium.fu-berlin.de/handle/fub188/30603

dc.identifier.uri

http://dx.doi.org/10.17169/refubium-30342

dc.description.abstract

Eukaryotic genes are mostly composed of a series of exons intercalated by sequences with no coding potential called introns. These sequences are generally removed from primary transcripts to form mature RNA molecules in a post-transcriptional process called splicing. An efficient splicing of primary transcripts is an essential step in gene expression and its misregulation is related to numerous human diseases. Thus, to better understand the dynamics of this process and the perturbations that might be caused by aberrant transcript processing, it is important to quantify splicing efficiency. In this thesis, I introduce SPLICE-q, a fast and user-friendly Python tool for genome-wide SPLICing Efficiency quantification. It supports studies focusing on the implications of splicing efficiency in transcript processing dynamics. SPLICE-q uses aligned reads from RNA-Seq to quantify splicing efficiency for each intron individually and allows the user to select different levels of restrictiveness concerning the introns’ overlap with other genomic elements, such as exons from other genes. I demonstrate SPLICE-q’s application using three use cases including two different species and methodologies. These analyses illustrate that SPLICE-q can detect a progressive increase of splicing efficiency throughout a time course of nascent RNA-Seq and it might be useful when it comes to understanding cancer progression beyond mere gene expression levels. Furthermore, I provide an in-depth study of time course nascent BrU-Seq data to address questions concerning differences in the speed of splicing and the underlying biological features that might be associated with it. SPLICE-q and its documentation are publicly available at: https://github.com/vrmelo/SPLICE-q.

dc.description.abstract

Eukaryotische Gene bestehen im Wesentlichen aus einer Reihe von Exons, die durch nicht-kodierende Sequenzen (so genannte Introns) getrennt sind. In einem posttranskriptionellen Prozess, der als Splicing bzw. Spleißen bezeichnet wird, werden diese Sequenzen üblicherweise aus den primären Transkripten entfernt, sodass reife RNA Moleküle entstehen. Effizientes Splicing der primären Transkripte ist ein derart essenzieller Schritt in der Expression von Genen, dass dessen Deregulation Ursache zahlreicher Erkrankungen des menschlichen Körpers ist. Deswegen ist es wichtig die Effizienz des Spleißens robust quantifizieren zu können, um die Dynamik dieses Prozesses und die Auswirkungen der aberranten Prozessierung von Transkripten besser zu verstehen. In diesem Manuskript präsentiere ich SPLICE-q, ein effizientes und benutzerfreundliches Pythonprogramm zur genomweiten Quantifizierung von Spleißeffizienzen (SPLICing Efficiency quantification). Es unterstützt u.a. Studien, die den Effekt von Spleißeffizienz auf die generelle Dynamik der Transkriptprozessierung untersuchen. SPLICE-q benutzt alignierte Reads aus RNA-Seq Experimenten, um die Spleißeffizienz für jedes einzelne Intron zu quantifizieren und erlaubt es dem Benutzer Introns in mehreren unterschiedlich restriktiven Stufen nach deren Überlapp mit anderen genomischen Elementen (bspw. Exons aus anderen Genen) zu filtern. Die Verwendung und Robustheit von SPLICE-q wird anhand von drei verschiedenen Anwendungsbeispielen, inkl. zweier unterschiedlicher Spezies und Methodologien, gezeigt. Diese Analysen demonstrieren, dass SPLICE-q in der Lage ist sowohl, anhand von Daten eines nascent RNA Experiments, einen progressiven Anstieg der Spleißeffizienz über die Zeit festzustellen, als auch zum Verständnis der Entwicklung von Krebszellen, über die bloße Genexpression hinaus, beizutragen. Darüber hinaus, untersucht diese Arbeit eine Zeitreihe aus nascent BrU-Seq-Daten im Detail, um Fragestellungen bzgl. Differenzen in der Spleißgeschwindigkeit in Verbindung mit gewissen biologischen Merkmalen zu klären. Der Quellcode von SPLICE-q und dessen Dokumentation sind öffentlich zugänglich unter: https://github.com/vrmelo/SPLICE-q.

dc.format.extent

ix, 100 Seiten

dc.language

eng

dc.rights.uri

http://www.fu-berlin.de/sites/refubium/rechtliches/Nutzungsbedingungen

dc.subject

splicing efficiency

dc.subject

RNA-seq

dc.subject

co-transcriptional splicing

dc.subject

splicing dynamics

dc.subject

bioinformatics

dc.subject.ddc

000 Computer science, information, and general works::000 Computer Science, knowledge, systems::004 Data processing and Computer science

dc.subject.ddc

500 Natural sciences and mathematics::570 Life sciences::570 Life sciences

dc.title

Genome-wide Determination Of Splicing Efficiency And Dynamics From RNA-Seq Data

dc.type

Dissertation

dcterms.format

Text

dc.contributor.gender

female

dc.contributor.firstReferee

Vingron, Martin

dc.contributor.furtherReferee

Piro, Rosario M.

dc.date.accepted

2021-04-22

dc.identifier.urn

urn:nbn:de:kobv:188-refubium-30603-1

refubium.affiliation

Mathematik und Informatik

dcterms.accessRights.dnb

free

dcterms.accessRights.openaire

open access

dcterms.accessRights.proquest

Zur Kurzanzeige

Das Dokument erscheint in:

Dissertationen FU

Dateien zu dieser Ressource

thesis_VMelo_FURefubium.pdf

Größe: 1.983MB

Format: PDF

Prüfsumme (MD5): 2104c2ca260c2e8ac16fc50abfd7e7e9

Öffnen

Genome-wide Determination Of Splicing Efficiency And Dynamics From RNA-Seq Data

Refubium - Repositorium der Freien Universität Berlin

Genome-wide Determination Of Splicing Efficiency And Dynamics From RNA-Seq Data

Metadaten

Das Dokument erscheint in:

Dateien zu dieser Ressource

Metadaten exportieren