Discoveries in the last decade have shown that small RNAs (such as microRNAs) perform a number of important functions, including post-transcriptional gene regulation, transposon silencing, DNA methylation, chromatin modifications and chromosome segregation. The ability of the new deep sequencing technologies to sequence millions of short RNAs in a few hours have made them the method of choice for simultaneous discovery and profiling of small RNAs. However, when the sequenced RNAs are mapped to the reference genome, they typically locate to millions of distinct loci, only a few of which are loci that produce regulatory small RNAs. To distinguish the few loci that produce regulatory small RNAs from the many loci that are sources of other short RNAs like degradation products is a non-trivial computational challenge. In my doctorate works I have formalized knowledge of small RNA biology and biogenesis into computational models that can accurately identify regulatory small RNAs of different classes in much larger pools of sequenced RNAs. As part of collaborations, I have used these models to discover hundreds of novel small RNA genes in more than ten animal species including humans, mice, fruit flies, nematodes and planarian flatworms. We find evidence that a number of these small RNA genes have roles in disease or in stem cell function. Further, some of the novel regulatory small RNAs are in fact cleaved bona fide snoRNAs, revealing cross-talk between two RNA pathways. Last, I have developed methods for precise quantitation of individual small RNAs as well as entire small RNA populations between deep sequencing samples.
Die Entdeckungen des letzten Jahrzehnts haben gezeigt, dass so genannte small RNAs, wie zum Beispiel microRNAs, bedeutenden Einfluss auf viele Zellabläufe haben. Dazu zählen unter anderem posttranskriptionelle Regulation, Chromatin Modifikationen sowie Segregation der Chromosomen. So genannte next generation sequencer Maschinen sind dazu in der Lage Millionen von kurzen RNA Molekülen innerhalb nur werniger Stunden zu sequenzieren, weshalb sie heutzutage das Mittel Wahl sind um sowohl neue regulatorische small RNAs zu entdecken als auch Expressionsprofile von diesen zu erstellen. Wenn die sequenzierten RNAs auf das Genom gemappt werden gibt es normalerweise Millionen von verschieden Moeglichkeiten von dem sie stammen koennten, aber nur einige von Ihnen produzieren kleine regulatorische RNAs. Die Identifikation genau dieser wenigen Loci, von denen die kleinen regulatorischen RNA Stücke stammen, ist eine computertechnisch anspruchsvolle Aufgabe. In meiner Doktorarbeit habe ich computerbasierte Modelle auf der Grundlage von der Biologie und Biogenese kleiner RNAs erstellt. Diese Modelle sind dazu in der Lage die Loci der verschiedenen kleinen regulatorischen RNAs zuverlaessig zu identifizieren. Während diverser Kollaborationen mit anderen Arbeitsgruppe habe ich meine Modelle dazu benutzt hunderte von noch nicht detektierten kleinen RNA Genen in mehr als zehn verschiedenen Tierspezies zu identifizieren. Dazu zählen Menschen, Mäuse, Fruchtfliegen und Flachwürmer. Wir haben Evidenz dafür gefunden, dass eine Vielzahl dieser kleinen RNAs eine Rolle in diversen Krankheiten oder Stammzellfunktion spielen. Des Weiteren sind einiger dieser kleinen RNAs tatsächlich prozessierte snoRNAs sind, was auf eine Interaktion der verschiedenen RNA Pathways nahelegt. Als Letzes habe ich noch Methoden entwickelt, die eine präzise Quantifikation von einzelnen kleinen RNAs sowie gesamter Populationen von kleinen RNAs zwischen Proben erlauben.