This thesis is concerned with signaling pathways leading to regulation of gene expression. I develop methodology to address two problems specific to gene silencing experiments:
1. gene perturbation effects cannot be controlled deterministically and have to be modeled stochastically. 2. direct observations of intervention effects on other pathway components are often not available.
Gene silencing by RNAi has drastically reduced the time required for genome- wide screens for gene function, but no work has been done so far to adapt statistical methodology to the specific needs of RNAi data.
Die vorliegende Arbeit beschreibt, wie sich regulatorische Netze und Signalwege rekonstruieren lassen, indem die Expression einzelner Gene gezielt unterdrückt wird. Die Arbeit widmet sich im Besonderen zwei statistischen Problemen:
1. Die Stärke einer Intervention ist meist unbekannt und unterliegt stochastischen Einflüssen in der Zelle. Ich demonstriere eine stochastische Modellierung der Auswirkung eines Experiments auf das Ziel-Gen in Kapitel 3. 2. Gene, die zu einem Signalweg beitragen, zeigen keine veränderte Expression, wenn andere Teile des Signalwegs gestört werden. Ich zeige in Kapitel 4, wie ein Signalweg aus sekundären Effekten rekonstruiert werden kann.
Kapitel 1: Biologische Einführung Nach Grundlagen der Genexpression in eukaryotischen Zellen klärt das erste Kapitel die beiden zentralen Begriffe dieser Arbeit: transkriptionelle regulatorische Netzwerke und molekulare Signalwege. Regulatorische Netze bestehen aus Transkriptionsfaktoren und den Genen, an die sie binden. Signalwege geben durch Proteininteraktionen und -modifikationen Reize von der Zellmembran an den Zellkern weiter.
Kapitel 2: Statistische Verfahren der Netzwerk-Rekonstruktion Das zweite Kapitel legt die mathematischen und statistischen Grundlagen für die folgenden Teile der Arbeit. Es baut auf dem Begriff der bedingten Unabhängigkeit auf und gibt einen Überblick über statistische Modelle, die zur Netzwerk- Rekonstruktion eingesetzt werden. Unter anderem behandelt das Kapitel Korrelationsgraphen, Gaußsche graphische Modelle und Bayessche Netzwerke.
Kapitel 3: Rekonstruktion transkriptioneller regulatorischer Netzwerke Ich entwickele ein statistisches Modell für Daten aus gene silencing Experimenten. In Experimenten lässt sich nur schwer bestimmen, wie weit die Expression des Ziel-Gens tatsächlich unterdrückt wurde. Ich modelliere dieses stochastische Verhalten, indem ich lokale a priori-Verteilungen anpassen. Das Ergebnis des Kapitels ist eine Theorie sogennanter probabilistic soft interventions.
Kapitel 4: Rekonstruktion von Protein-Signalwegen Die Unterdrückung von Proteinen, die zu Beginn von Signalketten stehen, resultiert in mehr Phänotypen als das Ausschalten von Proteinen am unteren Ende der Hierarchie. Ich formalisiere diese Idee in einem mehrstufigen Modell. Es enthält eine unbeobachtbare regulatorische Hierarchie von Signalmolekülen, deren knockdown zu beobachtbaren Phänotypen führt. Teilmengen-Beziehungen auf der Menge der beobachteten Phänotypen ermöglichen es, die regulatorische Hierarchie zu rekonstruieren. Ich demonstriere den Nutzen unserer Methode in Simulationsexperimenten und an einem biologischen Beispiel in Drosophila melanogaster.