This work presents the bioinformatic part of an integrative approach to analyze vertebrate cardiac transcription networks. Bioinformatic analyses of a number of high-throughput experiments elucidated regulatory dependencies driving correct spatiotemporal transcription by the interplay between combinatorial transcription factor (TFs) binding and co-occurring histone modifications (HMs). Key genes were characterized in terms of their association with cardiac disease and a database containing current knowledge in heart and muscle gene regulatory associations was implemented. Analysis of the four key cardiac TFs Gata4, Mef2a, Nkx2.5 and Srf using binding site detection by chromatin immunoprecipitation followed by array analysis (ChIP- chip) and knockdown of these TFs using siRNAs revealed highly overlapping binding sites as well as regulated target genes. Interestingly, those genes that had a high number of binding TFs were less likely differentially expressed in the knockdown of the four TFs, pointing to a buffering effect of combinatorial binding, where the remaining factors stabilize gene expression even if a single TF is missing. Co-occurrence analysis with four activating HMs revealed that the activating potential of Gata4, Nkx2.5 and Srf was highly dependent on the co-occurrence with HM marks, while no such dependency could be revealed for Mef2a. For Srf, histone 3 acetylation (H3ac) was revealed as the only important interacting modification. This was substantiated by additional ChIP experiments followed by next-generation Illumina sequencing (ChIP-seq), which also revealed that the presence of H3ac tags can buffer the expression of Srf targets even after knockdown of Srf. To gain further insights into Srf-driven gene transcription, the binding of Srf, the acetyltransferase p300 and the presence of H3ac and histone 3 lysine 4 di- methylation were subsequently analyzed in selected regulatory regions in a mouse heart time-series around birth using ChIP followed by real-time qPCR. The analysis revealed high correlation in the enrichments of the individual factors over time. One- and two-factor linear models confirmed and substantiated a link between Srf and H3ac through p300. Thus, they also implied so far unknown ways of coupling between the two TFs. Changes in the analyzed factors were shown to have a regulatory input on nearby gene expression levels. To investigate the significance of found regulatory implications, 42 selected genes were screened in patients with a broad panel of congenital heart disease. Using linear models, specific molecular portraits associated to phenotypic subgroups were identified. Further, using correlated expression and TF binding site prediction, optimized using the previously analyzed ChIP datasets, cardiac regulatory networks were revealed, which were verified by experimental, literature and bioinformatic data. Finally, the ‘CArdiovascular Regulatory INteraction’ database was implemented, integrating experimental results from several species with publicly available annotations and offering a sophisticated user interface which provides an easy and comfortable data overview using dynamic network representations and detailed information for individual genes at the same time. The database was developed to enable the integrated view of data generated within the European project HeartRepair and to promote future research in this field. In summary, the presented analyses revealed high complexity of the genetic and epigenetic levels of cardiac gene regulatory networks and a high interdependency between these.
Die Arbeit stellt eine bioinformatische Analyse transkriptioneller Netzwerke am Modell des Wirbeltierherzens vor. Durch aktuellste experimentelle Techniken gewonnenen Datensätzen wurden untersucht und Abhängigkeiten innerhalb der regulierenden Netzwerke aufgezeigt. Das Zusammenspiel von gemeinsamer Bindung von Transkriptionsfaktoren (TF) an Genpromotoren und das gleichzeitige Vorkommen von Histonmodifikationen (HM) wurde näher untersucht. Weitere Schwerpunkt waren die Bestimmung von deregulierten Genen in Patienten mit angeborenen Herzfehlern und der Aufbau einer Datenbank für herz- und muskelspezifische Genregulation. Die Analyse von Chromatin-Immunoprezipitation mit anschließender Mikro-Array-Detektion (ChIP-chip) für die TF Gata4, Mef2a, Nkx2.5 und Srf sowie von siRNA-Knockdowns derselben TF ergab eine hohen Zahl gemeinsamer Bindestellen und regulierter Zielgene. Dabei waren genau die Gene, die die höchste Zahl an Bindestellen aufwiesen, am seltensten im jeweiligen Knockdown differentiell exprimiert. Dies weist auf einen Puffereffekt durch kombinatorische TF-Bindung hin, wobei Gata4, Mef2a, Nkx2.5 und Srf die Expression von Zielgenen aufrecht erhalten, selbst wenn ein einzelner TF fehlt. Die Untersuchung von TF-Bindestellen und HM verdeutlichte, dass Gata4, Nkx2.5 und Srf ihr aktivierendes Potential nur zusammen mit HM entfalten können. Für Srf konnte die Acetylierung von Histone 3 (H3ac) als einziger bestimmender Faktor isolieren werden. Weitere ChIP-Experimente mit anschließender Next-Generation-Sequenzierung (ChIP-seq) untermauerten die Ergebnisse und deuteten zudem einen Puffereffekt von H3ac auf die Srf- Zielgenexpression im Srf-Knockdown an. Nachfolgend wurde das Zusammenspiel der Bindung von Srf und der Acetyltransferase p300 sowie den zwei HM H3ac und H3-Lysin-4-Dimethylierung in einer Mauseherz-Zeitreihenanalyse mittels ChIP gefolgt von quantitativer Real-Time-PCR untersucht. Die Analyse ergab eine hohe zeitliche Korrelation der untersuchten Faktoren, die durch den Einsatz linearer Modelle weiter untermauert werden konnte und den bereits vorher bekannten funktionelle Link zwischen p300, Srf und H3ac bestätigte. Zudem ergab die Analyse potentiell weitere von p300 unabhängige Interaktionen zwischen H3ac und Srf. Weiterhin wurde die Auswirkung veränderter TF- und HM- Bindung auf die Expression benachbarter Gene gezeigt. Nachdem die vorangegangenen Analysen sich auf transkriptionelle Netzwerke in Zellkultur und Mausherzen fokussierte, wurde die Expression von 42 ausgewählten Genen in Patienten mit verschiedenen angeborenen Herzfehlern untersucht. Dabei konnten phänotypischen Subgruppen spezifische molekulare Expressionsmuster zugeordnet werden. Mit einer Kombination aus korrelierter Expression und der Vorhersage von TF-Bindestellen, optimiert anhand der untersuchten ChIP-Datensätze, wurden transkriptionelle kardiale Regulationsnetzwerke vorhergesagt und mittels mehrerer biochemischer, bioinformatischer und Literaturdatensätze verifiziert. Abschließend wurde die „CArdiovascular Regulatory INteraction“-Datenbank implementiert zur Integration der experimentellen Ergebnisse mit öffentlich Datensätzen. Im Vordergrund stand eine fortgeschrittenen Visualisierung, die sowohl Netzwerke Informationen für einzelne Gene dynamisch darstellt. Dies soll eine Grundlage schaffen für weiterführende biologische und bioinformatische Analysen der erarbeiteten Ergebnisse.