Organisms have evolved cell types for different functions. Transcriptional regulation of subsets of genes by binding of transcription factors (TFs) to DNA sequences within regulatory regions is essential to manifest cellular phenotypes. Examination of genomic binding sites of the glucocorticoid receptor (GR), a hormone inducible TF, showed that only a small percentage of many possible GR binding sequences in the genome is actually GR-bound. Furthermore, only a fraction of the GR-bound regions appeared to contain the classical GR consensus sequence, indicating that this sequence is neither necessary nor sufficient to explain GR binding. This raises two questions: First, what features of the chromatin landscape discriminate bound from unbound GR binding sequences and second, what sequences, other than the classical binding sequence, can recruit GR to the genome? Density and organization of DNA-enwound nucleosomes divides the genome’s chromatin landscape into TF-accessible “open“ and “closed“ regions. Our GR chro- matin immunoprecipitation (ChIP) showed a predominant GR-binding to “open“ chromatin, with one distinctive feature: A specific depletion of GR-binding at pro- moter regions of the “open“ chromatin universe. This depletion could be explained to some extend by a reduced frequency of GR’s canonical motif- matching sequences in these regions. However, sequence composition of promoter regions explains only part of the depletion and our Hierarchical Bayes Modeling of GR-binding, using chromatin marks as model features, indicated additional candidate mechanisms. For example, we found typical promoter marks (e.g. H3K9ac) to be negatively correlated with GR-binding in the “open“ chromatin universe. These acetylation marks are set by histone acetyltransferases that can also post-translationally modify GR and attenuate its interaction with DNA (Kino & Chrousos 2011) thereby providing a possible explanation for the promoter-proximal depletion observed. As we found that a large fraction of GR-bound regions lack a canonical GR binding sequence, we asked what sequences recruit GR to individual loci? To identify these sequences at high resolution, we used ChIP-Exo, taking advantage of an exonuclease trimming of ChIP fragments to the protein:DNA cross-linking point which protects the DNA from further digestion. We exploited this signal by determining footprint profiles of TF binding at single base pair resolution, using ExoProfiler, a computational motif-based pipeline. Comparison of our and the few public available ChIP-Exo datasets revealed: footprints are protein and recognition-sequence-specific signatures of TF binding sites that allow to distinguish direct and indirect (tethering to other DNA-bound proteins) GR binding and captures information about TFs other than the one directly targeted by the antibody. We show that the absence of classical recognition sequences can be explained, in part, by direct GR binding to degenerate canonical GR binding sequences. Furthermore, my study identified a new mode of DNA binding, where GR binds as a heterodimer together with a member of the ETS or TEAD families of TFs. Finally, our studies indicate that GR can be recruited indirectly to the genome via FOX or STAT proteins. Together, our generically applicable footprint-based approach uncovers new structural and functional insights into the diverse ways of genomic cooperation and association of GR.
Zelltypen entwickelten sich, um die unterschiedlichen Funktionen eines Organismus zu erfüllen. Die spezifische Regulation der genetischen Information ist essentiell für die Aufrechterhaltung der einzelnen Zellphänotypen und wird durch die Bindung von Transkriptionsfaktoren an DNA-Sequenzen innerhalb regulatorischer Regionen ermöglicht. Untersuchungen an dem Glucocorticoid- Rezeptor (GR), einem hormonabhängigen Transkriptionsfaktor (TF), zeigten, dass nur ein kleiner Anteil aller möglichen genomischen GR-Bindesequenzen tatsächlich von GR gebunden wird. Zudem weist nur ein Bruchteil aller GR- Bindestellen eine klassische GR-Bindesequenz auf. Dies lässt den Schluss zu, dass diese DNA-Sequenz weder notwendig, noch ausreichend ist, um zu erklären wo GR im Genom bindet. Es stellen sich daher zwei Fragen: 1.) Lassen sich Unterschiede in der Chromatinlandschaft identifizieren, welche die genomischen Bindestellen von GR erklären und 2.) welche Sequenzen, neben den klassischen GR-Bindesequenzen, bewirken eine genomische Binding des GR? Ein Merkmal des Chromatins ist die Organisation von DNA in Nukleosomen, deren Verpackungsgrad das Genom in für TF zugängliche „offene“ und „geschlossene“ Bereiche teilt. Unsere GR-Chromatin-Immunpräzipitationen (ChIP) wiesen eine deutliche Präferenz der Binding von GR zu „offenem“ Chromatin auf, allerdings mit einer Besonderheit: GR bindet in „offenem“ Chromatin deutlich vermindert an Promoterregionen. Dies konnte teilweise durch eine verminderte Häufigkeit an Sequenzen, die dem klassischen GR-Motiv entsprechen, erklärt werden. Wir fanden jedoch auch Hinweise für zusätzliche Mechanismen. Hierarchical Bayes Modeling von GR-Bindestellen und Chromatinmerkmalen zeigte eine negative Korrelation von promoterspezifischen Histonmodifizierungen (z.B. H3K9ac) und der Binding von GR. Die für die Histonacetylierung verantwortlichen Histonacetyltransferasen verändern ebenfalls GR posttranslational und schwächen somit seine Interaktion mit der DNA (Kino & Chrousos 2011), was eine zusätzliche Erklärung für die von uns gefundene, verminderte promoterproximale Bindung von GR sein könnte. Da die Sequenzanalyse von GR-Bindestellen eine große Anzahl GR gebundener Regionen aufwies, die keine klassische GR- Bindesequenz enthielten, fragten wir uns, welche zusätzlichen Sequenzen in der Lage sind, GR an spezifische Loci zu rekrutieren. Um solche Sequenzen mit hoher Auflösung zu identifizieren, verwendeten wir eine modifizierte Version des klassisches ChIPs bei der eine Exonuclease die ChIP-Fragmente bis zur Crosslink-Stelle von Protein:DNA- Interaktionstelle degradiert (ChIP-Exo). Die zuvor durch Formaldehyd- Quervernetzung fixierte Interaktionsstelle schützt die DNA vor weiterer Degradierung. Mittels unseres ExoProfilers, einem computergestützten und motivbasierten Ansatz zur Identifizierung von TF- Bindestellen, wurden die resultierenden Next-Generation-Sequencing-Signale zu sogenannten footprint profiles von TF-Bindestellen mit basenpaargenauer Auflösung verrechnet. Der Vergleich unserer und der wenigen frei verfügbaren ChIP-Exo-Daten machte deutlich, dass footprints protein- und sequenzspezifische Merkmale von TF-Bindestellen sind. Dieses Wissen ermöglichte uns, zu unterscheiden, ob GR direkt oder indirekt (über ein zusätzliches Protein; tethering) an die DNA gebunden ist. Zudem erkannten wir, dass ChIP-Exo Informationen über Transkriptionsfaktoren liefert, die zusätzlich zu dem mit dem Antikörper erkannten TF am Genom gebunden sind. Wir konnten zeigen, dass das Fehlen einer klassischen GR-Bindesequenz teilweise mit dem Binden an degenerierte GR-Motive erklärt werden kann. Darüber hinaus konnten wir anhand meiner Experiment eine neue Art der GR-Binding identifizieren, bei der GR als heterodimer an die DNA bindet, zusammen mit Transkriptionsfaktoren von Mitgliedern der ETS- und TEAD-Proteinfamilie. Abschließend finden sich durch unsere Arbeit Hinweise darauf, dass die Rekrutierung von GR zu bestimmten genomischen Bereichen von Fox und ST A T Proteinen bewirkt wird. Zusammengefasst erlangen wir mit unserem allgemein anwendbareren und auf TF- footprints basierenden Ansatz strukturelle, sowie funktionelle Erkenntnisse, welche die vielfältigen Interaktionen auf genomischer Ebene im Allgemeinen und des GRs im Besonderen betreffen.