Chromosome conformation capture methods have identified sub-mega base structures of higher-order chromatin interactions in vertebrates called topologically associating domains (TADs) that are separated from each other by TAD boundaries. TADs subdivide the genome into discrete chromatin domains that direct the contacts enhancers can establish with their target genes. However, the mechanisms that underlie the partitioning of the genome into TADs and how this might be disturbed by structural variations (SVs), such as duplications, remain poorly understood. Here I show by capture Hi-C and 4C-seq that the SOX9 locus is spatially subdivided in two TADs in humans and mice, one comprising SOX9 (SOX9 TAD), the other the neighboring genes KCNJ2 and KCNJ16 (KCNJ TAD). LacZ expression analysis of reporter insertions in both TADs revealed that this spatial organization confines the cis-regulatory activity at the locus. Furthermore, I show in patient samples and genetically modified mice that tandem duplications in this region can interfere with TAD structure, resulting in the formation of new chromatin domains (neo-TADs). Neo-TADs are functionally and spatially separated from their neighboring KCNJ and SOX9 TADs and thereby determine the duplications’ pathogenesis. In humans, partially overlapping duplications upstream of SOX9 can cause female-to-male sex reversal, can have no phenotypic effect, or result in a limb malformation called Cooks syndrome. Duplications that occur within the SOX9 TAD but do not extend over the TAD boundary (intra-TAD), cause sex reversal. The duplicated cis-regulatory region showed increased contacts with the target gene SOX9 and only within the SOX9 TAD. In contrast, duplications expanding over the TAD boundary into the neighboring KCNJ TAD (inter-TAD), result in the formation of neo-TADs. The duplicated SOX9 regulatory region is insulated inside the neo- TAD and has no effect on gene regulation and no phenotypic consequence. In the Cooks syndrome associated duplications, however, incorporation of the next flanking gene, KCNJ2, in the neo-TAD leads to consecutive misexpression of KCNJ2 in a SOX9-like expression pattern. As a consequence, these mice have a limb malformation phenocopying Cooks syndrome. Further, I validate the insulating function of TAD boundaries in regular TADs and in the neo-TAD. Loss of boundaries leads to a partial loss of insulation and ectopic interactions across TADs, which is accompanied by misregulation of genes in the adjacent TADs. Besides giving important insights into the relationship of chromatin architecture and gene regulation, the results provide a framework for the interpretation of SVs in respect to disease. SVs are routinely detected in diagnostic tests for genetic diseases and cancer and their assessment according to changes in the TAD structure and enhancer-promoter interactions is critical for the identification of potential disease causing genes.
Messungen von Chromatin-Interaktionen mittels “Chromosome-Conformation- Capture“ (3C) haben gezeigt, dass das Genom von Witbeltieren in “Topologically associating domains“ (TADs) unterteilt ist. TADs haben entscheidenden Einfluss auf die Genexpression, da sie regulatorische Elemente zu ihren Zielgenen führen. Regionen innerhalb einer TAD weisen eine hohe Interaktionsfrequenz auf und benachbarte TADs sind von Grenzbereichen, sogenannten “Boundary-Regionen“ voneinander isoliert. Allerdings sind die Mechanismen, die zur Bildung von TADs führen und welche Rolle sie bei strukturellen Veränderungen im Genom spielen, unzureichend verstanden. In der vorliegenden Arbeit wurden die Chromatin-Struktur am SOX9 Lokus mit 3C Methoden (capture Hi-C und 4C-seq) im Mensch und in der Maus untersucht. Der Lokus ist in zwei TADs unterteilt, wobei die SOX9-TAD das SOX9 Gen und die benachbarte KCNJ-TAD die zwei Gene KCNJ2 und KCNJ16 enthält. Die Expressionsanalyse von LacZ-Reporter Insertionen in beiden TADs zeigte, dass die regulative Aktivität durch die TAD-Struktur begrenzt wird. Darüber hinaus ergab die Analyse von Patientenzellen und genetisch veränderten Mäusen, dass Tandem-Duplikationen diese TAD-Struktur verändern können. Duplikationen können zur Bildung neuer TADs (neoTADs) führen, die räumlich und funktionell von benachbarten TADs getrennt sind. Ihre Entstehung kann verschiedene Krankheitsbilder erklären, die durch überlappende Duplikationen beim Menschen beobachtet werden. Je nach Lage der Duplikation relativ zu SOX9 sind diese entweder ohne phänotypische Ausprägung, verursachen eine Umkehrung des Geschlechts oder führen zu einer Gliedmaßenfehlbildung, dem Cooks Syndrom. Intra-TAD Duplikationen, die regulatorische Regionen innerhalb der SOX9-TAD betreffen, verursachen Geschlechtsumwandlung. Die duplizierte Region weist dabei eine erhöhte Interaktionsfrequenz mit SOX9 auf. Im Gegensatz dazu führen inter-TAD Duplikationen, die Bereiche der SOX9- und KCNJ-TAD umfassen und somit eine Boundary-Region beinhalten, zur Entstehung einer neo-TAD. Der duplizierte regulatorische Bereich ist in der neo-TAD isoliert und hat dadurch keinen Einfluss auf die Genexpression und keine phänotypische Konsequenz. Größere inter-TAD Duplikationen beinhalten zudem KCNJ2 und führen zum Cooks Syndrom. In der entstehenden neo-TAD wird KCNJ2 mit regulatorischen Bereichen von SOX9 neu kombiniert. Dies hat zur Folge, dass KCNJ2 ein SOX9-ähnliches Expressionsmuster in den Gliedmaßen annimmt, was zu einem Cooks-ähnlichen Phänotyp in der Maus führt. Die hier präsentierten Ergebnisse geben wichtige Einblicke in das Zusammenspiel von Chromatin- Struktur und Generegulation und bilden einen konzeptionellen Rahmen zur Interpretation von strukturellen Variationen im Genom. Duplikationen werden als häufige Ursache bei Erbkrankheiten und Krebs identifiziert und durch die Einbeziehung der TAD-Struktur können wesentlich genauere Aussagen über die Auswirkungen dieser Mutationen getroffen werden.