Inflammatory bowel disease (IBD) is a relapsing chronic inflammatory disorder of the gastrointestinal tract. IBD and its two major sub-forms, namely Crohn's disease (CD) and ulcerative colitis (UC), are typical complex diseases thought to be caused by the intricate interplay of genetic, environmental and immunological factors . Due to the extensive haplotype structures in the HLA region on chromosome 6, it is impossible to disentangle the genetic association found for IBD and to single out potentially disease causing genes. The present study was based on the premise that disease-associated genes exhibit aberrant expression or splicing patterns. The first aim was to construct an HLA-microarray to investigate the transcriptome of the HLA linkage region. To gather as many genes as possible, including known and unknown genes, we developed an algorithm to merge four different transcript databases (Ensembl core, Ensembl ESTgene, Vega and RefSeq). We then developed a second algorithm to down-size the local and global redundancy created by pooling the data sources. This unique enrichment strategy tripled and quadrupled the transcript-count in the HLA region compared to the RefSeq database and the Affymetrix HU 133A microarrays, respectively. Microarray probe placement is crucial to discern expression levels of different transcripts of a gene. Therefore, in order to develop the optimal probe placement strategy, we investigated the limits of microarray technology in accordance to recent work on specificity. At most 51% of transcripts and 13% of exons contain a transcript-specific stretch to design oligonucleotide probes of length 50 nt. The chosen strategy designed two probes: on probe to catch the maximum number of transcript models and one probe for each transcript model with transcript-specific sequence. This strategy was shown to be the most efficient among four strategies compared. The HLA chip was manufactured at the Max Planck Institute for Molecular Genetics. Control measures on drop out rate, dynamic range and ratio correctness confirmed the chips' high quality for subsequent expression experiments. The second objective of this study was to investigate differential gene expression in IBD patient samples (n = 24) and normal controls (n = 6). Specific focus was placed on differential expression of splicing factors and intron-retention in IBD, since aberrant splicing had recently been shown to contribute to a number of human diseases. To date, the role of splicing factors and intron-retention events has not been described in the context of IBD. This study is the first to identify 47 splicing factors and 33 intron-retention events that were differentially regulated in mucosal tissue of IBD patients. In the third part of this work, we verified our findings on seven splicing factors (DUSP11, HNRPAB, HNRPH3, SLU7, SFR2IP, SFPQ, SF3B14) and three intron-retention events (IER3, FGD2, PARC) in a patient cohort of 195 individuals. Stratification by disease type and inflammation status revealed that most of our results were indeed specific for IBD and its subtypes. In silico analysis on FGD2, PARC and IER3 identified several binding sites for splicing factors that are regulated in IBD. These results suggest a link between splicing factors and intron- retention in the context of IBD pathology. Additionally, a structural analysis of IER3 mRNA revealed a RNA transport element-like structure, which could allow the IER3 intron-retention transcript to travel into the cytoplasm, where it can interfere with NFkB pathways and influence IBD pathology. This study demonstrates for the first time the potential impact of regulated splicing factors and regulated intron-retention in the pathogenesis of chronic inflammation in barrier tissues, exemplified by IBD.
Morbus Crohn (MC) und Colitis Ulcerosa (CU); Hauptformen der chronisch entzündlichen Darmerkrankungen (CED); weisen steigende Patientenzahlen in industrialisierten Ländern auf. Nach heutigem Verständnis ist ein Zusammenwirken verschiedener Faktoren (Genetik, Umwelt, Immunsystem) wesentlich für die Pathogenese der CED. Aufgrund der genetischen Kopplung innerhalb der HLA-Region auf Chromosom 6 ist es schwierig die genetischen Assoziationen zu CED einzelnen Genen zuzuordnen. Die Annahme, dass pathogenese-relevante Gene ein verändertes Expressions- oder Splice-Muster aufweisen initiierte diese Arbeit. Erste Aufgabe war die Erstellung eines Microarrays zur Untersuchung der Genaktivität der HLA Region. Um den Sequenzraum zu erweitern wurden ein Algorithmus entwickelt, der die Integration von vier Sequenz-Datenbanken (Ensembl core, Ensembl ESTgene, Vega and RefSeq) über die "golden path" Koordinaten ermöglicht. Die lokale und globale Redundanz, die bei Integration von vier Datenbanken entsteht, wurde durch einen weiteren Algorithmus minimiert. Die Anzahl der HLA-Transkripte wurde durch diese neue Strategie gegenüber der RefSeq Datenbank verdreifacht, gegenüber dem Affymetrix Microarray HU 133 vervierfacht. Um die Expressions- Aktivität auf Transkriptebene zu untersuchen, wurde eine Strategie zur Kombination von Microarray Sequenzen (Proben) entwickelt. In diesem Zusammenhang wurden die Spezifitätsgrenzen der Microarray-Technologie ermittelt und die Ergebnisse genutzt um die Effizienz verschiedene Kombinations-Strategien zu vergleichen. Da maximal 50% der Transkripte und 13% der Exons eine transkript-spezifische Sequenz (> 50nt) aufweisen wurde die effizienteste von vier Strategie verwand, welche eine Probe für alle Transkripte eines Gens erstellt neben zusätzlichen Proben pro Transcript mit transkript-spezifischer Sequenz. Der HLA-Chip wurde am MPI für Molekulare Genetik hergestellt. Interne Kontrollen zu dynamischem Umfang sowie Veränderungen der Messwerte (Ratio) zeigten die gute Funktionalität des HLA Microarray. Der zweite Teil dieser Arbeit analysiert die Expressionsmustern in Darmepithel-Biopsien. 24 Patienten mit CED, sowie 6 Probanten ohne CED wurden mit Hilfe von 60 Microarray Experimenten untersucht. Erstmalig für CED wurden die Expressionsmuster von Splicefaktoren sowie Intron-Sequenzen analysiert, da veränderte Splice-Muster kürzlich mit der Pathogenese verschiedener Erkrankungen assoziiert wurden. 47 der 149 Splicefaktoren und 33 der 145 Intron-Sequenzen zeigten veränderte Expressionsmuster in Krankheit und/oder Entzündung. Im dritten Teil wurden die Ergebnisse für sieben Splicefaktoren (DUSP11, HNRPAB, HNRPH3, SLU7, SFR2IP, SFPQ, SF3B14) und drei Intron-Sequenzen (IER3, FGD2, PARC) in einer Kohorte von 195 Individuen per Real-time-PCR Analyse verifiziert und stratifiziert. Die Resultate zu Splicefaktoren und Intron-Sequenzen erwiesen sich als spezifisch für CED sowie deren Untergruppen. Als Bindeglied zwischen differentieller Expression der Splicefaktoren sowie den Intron-Sequenzen konnten Splicefaktor-Bindestellen für in CED regulierte Splicefaktoren durch "in Silico" Analyse von FGD2, PARC und IER3 festgestellt werden. Die mRNA Sequenz von IER3 wurde zusätzlich einer Strukturanalyse unterzogen und ein Abschnitt identifiziert dessen Struktur der eines RNA Transport Elements ähnelt. Diese Studie demonstriert erstmalig die Bedeutung der Regulation von Splicefaktoren und Intron-Sequenzen in chronisch entzündlichen Darmerkrankungen.