The chloride channel regulators, calcium activated (CLCA) gene family has mainly been associated with cancer and chronic inflammatory airway diseases but the presumably complex cellular functions of these gene products are still widely unknown. The family comprises four distinct genetic clusters in mammals, termed CLCA1 to CLCA4. It is highly complex and diverse and includes amplified or inactivated genes with a high degree of variation between species. For example, in contrast to mice with eight CLCAs including one inactivated gene, humans have only three intact CLCAs and one inactivated gene. The tissue and cellular expression patterns of different CLCA homologues within a species are also often redundant. This complexity and redundancy of the CLCA members might be a reason, why the function of this gene family has not been revealed yet based on a mammalian model organism. The complexity and redundancy of mammalian CLCAs raise two questions: Are the complexity and diversity of these genes unique features of mammals? And second, what is the evolutionary background of these peculiar developments? To address these questions, data on CLCA homologues obtained from evolutionarily more distant species are needed. Recently, a rather simple CLCA gene locus was predicted for the chicken, comprising only two CLCA genes. In a phylogenetic analysis, the first galline CLCA gene product, gCLCA1, was found closely related to mammalian CLCA1, 3 and 4. In contrast, the second one, gCLCA2, seemed more closely related to mammalian CLCA2 than to gCLCA1 or mammalian CLCA1, 3 and 4. In this cumulative thesis, the galline CLCA genes and their genomic structures were analyzed and both members were cloned. Their protein architecture and biochemical properties were investigated in silico and in vitro. In addition, their mRNA as well as their cellular protein expression patterns were analyzed. All data were compared to mammalian CLCA1, 2, 3, and 4. Both avian proteins are encoded by 14 exons and are located in a conserved locus between the Outer Dense Fiber of Sperm Tails 2-Like (ODF2L) and SH3-Domain GRB2-Like Endophilin B1 (SH3GLB1) genes. gCLCA1 combines many properties of mammalian CLCA1, 3 and 4 as it was shown to be a cleaved protein with a typical CLCA domain architecture. Despite its relatively high phylogenetic distance to mammalian CLCA4, it shares most common traits with this member. This includes heavy asparagine-linked glycosylation, the presence of a transmembrane domain in the carboxy-terminal cleavage product and protein expression in the apical membrane of enterocytes. In contrast, gCLCA2 was highly similar to mammalian CLCA2 in terms of its protein architecture, cleavage and glycosylation. These findings were in line with results from in silico analyses of CLCA2 sequences from other avian species.Furthermore, the presence of a transmembrane domain in the carboxy-terminal cleavage product and its expression in keratinocytes are traits of avian CLCA2, which are also found in mammalian CLCA2. Interestingly, and as opposed to the expression patterns of mammalian CLCA proteins, no overlapping tissue or cellular expression patterns were detected for the two galline CLCA members. Based on these findings, CLCA2 appears to be highly conserved among birds and mammals. The results allow to speculate that a hypothetical gene ancestor was expressed in keratinocytes of a common ancestral species before mammalian and avian lineages diverged. This high degree of CLCA2 conservation is in contrast to gCLCA1 and mammalian CLCA1, 3 and 4. During evolution, a hypothetical ancient ancestor of gCLCA1 / mammalian CLCA1, 3, and 4, was likely expressed by enterocytes of a common ancestral species of mammals and birds. The hypothetical ancestral gene seems to have expanded by gene duplications in the mammalian lineage, which did not occur in birds. Besides that, these findings cannot only be used to unveil the evolutionary history of the CLCA family but should be taken into account with regard to the selection of an animal model for the functional analysis of these genes. The chicken might serve as a promising species for knockout models to study CLCA2 functions in vivo. Results obtained from such a knockout chicken are likely transferable to mammalian CLCA2 due to the high degree of conservation. A chicken gCLCA1 knockout model might provide data, which might be transferred most likely to mammalian CLCA4 genes in the gut, as both share a similar cell type specific protein expression in this microenvironment, a similar protein architecture as well as similar biochemical properties. At the transition to the post-genomic era with publically accessible information on gene structures as well as nucleotide and protein sequences of various species, comprehensive analyses of gene families across species have become possible. The comparison of such data in combination with the comparison of gene related information, including cellular expression patterns and biochemical properties, is a powerful approach to enlighten the evolutionary background of proteins. Furthermore, it might be beneficial to identify the most suitable animal model for further functional and biomedical studies.
Die CLCA, engl. „chloride channel regulator, calcium-activated“ Genfamilie wird hauptsächlich mit Krebserkrankungen sowie chronisch entzündlichen Atemwegserkrankungen in Zusammenhang gebracht. Die mutmaßlich komplexen Funktionen dieser Gene sind bisher jedoch noch weitgehend unbekannt. Die CLCA Genfamilie umfasst bei Säugetieren vier verschiedene Cluster, die als CLCA1 bis CLCA4 bezeichnet werden. Sie zeichnet sich durch eine außerordentliche Komplexität und Vielfältigkeit aus und beinhaltet tierartlich variierend amplifizierte und inaktivierte Gene. So besitzt der Mensch beispielsweise drei intakte CLCAs sowie ein inaktiviertes Gen, wohingegen die Maus über 8 CLCAs verfügt, von denen ebenfalls eines als inaktiviertes Gen vorliegt. Darüber hinaus sind die Gewebe- und Zellexpressionsmuster der CLCA-Homologen auch innerhalb einer Spezies häufig redundant. Diese Komplexität und Redundanz von CLCA könnten Gründe sein, welche die Aufdeckung der Funktion dieser Genfamilie im Säugetiermodell bisher erschwerte. Damit stellen sich zwei Fragen: Ist die Komplexität dieser Genfamilie eine Eigenart der Säugetiere? Und was ist der evolutionäre Hintergrund für diese Entwicklungen? Um diese Fragen zu beantworten, werden Daten über CLCA benötigt, die von evolutionär weiter entfernten Arten stammen. Kürzlich wurde für das Huhn ein relativ einfacher CLCA Genlokus vorhergesagt, welcher nur zwei CLCA Gene umfasst. Das erste CLCA Genprodukt des Huhns, gCLCA1, zeichnet sich durch eine besondere phylogenetische Nähe zu CLCA1, 3 und 4 der Säugetiere aus. Im Gegensatz dazu ist das zweite CLCA Genprodukt, gCLCA2, näher mit Säuger-CLCA2 verwandt als mit gCLCA1 oder Säuger-CLCA1, 3 oder 4. In dieser kumulativen These wurden die gallinen CLCA Gene sowie deren genomische Struktur analysiert und beide Homologe wurden kloniert. Darüber hinaus wurde deren Proteinarchitektur und die biochemischen Eigenschaften in silico und in vitro untersucht. Weiterhin wurden die mRNA- und zellulären Proteinexpressionsmuster im Vergleich zu CLCA1, 2, 3 und 4 bei Säugetieren analysiert. Beide Vogelproteine werden von 14 Exons kodiert und befinden sich an einem konservierten Ort zwischen den ODF2L, engl. „Outer Dense Fiber of Sperm Tails 2-Like” und SH3GLB1, engl „SH3-Domain GRB2-Like Endophilin B1“ Genen. gCLCA1 vereint mit seiner Proteinspaltung sowie der Proteinarchitektur viele Eigenschaften von CLCA1, 3 und 4 der Säugetiere. Trotz einer relativ großen phylogenetischen Entfernung zu Säuger-CLCA4 weist es jedoch die meisten gemeinsamen Merkmale mit diesem CLCA-Vertreter auf. Hierzu zählen eine starke, an Asparagin gekoppelte Glykosylierung, eine Transmembrandomäne im carboxyterminalen Spaltprodukt und eine Proteinexpression in der apikalen Membran von Enterozyten. Im Gegensatz dazu ist gCLCA2 dem Säugetier-CLCA2 in Bezug auf dessen Phylogenie, Proteinarchitektur, Spaltung und Glykosylierung sehr ähnlich. Diese Befunde ließen sich mittels in silico Analysen auch für weitere aviäre CLCAs nachweisen. Daneben sind die Präsenz einer Transmembrandomäne im carboxyterminalen Spaltprodukt und die Expression in Keratinozyten Merkmale des aviären CLCA2, die auch bei Säugetier-CLCA2 vorzufinden sind. Bemerkenswerterweise fanden sich im Gegensatz zu den Säuger-CLCAs bei den gallinen CLCA-Mitgliedern keine überlappenden gewebe- und zellspezifischen Expressionsmuster. Unter Betrachtung dieser Befunde erscheint CLCA2 bei Vögeln und Säugetieren stark konserviert zu sein. Weiterhin lässt sich auf Basis der in dieser kumulativen These erhobenen Daten spekulieren, dass ein hypothetischer gemeinsamer genetischer Vorfahre wahrscheinlich in Keratinozyten eines gemeinsamen Vorfahren von Vögeln und Säugern exprimiert wurde. Dieser hohe Grad an Konservierung von CLCA2 steht im Gegensatz zu demjenigen von gCLCA1 und Säugetier-CLCA1, 3 und 4. Im Laufe der Evolution scheint ein hypothetischer genetischer Vorfahre von gCLCA1/Säugetier-CLCA1, 3 und 4 vermutlich in Enterozyten eines gemeinsamen Vorfahren von Vögeln und Säugern exprimiert worden zu sein. Dieser hypothetische genetische Vorfahre scheint durch Genduplikationen bei Säugetieren expandiert zu sein, nicht jedoch bei Vögeln. Neben diesen Aussagen zu einem wahrscheinlichen evolutionären Szenario der CLCA Genfamilie zwischen Vogel und Säuger lassen sich die Ergebnisse jedoch auch zur Auswahl eines Modellorganismus zur funktionalen Analyse dieser Gene nutzen. Hierbei erscheint das Huhn zur Untersuchung der CLCA2-Funktion in vivo ein vielversprechender Kandidat für knockout-Modelle, deren Untersuchungsergebnisse durch den Grad an Konservierung mit hoher Wahrscheinlichkeit auf Säugetiere übertragbar sind. Ein gCLCA1-Knockoutmodell könnte hingegen Daten liefern, die hochwahrscheinlich auf CLCA4 Gene von Säugetieren im Darm übertragbar sind, da beide in dieser anatomischen Lokalisation ein vergleichbares zellspezifisches Expressionsmuster sowie eine ähnliche Proteinarchitektur und biochemische Eigenschaften besitzen. Im Anbruch des postgenomischen Zeitalters, in dem Genstrukturen sowie Nukleotid- und Proteinsequenzen verschiedener Spezies öffentlich leicht zugänglich sind, werden umfassende, vergleichende Analysen von Genfamilien über verschiedene Spezies hinweg möglich. In Kombination mit dem Vergleich von genbezogenen Daten wie zellulären Expressionsmustern oder biochemischen Eigenschaften der Genprodukte ist dies ein wirkungsvolles Vorgehen, um den evolutionären Hintergrund von Proteinen aufzudecken und das geeignetste Tiermodell für weitere wissenschaftliche Fragestellung auszuwählen.