The recent development of new technologies for high throughput sequencing and genotyping of organisms and individuals, as well as the generation of new tools for large-scale genomic analysis, all available through different research institutions world-wide, have changed the way questions from the different fields of genetics are addressed. This thesis is an example of the use of such resources in combination with traditional laboratory methods, in order to approach two themes belonging to immunogenetics and population genetics: on the one hand, the olfactory receptor genes linked to the major histocompatibility complex (MHC-linked OR) and, on the other hand, the allele transmission distortion (TD) phenomenon. The concept of linkage disequilibrium (LD) is regarded as a connecting subject, being fundamental for the discussion of both themes. This thesis presents a detailed description of LD patterns both within MHC-linked OR genes, and between OR loci and the MHC. Through the analysis of OR polymorphisms and conserved MHC haplotypes and the genotyping of a known cohort of smokers and non smokers, we were able to describe the association of one OR polymorphism with smoking habits in Caucasian women. Furthermore, we analyzed genotypic and phenotypic variation of MHC-linked OR genes for 18 human cell lines based on the description of new polymorphisms and OR alleles, thereby forming a basis for the functional assessment of the participation of MHC-linked OR loci in mate choice. Moreover, we developed the most comprehensive comparison performed to date – both chromosomal and phylogenetic – of MHC-linked OR genes in fourteen vertebrate species, enabling us to derive conclusions about the phylogenetic history of gene families and species. Considering TD, we were successful in detecting this phenomenon, through a purely in silico analysis of healthy family trios, in a region of human chromosome 6p that harbours the transcription factor encoding loci SUPT3H (suppressor of Ty 3 homolog), RUNX2 (runt-related transcription factor 2), and the microRNA MIR586. In a follow-up investigation in which we genotyped a large, independent South American cohort, we were able to confirm the presence of TD in that chromosomal segment, at least for populations of Caucasian ancestry. Given the high medial relevance of RUNX2 and the corresponding encoded protein isoforms, our findings have considerable implications for the interpretation of the many studies that found this locus to be associated with different phenotypes such as cancer, bone density and developmental disorders. These results were compiled into track files for uploading into internet-based genome browsers. These can thus be visualized in the genomic context, and provide a first step towards a genome-wide TD resource. We additionally found TD to be intimately associated to LD in the loci assessed, leading us to hypothesise that TD might be actively shaping the LD landscape of genomes. Finally, our results indicate one potential technical problem with the database of the International HapMap Project, which we suggest should be addressed in future updates of this database.
Sowohl die jüngste Entwicklung neuer Technologien für die Hochdurchsatzsequenzierung und -genotypisierung von Organismen als auch die Erzeugung neuer Werkzeuge für großflächige genomische Analysen, die in letzter Zeit von verschiedenen Forschungsinstituten weltweit zur Verfügung gestellt wurden, haben die Art der Fragestellungen in den verschiedenen Arbeitsfeldern der Genetik stark beeinflußt. Die vorliegende Arbeit ist ein Beispiel für die Nutzung dieser Ressourcen in Verbindung mit traditionellen Labormethoden, um sich zwei Themenfeldern in den Bereichen Immun- und Populationsgenetik zu nähern: einerseits den mit dem Haupthistokompatibilitätskomplex gekoppelten Geruchsrezeptorgenen (aus dem Englischen, major histocompatibility complex- linked olfactory receptor genes, MHC-linked OR), und andererseits dem Phänomen der Allelweitergabedistorsion (transmission distortion, TD). Das Konzept des Kopplungsungleichgewichts (linkage disequilibrium, LD) ist für die Diskussion beider Themenfelder grundlegend. Mit Bezug auf die MHC-OR Gene präsentiert diese Arbeit eine detaillierte Beschreibung des LD Profils innerhalb der OR Gene sowie zwischen ihnen und dem MHC. Durch Analyse der OR Polymorphismen und konservierter MHC-Haplotypen sowie der Genotypisierung einer Kohorte von Raucherinnen und Nichtraucherinnen konnten wir den Zusammenhang zwischen einem OR Polymorphismus und dem Rauchverhalten europäischstämmiger Frauen beschreiben. Wir schilderten genotypische und phänotypische Variationen der MHC-OR Gene bei achtzehn menschlichen Zelllinien, indem wir neue Polymorphismen und OR Allele bestimmten, und damit die Grundlage für die Einschätzung der funktionalen Partizipation von MHC-linked OR bei der Partnerwahl schufen. Darüber hinaus führten wir einen chromosomalen und phylogenetischen Vergleich von MHC-OR Genen bei vierzehn Wirbeltierspezien durch und konnten Schlussfolgerungen über die phylogenetische Geschichte der Genfamilien und Tierarten ziehen. Bezüglich TD konnten wir dieses Phänomen durch eine reine in silico-analyse in einer Region des menschlichen Chromosoms 6p ermitteln, welche die Transkriptionsfaktorgene SUPT3H (suppressor of Ty 3 homolog), RUNX2 (runt-related transcription factor 2) sowie mikro RNA MIR586 beherbergt. In einer anschließenden Untersuchung, in der wir eine große unabhängige südamerikanische Kohorte genotypisierten, konnten wir die Anwesenheit von TD in diesem chromosomalen Segment, zumindest bei europäischstämmigen Populationen, bestätigen. Aufgrund der hohen Bedeutung von RUNX2 (und den entsprechenden Proteinisoformen) haben unsere Erkenntnisse Auswirkungen auf die Interpretation einer Reihe von früheren Studien, die dieses Gen mit verschiedenen Phänotypen wie Krebs, Knochendichte und Entwicklungsstörungen in Verbindung brachten. Diese Ergebnisse wurden in elektronischen Dateien für den Internet-basierenden Genome Browser des HapMap Projekts zusammengestellt, um sie im genomischen Kontext sichtbar werden zu lassen und folglich einen ersten Schritt in Richtung einer genomweiten TD Ressource zu unternehmen. Zusätzlich fanden wir heraus, dass TD mit LD korrespondiert und stellten die Hypothese auf, TD könnte die LD „Landschaft“ des Genoms aktiv gestalten. Schließlich weisen unsere Ergebnisse auf ein potenzielles technisches Problem mit der Datenbank des HapMap Projektes hin, das wir vorschlugen bei zukünftigen Erweiterungen der Datenbank zu berücksichtigen.