Hintergrund: Viele der häufigsten chronischen Erkrankungen werden durch genetische und Umweltfaktoren beeinflusst. Durch die Analyse einzelner genetischer Marker, beispielsweise SNPs (single nucleotide polymorphisms), kann ein kleiner Teil der genetischen Ursache erklärt werden. Um den Effekt mehrerer Marker und deren Kombination besser einschätzen und damit tiefergehende Einblicke in der genetischen Ursachenforschung gewinnen zu können, ist die Anwendung und Entwicklung geeigneter biostatistischer Methoden essentiell. Zielstellung: Ziel dieser Arbeit war es, biostatistische Methoden zur Identifizierung von genetischen Risikofaktoren basierend auf einzelnen SNPs und deren Kombination zu entwickeln und anzuwenden, um systematisch informative krankheitsassoziierte Allelkombinationen, wie z.B. Haplotypen, aus einer Vielzahl von SNPs zu identifizieren. Daneben wurden drei Kandidatengenstudien zur Evaluierung vielversprechender Gene begleitet. Methodik: Die Multi-locus Stepwise Regression (MSR) wurde im Rahmen der zugrundeliegenden deutschen genomweiten Studie zur atopischen Dermatitis entwickelt. Die MSR vereinigt die Vorteile schrittweiser Auswahlverfahren und Haplotypanalysen. Dabei werden SNP-Kombinationen sukzessive um jeweils einen SNP erweitert, wenn sich das Ergebnis der Haplotypanalyse statistisch verbessert. Zusätzlich wurde die MSR auf ungekoppelte SNPs im Rahmen der EPIC- Potsdam-Studie angewendet. Für diese Arbeit standen Daten aus einer deutschen genomweiten Studie zur atopischen Dermatitis bestehend aus einer Fall- Kontroll-Studie (939 Fälle, 975 Kontrollen) und einer Familienstudie (268 Familien mit 529 erkrankten Kindern) zur Verfügung. Es wurden 94 tagSNPs der EDC-Region auf Chromosom 1q21 und vier bekannte FLG-Mutationen, welche Strukturproteine für den Verhornungsprozess der menschlichen Epidermis kodieren, eingeschlossen. In der EPIC-Potsdam-Studie wurden vier Teilstudien durchgeführt: [1] 41 SNPs auf Body-Mass-Index (kg/m²) und Taillenumfang (Querschnittsanalyse, MSR, Permutationstest), [2] 2 SNPs (ADH1B, ADH1C) als Marker für Alkoholaufnahme auf kardiovaskuläre Erkrankungen (Fall-Kohorten- Design, modifierte Cox-Regression), [3] 1 SNP des MTTP-Gens, dessen kodiertes Protein eine zentrale Rolle im Lipoproteinstoffwechsel spielt, auf kardiovaskuläre Erkrankungen unter Berücksichtigung der Gesamtcholesterinaufnahme (Fall-Kohorten-Design, modifierte Cox-Regression) und [4] 7 tagSNPs des SCD1-Gens, das ein Protein des Fettstoffwechsels kodiert, auf metabolische Risikofaktoren (Querschnittsanalyse, Kovarianzanalyse). Ergebnisse: Die Anwendung der MSR in der genomweiten Studie ergab in der Fall-Kontroll-Studie ein Haplotyp-Muster, dass in der Familienstudie repliziert werden konnte. Dieses Haplotyp-Muster bestehend aus 4 SNPs zeigte den bekannten FLG-Effekt und einen zusätzlichen FLG-unabhängigen Effekt auf die atopische Dermatitis. In der EPIC-Potsdam-Studie identifizierte die MSR mit Body-Mass-Index und Taillenumfang assoziierte SNP-Kombinationen, die sich unter Berücksichtigung der simulierten Null-Verteilung (Annahme keines genetischen Effektes) als nicht signifikant herausstellten. Die SNPs der Gene ADH1B und ADH1C beeinflussten das Risiko für Myokardinfarkt und Schlaganfall nicht. Andererseits wurde eine Interaktion zwischen MTTP-SNP rs1800804 und Gesamtcholesterin für die kardiovaskulären Erkrankungen beobachtet. Zusammenhänge zwischen SCD1-SNPs und den dazugehörigen Haplotypen mit den untersuchten metabolischen Risikofaktoren wurden nicht festgestellt. Schlussfolgerung: Eine schrittweise haplotyp-basierte SNP-Selektion wurde in dieser Arbeit entwickelt und konnte erfolgreich in einer Kandidatengenregion angewendet werden. Die Anwendung auf ungekoppelte SNPs erforderte eine besondere Berücksichtigung des Suchprozesses. Obwohl die verwendeten Daten exemplarisch das Vorgehen der MSR zeigen, konnten in dieser Arbeit keine wesentlichen Effekte über die Einzel-SNP-Analyse hinaus gefunden werden. Weitere Studien sind erforderlich, um die MSR weiter zu entwickeln und zu beurteilen. In den Kandidatengenstudien waren ebenfalls keine zusätzlichen Multi-Locus-Marker-Effekt zu beobachten.
Background: Most common chronic diseases are influenced by genetic and environmental factors. Analysis of single genetic markers, such as SNPs (single nucleotide polymorphisms), explain a small part of genetic causes. The application and development of biostatistical methods are necessary to get further insights into the genetic causes of chronic diseases by taking into consideration of single and multiple genetic markers. Objectives: The objective was to develop biostatistical methods to identify genetic risk factors using single SNPs and their combinations and to apply these methods to select systematically risk-related allele combinations, such as haplotypes, from a large number of SNPs. In addition, three candidate gene studies were carried out to evaluate the effect of different promising genes. Methods: The Multi-locus stepwise regression (MSR) method was developed using data of a German genome-wide association study on atopic dermatitis. The MSR combines the advantages of stepwise selection methods with haplotype-based approaches. The MSR extends stepwise SNP-combinations successively if the result of the haplotype-based test is statistically improved until a stop criterion is met. The MSR was subsequently applied to investigate unlinked SNPs and their combinations as part of the EPIC-Potsdam study. The German genome-wide association study of atopic dermatitis consists of a case-control study (939 cases and 975 controls) and a family study (268 families with 529 children). 94 tagSNPs of EDC region on chromosome 1q21 and four known FLG-mutations encoding structural proteins that are expressed during terminal differentiation of the human epidermis were used Within the EPIC-Potsdam study the following associations were investigated in four sub-studies: [1] 41 SNPs for body-mass index (kg/m²) and waist circumference (cross-sectional study, MSR, and permutation test), [2] 2 SNPs (ADH1B, ADH1C) as marker for alcohol intake in relation to incident cardiovascular diseases (case-cohort study, modified Cox proportional hazards regression), [3] 1 SNP from MTTP gene that encodes a lipid transfer protein for cardiovascular diseases under consideration of cholesterol levels (case-cohort study, modified Cox proportional hazards regression), and [4] 7 tagSNPs from SCD1 gene encoding a protein that is involved in lipid metabolism for metabolic risk factors (cross-sectional study, analysis of covariance). Results: The MSR used in the genome-wide association study identified a haplotype pattern in the case- control study and was replicated in the family study. This haplotype pattern of four SNPs reflects the well-known FLG effect and an additional FLG- independent effect on atopic dermatitis. In the EPIC-Potsdam study, the MSR identified SNP-combinations associated with body-mass index and waist circumference, but these were not statistically significant compared to the simulated distribution under the null hypothesis of no genetic effect. The SNPs in ADH1B and ADH1C showed no associations to risk of cardiovascular diseases. An interaction was observed between MTTP-SNP rs1800804 and cholesterol levels on cardiovascular diseases. No evidence for an effect of single SCD1-SNPs and their corresponding haplotypes on metabolic risk factors was found. Conclusion: A stepwise haplotype-based SNP selection method was developed and successfully applied to one candidate gene region. The application of the method to unlinked SNPs requires a careful selection of SNPs. Although the data that were used to exemplify the method did not add additional evidence concerning the genetic etiology of combined SNP effects beyond single SNP analysis. Further studies are needed to assess the real value of the MSR. In the candidate gene studies as well none essential multi- locus marker effects were found.