In dieser Habilitationsschrift beschreibe ich verschiedene Strategien und von mir entwickelte oder mitentwickelte Computerprogramme, die es Forschern und Klinikern erlauben, unter einem möglichst minimalen Einsatz von Zeit und Geld die wahrscheinlichsten Ursachen monogener Krankheiten zu bestimmen. Alle hier vorgestellten Programme sind web-basiert, das heißt, dass sie direkt und ohne die Notwendigkeit, Software zu installieren, benutzt werden können. Sie zeichnen sich überdies durcheine sehr einfache Benutzbarkeit aus. Dies versetzt die mit einer Krankheit vertrauten Wissenschaftlern oder Ärzten in die Lage, sich selber stärker in die Aufklärung der Krankheitsursachen einzubringen, ohne die Datenauswertung komplett an Bioinformatiker angeben zu müssen, womit in der Regel Informationsverluste einhergehen, da diese weit weniger über die betreffende Krankheit wissen. Die Software GeneDistiller, die schon in meiner Promotion entstanden ist, dient primär der Suche nach Kandidatengenen für monogene Krankheiten, kann aber darüber hinaus auch dazu verwendet werden, diverse Informationen über ein einzelnes oder eine Reihe von Genen komfortabel und schnell anzuzeigen oder die Gene nach selbst gewählten Eigenschaften zu durchzusuchen, zu filtern und nach ihrem erwarteten Krankheitspotential zu priorisieren. Neben dem Einsatz im Rahmen einer klassischen Genkartierung können mit GeneDistiller auch die Eigenschaften der Gene studiert werden, in denen in Exom- oder Genomsequenzierung potentiell krankheitsverursachende Varianten detektiert wurden. GeneDistiller kann auch in der Erforschung komplexer Krankheiten eingesetzt werden, um den möglichen Einfluss der den durch Assoziationsstudien bestimmten Loci benachbarten Gene auf die Krankheit zu beurteilen. Eine weitere hier vorgestellte Software ermöglicht die Bestimmung von Krankheitsloci in konsanguinen Familien. Die Software HomozygosityMapper arbeitet erheblich schneller und ist deutlich einfacher zu benutzen als klassische Computerprogramme für die Kopplungsanalyse. Die erste Version der Software gestattete die direkte Analysen von Genotypen, die mittels SNP-Chips gewonnen worden. Die aktuelle Version erlaubt es darüber hinaus, Homozygotiekartierungen auch mit den durch Exom- oder Genomsequenzierungen gewonnenen Daten durchzuführen. Zur raschen in silico Bewertung des Krankheitspotentials von DNA-Varianten haben wir ein weiteres Computerprogramm entwickelt, MutationTaster. Im Gegensatz zu allen bisherigen Variantenbewertungsprogrammen arbeitet MutationTaster auch auf DNA- Ebene und erlaubt es deshalb, neben nicht-synonymen auch synonyme und nicht kodierende DNA-Varianten zu analysieren. Auch von diesem Programm gibt es zwei publizierte Versionen; die zweite greift die in der Zwischenzeit verfügbar gewordene umfangreiche Sammlung an Polymorphismen aus dem 1000-Genom-Projekt und funktioneller genomischer Elemente aus dem ENCODE-Projekt auf und verfügt zudem über wesentlich mehr Tests und einen deutlich vergrößerten Satz an Trainingsdaten. Sie erlaubt es darüber hinaus, durch eine web-basierte Analysestrecke, die wahrscheinlichsten Krankheitsmutationen aus den tausenden oder Millionen von Varianten herauszufiltern, die in kompletten Exom- oder Genomsequenzierungen detektiert werden. Die Variantenbewertung durch MutationTaster wird von einer weiteren Software genutzt, an deren Erstellung ich beteiligt war: der Exomiser verbindet die Wahrscheinlichkeit der Pathogenität einer Variante mit der Wahrscheinlichkeit, dass das betroffene Gen an der Pathogenese einer bestimmten Erkrankung beteiligt ist. Das Programm CNVinspector dient der benutzerfreundlichen Identifizierung potentiell krankheitsverursachender Variationen in der Kopienzahl von Genen oder chromosomalen Regionen. Hierbei können die durch ArrayCGH-Experimente, SNP- Chips oder andere Methoden bestimmten duplizierten, deletierten oder hemizygoten Regionen in einzelnen Patienten oder Kohorten und mit gesunden Kontrollen verglichen werden. Dazu können wahlweise eigene Kontrollen oder aber öffentlich publizierte Studien herangezogen werden. Das Programm bietet ein Interface zu GeneDistiller, so dass eine schnelle Untersuchung und Bewertung der betroffenen Gene möglich wird.
This professorial dissertation describes various strategies to find disease- causing DNA variants as quick and cost-efficient as possible. These strategies employ several computer programs that I have developed or co-developed. All computer program are web-based, i.e. they do not require the installation of software. They can be used free of charge and offer intuitive and simple interfaces. This allows clinicians or scientists to analyse their data on their own without the need to ask bioinformaticians or IT personnel for help. The software GeneDistiller is aimed at finding candidate genes for monogenic diseases. It can be used to conveniently display information about a list of genes, to search for specific gene features, to filter genes or to prioritise them according to a disease model. HomozygosityMapper allows a rapid determination of disease loci of Mendelian disorders in consanguineous families. It is much faster than conventional linkage analysis and much easier to use. The current version can handle genotype files from high-throughput sequencing studies. The disease-causing potential of DNA variants can be studied in silico with the software MutationTaster. In contrast to its most prominent competitors, it also performs tests on DNA level. It is hence not restricted to single amino acid substitutions but can also analyse synonymous and non-coding variants. The current version includes a web-based pipeline to automatically analyse genotype files from high-throughput sequencing projects to facilitate the identification of the causal mutation in the tens of thousands of variants detected. The variant prediction is used by another software which I co-developed: The Exomiser integrates the potential effect of a variant on the gene product with the potential of the affected gene to be involved in the pathogenesis of a given Mendelian disease. The CNVinspector software was designed for the convenient identification of potentially disease-causing copy number variants (CNV). CNVs obtained by ArrayCGH, SNP arrays, or other means can be compared with other patients or filtered against control data. An interface to GeneDistiller allows a rapid study of the affected genes.