In dieser Habilitationsschrift habe ich eine Übersicht über den Einsatz rechnergestützten Verfahren als Grundlage für die Analyse von genetischen Varianten gegeben und exemplarisch einige biomedizinische Ergebnisse dargestellt, die ohne den Einsatz maßgeschneiderter Programme nicht erreichbar gewesen wären. Die Quelltexte aller vorgestellten Methoden sind offen und stehen jeder Mensch unter freien Lizenzen über das Internet zu Verfügung.
Das Programmpaket SODAR ermöglicht die effiziente Verwaltung von Meta- und Massendaten für komplexe Studien, bei Anwendung mehrerer experimenteller Methoden und Erzeugung großer Datenmengen und/oder großer Anzahl von Dateien. Das Programm als Webanwendung auch für unerfahrene Anwender:innen einfach zu bedienen. Für Bioinformatiker:innen stellt es programmierbare Schnittstellen (APIs) bereit und ist auch von der Kommandozeile zu bedienen. Damit vereinfacht oder ermöglicht SODAR viele Forschungsvorhaben, die in der Core Unit Bioinformatik (CUBI) durchgeführt werden. Es wird aber mittlerweile auch unabhängig von CUBI an der Charité und anderen Instituten verwendet. Durch die Nutzung offener und freier Dateiformaten und Schnittstellen ermöglicht es SODAR, auch die Anforderungen der FAIR Grundprinzipien für Datenmanagement zu erfüllen.
Das Programm ClearCNV vereinfacht den Umgang von Sequenzdaten aus Anreicherungsverfahren und Bedingungen wie sie in der Praxis im Labor und Klinik oft anfallen. Solche Daten wurden meist über mehrere erzeugt, was unter anderem zu Verzerrungen (batch effect) führt. ClearCNV ermöglicht es dem Benutzer die für die gemeinsame Analyse homogenen und passenden Daten entsprechend auszuwählen und dann zuverlässig auch DNS Kopiezahlvarianten zu detektieren, die nur kleine Abschnitte des Genoms betreffen. Es stellt auch Module bereit, um die Ergebnisse grafisch darzustellen und die Qualität zu überprüfen. Wir konnten unter Verwendung realer Daten zeigen, dass die Güte der Ergebnisse mindestens vergleichbar mit vorherigen Methoden ist.
Die Anwendung VarFish stellt Anwendern in Klinik und Forschung eine grafischen Benutzeroberfläche für die Auswertung von DNS-Varianten bereit. Durch die enge Zusammenarbeit mit Nutzer:innen konnte sichergestellt werden, dass die Software einfach benutzbar ist. Die Soft-ware wird außerdem ständig weiterentwickelt und verbessert. Alle im Institut für Humangenetik der Charité prozessierten Exom- und Genomfälle werden mit VarFish bearbeitet, was den Erfolg des Ansatzes zeigt.
Durch die Anwendung einer verfeinerten Gene Burden Analyse im Kontext der dilativen Kardiomypathie konnte ich zusammen mit anderen Forscher:innen die Rolle von Varianten mit hoher Relevanz in diesem Krankheitsbild zeigen. Eine weitere Klärung des Sachverhaltes steht durch die Vergrößerung der Kohorte sowie der Exomsequenzierung statt der verwendeten Panelsequenzierung aus.
Durch die genaue Analyse genomweiter de novo Varianten konnte ich zusammen mit anderen Forscher:innen die zeigen, dass multisite de novo Varianten (MSDN) ein Marker für die Exposition des Vaters durch ionisierender Strahlung ist. Vorher nur im Mausmodell nachgewiesen, stellt unsere Studie den ersten Nachweis für die Relevanz des Markers im Menschen dar, nachdem die langjährige Lehrmeinung war, dass durch ionisierende Strahlung entstandene Schäden nicht vererbt werden. Die Rolle des Markers wird derzeit durch eine weitere Studie mit meinen Koautor:innen geklärt, das entsprechende Manuskript ist eingereicht.
Insgesamt zeigt meine Arbeit auf, wie der Einsatz der Bioinformatik unterschiedliche essenzielle Beiträge zur biomedizinischen Forschung im Zeitalter der Hochdurchsatzverfahren, insbesondere der Hochdurchsatzsequenzierung von DNS leistet.