dc.contributor.author
Lienhard, Matthias
dc.date.accessioned
2018-06-07T17:28:56Z
dc.date.available
2017-11-06T08:48:43.137Z
dc.identifier.uri
https://refubium.fu-berlin.de/handle/fub188/3895
dc.identifier.uri
http://dx.doi.org/10.17169/refubium-8095
dc.description
1) INTRODUCTION 1.1) Motivation 1.2) Research Objective 1.3) Thesis Outline 2)
BIOLOGICAL BACKGROUND : EPIGENETICS 2.1) Epigenetics in Development 2.2)
Epigenetics in Disease 2.3) Chromatin structure 2.4) Histone Modification 2.5)
DNA Methylation 3) FUNDAMENTAL PRINCIPLES 3.1) Approaching the Epigenome:
Experimental Principles 3.2) Modeling Read Enrichment: Statistical Principles
3.3) Benchmark Dataset 4) ESTIMATING ABSOLUTE METHYLATION VALUES 4.1) Coupling
Factor Scaling 4.2) Relation of Methylation Level and Enrichment 4.3) Modeling
the Read Coverage 4.4) Estimating Local C P G Density 4.5) Estimating
Abundance of Background Reads 4.6) Assessing Sample Specific Enrichment 4.7)
Fitting Enrichment Profiles 4.8) Statistical Model of the Absolute Methylation
Level 4.9) Bayesian Estimators for the Absolute Methylation Level 4.10)
Assessment of Methylation Level Estimation Methods 4.11) Conclusion 5)
DIFFERENTIAL METHYLATION ANALYSIS 5.1) Wilcoxon’s Rank Sum Test 5.2)
Generalized Linear Model Likelihood Ratio Test 5.3) Comparison of Statistical
Tests 5.4) Conclusion 6) IMPLEMENTATION 6.1) MEDIPS package 6.2) QSEA package
6.3) Conclusion 7) APPLICATIONS 7.1) DNA-Methylome Analysis of Mouse
Intestinal Adenoma 7.2) QSEA – Modeling genome-wide DNA methylation enrichment
7.3) Predicting Therapy Resistance in NSCLC by Epigenomic Profiling 7.4)
Epigenomic Analysis of Immune Cells from Asthma Patients 8) DISCUSSION
BIBLIOGRAPHY APPENDICES MATHEMATICAL PROOFS CURRICULUM VITAE PUBLICATIONS
SUMMARY ZUSAMMENFASSUNG
dc.description.abstract
Enrichment of methylated DNA followed by sequencing offers a reasonable
compromise between experimental cost and genomic coverage, allowing genome-
wide DNA methylation to be assessed for large numbers of samples, which is a
common requirement for clinical studies. However, the computational analysis
of these experiments is complex, and depends on specific normalization and
statistical approaches. Furthermore, quantification of the enrichment signals
in terms of absolute levels of methylation requires specific transformation.
In this dissertation, I introduce specific computational methods for the
individual steps of the analysis workflow. I assess the impact of sequencing
library size, alterations in DNA copy number and CpG density on the local
enrichment, and present a suitable normalization procedure. As the central
part of the workflow, I developed a statistical model for the enrichment read
counts, which is deployed in the Bayesian estimation of absolute levels of
methylation. The model involves experimental parameters, such as sample
specific enrichment characteristics. Accounting for different levels of prior
knowledge, I suggest several calibration strategies for the model's
parameters, which use either additional data or certain general assumptions.
The transformation to absolute methylation levels greatly enhances
interpretability and facilitates comparison with other methylation assays. By
comparing the results with bisulfite sequencing validation data, I demonstrate
the accuracy of the transformation, as well as the improvement over existing
alternative methods. A common objective of methylome analysis is the detection
of differentially methylated regions between groups of samples. I compare
different statistical approaches for this task and discuss the inherent
properties. I thereby identify likelihood ratio tests of nested generalized
linear models to be well suited in terms of reliability and efficiency. The
methods are implemented in two different R/bioconductor packages, MEDIPS and
QSEA, which are easy to use and provide comprehensive functionality for the
analysis of enrichment based experiments. All functions are documented and
demonstrated by runnable examples, as well as detailed tutorials for specific
practically relevant use cases. By presenting four representative studies
published in peer-reviewed journals, I demonstrate the applicability and the
versatility of the introduced methods. Taken together, this dissertation
provides new computational methods for the analysis of enrichment based
methylation experiments; these methods enhance the interpretability and
reliability of the results from these experiments.
de
dc.description.abstract
Hochdurchsatzsequenzierung von angereicherter methylierter DNS erlaubt
genomweite Methylierungsmessung zu relativ günstigen Kosten, wodurch die
Analyse von zahlreichen Proben, zum Beispiel für klinische Studien, ermöglicht
wird. Die computergestützte statistische Auswertung dieser Experimente ist
jedoch komplex, und bedarf spezieller Normalisierungsmethoden und
Schätzverfahren. In dieser Dissertation stelle ich spezifische
computergestützte Methoden für die einzelnen Analyseschritte der Auswertung
vor. Ich untersuche den Einfluss von Sequenziertiefe, Amplifikationen oder
Deletationen der DNS, sowie der Häufigkeit von CpGs auf die Anreicherung der
entsprechenden genomischen Region, und führe ein geeignetes
Normalisierungsverfahren ein. Als zentralen Analyseschritt rekonstruiere ich
das absolute Methylierungsniveau aus der relativen Anreicherung mittels
Bayes'schen Schätzern. Hierfür habe ich ein statistisches Modell der
angereicherten sequenzierten DNS-Fragmente entwickelt. Abhängig vom Vorwissen
über die Proben schlage ich verschiedene Kalibrierungsstrategien für die
probenspezifischen Anreicherungsparameter des Modells vor, basierend auf
zusätzlichen Daten oder allgemeinen Annahmen. Die Umwandlung in absolute
Methylierungswerte erhöht die Interpretierbarkeit erheblich und erleichtert
den Vergleich mit anderen Methylierungsexperimenten. Durch Vergleich der
Ergebnisse mit Bisulfit-Sequenzierung Validierungsdaten zeige ich die
Schätzgenauigkeit des Verfahrens sowie die Verbesserung gegenüber bestehender
alternativer Methoden. Ein häufiges Ziel der Methylomanalyse ist der Nachweis
von differentiell methylierten Regionen zwischen Probengruppen. Ich vergleiche
verschiedene statistische Ansätze für diesen Schritt und zeige diesbezüglich
die Eignung von Likelihood-Quotienten-Tests geschachtelter generalisierter
linearer Modelle hinsichtlich Zuverlässigkeit und Effizienz. Die vorgestellten
Methoden sind in zwei R / Bioconductor-Paketen implementiert, MEDIPS und QSEA.
Die Pakete sind einfach zu bedienen bieten umfassende Funktionalität. Alle
Funktionen sind dokumentiert und werden mittels anschaulichen Beispiele, sowie
ausführlichen Tutorials zu spezifischen praktisch relevanten Anwendungsfällen
veranschaulicht. Vier vorgestellte repräsentative Studien, welche in
wissenschaftlichen Fachzeitschriften veröffentlicht wurden, demonstrieren die
praktische Anwendbarkeit und die Vielseitigkeit der eingeführten Methoden.
Zusammengefasst bietet diese Dissertation neue computergestützte Methoden zur
Analyse anreicherungsbasierter Methylierungsexperimente, welche sowohl die
Interpretierbarkeit als auch die Zuverlässigkeit der Ergebnisse solcher
Experimente erhöhen.
de
dc.format.extent
xii, 125 Seiten
dc.rights.uri
http://www.fu-berlin.de/sites/refubium/rechtliches/Nutzungsbedingungen
dc.subject
bioinformatics
dc.subject
DNA methylation
dc.subject.ddc
000 Informatik, Informationswissenschaft, allgemeine Werke::000 Informatik, Wissen, Systeme::004 Datenverarbeitung; Informatik
dc.subject.ddc
500 Naturwissenschaften und Mathematik
dc.subject.ddc
500 Naturwissenschaften und Mathematik::510 Mathematik::519 Wahrscheinlichkeiten, angewandte Mathematik
dc.subject.ddc
500 Naturwissenschaften und Mathematik::570 Biowissenschaften; Biologie::570 Biowissenschaften; Biologie
dc.title
Computational Analysis of Genome-wide Methylation Enrichment Experiments
dc.contributor.contact
lienhard@molgen.mpg.de
dc.contributor.firstReferee
Prof. Dr. Martin Vingron
dc.contributor.furtherReferee
Prof. Dr. Dr. Michal-Ruth Schweiger
dc.date.accepted
2017-10-09
dc.identifier.urn
urn:nbn:de:kobv:188-fudissthesis000000105705-9
dc.title.translated
Computergestützte Analyse genomweiter Methylierungsanreicherungsexperimente
de
refubium.affiliation
Mathematik und Informatik
de
refubium.mycore.fudocsId
FUDISS_thesis_000000105705
refubium.mycore.derivateId
FUDISS_derivate_000000022521
dcterms.accessRights.dnb
free
dcterms.accessRights.openaire
open access