dc.contributor.author
Emde, Anne-Katrin
dc.date.accessioned
2018-06-07T17:56:11Z
dc.date.available
2013-12-03T11:56:04.754Z
dc.identifier.uri
https://refubium.fu-berlin.de/handle/fub188/4421
dc.identifier.uri
http://dx.doi.org/10.17169/refubium-8621
dc.description.abstract
Next-Generation-Sequencing (NGS) has brought on a revolution in sequence
analysis with its broad spectrum of applications ranging from genome
resequencing to transcriptomics or metagenomics, and from fundamental research
to diagnostics. The tremendous amounts of data necessitate highly efficient
computational analysis tools for the wide variety of NGS applications. This
thesis addresses a broad range of key computational aspects of resequencing
applications, where a reference genome sequence is known and heavily used for
interpretation of the newly sequenced sample. It presents tools for read
mapping and benchmarking, for partial read mapping of small RNA reads and for
structural variant/indel detection, and finally tools for detecting and
genotyping SNVs and short indels. Our tools efficiently scale to large NGS
data sets and are well-suited for advances in sequencing technology, since
their generic algorithm design allows handling of arbitrary read lengths and
variable error rates. Furthermore, they are implemented within the robust C++
library SeqAn, making them open-source, easily available, and potentially
adaptable for the bioinformatics community. Among other applications, our
tools have been integrated into a large-scale analysis pipeline and have been
applied to large datasets, leading to interesting discoveries of human
retrocopy variants and insights into the genetic causes of X-linked
intellectual disabilities.
de
dc.description.abstract
Neuste DNA-Sequenzieungstechnologien (kurz genannt NGS Technologien)
ermöglichen revolutionäre neue Anwendungen, die sowohl von
Genomresequenzierung über Transkriptomsequenzierung zu Metagenomik als auch
von Grundlagenforschung zu Diagnostik reichen. Problematisch ist dabei die
Flut an Daten, die eine grosse Herausforderung für die Bionformatik darstellt.
Hocheffiziente Analysesoftware ist von enormer Wichtigkeit für das breite
Spektrum von NGS Anwendungen. Diese Arbeit adressiert mehrere Schlüsselaspekte
der Analyse von Resequenzierungsdaten, bei der ein bereits sequenziertes
Referenzgenom als Grundlage für die Interpretation eines neu sequenzierten
Datensatzes dient. Es werden Algorithmen und Programme präsentiert für das
sogenannte Read Mapping Problem und für die Auswertung der Güte seiner Lösung,
für partielles Read Mapping, welches in miRNA Studien und bei der Suche nach
strukturellen Variationen Anwendung findet, sowie letztlich zum Auffinden und
Genotypisieren von Basenmutationen und kurzen Insertionen/Deletionen im Genom.
Die vorgestellten Algorithmen sind effizient und so gestaltet, dass sie auch
bei Fortschritten in Sequenzierungstechnologien weiterhin anwendbar und
skalierbar bleiben. Zudem sind sie in der robusten C++ Bibliothek SeqAn
implementiert, was sie leicht zugänglich und adaptierbar macht. Unter anderem
wurden unsere Tools in eine Hochdurchsatz-Analysepipeline integriert und auf
grosse Datensaetze angewendet, wodurch interessante biologische Erkenntnisse
(vorallem im Zusammenhang X-Chromosom gebundener geistiger Behinderung)
gewonnen werden konnten.
de
dc.format.extent
VIII, 148 S.
dc.rights.uri
http://www.fu-berlin.de/sites/refubium/rechtliches/Nutzungsbedingungen
dc.subject
Bioinformatics
dc.subject
Sequence Analysis
dc.subject
Variant Detection
dc.subject.ddc
000 Informatik, Informationswissenschaft, allgemeine Werke::000 Informatik, Wissen, Systeme::004 Datenverarbeitung; Informatik
dc.subject.ddc
500 Naturwissenschaften und Mathematik::570 Biowissenschaften; Biologie
dc.title
Next-generation sequencing algorithms
dc.contributor.contact
akemde@gmail.com
dc.contributor.firstReferee
Prof. Dr. Knut Reinert
dc.contributor.furtherReferee
Prof. Dr. Martin Vingron
dc.contributor.furtherReferee
Prof. Dr. Peter Nürnberg
dc.date.accepted
2013-04-17
dc.identifier.urn
urn:nbn:de:kobv:188-fudissthesis000000095411-7
dc.title.subtitle
from read mapping to variant detection
dc.title.translated
Next generation sequencing Algorithmen
de
dc.title.translatedsubtitle
von Read Mapping zur Detektion von genomischen Variationen
en
refubium.affiliation
Mathematik und Informatik
de
refubium.mycore.fudocsId
FUDISS_thesis_000000095411
refubium.mycore.derivateId
FUDISS_derivate_000000014352
dcterms.accessRights.dnb
free
dcterms.accessRights.openaire
open access