dc.contributor.author
Kehr, Birte
dc.date.accessioned
2018-06-08T02:02:35Z
dc.date.available
2014-06-11T11:50:13.356Z
dc.identifier.uri
https://refubium.fu-berlin.de/handle/fub188/13970
dc.identifier.uri
http://dx.doi.org/10.17169/refubium-18167
dc.description.abstract
Recent advances in sequencing technologies have opened up the opportunity to
study whole genomes at the nucleotide level. Similarities in the nucleotide
sequences of genomes provide new insights in the relationships of organisms
and species. Multiple whole-genome alignments represent these similarities,
however their computation is challenging. In contrast to approaches for other
sequence alignment problems, genome alignment methods have to deal with very
long sequences and with non-colinearity of similarities. This thesis makes
three contributions to the development of multiple whole-genome alignment
methods. The prevailing strategy of such methods is to combine a set of local
alignments to a global genome alignment. This thesis suggests an efficient and
fully sensitive local alignment approach, compares graph data structures for
representing genome alignments, and describes hidden rearrangement breakpoints
that become visible only in the comparison of more than two genomes. All three
contributions provide potential for significant improvements to the
computation or modeling of genome alignments. In a comparison to other local
alignment approaches, the new local aligner is the fastest of three fully
sensitive ones and competitive with seed-and-extend approaches despite having
full sensitivity. The assessment of graph data structures describes for the
first time all graphs using the same terminology, and demonstrates how the
graph structures differ in their information content. Finally, an analysis of
breakpoints in simulated genome alignments suggests that hidden breakpoints
are abundant and relevant for measuring the accuracy of genome alignments. In
summary, the three contributions provide a promising basis for future genome
alignment methods.
de
dc.description.abstract
In den letzten Jahren wurden enorme Fortschritte mit Sequenziertechnologien
gemacht, die es ermöglichen, ganze Genome auf Nukleotidebene zu untersuchen.
Genomische Nukleotidsequenzen weisen erstaunliche Ähnlichkeiten auf, die neue
Einblicke in Verwandschaftsbeziehungen von Organismen und Arten gewähren
können. Multiple Genomalignments stellen diese Ähnlichkeiten zwischen
verschiedenen Genomen dar, ihre Berechnung ist allerdings sehr anspruchsvoll.
Im Gegensatz zu Methoden für andere Squenzalignmentprobleme muss bei der
Berechnung von Genomalignments zum einen die gewaltige Länge von genomischen
Sequenzen bewältigt werden und zum anderen beachtet werden, dass ähnliche
Abschnitte in verschiedenen Genomen in unterschiedlicher Anordnung vorliegen
können (Nichtkolinearität). Methoden zur Berechnung von Genomalignments suchen
meist zunächst lokale Alignments und fügen diese anschließend zu einem
globalen Genomalignment zusammen. Die vorliegende Arbeit leistet drei Beiträge
zu solchen Methoden: Es wird ein effizienter Ansatz für lokales Alignment
vorgeschlagen, Graphdatenstrukturen für Genomalignments verglichen und
genomische Bruchstellen beschrieben, die erst im Vergleich von mehr als zwei
Genomen sichtbar werden und auf zusätzliche nichtkolineare Veränderungen
hinweisen.
de
dc.format.extent
XVII, 161 S.
dc.rights.uri
http://www.fu-berlin.de/sites/refubium/rechtliches/Nutzungsbedingungen
dc.subject
Genome alignment
dc.subject
sequene analysis
dc.subject
genome rearrangement
dc.subject.ddc
500 Naturwissenschaften und Mathematik::570 Biowissenschaften; Biologie
dc.subject.ddc
000 Informatik, Informationswissenschaft, allgemeine Werke::000 Informatik, Wissen, Systeme::004 Datenverarbeitung; Informatik
dc.title
Contributions to computing and modeling multiple whole-genome alignments
dc.contributor.firstReferee
Prof. Dr. Knut Reinert
dc.contributor.furtherReferee
Prof. Aaron Darling, PhD
dc.date.accepted
2014-05-19
dc.identifier.urn
urn:nbn:de:kobv:188-fudissthesis000000096799-2
dc.title.translated
Beiträge zur Berechnung und Modellierung multipler Alignments ganzer Genome
de
refubium.affiliation
Mathematik und Informatik
de
refubium.mycore.fudocsId
FUDISS_thesis_000000096799
refubium.mycore.derivateId
FUDISS_derivate_000000015273
dcterms.accessRights.dnb
free
dcterms.accessRights.openaire
open access