dc.contributor.author
Lange, Eva
dc.date.accessioned
2018-06-07T18:12:55Z
dc.date.available
2008-09-09T09:49:39.502Z
dc.identifier.uri
https://refubium.fu-berlin.de/handle/fub188/4781
dc.identifier.uri
http://dx.doi.org/10.17169/refubium-8981
dc.description.abstract
We study two fundamental processing steps in mass spectrometric data analysis
from a theoretical and practical point of view. For the detection and
extraction of mass spectral peaks we developed an efficient peak picking
algorithm that is independent of the underlying machine or ionization method,
and is able to resolve highly convoluted and asymmetric signals. The method
uses the multiscale nature of spectrometric data by first detecting the mass
peaks in the wavelet-transformed signal before a given asymmetric peak
function is fitted to the raw data. In two optional stages, highly overlapping
peaks can be separated or all peak parameters can be further improved using
techniques from nonlinear optimization. In contrast to currently established
techniques, our algorithm is able to separate overlapping peaks of multiply
charged peptides in LC-ESI-MS data of low resolution. Furthermore, applied to
high-quality MALDI-TOF spectra it yields a high degree of accuracy and
precision and compares very favorably with the algorithms supplied by the
vendor of the mass spectrometers. On the high-resolution MALDI spectra as well
as on the low-resolution LC-MS data set, our algorithm achieves a fast runtime
of only a few seconds. Another important processing step that can be found in
every typical protocol for labelfree quantification is the combination of
results from multiple LC-MS experiments to improve confidence in the obtained
measurements or to compare results from different samples. To do so, a
multiple alignment of the LC-MS maps needs to be estimated. The alignment has
to correct for variations in mass and elution time which are present in all
mass spectrometry experiments. For the first time we formally define the
multiple LC-MS raw and feature map alignment problem using our own distance
function for LC-MS maps. Furthermore, we present a solution to this problem.
Our novel algorithm aligns LC-MS samples and matches corresponding ion species
across samples. In a first step, it uses an adapted pose clustering approach
to efficiently superimpose raw maps as well as feature maps. This is done in a
star-wise manner, where the elements of all maps are transformed onto the
coordinate system of a reference map. To detect and combine corresponding
features in multiple feature maps into a so-called consensus map, we developed
an additional step based on techniques from computational geometry. We show
that our alignment approach is fast and reliable as compared to five other
alignment approaches. Furthermore, we prove its robustness in the presence of
noise and its ability to accurately align samples with only few common ion
species.
de
dc.description.abstract
Im Rahmen dieser Arbeit beschäftigen wir uns mit peak picking und map
alignment; zwei fundamentalen Prozessierungsschritten bei der Analyse
massenspektrometrischer Signale. Im Gegensatz zu vielen anderen peak picking
Ansätzen haben wir einen Algorithmus entwickelt, der alle relevanten
Informationen aus den massenspektrometrischen Peaks extrahiert und unabhängig
von der analytischen Fragestellung und dem MS Instrument ist. Im ersten Teil
dieser Arbeit stellen wir diesen generischen peak picking Algorithmus vor. Für
die Detektion der Peaks nutzen wir die Multiskalen-Natur von MS Messungen und
erlauben mit einem Wavelet-basierten Ansatz auch das Prozessieren von stark
verrauschten und Baseline-behafteten Massenspektren. Neben der exakten m/z
Position und dem FWHM Wert eines Peaks werden seine maximale Intensität sowie
seine Gesamtintensität bestimmt. Mithilfe des Fits einer analytischen
Peakfunktion extrahieren wir außerdem zusätzliche Informationen über die
Peakform. Zwei weiterere optionale Schritte ermöglichen zum einen die Trennung
stark überlappender Peaks sowie die Optimierung der berechneten Peakparameter.
Anhand eines niedrig aufgelösten LC-ESI-MS Datensatzes sowie eines hoch
aufgelösten MALDI-MS Datensatzes zeigen wir die Effizienz unseres generischen
Algorithmus sowie seine schnelle Laufzeit im Vergleich mit kommerziellen peak
picking Algorithmen. Ein direkter quantitativer Vergleich mehrer LC-MS
Messungen setzt voraus, dass Signale des gleichen Peptids innerhalb
unterschiedlicher Maps die gleichen RT und m/z Positionen besitzen. Aufgrund
experimenteller Unsicherheiten sind beide Dimension verzerrt. Unabhängig vom
Prozessierungsstand der LC-MS Maps müssen die Verzerrungen vor einem Vergleich
der Maps korrigiert werden. Mithilfe eines eigens entwickelten
Ähnlichkeitsmaßes für LC-MS Maps entwickeln wir die erste formale Definition
des multiplen LC-MS Roh- und Featuremap Alignment Problems. Weiterhin stellen
wir unseren geometrischen Ansatz zur Lösung des Problems vor. Durch die
Betrachtung der LC-MS Maps als zwei-dimensionale Punktmengen ist unser
Algorithmus unabhängig vom Prozessierungsgrad der Maps. Wir verfolgen einen
sternförmigen Alignmentansatz, bei dem alle Maps auf eine Referenzmap
abgebildet werden. Die Überlagerung der Maps erfolgt hierbei mithilfe eines
pose clustering basierten Algorithmus. Diese Überlagerung der Maps löst
bereits das Rohmap Alignment Problem. Zur Lösung des multiplen Featuremap
Alignment Problems implementieren wir einen zusätzlichen, effizienten
Gruppierungsschritt, der zusammengehörige Peptidsignale in unterschiedlichen
Maps einander zuordnet. Wir zeigen die Effizienz und Robustheit unseres
Ansatzes auf zwei realen sowie auf drei künstlichen Datensätzen. Wir
vergleichen hierbei die Güte sowie die Laufzeit unseres Algorithmus mit fünf
weiteren frei verfügbaren Featuremap-Alignmentmethoden. In allen Experimenten
überzeugte unser Algorithmus mit einer schnellen Laufzeit und den besten
recall Werten.
de
dc.format.extent
V, 200 S.
dc.rights.uri
http://www.fu-berlin.de/sites/refubium/rechtliches/Nutzungsbedingungen
dc.subject
mass spectrometry
dc.subject
computational proteomics
dc.subject
peak detection
dc.subject.ddc
500 Naturwissenschaften und Mathematik
dc.title
Analysis of mass spectrometric data
dc.contributor.firstReferee
Prof. Dr. Knut Reinert
dc.contributor.furtherReferee
Prof. Dr. Oliver Kohlbacher
dc.date.accepted
2008-06-13
dc.identifier.urn
urn:nbn:de:kobv:188-fudissthesis000000005168-7
dc.title.subtitle
peak picking and map alignment
dc.title.translated
Analyse massenspektrometrischer Daten
de
dc.title.translatedsubtitle
peak picking und map alignment
de
refubium.affiliation
Mathematik und Informatik
de
refubium.mycore.fudocsId
FUDISS_thesis_000000005168
refubium.mycore.derivateId
FUDISS_derivate_000000004356
dcterms.accessRights.dnb
free
dcterms.accessRights.openaire
open access