In dieser Arbeit werden von mir neu entwickelte Strategien und Algorithmen vorgestellt, welche die Proteinidentifikation mittels MALDI-TOF-MS "peptide mass fingerprinting" unter Verwendung einer externen Kalibrierung so weit verbessern, dass auf die Anwendung einer internen Kalibrierung gänzlich verzichtet werden kann. Die Algorithmen basieren auf der Beobachtung, dass die Variation in den bestimmten Flugzeiten der sich an unterschiedlichen Positionen auf dem MALDI-Probenträger befindlichen Peptide auf zwei systematische Fehler zurückführen lässt. Zum einen wird bei Wechsel der Position der Nullpunkt des Massenspektrums verschoben, das heißt alle Massen weichen danach um einen bestimmten konstanten Betrag von den vorherigen Werten ab. Zum anderen können die Massenspektren nach Wechsel der Position noch zusätzlich linear gestreckt oder gestaucht sein. Im ersten Fall wird jede einzelne gemessene Masse mit einem bestimmten für alle Massen gleichen Fehlerbetrag behaftet. Die Differenzen zwischen den einzelnen gemessenen Massen bleiben davon jedoch unberührt. Im zweiten Fall werden sowohl die Absolutwerte, als auch die Massendifferenzen verändert. Die Algorithmen erkennen diese systematischen Fehler und ermöglichen, auch wenn die Massenrichtigkeit der generierten Daten sehr gering ist, eine korrekte Identifizierung der analysierten Proteine. Um Proteine eindeutig in großen Proteinsequenzdatenbanken zu identifizieren, wurde von mir ein Algorithmus entwickelt, der mit Hilfe der Parameter: Standardabweichung, Trefferanzahl und prozentualer Sequenzabdeckung für jedes Protein einen "Scoring"-Faktor" Z berechnet. Mit diesem neu entwickelten "Scoring"-Verfahren konnten z.B. 52 von 96 gentechnisch hergestellten Proteinen ohne Eingreifen des Menschen eindeutig identifiziert werden. In keinem Fall wurde ein falsch-positives Ergebnis geliefert. Weiterhin wurde von mir das Softwarepaket "MS-Proteomics" entwickelt, dass in kurzer Zeit vollautomatisch eine große Anzahl von massenspektrometrischen Datensätzen einliest, die Proteinidentifikation durch Abgleich mit einer in wenige Sekunden aus einer ausgewählten Proteindatenbank berechneten Peptidsequenzdatenbank durch Anwendung der oben erwähnten Algorithmen vornimmt und die Ergebnisse übersichtlich darstellt. Die Software liest darüber hinaus 2D-Gelbilder ein und weist den detektierten Proteinspots die Ergebnisse der Datenbanksuche automatisch zu. Alle relevanten Ergebnisse wurden publiziert oder eingereicht zur Veröffentlichung in den anerkannten wissenschaftlichen Fachzeitschriften "Analytical Chemistry" und "Electrophoresis" (die entsprechenden Literaturhinweise finden sich Anhang). Ein Internetversion von MSA 2.0 wird nach Veröffentlichung dieser Arbeit unter http://www.scienion.de/msa der wissenschaftlichen Gemeinde zur Verfügung gestellt.
Within this work I present a new protein identification strategy that overcomes the need for performing internal or close external calibration in MALDI-TOF-MS peptide mass fingerprinting. The strategy is based on the observation that the variation of peptide flight times, when measured on different positions on the sample support, are systematic and affect mainly the linear components (offset and slope) of the correlation between m/z and the square of the flight time. Consequently, the mass errors obtained when using a single set of calibration constants, determined at one position of the sample support, to calibrate all other time-of-flight spectra recorded from that support, are also systematic. The developed search algorithm recognizes these systemic trends in the mass errors, thereby allowing protein identification even with a low mass accuracy of the input data. For the retrieval of the correct protein in a database search, I have developed a new scoring algorithm, which uses the parameters: standard deviation, number of matching peptide masses and the sequence coverage of the protein to calculate the score for each protein. Using this algorithm it was possible to correctly identify 52 out of 96 recombinant proteins of known identity, without any false identification. Moreover, I implemented the above identification strategy and scoring algorithms in a software package designated "MS- Proteomics", which automatically reads many peptide mass maps in a short time and performs all calculations for protein identification. For protein identification from 2D-gel electrophoresis, MS-Proteomics also comprises a 2D- gel viewer that links the search results to its corresponding spots on the gel image. All relevant results have been published or submitted for publication in the peer-reviewed scientific journals "Analytical Chemistry" and "Electrophoresis" (references are part of the appendix). In addition, some of the results have been presented at the 48th ASMS Conference on Mass Spectrometry and Allied Topics, LA, California, USA, June 11-15, 2000. A web- based version of the program MSA 2.0 will be made available to the scientific community at http://www.scienion.de/msa, following publication of this thesis.