Recent advances in genomics, which outstanding achievements were exemplified by the complete sequencing of the human genome provided the infrastructure and information enabling the development of several proteomic technologies. Currently no single proteomic analysis strategy can sufficiently address the question of how the proteome is organised in terms of numerical complexity and complexity generated by the protein-protein interactions forming supramolecular complexes within the cell.
In order to bring a detailed structural/functional picture of these complexes in whole genomes, cells, organelles or in normal and pathological states several proteomic strategies can be utilised. Combination of technologies will bring a more detailed answer to what are the components of certain cellular pathways (e.g.: targets of kinases/phosphatases, cytoskeletal proteins, signalling molecules), how do they interconnect, how are they modified in the cell and what are the roles of several complex components in normal and disease conditions.
These types of studies depend on fast and high throughput methods of protein identification. One of the most common methods of analysis is mass spectrometric technique called peptide mapping. Peptide mapping is the comparison of mass spectrometrically determined peptide masses of a sequence specific digest of a single protein or peptide of interest with peptide masses predicted from genomic databases. In this work several contributions to the computational analysis of mass spectrometric data are presented. During the course of my studies I looked at the distribution of peptide masses in sequence specific protein sequence digests and developed a simple mathematical model dealing with peptide mass cluster centre location. I have introduced and studied the methods of calibration of mass spectrometric peak-list without resorting to internal or external calibration samples. Of importance is also contribution of this work to the calibration of data produced in high throughput experiments. In addition, I studied how filtering of non-peptide peaks influences the identification rates in mass spectrometric instruments. Furthermore, I focused my studies on measures of spectra similarity which can be used to acquire supplementary information, increasing the sensitivity and specificity of database searches.
Fortschritte in der Gnomforschung, deren herrausragende Errungenschaften mit der Sequenzierung des Menschlichen Genoms verdeutlicht wurden, stellten die Informationen und Infrastruktur zur Verfügung welche die Entwicklung neuer Methoden der Proteom Forschung ermöglichte.
Keine Methode der Proteom Untersuchung alleine ist in der Lage die Frage ausreichend zu Beantworten, wie das Proteom sowohl bezüglich der numerischen Komplexität als auch der Komplexität die sich aus den Protein Protein Interaktionen ergibt, die supermolekulare komplexe bilden, organisiert ist. Um ein detailliertes strukturelle und funktionelle Darstellung dieser Komplexe in Zellen, Organellen, im normalen und in pathologische Zuständen zu gewinnen, können mehrere Techniken der Proteom Analyse verwendet werden. Die Antwort auf die Frage wie zellularer Signalwegen verschaltet sind, wie sie modifiziert werden und was die Funktion von Protein Komplexen, im Normalen und Krankheit- Zustand ist, kann mit Hilfe der Kombination mehrerer Proteom Analyse Techniken bestimmt werden. Die Realisation dieser Studien benötigt Hoch Durchsatz Methoden zur schnellen Proteinidentifizierung.
Eines der gebräuchlichsten Analyseverfahren ist die Identifizierung von Proteinen und Peptiden mit Hilfe Massenspektrometrischer Messungen. Massenspektrometrisch bestimmte Peptid-Massen eines Sequenz spezifischen Protein-Verdaus werden mit theoretischen Massen, die anhand einer Protein- Sequenz-Datenbank vorhergesagt wurden, verglichen.
In dieser Arbeit werden Beiträge zur computer-unterstützten Analyse von Massenspektrometrischen Daten vorgestellt. Während meiner Studien betrachtete ich die Verteilung der Peptidmassen, wie sie durch einen Sequenz-Spezifischen Protein-Verdauen gebildet werden. Ich entwickelte eine mathematisches Modell um die empirischen Eigenschaften der Verteilung z.B. die Position von Peptide Massen Clustern vorherzusagen. In dieser Arbeit habe ich auch Methoden zur Kalibrierung von Massenspektrometrischen Signalen untersucht, die ohne interne und externe Kalibrierungs-Proben arbeiten. Desweiteren wurde analysiert wie das Entfernen von Nicht-Peptidmassen die Identifizierung-Ergebnisse beeinflusst. Außerdem fokussierte ich meine Studien auf Maße der Spektrenähnlichkeit. Diese Maße können dazu verwendet werden um die Empfindlichkeit und die Genauigkeit der Datenbanksuchen zu erhöhend.