Protein-protein interactions (PPIs) are the drivers of most biological processes. Cross-linking mass spectrometry (XL-MS) allows the detection of PPIs from complex biological systems and even in vivo scenarios by combining chemical cross-linking with small reactive molecules, proteolytic digestion and LC-MS (liquid chromatography coupled to mass spectrometry) analyses. However, as the abundance and physicochemical properties of cross-linked peptides differ from those of unmodified peptides, the reliable identification and accurate quantification of cross-linked peptides requires tailored protocols, efficient acquisition strategies and dedicated data analysis pipelines. Throughout my doctoral studies, I focused on advancing different steps of the XL-MS pipeline, including (1) the optimization of acquisition parameters for the detection and quantification of isobarically labeled cross-linked peptides, (2) the development of novel methods for the targeted detection of cross-linked peptides over less wanted species, and (3) the introduction of a ground truth dataset for benchmarking existing cross-linking database search engines and the development of new computational tools. Firstly, I described a speedy MS2-based acquisition strategy with an optimized stepped collision energy of 42% ± 6 and a perfect balance between sensitivity and accurate quantification of TMT-labeled cross-linked peptides from complex samples. Previously described MS2-MS3-based methods were shown to have exhaustive duty cycles, hampering the identification of cross-linked peptides, although their quantification capabilities overcame MS2-based methods. Secondly, utilizing a real-time library search (RTLS) algorithm was shown to increase cross-link identifications by 45% as the instrument was able to partially distinguish cross-links from other peptide species based on the unique relative intensity pattern of a set of four diagnostic peaks. This was achieved by performing a fast scan on each precursor and comparing it on-the-fly to a library of theoretical spectra for cross-links and other species. Exhaustive identification scans were only triggered when the previous survey scan matched to the theoretical cross-link spectrum. Lastly, I generated a dataset with known PPIs by mixing purified proteins according to a defined scheme and heat-induced interactions. The dataset was used to monitor the empirical false-discovery rate of various existing database search algorithms. Multiple features of spectral quality from this dataset have been used to develop Scout, a machine-learned cross-link search engine that greatly outperforms other software in terms of usability, sensitivity, reliability and speed. Taken together, these methodological achievements display a considerable progress for the XL-MS community by providing versatile tools that will promote the research on PPIs across various biological models.
Protein-Protein Interaktionen (PPIs) bilden die Grundlage vieler biologischer Prozesse. Cross-Linking Massenspektrometrie (XL-MS) ermöglicht das Detektieren von PPIs aus komplexen biologischen Systemen und sogar in vivo Szenarios. Dies wird erreicht durch die Kombination der Quervernetzung von Organellen, Zellen oder Geweben mittels kleiner, reaktiver Moleküle mit proteolytischem Verdau und LC-MS (Flüssigchromatografie gekoppelt mit Massenspektrometrie) Analyse. Da sich jedoch ihre Abundanz und physikalisch-chemischen Eigenschaften von denen unmodifizierter Peptide unterscheiden, sind für ihre zuverlässige Identifikation und genaue Quantifizierung spezielle Protokolle, effiziente Messmethoden und Datenanalyseverfahren notwendig. Im Verlauf dieser Arbeit wurden mehrere Schritte des XL-MS Arbeitsvorgangs optimiert, darunter (1) die Optimierung der Messparameter für den Nachweis und die Quantifizierung isobar markierter vernetzter Peptide, (2) die Entwicklung neuartiger Methoden für die gezielte Identifikation vernetzter statt unvernetzter Peptide und (3) die Bereitstellung eines kontrollierten Datensatzes für die Validierung bestehender oder die Entwicklung neuer Software für die Analyse von XL-MS Daten. Zuerst habe ich eine schnelle MS2-basierte Methode mit einer optimierten gestuften Kollisionsenergie von 42% ± 6 für die optimale Balance zwischen Sensitivität und akkurater Quantifizierung TMT-markierter, vernetzter Peptide aus komplexen Proben konzipiert. Zuvor entwickelte MS2-MS3-basierte Methoden haben nachweislich ausgelastete Laufzyklen, was den Nachweis vernetzter Peptide erschwert, obwohl ihre Quantifizierungskapazitäten die von MS2-basierten Methoden übertreffen. Zweitens habe ich gezeigt, dass die Verwendung eines Echtzeit-Suchalgorithmus die Anzahl identifizierter vernetzter Peptide um 45% erhöht, da das Instrument mithilfe eines einzigartigen Musters relativer Intensitäten von vier diagnostischen Peaks vernetzte Peptide von unvernetzten unterscheiden konnte. Dies wurde erreicht, indem für jeden Precursor ein schneller Abfragescan durchgeführt wurde, der während der Messung mit theoretischen Spektren vernetzter und unvernetzter Peptide verglichen wurde. Ausgiebige Identifikations-Scans wurden nur dann ausgelöst, wenn der Abfragescan mit dem theoretischen Spektrum vernetzter Peptide übereinstimmte. Und schließlich generierte ich einen Datensatz mit kontrollierten PPIs, indem ich aufgereinigte Proteine nach einem bestimmten Schema zusammengab und Interaktionen durch Hitze induzierten. Der Datensatz wurde verwendet um die empirische Falscherkennungsrate verschiedener bestehender Datenbanksuchalgorithmen zu überprüfen. Mehrere spektrale Merkmale wurden zudem verwendet, um Scout zu entwickeln, eine neuartige maschinen-gelernte Suchmaschine für vernetzte Peptide, die andere Programme in Benutzerfreundlichkeit, Sensitivität, Zuverlässigkeit und Geschwindigkeit übertrifft. Zusammenfassend lässt sich sagen, dass diese methodischen Fortschritte einen bedeutenden Nutzen für die XL-MS Gemeinschaft darstellen, da sie Werkzeuge bereitstellen, die die Erforschung von PPIs aus verschiedenen biologischen Modellen erleichtern werden.