In the last few years, protein structure determination by solution NMR has benefited enormously from the introduction of software packages for automatically assigning NOESY spectra of small proteins. However, experience shows that more robust protocols are required to tackle the problem of structure calculation of larger proteins or protein complexes. Also, new challenges such as the automation of protein structure determination by MAS solid-state NMR need to be addressed. This first part of this work represents a thorough study of the influence of the input conditions on the performance of such programmes, using the ARIA protocol (Ambiguous Restraints for Iterative Assignment) as an example. The second section is focused on automated structure calculations using solid-state NMR data. In Chapters 3 and 4, the influence of three important parameters, the chemical shift tolerances D, the cut-off nmax for the assignment possibilities of a peak and the number of simulated annealing cooling steps, was extensively investigated. A large number of structure calculations on datasets from five proteins were performed in which these three parameters were systematically varied. In the course of this study, the dependence of the average number of assignment options per peak (nav) and of the number of rejected peaks on D and nmax was studied and rationalised by mathematical relations. It turned out that these functions might be employed as a diagnostic tool to detect macroscopic anomalies in datasets, and, most importantly, to guide the choice of Dand nmax prior to structure calculation. A Python script, named Cesta.py, was created and made freely available for rapidly evaluating these diagnostic functions prior to structure calculations. In Chapter 5, a modification of the ARIA procedure is described, which is specifically designed to assign cross-peaks of solid-state NMR PDSD spectra. This new software, SOLARIA, accepts also typical solid-state 13C-13C and 13C-15N correlations in the input peak lists and exploits the characteristic 13C-labelling scheme of the samples to simplify the assignment of the cross-peaks. PDSD spectra are notably affected by extensive resonance overlap and large line widths, which prevent an accurate measurement of the chemical shifts. To compensate for this, generous values of the tolerances D have to be chosen, which leads to high numbers of assignment options per peak. Furthermore, PDSD spectra lack a clear dependence of measured volumes on inter-nuclear distances. Such a problem was circumvented in SOLARIA by the use of unusually large, uniform boundaries for all distance restraints, which reduces, however, their effectiveness in restraining the structure. The quality of the structures of the SH3 domain calculated by SOLARIA expressed as root-mean-square deviation to the X-ray reference varied from 1.3 Å, when inter-molecular cross-peaks were manually removed, to 2.2 Å, when they were included in the calculation. This is the first example of protein structure determination by automated assignment of MAS NMR spectra of solid protein samples. The automation of cross-peak assignment resulted in a dramatic speed- up of the whole procedure and, most importantly, provided a way to handle unassigned, ambiguous cross-peaks in MAS NMR spectra.
In den letzten Jahren hat die Proteinstrukturbestimmung mittels NMR von der Einführung von Softwarepaketen für die automatische Zuordnung von NOESY Spektren und die Strukturberechnung kleiner Proteine stark profitiert. Robustere Protokolle sind jedoch notwendig, um das Problem der Strukturberechnung von größeren Proteinen und von Proteinkomplexen anzugehen. Zusätzlich ergeben sich mit der Automatisierung von Strukturbestimmung durch MAS NMR neue Herausforderungen, zu deren Bewältigung neue Lösungswege beschritten werden müssen. Der erste Teil dieser Arbeit stellt eine Untersuchung des Einflusses der Eingabeparameter auf die Leistung solcher Programme anhand des Beispiels des ARIA-Protokolls dar. Der zweite Teil beschäftigt sich mit der Automatisierung von Proteinstrukturbestimmung mittels Festkörper-NMR Daten. In den Kapiteln 3 und 4 wird der Einfluss dreier wichtiger Parameter, der Toleranzen Dfür die chemischen Verschiebungen, des Höchstwertes nmax für die Zuordnungsmöglichkeiten eines Kreuzsignals und der Kühlungsgeschwindigkeit während des Simulated Annealing, untersucht. Dazu wurden viele Strukturberechnungen angesetzt, in denen diese Parameter systematisch geändert wurden. Dabei wurde die Abhängigkeit von D und nmax der Durchschnittsanzahl der Zuordnungsmöglichkeiten pro Kreuzsignal und der Anzahl der verworfenen Kreuzsignale untersucht und durch Formeln beschrieben. Diese Untersuchungen zeigten, dass solche Funktionen als diagnostisches Werkzeug benutzt werden können, um makroskopische Anomalien zu erkennen, und, was noch wichtiger ist, bei der Auswahl von D und nmax vor der Strukturberechnung zu helfen. Ein frei herunterladbares Python Script, Cesta.py, wurde erstellt, um diese diagnostischen Funktionen vor der Strukturberechnung schnell auszuwerten. Im Kapitel 5 wird eine Abwandlung des ARIA-Verfahrens beschrieben, die besonders dafür geeignet ist, Kreuzsignale in PDSD Festkörper-NMR-Spektren zuzuordnen. Dieses neue Software, SOLARIA, akzeptiert auch typische Festkörper-Korrelationen in den Kreuzsignallisten und nutzt das charakteristische Markierungsmuster der Proben, um die Zuordnung zu vereinfachen. PDSD Spektren zeigen bekanntlich eine höhere Überlagerung von Resonanzen und große Linienbreiten, die eine genaue Messung der chemischen Verschiebungen erschweren. Um Zuordnungsfehler zu vermeiden, müssen große Werte für die D-Toleranzen gewählt werden, welche zu einer großen Anzahl von Zuordnungsmöglichkeiten führen. Dazu mangelt es PDSD Spektren an einer deutlichen Abhängigkeit der gemessenen Volumina von internuklearen Abständen. Dieses Problem wurde in SOLARIA dadurch gelöst, dass außergewöhnlich große und gleiche Grenzen für alle Abstandsschranken benutzt werden, die jedoch ihre Nützlichkeit, die Struktur zu definieren, mindern. SOLARIA lieferte genaue Strukturen von der SH3 domäne, mit mittlerer quadratischer Differenz zu der Röntgen-Referenzstruktur von 1.3 Å, wenn die intermolekularen Kreuzsignale manuell verworfen wurden, oder 2.2 Å, wenn sie in die Rechnung einbezogen wurden. Das ist das erste Beispiel von Strukturbestimmung eines Proteins im Festkörper mittels automatischer Zuordnung von MAS-NMR Spektren. Die Automatisierung der Kreuzsignalzuordnung führte zu einer erheblichen Beschleunigung des gesamten Verfahrens und, was noch wichtiger ist, ermöglichte die Zuordnung von sehr mehrdeutigen Kreuzsignale, die man manuell nicht zuordnen konnte.