Nuclear Magnetic Resonance (NMR) spectroscopy has become an important tool to investigate the structure and dynamics of proteins and protein complexes. The recent progress in solution and solid-state NMR opens the door to detailed analyses of large macromolecular structures, and notably, symmetric protein aggregates. In this context, the determination of high resolution three- dimensional structures of proteins by NMR critically relies on efficient and reliable automated assignment strategies. In this thesis, several methods were developed for automated assignment and structure calculation from NMR data in the framework of the Ambiguous Restraints for Automated Assignment (ARIA) protocol. These methods tackle the majors issues of structure determination by modern NMR spectroscopy. First, the incorporation of a network anchoring approach in the ARIA methodology was shown to considerably speed-up the NOE assignment process while preserving a high structural quality of the obtained models. With a new protocol based on the Internal Coordinates Molecular Dynamics (ICMD) methodology, it was also demonstrated that the structures of small proteins can be calculated through a molecular dynamics based simulated annealing protocol entirely performed with a complete general purpose force- field. With regard to the structural quality of the models, this approach can be considered as intermediate between structure calculation with a simple force-field and refinement in a shell of water molecules. In a second stage, the difficult problem of de novo structure determination of symmetric protein assemblies from NMR data was considered. For symmetric homo–dimers, a specific approach based on ambiguous distance restraints was shown to perform well when the ambiguity of the restraints is limited to an ambiguity of chain. For some homo–dimeric folds, network anchoring was found to be essential for unravelling both chain and proton assignment ambiguities and for calculating high quality dimeric structures from completely unassigned NOE cross-peaks. Furthermore, a new general method based on strict symmetr y definitions was conceived for structure calculation of any type of symmetric assemblies from both solution and solid-state NMR data. This method was successfully applied to the calculation of a pentameric membrane protein structure and of amyloid fibrils from ambiguous ssNMR distance restraints. In addition, an analysis of the conformational landscape of the Crh protein during oligomerisation and crystallisation was conducted with a simultaneous use of solution-state, solid-state NMR and X-ray crystallography data. The generation of NMR and crystallographic conformers, as well as molecular dynamics simulations allowed us to describe the impact of the long-range solid-state order on the convergence. The variability of Crh monomer orientation is concentrated in rotations around the dimer longitudinal axis, which is amplified but not created by the use of distance restraints. Finally, we have addressed the problem of high-resolution structure determination from Magic Angle Spinning (MAS) solid-state NMR data, which is often hampered by two crucial complications : the high level of ambiguity present in the spectra and the detection of inter-molecular correlations. By adapting the ARIA methodology to the specific case of CHHC/NHHC ssNMR spectra recorded on a uniformly labelled sample, it was possible to determine the structure of the dimeric Crh protein without manual cross-peak assignment. Moreover, a specific protocol was designed to refine the structure of micro-crystalline proteins incorrectly resolved from MAS ssNMR spectra, due to the presence of inter-molecular correlations. By taking into account the overall configuration of the crystal lattice in the calculation, it was possible to drastically increase the accuracy of the SH3 domain structure from a subset of reliable unassigned cross-peaks.
Die Kernspinresonanzspektroskopie (NMR) ist ein wichtiges Werkzeug, um die Struktur und Dynamik von Proteinen und Proteinkomplexen zu untersuchen. Neue Fortschritte in der Lösungsmittel- und der Festkörper-NMR (ssNMR) ermöglichen detailierte Analysen grosser makromolekularer Strukturen, insbesondere symmetrischer Proteinaggregate. In diesem Kontext hängt die Bestimmung von hochaufgelösten dreidimensionalen Proteinstrukturen mittels NMR kritisch von effizienten und verlässlichen automatisierten Assignmentstrategien ab. In der vorliegenden Arbeit wurden mehrere Methoden für die automatische Zuordnung und Strukturrechnung aus NMR-Daten im Rahmen des Protokolls “Ambiguous Restraints for Automated Assignment” (ARIA) entwickelt. Diese Methoden nehmen die wichtigsten Schwierigkeiten der Strukturbestimmung mittels moderner NMR- Spektroskopie in Angriff. Im ersten Teil der Arbeit wurde gezeigt, dass die Verwendung einer Netzwerkverankerung im ARIA-Protokoll die NOE-Zuordnung erheblich beschleunigt und zugleich die hohe Qualität der Strukturen erhält. Desweiteren wurde gezeigt, dass ein neues Protokoll, das auf der Molekulardynamik (MD) in internen Koordinaten (ICMD) beruht, die Berechnung der Strukturen kleiner Proteine mittels MD-basiertem Simulated Annealing in einem vollen MD-Kraftfeld ermöglicht. Bezüglich der Qualität der Strukturen kann dieser Zugang als ein Zwischenschritt in der Strukturberechnung mit vereinfachtem Kraftfeld und einer Verfeinerung in einer Box von Wassermolekülen angesehen werden. Im zweiten Teil dieser Arbeit wurde das schwierige Problem der De-novo-Strukturbestimmung symmetrischer Proteinkomplexe behandelt. Für symmetrische Homodimere wurde gezeigt, dass ein Zugang basierend auf mehrdeutigen Distanzeinschränkungen zufriedenstellend abschneidet, wenn die Mehrdeutigkeit in den Distanzeinschränkungen auf die Mehrdeutigkeit in der Zuweisung der Polypeptidkette beschränkt ist. Für einige Faltungen von Homodimeren stellte sich die Netzwerkverankerung als essentiell heraus, um Mehrdeutigkeiten sowohl in der Ketten- als auch der Protonenzuordnung aufzulösen, und um qualitativ hochwertige Dimerstrukturen aus komplett nicht-zugeordneten NOEs zu berechnen. Desweiteren wurde eine neue Methode entwickelt, die auf strikten Symmetry definitionen basiert und die Strukturrechnung von Komplexen, die eine beliebige Symmetrie aufweisen, von Lösungmittel- und Festkörper- NMR-Daten ermöglicht. Diese Methode wurde erfolgreich in der Berechnung einer Membranproteinstruktur mit fünffacher Symmetrie sowie von Amyloidfibrillen aus mehrdeutigen ssNMR- Distanzeinschränkungen eingesetzt. Zusätzlich wurde eine Analyse der Konformationslandschaft des Crh Proteins während der Oligomerisierung und Kristallisation durchgeführt unter gleichzeitiger Verwendung von Lösungmittel- NMR, Festkörper-NMR und röntgenkristallographischen Daten. Die Generierung von NMR- und kristallographischen Konformern sowie MD-Simulationen erlaubten uns, den Einfluss der langreichweitigen Festkörperordnung auf die Konvergenz zu beschreiben. Die Variabilität der Crh-Monomer-Orientierung konzentriert sich in Rotationen um die Längsachse des Dimers, diese wird durch den Gebrauch von Distanzeinschränkungen verstärkt, aber nicht erzeugt. Schliesslich wurde das Problem der hochaufgelösten Strukturbestimmung aus Magic Angle Spinning (MAS) Festkörper-NMR-Daten bearbeitet; hier treten zwei Schwierigkeiten auf: der hohe Grad an Mehrdeutigkeit in den Spektren und das Aufspüren von intermolekularen Korrelationen. Durch Anpassung der ARIA-Methode für den spezifischen Fall der CHHC/NHHC-ssNMR-Spektren, welche für eine uniform markierte Probe gemessen wurden, konnten wir die Struktur eines Crh-Dimers berechnen, ohne zuvor die Kreuzsignale manuell zuzuordnen. Ausserdem wurde ein Protokoll entwickelt, um die Struktur mikrokristalliner Proteine zu verfeinern, die aufgrund inter-molekularer Korrelationen falsch aus MAS-ssNMR- Spektren aufgelöst wurden. Durch Berücksichtigung der gobalen Konfiguration des Kristallgitters in der Strukturrechnung war es möglich, die Genauigkeit der Struktur einer SH3-Domäne aus einer Untermenge verlässlicher, nicht- zugeordneter Kreuzsignale dramatisch zu verbessern.