The topic of this thesis is the determination of a three-dimensional structure of outer membrane protein G (OmpG) from E. coli in its native lipid environment by solid state magic-angle-spinning (MAS) NMR. For this purpose, it was necessary to develop and test new methods for enabling resonance assignments, the collection of distance restraints as well as methods for structure calculation. The lipid bilayer is thought to influence structure and function of membrane proteins, and one of the advantages of solid-state NMR over other methods in structural biology is that this technique allows membrane proteins to be studied in their native environment. OmpG is a porin in the outer membrane of E. coli and has a molecular weight of 34 kDa, with 281 amino acid residues forming a β-barrel composed of 14 strands. The sequence of OmpG is longer than that of most other proteins of which a structure was solved so far by solid state MAS NMR. Since the complexity of NMR spectra increases with the number of amino acids in a protein, OmpG is a challenging system, requiring the development of new assignment strategies. Furthermore, it is an appropriate test system to benchmark the effectiveness of new NMR experiments. First attempts to assign OmpG were made using 13C- detected spectra, as this was the most common detection method in solid-state NMR at the time this project was started. To reduce spectral overlap and the ambiguity of cross-peak assignment, a set of amino acid-specifically 13C- labeled OmpG samples was produced. This set included samples where only a few amino acids at a time were labeled, such as GAVLS, GAFY and RIGA. The spectra recorded of these samples offered a starting point for the sequential assignment. Other labeling schemes tested were based on the specific carbon labeling pattern obtained when glycerol labeled either on the first and third carbon positions (1,3-glycerol) or the second carbon position (2-glycerol) is used as the sole carbon source during protein expression. Combining the glycerol labeling method with a reverse labeling strategy, two more schemes were produced, in which a specific set of amino acids was labeled following the 1,3- or 2-glycerol labeling pattern: 1,3- and 2-TEMPQANDSG and 1,3- and 2-SHLYGWAFV. These samples allowed the initial assignment to be extended. However, it was not possible to arrive at an assignment to such an extend that structure determination became possible, using 13C-detected experiments alone. In recent years, solid-state NMR has seen enormous progress. The availability of perdeuterated and partially back-exchanged protein samples and fast spinning probes has opened up the possibility to detect protons. Using this strategy, a set of spectra was recorded on perdeuterated and partially back- exchanged samples of OmpG, where all amino acids were as well 15N/13C-labeled. The set of 1H-detected experiments allows the assignment of the amide 1H and 15N, Cα and Cβ resonances and greatly simplifies the assignment strategy. It is a characteristic of the methodology developed in this thesis that data from the deuterated samples were evaluated together with data obtained on amino acid-selectively labeled samples in order to arrive at a trustful assignment. The Cα and Cβ chemical shifts obtained from 1H-detected spectra were used to find corresponding peak patterns in the 13C-detected spectra, giving access to side-chain 13C chemical shifts. The knowledge of side-chain 13C chemical shifts results in more specific amino acid typing, which further facilitated the sequential assignment. Furthermore, cross-peaks in the 13C-detected spectra, provide extra evidence that a sequential assignment is correct. With this combined approach, using information from 13C- and 1H-detected spectra, residues in the regions of the sequence that correspond to the membrane- embedded β-barrel could be assigned. Using these assignments and distance restraints from a set of through-space correlation experiments between carbons and protons, the structure of OmpG in its native lipid environment could be calculated. Ambiguous distance restraints were disambiguated using the ambiguous restrain iterative assignment (ARIA) protocol. The final structure has a backbone rmsd of ~1.6 Å for the residues in the β-sheets and closely resembles the structure calculated before using solution NMR. The structure deviates from available crystal structures in the extra-cellular part of the protein. In this part of the protein, the structure calculated here shows large flexible loops, like in the solution NMR structure. In contrast, in the crystal structures the β-sheets are extended and on most strands, only small turns, instead of loops, remain. This can be explained by crystal contacts stabilizing the extended structure. The progress made in our OmpG project allows to design further experiments that yields more insight into the pH- dependent opening and closing mechanism of the porin. Furthermore, the new methodology presented here and verified by the successful structure determination of a membrane protein in its native lipid environment opens up the way to structural investigations of proteins under similar sample conditions.
Ziel der vorliegenden Arbeit ist die Bestimmung der drei-dimensionalen Struktur des aus E. coli stammenden Proteins Outer Membrane Protein G (OmpG) in seiner nativen Lipidumgebung mittels Festkörper - NMR Spektroskopie. Dazu war es notwendig neue Methoden für die Zuordnung der Resonanzsignale sowie für die Bestimmung von Strukturparametern und Berechnung der Struktur zu entwickeln und zu testen. Da die Lipiddoppelschicht die Struktur und Funktion von Membranproteinen beeinflusst, ist die Festkörper-NMR besonders für Studien dieser Proteine geeignet. Sie ermöglicht im Gegensatz zu anderen Methoden der Strukturbiologie Untersuchungen in der natürlichen Umgebung von Proteinen. OmpG ist ein Porin in der äußeren Membran von E. coli, es besteht aus 281 Aminosäuren die ein aus 14 Strängen aufgebautes β-barrel bilden und hat ein Molekulargewicht von 34 kDa. Die Sequenz von OmpG ist länger als die der meisten Proteine deren Struktur bisher mittels Festkörper-NMR gelöst wurde. Die Anwendung von NMR an diesem herausfordernden System erfordert die Entwicklung neuer Zuordnungsstrategien, da die Komplexität von NMR Spektren mit der Anzahl an Aminosäuren eines Proteins zunimmt. Darüber hinaus ist es ein geeignetes Testsystem um die Effektivität neuer NMR Experimente zu validieren. Erste Versuche die Signale von OmpG zuzuordnen wurden mit 13C- detektierten Spektren unternommen, da diese Detektionsmethode zu Projektbeginn die meistverbreitete in der Festkörper-NMR war. Um spektrale Überlagerungen und die Uneindeutigkeit der Zuordnung von Kreuzsignalen zu reduzieren, wurden verschiedene Aminosäuren-spezifischen 13C-markierte Proben von OmpG hergestellt. Diese umfassen auch solche, in denen nur einige wenige Aminosäuren markiert wurden, beispielsweise GAVLY, GAFY und RIGA. Die Spektren dieser Proben ermöglichten es mit der sequentiellen Zuordnung zu beginnen. Andere verwendete Markierungsprotokolle basierten auf dem resultierenden spezifischen Kohlenstoff-Markierungsmuster in welchen Glycerol, entweder in der ersten und dritten (1,3-glycerol) oder in der zweiten (2-glycerol) Kohlenstoffposition ^13^C-markiert, als einzige Kohlenstoffquelle während der Proteinexpression eingesetzt wird. Durch Kombination dieser Glycerol- Markierungsmethode und einer umgekehrten Markierungsstrategie konnten zwei weitere Schemata erzeugt werden, in welchen Aminosäuren gemäß den Regeln der 1,3- und 2-glycerol Markierung spezifisch markiert werden konnten: 1,3- und 2-TEMPQANDSG und 1,3- und 2-SHLYGWAFV. Diese Proben ermöglichten weitere Zuordnungen von Resonanzen. Die Verwendung von ausschließlich 13C-detektierten Experimenten war allerdings nicht ausreichend eine für die Strukturbestimmung hinreichende Anzahl an Signalen zuzuordnen. In den letzten Jahren wurden enorme Fortschritte in der Weiterentwicklung der Festkörper-NMR erzielt. Die Verfügbarkeit von deuterierten und teilweise reprotonierten Proteinproben und schnell drehenden Probenköpfe hat die Möglichkeit Protonen zu detektieren eröffnet. Dieser Strategie folgend, wurden Spektren von deuterierten und teilweise rück-getauschten OmpG-Proben, in denen alle Aminosäuren zudem 15N/13C markiert wurden, aufgenommen. Der Satz an 1H-detekierten Experimenten ermöglicht die Zuordnung der Amidprotonen und der 15N, Cα und Cβ Resonanzen und vereinfacht die Zuordnungsstrategie deutlich. Es ist für die in dieser Arbeit entwickelten Methode charakteristisch, dass Daten von deuterierten Proben gemeinsam mit Daten von Aminosäure-spezifisch markierten Proben evaluiert wurden um die zuverlässige Zuordnung zu gewährleisten. Die chemischen Verschiebungen von Cα und Cβ in den 1H-detektierten Spektren konnten dazu verwendet werden korrespondierende Signalmuster in den 13C- detektierten Experimenten zu analysieren, was Zugang zu den chemischen Verschiebungen der Kohlenstoffe der Aminosäure-Seitenketten ermöglichte. Die Kenntnis über diese chemischen Verschiebungen führt zu einer exakteren Typisierung der Aminosäuren, was im Weiteren die sequentielle Zuordnung der Signale erlaubt. Zudem konnten mit Hilfe der Kreuzsignale in den 13C- detektierten Spektren die Korrektheit sequentieller Zuordnungen bestätigt werden. Mit der Kombination aus 1H- und 13C-detektierten Spektren konnten Aminosäure-Reste der Sequenzregion die zu dem in der Membran eingebetteten β-barrel korrespondiert, zugeordnet werden. Mit Hilfe dieser Zuordnungen und Abstandsmessungen von Korrelationsexperimenten, in denen Magnetisierung durch den Raum zwischen Kohlenstoffen und Protonen ausgetauscht wird, konnte die Struktur von OmpG in seiner nativen Lipidumgebung berechnet werden. Durch die Verwendung des *Ambiguous Restrain Iterative Assignment* (ARIA) Protokolls konnten Abstandsparameter eindeutig zugeordnet werden. Die endgültige Struktur hat ein RMSD des Proteinrückgrates von ~1.6 Å für Aminosäuren in den β-Strängen und ähnelt der Struktur, die bereits mittels Lösungs-NMR gelöst wurde. Die Struktur weicht in den extra-zellulären Bereichen des Proteins von verfügbaren Kristallstrukturen ab. In diesen Bereichen zeigt die hier ermittelte Struktur große flexible loops, ähnlich wie in der mittels Lösungs- NMR bestimmten Struktur. Im Gegensatz dazu sind in den Kristallstrukturen die β-Stränge verlängert und anstatt loops sind nur kurze strukturelle Wendungen festzustellen. Dies kann durch Kristallkontakte, die eine verlängerte Struktur stabilisieren erklärt werden. Der Fortschritt in diesem OmpG Projekt ermöglicht die Konzeption neuer Experimente, die neue Einblicke in den pH- abhängigen Öffnungs- und Schließmechanismus des Porins bieten können. Darüber hinaus ermöglicht die hier vorgestellte neue Methode, die durch die erfolgreiche Bestimmung der Struktur eines Membranproteins in seiner nativen Lipidumgebung verifiziert wurde, neue strukturelle Untersuchungen von Proteinen unter ähnlichen Probenbedingungen.