Viele humane Krankheiten, wie Alzheimer [89], Krebs [83]), Muskeldystrophie [54], „Liddle-Syndrom“ [118] und Huntington [119] können auf fehlregulierte WW-Domänen-vermittelte Signalwege zurückgeführt werden. Erstmalig beschrieben wurden WW-Domänen 1994 von Bork und Sudol [67], die diesen Domänen auf Grund zweier hochkonservierter Tryptophane (W) innerhalb ihrer Consensus-Sequenz auch ihren Namen verliehen. Mit nur ca. 40 Aminosäuren gehören sie zu den kleinsten Proteindomänen. Sie binden bevorzugt prolinreiche Sequenzmotive (PRS) und sind, mit Ausnahme von Bakterien, hoch konserviert in allen Organismengruppen präsent. Der humane Transkriptionsfaktor CA150 (Synonym: TCERG1 transcription elongation regulator 1) ist eines dieser Proteine. Es besitzt neben sechs FF-Domänen und zwei N- und C-terminal lokalisierten PRS, gleich drei WW-Domänen, die durch außergewöhnlich lange Linkersequenzen miteinander verknüpft sind. CA150 interagiert mit verschiedensten Proteinen und ist so an der Regulation der Elongation der RNA-Polymerase II, der Koordinierung der Transkription und der prä-mRNA-Prozessierung beteiligt. Dementsprechend konnten unter anderem Interaktionen der WW- und FF-Domänen zur RNA-Polymerase II [112,116] sowie Wechselwirkungen der WW-Domänen (1&2) mit den PRS des Spleißfaktors SF1 [112] nachgewiesen werden. Darüber hinaus kann CA150 auch mit der mutierten Form des Huntingtin-Proteins interagieren, wodurch dem Protein eine wichtige Rolle im Krankheitsverlauf von Huntington zukommt [87]. Es besteht daher ein großes Interesse, die molekularen Mechanismen CA150-vermittelter Wechselwirkungen besser zu verstehen. Die Vielzahl der bisher identifizierten CA150-Interaktionspartner und das mehrfache Vorhandensein gleicher Funktionseinheiten legen nahe, dass CA150 mit vielen Zielproteinen multivalent wechselwirken könnte. Die Multivalenz könnte zum einen über das Tandem der drei aufeinanderfolgenden WW-Domänen und zum anderen über die beiden PRS realisiert sein. Der Fokus dieser Arbeit lag insbesondere auf der systematischen Analyse von Interaktionen der isolierten WW-Domänen und Tandem-WW-Konstrukten aus CA150 mit Teilbereichen der PRS aus SF1 (SF1PRS) sowie Teilbereichen der N-terminalen PRS aus CA150 selbst (CA150PRS). Um ein besseres Verständnis grundlegender Mechanismen der multivalenten Wechselwirkungen zu erlangen, aber auch um Erkenntnisse bezüglich der Organisation der drei WW-Domänen in CA150 zu gewinnen, wurde eine Vielzahl molekular-biologischer, biochemischer und biophysikalischer Methoden angewendet. Die codierenden Sequenzen verschiedener CA150 WW- Varianten wurden in verschiedene Vektoren kloniert. Zur Maximierung der Ausbeuten unmarkierter bzw. isotopenmarkierter Proteine wurden die Expressionsbedingungen optimal an die zu exprimierenden WW-Varianten angepasst. Für diverse GST-WW und His-WW-Konstrukte wurde eine IMAC-basierte Reinigungsstrategie entwickelt. Durch SILAC-Pulldown-Experimente konnte die Aktivität der rekombinanten WW-Domänen verifiziert werden, indem bekannte sowie neue, bisher unbekannte, Interaktionspartner gefunden wurden. Der SILAC- Pulldown lieferte auch erste Hinweise dafür, dass CA150 mit sich selbst interagieren könnte. In einer SPOT-Analyse wurde die Interaktion zwischen Teilbereichen der N-terminalen CA150PRS und den drei CA150-WW-Domänen verifiziert. Darüber hinaus konnte mittels AUZ gezeigt werden, dass die bivalente Bindung einer ausgewählten CA150PRS-Sequenz dazu führt, dass ein WW23-Tandem eine Konformationsänderung erfährt. Eine artifizielle Oligomerisierung des WW23-Tandems konnte durch die AUZ ausgeschlossen werden. SPOT-Analysen mit SF1PRS-Teilbereichen zeigten neben mehreren Interaktionen mit WW1 und WW2, auch verschiedene Wechselwirkungen mit WW3. Durch die Aufnahme von HSQC-basierten Triple-Resonanz-Spektren von 13C15N-markiertem WW23-Protein konnten 75% der 1H15N-Korellationen sequentiell eindeutig zugeordnet werden. Die Resonanzen der einzelnen WW-Domänen wurden fast vollständig identifiziert. Durch die sequentielle Zuordnung war es möglich, die dynamischen Eigenschaften des Proteinrückgrades des WW23-Tandems NMR- spektroskopisch zu ermitteln. Dabei wurden neue Domänengrenzen für WW2 und WW3 aufgedeckt. Die strukturdynamischen Untersuchungen in Kombination mit sequenzbasierten (Psipred) und "chemical shift"-basierten (Talos+) Sekundärstrukturvorhersagen zeigten, dass der Linker zwischen WW2 und WW3 aus einem zentralen unstrukturierten Abschnitt besteht, der von zwei α-helikalen Bereichen flankiert wird. Die sequentielle Zuordnung erlaubte zusammen mit den NMR-Bindungsstudien auch die Identifizierung der Interaktionsstellen für bestimmte bivalente Peptide. Dadurch konnte gezeigt werden, welche WW- Bindetasche („xP“, „xP2) in der jeweiligen Bindungssituation vom Peptid genutzt wird und zusätzlich die Existenz einer postulierten „xP2“-Tasche innerhalb der WW3 bestätigt werden. Um in Bindungsstudien mono- und bivalente Wechselwirkungen eindeutig identifizieren zu können, war es notwendig, Mutanten vom WW23-Tandem zu erzeugen, in denen die Bindungsaktivität einer Domäne durch eine Punktmutation in der „xP“-Tasche ausgelöscht wurde. Der Einsatz der Mutanten in ITC-Bindungsstudien ermöglichte es, die Affinitäten von mono- und bivalenten Interaktionen zu ermitteln und vergleichend zu analysieren. In den ITC-Bindungsstudien wurden durchweg schwache Affinitäten detektiert. Aus den Ergebnissen der Interaktionsanalysen konnten zwei Mechanismen bivalenter Wechselwirkungen abgeleitet werden. Ersterer führte durch Kombination einer spezifischen und einer unspezifischen Wechselwirkung zu einer deutlichen Affinitätserhöhung. Der Zweite basiert auf zwei spezifischen Wechselwirkungen. Diese führten jedoch nicht zu einer verstärkten, sondern zu einer veränderten Interaktion in der Art, dass in der bivalenten Bindungssituation mindestens eine WW-Domäne über andere Oberflächenbereiche wechselwirkt, als bei der monovalenten Bindung. Durch Kombination der Daten der Interaktionsanalysen konnten auch die Bindepräferenzen der WW-Domänen ermittelt und bisher unbekannte prolinreiche Motive identifiziert werden. So konnte gezeigt werden, an welchen Positionen der CA150PRS die WW-Domänen binden können. Darauf aufbauend konnten hypothetische Modelle bivalent intramolekularer bzw. tetravalent intermolekularer CA150WW/CA150PRS-Interaktionsmechanismen abgeleitet werden.
Diverse human diseases, such as Alzheimer’s [89], cancer [83], muscular dystrophy [54], „Liddle-syndrome“[118] and Huntington [119] have been implicated with miss regulated WW domain mediated pathways. WW domains were described first by Bork und Sudol [67] in 1994. Based on the presence of two highly conserved tryptophan residues (W) within the consensus sequence, they were named WW domains. They belong to the smallest protein domains containing on average 40 amino acids. They preferentially bind proline-rich sequence motifs (PRS) and are highly conserved in all organisms, except bacteria. One of these WW domain containing proteins is the human transcription factor CA150 (synonym: TCERG1 transcription elongation regulator 1). It consists additionally six FF domains, a N- and a C-terminal PRS as well as three WW domains, which are linked by exceptionally long linker sequences. CA150 is involved in the regulation of the elongation of RNA polymerase II, the coordination of transcription and pre-mRNA processing by interacting with many different proteins. Among others, interactions of the WW and FF domains with the RNA polymerase II [112,116] and interactions of the WW domains (1 & 2) with the PRS of the splicing factor SF1 [112] were detected. Moreover, CA150 also interacts with the mutated form of the huntingtin protein (HTT), whereby the protein plays an important role in huntington’s disease [87]. It is of high medical interest to elucidate the molecular mechanisms of CA150 mediated interactions. Both, many previously identified CA150-interacting proteins and the presence of multiple equal functional units suggests that CA150 might interact multivalent with many target proteins. The multivalency could be realized on the one hand through the tandem of the three successive WW domains and on the other hand on the two PRS. This work focuses mainly on the systematic analysis of interactions between isolated or tandem CA150 WW domain constructs and PRS motifs of SF1 (SF1PRS) as well as motifs of the N-terminal CA150PRS. To gain a better understanding of basic mechanisms of multivalent interactions, but also to get insights into the organization of the three WW domains in CA150, a variety of molecular biological, biochemical and biophysical methods have been used. The coding sequences of different CA150 WW variants were cloned into different E. coli expression vectors. In order to yield efficient amounts of unlabeled and isotopic labeled WW variants, the expression conditions have been optimized. For various GST-WW and His-WW constructs, an IMAC-based purification strategy was developed. The activity of recombinant WW domains could be verified by SILAC pull-down experiments, by identifying known and new, previously unknown, interaction partners. The SILAC pull-down also provided the first evidence that CA150 might interact with itself. Furthermore, the interaction between sub-regions of the N-terminal CA150PRS and the three CA150 WW domains was verified by SPOT analysis experiments. Moreover, it was shown by means of analytical ultracentrifugation (AUC) that the bivalent binding of a selected CA150PRS sequence causes a conformational change of a WW23 tandem. An artificial oligomerization of the WW23 tandems could be screened out by the AUC measurements. SPOT analysis with SF1PRS sub-regions showed besides several interactions with WW1 and WW2 also various interactions with WW3. By recording of HSQC-based triple-resonance spectra of 13C15N-labeled WW23 protein, 75% of the 1H15N-correllations were sequentially assigned unambiguously. The resonances of the individual WW domains were identified almost completely. The sequential assignment enabled the determination of dynamic characteristics of the protein-backbone of a WW23 tandem via solution-state NMR spectroscopy. Thereby new domain boundaries for WW2 and WW3 were revealed. The structural dynamic studies in combination with sequence-based (Psipred) and chemical shift-based (Talos+) secondary structure prediction showed that the linker between WW2 and WW3 consists of a central unstructured section flanked by two α-helical regions. Both, the sequential assignment and the NMR binding studies, allowed the identification of interaction sites for specific bivalent peptides. It could be shown that the WW domain binding grooves ("xP", "xP2”) are occupied by the bound proline-rich ligand in particular situations. Thereby the existence of a postulated “xP2"-groove in WW3 could be confirmed. For the exact determination of mono- and bivalent interactions in different binding studies, mutants of the WW23 tandem, in which the binding activity of one domain was deleted by a point mutation in the "xP"-groove, were generated. ITC binding studies with the WW23-mutants were used to determine the binding affinities of mono- and bivalent interactions and allowed direct comparison. In the ITC consistently weak affinities were detected. Finally, two mechanisms of bivalent interactions could be detected by interaction analysis. The first mechanism is based on the combination of specific and non-specific interactions that results in a significant increase of affinity. The second one underlies two specific interactions and did not lead to an increase of affinity. Rather the nature of interaction changes in the way that in the bivalent binding situation the tri- or bivalent proline-rich ligand attaches other surface regions of at least one WW domain, in contrast to the monovalent binding. By combining the data of the interaction analyses also the binding preferences of the WW domains could be identified and previously unknown proline-rich motifs could be uncovered. Thereby, it could be shown as well, to which positions of the N-terminal CA150PRS the WW domains bind. Based on this information, hypothetical models could be derived for bivalent intramolecular or tetravalent intermolecular CA150WW/CA150PRS-interactions.