dc.contributor.author
Wartenberg, Anne
dc.date.accessioned
2018-06-07T20:57:59Z
dc.date.available
2013-05-06T10:59:12.712Z
dc.identifier.uri
https://refubium.fu-berlin.de/handle/fub188/7204
dc.identifier.uri
http://dx.doi.org/10.17169/refubium-11403
dc.description.abstract
Viele humane Krankheiten, wie Alzheimer [89], Krebs [83]), Muskeldystrophie
[54], „Liddle-Syndrom“ [118] und Huntington [119] können auf fehlregulierte
WW-Domänen-vermittelte Signalwege zurückgeführt werden. Erstmalig beschrieben
wurden WW-Domänen 1994 von Bork und Sudol [67], die diesen Domänen auf Grund
zweier hochkonservierter Tryptophane (W) innerhalb ihrer Consensus-Sequenz
auch ihren Namen verliehen. Mit nur ca. 40 Aminosäuren gehören sie zu den
kleinsten Proteindomänen. Sie binden bevorzugt prolinreiche Sequenzmotive
(PRS) und sind, mit Ausnahme von Bakterien, hoch konserviert in allen
Organismengruppen präsent. Der humane Transkriptionsfaktor CA150 (Synonym:
TCERG1 transcription elongation regulator 1) ist eines dieser Proteine. Es
besitzt neben sechs FF-Domänen und zwei N- und C-terminal lokalisierten PRS,
gleich drei WW-Domänen, die durch außergewöhnlich lange Linkersequenzen
miteinander verknüpft sind. CA150 interagiert mit verschiedensten Proteinen
und ist so an der Regulation der Elongation der RNA-Polymerase II, der
Koordinierung der Transkription und der prä-mRNA-Prozessierung beteiligt.
Dementsprechend konnten unter anderem Interaktionen der WW- und FF-Domänen zur
RNA-Polymerase II [112,116] sowie Wechselwirkungen der WW-Domänen (1&2) mit
den PRS des Spleißfaktors SF1 [112] nachgewiesen werden. Darüber hinaus kann
CA150 auch mit der mutierten Form des Huntingtin-Proteins interagieren,
wodurch dem Protein eine wichtige Rolle im Krankheitsverlauf von Huntington
zukommt [87]. Es besteht daher ein großes Interesse, die molekularen
Mechanismen CA150-vermittelter Wechselwirkungen besser zu verstehen. Die
Vielzahl der bisher identifizierten CA150-Interaktionspartner und das
mehrfache Vorhandensein gleicher Funktionseinheiten legen nahe, dass CA150 mit
vielen Zielproteinen multivalent wechselwirken könnte. Die Multivalenz könnte
zum einen über das Tandem der drei aufeinanderfolgenden WW-Domänen und zum
anderen über die beiden PRS realisiert sein. Der Fokus dieser Arbeit lag
insbesondere auf der systematischen Analyse von Interaktionen der isolierten
WW-Domänen und Tandem-WW-Konstrukten aus CA150 mit Teilbereichen der PRS aus
SF1 (SF1PRS) sowie Teilbereichen der N-terminalen PRS aus CA150 selbst
(CA150PRS). Um ein besseres Verständnis grundlegender Mechanismen der
multivalenten Wechselwirkungen zu erlangen, aber auch um Erkenntnisse
bezüglich der Organisation der drei WW-Domänen in CA150 zu gewinnen, wurde
eine Vielzahl molekular-biologischer, biochemischer und biophysikalischer
Methoden angewendet. Die codierenden Sequenzen verschiedener CA150 WW-
Varianten wurden in verschiedene Vektoren kloniert. Zur Maximierung der
Ausbeuten unmarkierter bzw. isotopenmarkierter Proteine wurden die
Expressionsbedingungen optimal an die zu exprimierenden WW-Varianten
angepasst. Für diverse GST-WW und His-WW-Konstrukte wurde eine IMAC-basierte
Reinigungsstrategie entwickelt. Durch SILAC-Pulldown-Experimente konnte die
Aktivität der rekombinanten WW-Domänen verifiziert werden, indem bekannte
sowie neue, bisher unbekannte, Interaktionspartner gefunden wurden. Der SILAC-
Pulldown lieferte auch erste Hinweise dafür, dass CA150 mit sich selbst
interagieren könnte. In einer SPOT-Analyse wurde die Interaktion zwischen
Teilbereichen der N-terminalen CA150PRS und den drei CA150-WW-Domänen
verifiziert. Darüber hinaus konnte mittels AUZ gezeigt werden, dass die
bivalente Bindung einer ausgewählten CA150PRS-Sequenz dazu führt, dass ein
WW23-Tandem eine Konformationsänderung erfährt. Eine artifizielle
Oligomerisierung des WW23-Tandems konnte durch die AUZ ausgeschlossen werden.
SPOT-Analysen mit SF1PRS-Teilbereichen zeigten neben mehreren Interaktionen
mit WW1 und WW2, auch verschiedene Wechselwirkungen mit WW3. Durch die
Aufnahme von HSQC-basierten Triple-Resonanz-Spektren von 13C15N-markiertem
WW23-Protein konnten 75% der 1H15N-Korellationen sequentiell eindeutig
zugeordnet werden. Die Resonanzen der einzelnen WW-Domänen wurden fast
vollständig identifiziert. Durch die sequentielle Zuordnung war es möglich,
die dynamischen Eigenschaften des Proteinrückgrades des WW23-Tandems NMR-
spektroskopisch zu ermitteln. Dabei wurden neue Domänengrenzen für WW2 und WW3
aufgedeckt. Die strukturdynamischen Untersuchungen in Kombination mit
sequenzbasierten (Psipred) und "chemical shift"-basierten (Talos+)
Sekundärstrukturvorhersagen zeigten, dass der Linker zwischen WW2 und WW3 aus
einem zentralen unstrukturierten Abschnitt besteht, der von zwei α-helikalen
Bereichen flankiert wird. Die sequentielle Zuordnung erlaubte zusammen mit den
NMR-Bindungsstudien auch die Identifizierung der Interaktionsstellen für
bestimmte bivalente Peptide. Dadurch konnte gezeigt werden, welche WW-
Bindetasche („xP“, „xP2) in der jeweiligen Bindungssituation vom Peptid
genutzt wird und zusätzlich die Existenz einer postulierten „xP2“-Tasche
innerhalb der WW3 bestätigt werden. Um in Bindungsstudien mono- und bivalente
Wechselwirkungen eindeutig identifizieren zu können, war es notwendig,
Mutanten vom WW23-Tandem zu erzeugen, in denen die Bindungsaktivität einer
Domäne durch eine Punktmutation in der „xP“-Tasche ausgelöscht wurde. Der
Einsatz der Mutanten in ITC-Bindungsstudien ermöglichte es, die Affinitäten
von mono- und bivalenten Interaktionen zu ermitteln und vergleichend zu
analysieren. In den ITC-Bindungsstudien wurden durchweg schwache Affinitäten
detektiert. Aus den Ergebnissen der Interaktionsanalysen konnten zwei
Mechanismen bivalenter Wechselwirkungen abgeleitet werden. Ersterer führte
durch Kombination einer spezifischen und einer unspezifischen Wechselwirkung
zu einer deutlichen Affinitätserhöhung. Der Zweite basiert auf zwei
spezifischen Wechselwirkungen. Diese führten jedoch nicht zu einer
verstärkten, sondern zu einer veränderten Interaktion in der Art, dass in der
bivalenten Bindungssituation mindestens eine WW-Domäne über andere
Oberflächenbereiche wechselwirkt, als bei der monovalenten Bindung. Durch
Kombination der Daten der Interaktionsanalysen konnten auch die
Bindepräferenzen der WW-Domänen ermittelt und bisher unbekannte prolinreiche
Motive identifiziert werden. So konnte gezeigt werden, an welchen Positionen
der CA150PRS die WW-Domänen binden können. Darauf aufbauend konnten
hypothetische Modelle bivalent intramolekularer bzw. tetravalent
intermolekularer CA150WW/CA150PRS-Interaktionsmechanismen abgeleitet werden.
de
dc.description.abstract
Diverse human diseases, such as Alzheimer’s [89], cancer [83], muscular
dystrophy [54], „Liddle-syndrome“[118] and Huntington [119] have been
implicated with miss regulated WW domain mediated pathways. WW domains were
described first by Bork und Sudol [67] in 1994. Based on the presence of two
highly conserved tryptophan residues (W) within the consensus sequence, they
were named WW domains. They belong to the smallest protein domains containing
on average 40 amino acids. They preferentially bind proline-rich sequence
motifs (PRS) and are highly conserved in all organisms, except bacteria. One
of these WW domain containing proteins is the human transcription factor CA150
(synonym: TCERG1 transcription elongation regulator 1). It consists
additionally six FF domains, a N- and a C-terminal PRS as well as three WW
domains, which are linked by exceptionally long linker sequences. CA150 is
involved in the regulation of the elongation of RNA polymerase II, the
coordination of transcription and pre-mRNA processing by interacting with many
different proteins. Among others, interactions of the WW and FF domains with
the RNA polymerase II [112,116] and interactions of the WW domains (1 & 2)
with the PRS of the splicing factor SF1 [112] were detected. Moreover, CA150
also interacts with the mutated form of the huntingtin protein (HTT), whereby
the protein plays an important role in huntington’s disease [87]. It is of
high medical interest to elucidate the molecular mechanisms of CA150 mediated
interactions. Both, many previously identified CA150-interacting proteins and
the presence of multiple equal functional units suggests that CA150 might
interact multivalent with many target proteins. The multivalency could be
realized on the one hand through the tandem of the three successive WW domains
and on the other hand on the two PRS. This work focuses mainly on the
systematic analysis of interactions between isolated or tandem CA150 WW domain
constructs and PRS motifs of SF1 (SF1PRS) as well as motifs of the N-terminal
CA150PRS. To gain a better understanding of basic mechanisms of multivalent
interactions, but also to get insights into the organization of the three WW
domains in CA150, a variety of molecular biological, biochemical and
biophysical methods have been used. The coding sequences of different CA150 WW
variants were cloned into different E. coli expression vectors. In order to
yield efficient amounts of unlabeled and isotopic labeled WW variants, the
expression conditions have been optimized. For various GST-WW and His-WW
constructs, an IMAC-based purification strategy was developed. The activity of
recombinant WW domains could be verified by SILAC pull-down experiments, by
identifying known and new, previously unknown, interaction partners. The SILAC
pull-down also provided the first evidence that CA150 might interact with
itself. Furthermore, the interaction between sub-regions of the N-terminal
CA150PRS and the three CA150 WW domains was verified by SPOT analysis
experiments. Moreover, it was shown by means of analytical ultracentrifugation
(AUC) that the bivalent binding of a selected CA150PRS sequence causes a
conformational change of a WW23 tandem. An artificial oligomerization of the
WW23 tandems could be screened out by the AUC measurements. SPOT analysis with
SF1PRS sub-regions showed besides several interactions with WW1 and WW2 also
various interactions with WW3. By recording of HSQC-based triple-resonance
spectra of 13C15N-labeled WW23 protein, 75% of the 1H15N-correllations were
sequentially assigned unambiguously. The resonances of the individual WW
domains were identified almost completely. The sequential assignment enabled
the determination of dynamic characteristics of the protein-backbone of a WW23
tandem via solution-state NMR spectroscopy. Thereby new domain boundaries for
WW2 and WW3 were revealed. The structural dynamic studies in combination with
sequence-based (Psipred) and chemical shift-based (Talos+) secondary structure
prediction showed that the linker between WW2 and WW3 consists of a central
unstructured section flanked by two α-helical regions. Both, the sequential
assignment and the NMR binding studies, allowed the identification of
interaction sites for specific bivalent peptides. It could be shown that the
WW domain binding grooves ("xP", "xP2”) are occupied by the bound proline-rich
ligand in particular situations. Thereby the existence of a postulated
“xP2"-groove in WW3 could be confirmed. For the exact determination of mono-
and bivalent interactions in different binding studies, mutants of the WW23
tandem, in which the binding activity of one domain was deleted by a point
mutation in the "xP"-groove, were generated. ITC binding studies with the
WW23-mutants were used to determine the binding affinities of mono- and
bivalent interactions and allowed direct comparison. In the ITC consistently
weak affinities were detected. Finally, two mechanisms of bivalent
interactions could be detected by interaction analysis. The first mechanism is
based on the combination of specific and non-specific interactions that
results in a significant increase of affinity. The second one underlies two
specific interactions and did not lead to an increase of affinity. Rather the
nature of interaction changes in the way that in the bivalent binding
situation the tri- or bivalent proline-rich ligand attaches other surface
regions of at least one WW domain, in contrast to the monovalent binding. By
combining the data of the interaction analyses also the binding preferences of
the WW domains could be identified and previously unknown proline-rich motifs
could be uncovered. Thereby, it could be shown as well, to which positions of
the N-terminal CA150PRS the WW domains bind. Based on this information,
hypothetical models could be derived for bivalent intramolecular or
tetravalent intermolecular CA150WW/CA150PRS-interactions.
en
dc.rights.uri
http://www.fu-berlin.de/sites/refubium/rechtliches/Nutzungsbedingungen
dc.subject.ddc
500 Naturwissenschaften und Mathematik::570 Biowissenschaften; Biologie::572 Biochemie
dc.title
Untersuchung von multivalenten Protein-Protein Interaktionen zwischen WW-
Domänen und prolinreichen Sequenzen
dc.contributor.firstReferee
Prof. Dr. Hartmut Oschkinat
dc.contributor.furtherReferee
Prof. Dr. Christian Freund
dc.date.accepted
2013-04-25
dc.identifier.urn
urn:nbn:de:kobv:188-fudissthesis000000094195-5
dc.title.translated
Analysis of multivalent protein-protein interactions between WW domains and
proline-rich sequences
en
refubium.affiliation
Biologie, Chemie, Pharmazie
de
refubium.mycore.fudocsId
FUDISS_thesis_000000094195
refubium.mycore.derivateId
FUDISS_derivate_000000013353
dcterms.accessRights.dnb
free
dcterms.accessRights.openaire
open access