Understanding the complex interplay between proteins in physiological contexts poses a great challenge, since a striking number of human proteins still remain without solid functional annotation. To gain insight into the function of proteins encoded by human chromosome 21 (Hsa21) and to identify regulatory networks potentially relevant to Down syndrome (DS), 206 annotated open reading frames (ORFs) on Hsa21 were used as basis for amplification and cloning of ORFs and for collection of available full-length cDNA clones. This work resulted in the largest library of Hsa21 ORF clones available to date, covering 81% of the 206 annotated ORFs. A high success rate was reached in production of recombinant proteins (80%), ensuring appropriate downstream functional genomics analyses. For high-throughput determination of subcellular protein localizations, 89 constructs encoding N-terminally tagged proteins were introduced into HEK293T cells on transfected cell arrays. Localization information could be obtained for 52 out of the 89 Hsa21 proteins (58%). Of these, 28 subcellular localizations were described for the first time (published in Hu et al. 2006). All Hsa21 localization information has been entered into the public Gene Ontology (GO) database. For the identification of protein-protein interactions (PPIs), 53 constructs encoding non-autoactivating baits were screened against a prey set of 5,640 human proteins using a high- throughput mating array-based yeast two-hybrid (Y2H) system. Altogether, this mating array identified 56 new interactions for 24 different Hsa21 proteins. Twenty-three of the new interactions could be verified in an independent cotransformation Y2H set-up (56% of 41 tested). Cellular colocalization experiments in COS-1 cells and pull-down experiments confirmed five of six tested protein pairs (83%). All previously known protein interaction data for Hsa21 proteins were retrieved from available public sources. This resulted in a set of 684 new and known PPIs for 108 Hsa21 proteins, representing the largest Hsa21-centered interaction network to date. A proteome-wide interaction network was then generated by computational searches for indirect protein interactors in available data sets. Analysis of transcription factors showed a compelling inter-connection of thirteen Hsa21-encoded transcription factors. Detailed functional analysis of sub-networks involving NRIP1, UBE2G2, PCP4, MCM3AP and C21orf127 revealed novel functional properties of these Hsa21-encoded proteins. 35 Hsa21 proteins were found connected to nine signaling pathways, some of which have been previously implicated in the pathogenesis of DS, while others appear in this context for the first time. Further expansion of the Hsa21 interaction network will support the identification of new protein functions and regulatory networks. The data presented here shows that a Hsa21 interaction network is a useful resource for elucidating the biological contexts of new PPIs, providing an essential tool for the systems biology of Down syndrome.
Eine der großen Herausforderungen der Genomforschung liegt in der Vertiefung unseres Verständnisses vom komplexen Zusammenwirken von Proteinen in physiologischen Kontexten. Dafür ist es auch notwendig, zur funktionellen Annotation der beachtlichen Anzahl von uncharakterisierten menschlichen Proteinen beizutragen. Ziel dieser Arbeit war es, Einsichten in die Funktion der Proteine zu erlangen, die auf dem menschlichen Chromosom 21 (Hsa21) kodiert sind, und regulatorische Netzwerke zu identifizieren, die relevant für die Entstehung des Down-Dyndroms (DS) sein könnten. Dazu wurden zunächst 206 bekannte protein-kodierende Sequenzen (open reading frames, ORFs) vervielfältigt und kloniert oder aus verfügbaren ORF-Klonsammlungen übernommen. Die resultierende Kollektion von Hsa21-ORF-Klonen stellt die umfangreichste bisher beschriebene dar, mit einer Abdeckung von 81% der bekannten ORFs. Eine hohe Erfolgsrate (80%) wurde auch bei der rekombinanten Herstellung von entsprechenden Proteinen erzielt, so daß die folgenden funktionellen genomischen Analysen auf einer soliden Grundlage beruhten. Zur Ermittlung der subzellulären Lokalisierung von Proteinen im Hochdurchsatz- Verfahren wurden 89 Konstrukte, die N-terminal markierte Proteine kodierten, auf transfizierten Zell-Arrays in HEK293T-Zellen eingeführt. So konnten Informationen zur Lokalisierung von 52 der 89 untersuchten Hsa21-Proteine (58%) gewonnen werden, wobei 28 dieser Lokalisierungen zum ersten Mal überhaupt beschrieben wurden (veröffentlicht in Hu et al. 2006). Alle ermittelten Lokalisierungen wurden in die öffentliche Gen-Ontologie (GO)-Datenbank eingetragen. Zur Identifikation von Protein-Protein- Interaktionen (PPIs) wurden 53 nicht-autoaktivierende Konstrukte im Hefe- Interaktionssystem (yeast two-hybrid, Y2H) gegen eine Sammlung von 5.640 menschlichen Proteinen selektiert. Dazu wurde ein automatisiertes Hochdurchsatz-Y2H-System verwendet, mittels dessen 56 neue Interaktionen für 24 verschiedene Hsa21-Proteine gefunden wurden. Dreiundzwanzig der neuen PPIs konnten in unabhängig durchgeführten Kotransformations-Y2H-Ansätzen bestätigt werden (56% von 41 getesteten PPIs). Experimente zur zellulären Ko- Lokalisierung in COS-1-Zellen sowie biochemische Interaktions-Tests (pull-down assays) bestätigten die PPIs für fünf von sechs getesteten Proteinpaaren (83%). Zudem wurden alle bereits bekannten Interaktionsdaten für Hsa21-Proteine aus öffentlichen Datenbanken erfasst. Auf diese Weise konnte ein Datensatz geschaffen werden, der insgesamt 684 Interaktionen für 108 verschiedene Hsa21-Proteine enthält und damit der umfangreichste bisher für dieses Chromosom beschriebene ist. Im nächsten Schritt wurde dann ein Proteom- weites Interaktionsnetzwerk errechnet, indem indirekte Protein-Interaktoren in den verfügbaren Interaktions-Datensätzen ermittelt wurden. Die Analyse von Transkriptionsfaktoren in diesem Netzwerk zeigte eine bemerkenswerte Vernetzung von 13 Hsa21-kodierten Faktoren über Protein-Protein-Interaktionen. Eine detaillierte Betrachtung der Funktionen von Sub-Netzwerken für die Hsa21-Proteine NRIP1, UBE2G2, PCP4, MCM3AP und C21orf127 offenbarte neue funktionelle Zusammenhänge. Die Untersuchung der Verbindungen von Hsa21-Proteinen zu zellulären Signalübertragungswegen zeigte neun Verbindungen auf. Von diesen wurden einige bereits vorher mit der Pathogenese des Down- Syndroms in Verbindung gebracht, wohingegen andere hier zum ersten Mal in diesem Kontext beschrieben werden. Auch in Zukunft wird der Ausbau des bekannten Hsa21-Interaktionsnetzwerks einen Beitrag dazu leisten, neue Proteinfunktionen und regulatorische Netzwerke zu identifizieren. Die hier beschriebenen Ergebnisse zeigen, daß Hsa21-Protein-Interaktionsnetzwerke nützliche Hilfsmittel darstellen, um die biologischen Kontexte von neu ermittelten Protein-Interaktionen zu verdeutlichen, und daher ein unerläßliches Werkzeug für einen systembiologische Ansatz zum Down-Syndrom bilden.