In dieser Dissertation werden neue Wege in der Krebsforschung beleuchtet, die durch die Analyse genomischer Daten von Modellorganismen ermöglicht werden. Wie am Beispiel der drei Publikationen dieser Dissertation gezeigt, hat diese Herangehensweise ein beträchtliches und nicht erschöpfend genutztes Potential, auf ganz verschiedenen Ebenen neue Einsichten in die Krebsbiologie zu gewinnen. Wie in einer dieser Veröffentlichungen beschrieben, können genomische Sequenzdaten auf zwischenartlich-vergleichender Basis zu interessanten Einsichten auch im Rahmen einer rein bioinformatische Studie führen. In dieser Studie untersuchen wir ein bestimmtes Gen, welches das extrazelluläre Matrixprotein Periostin kodiert. Periostin ist auch als Krebsmarker bekannt, über seine Funktion jedoch weiss man nur recht wenig. Im Zuge dieser Arbeit wurde das Verständnis von Periostins C-terminaler Region verbessert, indem Periostin-Sequenzen verschiedener Vertebraten verglichen wurden. Die Ergebnisse machten das Fehlen bekannter Proteindomänen oder Sequenzähnlichkeiten zu Nicht-Periostin-Proteinen verständlich, zeigten seine bemerkenswerte genomische und trankriptomische Variabilität auf und legten die Möglichkeit für eine Sekundärstruktur und einen funktionellen Mechanismus nahe. Die anderen beiden Studien dieser Dissertation beruhen auf nicht-murinen Modellorganismen – in der Krebsforschung eher unüblich – und enthalten wichtige bioinformatische Komponenten, die mit den experimentellen, von Forscherkollegen beigebrachten Teilen integriert sind. In diesen Fällen stellten genomische Daten eine notwendige Grundlage dar, welche sowohl die unmittelbare Forschung im Modellorganismus als auch deren Projektion auf den Menschen ermöglichte. In der einen Studie, am Fadenwurm Caenorhabditis elegans erarbeitet, werden Daten zu der Funktion bestimmter Gene (lin-35, zfp-1, rde-4, alg-1) vorgestellt und interpretiert, und wir beschreiben, dass diese in kooperativer Weise mit endogenen kurzen interferierenden RNAs („small interfering RNAs“, siRNAs) agieren. mRNA-Expressionsdaten von C. elegans- Mutanten wurden in einem bioinformatischen Kontext analysiert, welcher genomweite funktionelle Interpretationen unter Berücksichtigung von relevanten genomischen Daten aus anderen Publikationen erlaubte. Diese Studie ist onkologisch von Bedeutung, weil die untersuchten Gene (mit einer Ausnahme) homolog zu bekannten Krebsgenen im Menschen sind, und weil die Ergebnisse auf das Konzept von Krebs als einem Zustand verweisen, bei welchem Keimbahn-Gene in somatischen Zellen pathologisch dereprimiert sind. Demgemäß handelt es sich bei dieser Studie um Grundlagenforschung mit einer wegen der untersuchten Gene und Mechanismen intrinsischen Bedeutung für die Krebsbiologie. Die Ergebnisse der auf Zebrafisch-Tumoren beruhenden Studie sind unmittelbar krebsspezifisch. Hier wurde ein genomweites DNA-Mikroarray konzipiert, um vergleichende genomische Hybridisierungsdaten („comparative genomic hybridization“, CGH) zu erzeugen, und zwar von malignen peripheren Nervenscheidentumoren (MPNSTs) des Zebrafischs (Danio rerio). Die Datenanalyse zeigte, dass Zebrafisch-MPNSTs chromosomale und subchromosomale Veränderungen aufweisen, ähnlich solchen, die auch von menschlichen Tumoren (einschließlich MPNSTs) einschlägig dokumentiert sind. Manche der betroffenen Gene sind bei menschlichen Tumoren als häufig amplifiziert bekannt (z.B. met, ccnd2a, cdk6). Diese Erkenntnis führt zu einem möglichen Modellsystem für die Aneuploidie, einem Krebs-Merkmal, das in Mausmodellen generell nicht gut darstellbar ist. Des weiteren, und von unmittelbarer praktischer Bedeutung, stellen die Ergebnisse eine Strategie in Aussicht, mit der Kandidaten für krebsfördernde Gene identifiziert werden könnten, indem man die Chromosomenprofile mit ihren Änderungen von Mensch und Zebrafisch vergleichend überlagert. Zusammengenommen stellen diese drei Abhandlungen Beiträge zur onkologischen Forschung dar, die sich in kritischer Weise auf Modellorganismen – und ihre Gegenstücke in silico, Modellgenome – stützen. Auf dieser Basis wurden hier bioinformatische Untersuchungen möglich, die entweder eng mit experimenteller Forschung verschränkt waren oder die in eigenständiger Weise nützliche Einsichten und Hypothesen hervorbrachten, und die so wiederum Fortschritte in unserem Verständnis von Krebs im Menschen erlaubten.
This thesis explores new territory in cancer research, enabled by genomic data originating from model organisms. As exemplified in three publications forming the core of this thesis, this approach has a considerable and generally under- used potential for gaining insights into cancer biology on many distinct levels. As described in one of these publications, genomic sequence data can be used in comparative mode across species with insightful results even in the context of a purely computational project. Here, we study one particular gene of interest, which encodes the extracellular matrix protein periostin. Known also as a cancer marker, periostin function remains poorly characterized overall, but as part of this project, an improved understanding of periostin’s C-terminal region was achieved by comparing periostin sequences across a range of vertebrate genomes. We explained the absence of known domains or sequence similarities to any non-periostin proteins for this region, demonstrated its remarkable genomic and transcriptomic variability, and suggested a possible secondary structure and functional mechanism. The other two studies reported in this thesis are based on non-murine model organisms – the use of which is generally not common in cancer research – and contain key bioinformatic components in tight integration with experimental results that were contributed by other members of the research teams. Here, genomic data was a necessary foundation enabling both the immediate, model organism-centric research and its projection into the human realm. The study on the nematode Caenorhabditis elegans presents and interprets data on the functional roles of select genes (lin-35, zfp-1, rde-4, alg-1), finding that they act cooperatively with endogenous small interfering RNAs (siRNAs). Here, mRNA expression profiling data of mutant C. elegans strains were evaluated in a bioinformatic framework that allowed genome-wide functional interpretations in conjunction with relevant genomic data from the public domain. This study is significant because the genes investigated are, with one exception, homologs of human genes with known importance in cancer, and because the findings point to the notion of cancer as a condition where germline genes are pathologically de-repressed in the soma. Thus, this study constitutes basic research with an intrinsic relevance for cancer due to the identity of the genes and mechanisms examined. The third study focuses on tumors occurring in zebrafish (Danio rerio), with results that are directly cancer-specific. A genome-wide DNA microarray was custom-designed to generate comparative genomic hybridization (aCGH) data from zebrafish malignant peripheral nerve sheath tumors (MPNSTs). Analysis of this data showed that zebrafish MPNSTs have chromosomal and subchromosomal alterations akin to those widely documented in human cancers (including human MPNSTs), some of them comprising genes known to be amplified in human cancers (met, ccnd2a, cdk6). The results suggest a model system for aneuploidy, an aspect of cancer not generally well replicated in mouse models. Furthermore, and practically forward-looking, they also evoke the promise of a strategy to effectively screen for cancer driver gene candidates by “intersecting” human and zebrafish copy number alteration profiles. Together, these three studies exemplify contributions to oncology research that rely critically on model organisms and their in silico counterparts, model genomes. On this basis, bioinformatic analyses became possible – either closely integrated with experimental research or generating useful insights and hypotheses on their own – that enabled advances in our understanding of human cancer.