Histopathological diagnosis of cancer is the basis of oncological therapy. However, during the last two decades, rapidly increasing amounts of high- dimensional molecular profiling data has become available. These data have been used to complement classical morphology- and immunohistology-based methods, but are still rarely used in the clinical practice. The aim of this work is to contribute to bridging the gap between these approaches. First, we designed two algorithms for differential correlation analysis in gene expression data. Complementary to differential expression analysis, which searches for globally up- or downregulated genes, differential correlation analysis aims to identify groups of genes that exhibit different correlation patterns in two disease states. These algorithms were applied to compare subgroups of breast cancer defined by immunohistochemistry for the estrogen and the HER2 receptor. This permitted the identification of differentially correlated gene groups, which contain known and potentially new prognostic or predictive biomarkers. In particular, our analysis enabled the discovery of subtype specific divergences beyond the results of conventional differential expression analysis. Secondly, we analyzed the relationship between the mutational profile, histological tumor grade and subtypes of breast cancer. Notably, this analysis showed that the mutational load is significantly correlated with the tumor grade and the gene expression of known proliferation markers of breast cancer. Finally, we investigated the prognostic value of programmed cell death-1 (PD-1) and programmed death-ligand 1 (PD-L1) in gene expression data of ovarian high-grade serous carcinoma. High expression levels were associated with favorable prognosis and these results corroborate experimental findings based on immunohistochemistry. In summary, the different parts of this work, although methodologically distinct, all contribute to an integrative analysis of the complex relations between different data modalities including high-dimensional molecular profiling data and (immuno-)histopathological features. This is one step towards the integration of new omics-based data with classical diagnostic approaches used in breast and ovarian cancer pathology.
Die histopathologische Diagnose einer Krebserkrankung ist die Grundlage für onkologische Therapien. Gleichwohl sind in den letzten zwei Jahrzehnten eine stark zunehmende Menge an hochdimensionalen molekularen Profilierungsdaten verfügbar geworden. Diese Daten wurden dazu benutzt, um konventionelle auf Morphologie und Immunhistologie basierende Methoden zu ergänzen. In der klinischen Routinearbeit werden sie aber weiterhin selten eingesetzt. Ziel dieser Arbeit ist es dazu beizutragen, die Lücke zwischen diesen Ansätzen zu verringern. In dem ersten Teil entwickelten wir zwei Algorithmen zur differentiellen Korrelationsanalyse von Genexpressionsdaten. Komplementär zur differentiellen Expressionsanalyse, welche nach global hoch- bzw. herunterregulierten Genen sucht, zielt die differentielle Korrelationsanalyse auf die Identifikation von Gengruppen, die in zwei Krankheitszuständen unterschiedliche Korrelationsmuster zeigen. Diese Algorithmen wurden anschließend angewendet, um die immunhistochemischen Subgruppen des Mammakarzinoms (eingeteilt nach Östrogenrezeptor- und HER2-Status) zu vergleichen. Dies ermöglichte die Identifizierung von Gruppen differentiell korrelierender Gene, welche bekannte und möglicherweise neue prognostische oder prädiktive Biomarker enthalten. Insbesondere ermöglichte dieser Ansatz, subtypenspezifische Unterschiede zu erkennen, die über die Ergebnisse konventioneller differentieller Expressionsanalysen hinausgehen. Im zweiten Teil untersuchten wir die Zusammenhänge zwischen Mutationsprofil, histologischem Tumorgrad und den Subtypen des Mammakarzinoms. Diese Analyse zeigte insbesondere, dass die Mutationslast signifikant mit dem Tumorgrad und der Genexpression bekannter Proliferationsmarker des Mammakarzinoms korreliert. Schließlich untersuchten wir den prognostischen Wert der Genexpression von programmed cell death-1 (PD-1) und programmed death-ligand 1 (PD-L1) im hochgradigen serösen Ovarialkarzinom. Hohe Expressionsniveaus waren mit einer günstigen Prognose assoziiert. Diese Resultate bekräftigen experimentelle immunhistologische Untersuchungen. Zusammenfassend tragen die verschiedenen Teile dieser Arbeit, trotz unterschiedlicher Methodik, alle zu einer integrativen Untersuchung der komplexen Relationen zwischen verschiedenen Datentypen bei, insbesondere zwischen hochdimensionalen molekularen Profilierungsdaten und (immun-)histologischen Merkmalen. Dies ist ein Schritt hin zur Integration der neuen omik-basierten Daten mit klassischen diagnostischen Ansätzen in der Pathologie des Mamma- und Ovarialkarzinoms.