Structural variants (SVs) are of major importance for the field of cancer genomics as well human genetics. Their reliable detection and functional interpretation are still an important limitation to both fields. In this work, we applied SV detection methods based on gDNA long-read sequencing and high-throughput chromosome confirmation capture (Hi-C) to samples from patients with acute myeloid leukemia (AML) as well as patients with germline genetic disorders in order to develop a novel workflow for SV detection. This integrated workflow enabled us to characterize the SV landscape of the AML subtype of AML with complex karyotype (CK-AML), which is associated with a very poor prognosis and therapy resistance. The complexity of the structural variants that we identified exceeds the previous knowledge about complex genomic rearrangements in CK-AML and existing concepts like chromothripsis. The extreme local complexity in one CK-AML case reached up to an SV cluster of 31 breakends in a region only 2.7 kilobases in size, detectable with both Hi-C and gDNA long-read sequencing. These extremely complex SVs consisted in large part of focal amplifications and were enriched in the proximity of mammalian-wide interspersed repeat (MIR) elements. To get additional insight into the functional consequences of these structural variants, we further characterized the transcriptome of the cohort using RNA and long-read direct cDNA sequencing. This enabled us to identify novel fusion transcripts such as USP7::MVD. In the differential gene expression analysis, we identified new as well as previously described candidate genes associated with CK-AML. Our integrated structural variant detection workflow enabled us to identify complex genomic rearrangements with very high resolution and accurate elimination of likely false-positive SVs in the datasets. Our workflow can help to further elucidate the structure and consequences of complex genomic rearrangements in the future.
Strukturelle Varianten (SVs) sind sowohl für die Krebsgenomik als auch für die Humangenetik von großer Bedeutung. Ihre zuverlässige Erkennung und funktionale Interpretation stellen für beide Bereiche immer noch eine wichtige Limitation dar. In dieser Arbeit wandten wir SV Detektionsmethoden basierend auf gDNA-long-read Sequenzierung und high-throughput chromosome confirmation capture (Hi-C) auf Proben von Patienten mit akuter myeloischer Leukämie (AML) sowie Patienten mit genetischen Erkrankungen der Keimbahn an, um eine neuartige Methode für den Nachweis von SVs zu entwickeln. Diese Methode ermöglichte es uns, die SV-Landschaft des Subtyps der AML mit komplexem Karyotyp (CK-AML) zu charakterisieren, welche mit einer sehr schlechten Prognose und Therapieresistenz assoziiert ist. Die Komplexität der von uns identifizierten SVs übersteigt das bisherige Wissen über komplexe genomische Varianten in der CK-AML und bekannte Phänomene wie Chromothripsis. Die extreme lokale Komplexität in einem CK-AML Fall erreichte in einem SV-Cluster 31 Bruchpunkte in einer Region mit einer Größe von nur 2,7 Kilobasen, welche sowohl mit Hi-C- als auch mit gDNA-Long-Read-Sequenzierung nachweisbar waren. Diese äußerst komplexen SVs bestanden zu einem großen Teil aus fokalen Amplifikationen und waren häufig in der Nähe von mammalian-wide interspersed repeat (MIR) Elementen angereichert. Um die funktionellen Konsequenzen dieser SVs zu untersuchen, charakterisierten wir ebenfalls das Transkriptom der Kohorte mithilfe von RNA und and long-read direct cDNA Sequenzierung. Dadurch konnten wir neuartige Fusionstranskripte wie USP7::MVD identifizieren. In der Genexpressionsanalyse konnten wir sowohl neue als auch bereits beschriebene, mit der CK-AML assoziierte. Kandidatengene identifizieren. Unsere integrative Detektionsmethodik zur Erkennung struktureller Varianten ermöglichte es uns, komplexe genomische Varianten mit sehr hoher Auflösung zu identifizieren und falsch positive SVs in den Datensätzen zu eliminieren. Unsere Methodik kann dazu beitragen, die Struktur und die Folgen komplexer genomischer Varianten in der Zukunft weiter aufzuklären.