Klinisches Problem und Zielsetzung: Das Prostatakarzinom zählt zu den häufigsten malignen Erkrankungen des Mannes. Die Auswertung der Prostata-MRT zur Diagnostik bedeutet klinisch einen hohen zeitlichen Aufwand. Insbesondere die voxelgenaue Segmentierung der zonalen Anatomie zur genauen Lokalisation pathologischer Veränderungen ist langwierig und wird in der Praxis, obwohl sinnvoll, kaum durchgeführt. Im Zuge des Trainings und der Anwendung eines Deep Learning Algorithmus soll die automatisierte Segmentierung der Prostata und -zonen hinsichtlich ihrer Genauigkeit untersucht werden. Zur Verbesserung der Detektionsrate und Reduktion biopsiebedingter Nebenwirkungen soll die optimale Anzahl gezielter MRT-Stanzen pro Indexläsion in Abhängigkeit von Läsionsgröße, Lage und Gleason-Score ermittelt werden. Es soll die Möglichkeit der Vorhersage der Anzahl notwendiger Stanzen zur Detektion des finalen, klinisch relevantesten histologischen Ergebnisses untersucht werden. Methoden: Nach Durchführung einer multiparametrischen Prostata-MRT wurden die Prostata und deren Zonen in der axialen T2-gewichteten Sequenz manuell markiert, vom Deep Learning-basierten nnU-Net trainiert und getestet. Die klinische Anwendbarkeit wurde mithilfe eines Vergleiches der Zuordnung von Segmenten überprüft. Die Einschätzung von Radiolog*innen mit und ohne Prostataatlas sowie mehrerer Radiolog*innen wurden durch Kreuztabellen und Chi-Quadrat-Test verglichen. Für die Ermittlung der benötigten Anzahl an Stanzen wurde eine Datenbank erstellt und statistisch ausgewertet. Zur Berechnung eines Vorhersagewertes wurden verschiedene Regressionsanalysen und Bayes‘ Klassifikatoren unter Berücksichtigung der Einflussfaktoren angewendet. Ergebnisse: Im Vergleich zur Einschätzung der Radiolog*innen wies die des nnU-Net eine bessere Lokalisationsrate auf (p = 0,006 ohne Raster, p = 0,136 mit Raster). Bei der Betrachtung der Anzahl an gezielten MRT-Stanzen zeigte die erste gezielte Stanze den finalen histopathologischen Befund für 331 Indexläsionen (73 %). Für die zweite bis fünfte Stanze lag dieser bei 66 (15 %), 39 (9 %), 13 (3 %) bzw. zwei Fällen (<1 %) vor. Es zeigten sich keine unabhängigen Auswirkungen der untersuchten Einflussfaktoren. Durch den Bayes‘ Klassifikator konnten in 79 % die erste Stanze mit dem höchstem histopathologischem Befund korrekt vorhergesagt werden. Schlussfolgerung: Der Einsatz des nnU-Net als Beispiel eines Deep Learning Algorithmus zeigte im Vergleich zu Radiolog*innen eine höhere Genauigkeit bei der Segmentierung der Prostata und Zuordnung von Segmenten. Der Großteil der finalen histopathologischen Ergebnisse kann durch die erste bis dritte gezielte Stanze nachgewiesen werden, weshalb für weitere das Risiko-Nutzen-Verhältnis abgewogen werden sollte. Die Vorhersage der ersten gezielten Stanze mit finalem histopathologischen Befund kann durch den verwendeten, mit prä-interventionell erfassten Variablen trainierten Klassifikator unterstützt werden.
Purpose: This study evaluates the accuracy of the deep learning-based nnU-Net in automatic prostate segmentation and comparing to the performance of experienced radiologists with and without a prostate segment pattern. Moreover, we analyze the number of magnetic resonance imaging (MRI) targeted biopsy cores per index lesion necessary to detect the final, most relevant histopathologic diagnosis and its possible predictors. Methods: Retrospectively T2-weighted multiparametric MRI scans of the prostate and its zones were manually segmented and subsequently trained and tested using the deep learning-based nnU-Net. Applicability was assessed by comparing mapping of prostate segments within a segment pattern to the ones assigned by radiologists and an expert council using contingency tables and chi-square test. Data of patients receiving 10-core systematic prostate biopsy and at least three MRI targeted biopsy cores per index lesion were collected, including recording the core sampling sequence and determining the first biopsy core with the final, most relevant histopathologic result. A subgroup of patients who underwent three targeted biopsy cores was used for prediction analysis for the first biopsy core revealing the final histopathologic diagnosis. Regression analysis was applied, and nonparametric Bayes classifiers were trained considering the previously assessed parameters prostate specific antigen density, lesion size, lesion zone and PI-RADS score to predict the number of cores needed. Results: The nnU-Net provided a higher rate of correct localizing prostate segments than radiologists (p = 0.006 without segment pattern, p = 0.136 with segment pattern). In 331 index lesions (73 %) the final histopathologic diagnosis was detected with the first targeted biopsy core, in 66 cases (15 %) by the second core and in 39 index lesions (9 %) by the third core. The most relevant histopathologic result was revealed by the fourth biopsy core in 13 cases (3 %) and in two index lesions (<1 %) by the fifth core. The analyzed covariates did not independently influence the prediction of the needed number of biopsy cores. The Bayes classifier was able to predict the required number of biopsy cores to detect the final histopathologic result in 79 % cases. Conclusion: Using a deep learning-based algorithm enabled a higher accuracy and efficiency compared to radiologists. According to this study’s results and similar studies in most cases the final histopathologic diagnosis can be identified with three targeted biopsy cores per index lesion. Despite the covariates less than three MRI-targeted biopsy cores should not be obtained. The prediction of the first MRI targeted biopsy core yielding the final histopathologic result can be assisted by using a classifier trained with covariates determined prior to biopsy.