Zielsetzung: In dieser Arbeit wurden Machine Learning (ML) Methoden für die Teilautomatisierung der Befundung von Prostata-MRTs entwickelt und mit internen und externen Datensätzen sowie einer Leserstudie evaluiert.
Methoden: Es wurden drei ML-Modelle umgesetzt: ein Modell zur Klassifizierung von Sequenztyp und anatomischer Richtung von Prostata-MRTs, ein Modell zur Segmentierung von Prostata und Transitionalzone (TZ) sowie ein Modell zur Klassifizierung von Prostataläsionen in benigne und maligne, dessen Ausgabe anhand von Bildmerkmalen des Prostate Imaging Reporting and Data System (PI-RADS) erklärt wird. Die Modelle wurden mit einem internen Prostata-MRT-Datensatz von 1.243 Patienten entwickelt und anhand von drei externen Datensätzen unterschiedlicher Herkunft, Scannertypen und -hersteller validiert. Zusätzlich zu den entwickelten Modellen wurde der diagnostische Mehrwert der TZ-spezifischen Prostataspezifischen Antigen Dichte (sPSAD) basierend auf Segmentierungen analysiert und der Mehrwert eines erklärtes Läsionsklassifikationsmodells bei der Befundung in einer Leserstudie evaluiert. Die einzelnen entwickelten Methoden wurden im Anschluss in einen Prototypen überführt, der den Befundungsprozess vom Einladen der Bilder bis zur Ausgabe eines Befundes beinhaltet.
Ergebnisse: Das Sequenzklassifizierungsmodell erreicht Genauigkeiten von 99,88% (99,75% – 100%) intern und extern von 77,68% (63,89% – 91,47%) bis 92,53% (90,91% - 94,15%). Eine Nutzung der entwickelten Methode innerhalb zweier externer Datensätze brachte Genauigkeiten von 98,53% (97,59% - 99,47%) und 99,55% (97,92% - 100%). Das Prostatasegmentierungsmodell hat DICE-Scores von 0,89 (0,80 – 0,97) intern und extern 0,90 (0,83 – 0,97) für die Prostata sowie 0,84 (0,70 – 0,99) und 0,85 (0,70 – 1,0) für die TZ erreicht. Das Läsionsklassifikationsmodell erreicht intern eine läsionsbasierte AUC für die Klassifikation von klinisch signifikantem Prostatakrebs von 0,89 (0,85-0,93) und extern 0,85 (0,80-0,91). Die Leserstudie zeigt, dass unerfahrene Leser um den Faktor 1,8 von 85s auf 47s für die Detektion und Klassifikation der Indexläsion nahe an das Niveau von Experten (39s) beschleunigt wurden. Die AUCs der sPSAD lagen in allen betrachteten Datensätzen höher als die PSAD. In einer aufgestellten Decision-Curve Analyse hat eine Biopsiestrategie, basierend auf PI-RADS und sPSAD, bei einer Grenzwahrscheinlichkeit von 40% einen Mehrwert zum reinen PI-RADS Score oder einer Kombination mit der PSAD gezeigt.
Schlussfolgerung: Die entwickelten Modelle und der Prototyp, der diese in einer leicht bedienbaren Form zusammenfasst, zeigen das Potential für ML-Methoden in der Prostatakrebsbefundung auf. Es ist möglich unkritische zeitintensive Aufgaben wie das Heraussuchen der notwendigen Sequenzen und Segmentierungen vollständig sowie kritische Befundungen und die dazugehörige Dokumentation teilweise zu automatisieren. Die entwickelten Methoden können auch für ähnliche Fragestellungen genutzt werden.
Objective: In this work, machine learning (ML) methods for the partial automation of prostate MRI diagnosis were developed and evaluated with internal and external data sets and a reader study. Methods: Three ML models were implemented: a model for the classification of sequence type and anatomical direction of prostate MRIs, a model for the segmentation of prostate and transitional zone (TZ), and a model for the classification of prostate lesions into benign and malignant, whose decision making is explained with image features from the Prostate Imaging Reporting and Data System (PI-RADS). The models were developed using an internal prostate MRI dataset of 1243 patients and validated using three external data sets from different centers, scanner types and scanner manufacturers. In addition to the developed models, the diagnostic value of the TZ-specific prostate-specific antigen density (sPSAD) based on segmentations was analyzed and the added value that an explained lesion classification model brings to the diagnosis was evaluated in a reader study. The individually developed methods are implemented in a prototype, including the diagnostic process from loading the images to creating a report. Results: The sequence classification model provides accuracies of 99.88% (99.75% - 100%) internally and between 77.68% (63.89% - 91.47%) and 92.53% (90.91% - 94.15%) externally. Using the developed method within two external data sets yielded accuracies of 98.53% (97.59% - 99.47%) and 99.55% (97.92% - 100%). The prostate segmentation model achieved DICE-Scores of 0.89 (0.80 – 0.97) internally and 0.90 (0.83 – 0.97) externally for the prostate and 0.84 (0.70 – 0.99) and 0.85 (0.70 – 1.0) for the TZ. The lesion classification model achieves an internal lesion-based AUC for the classification of clinically significant prostate cancer of 0.89 (0.85-0.93) and an external AUC of 0.85 (0.80- 0.91). The reader study shows that inexperienced readers were accelerated by a factor of 1.8 from 85s to 47s for the detection and classification of the index lesion. Their speed became close to that of experts with >10 years of experience at 39s. The AUCs of the sPSAD were higher than the PSAD in all data sets analyzed. In a decision curve analysis, a biopsy strategy based on PI-RADS and sPSAD showed an added value to the pure PIRADS score or a combination with the PSAD at a threshold probability of 40%. Conclusion: The developed models and the prototype, which summarizes them in an easy-to-use web interface, show the potential for ML methods in prostate cancer diagnostics. It is possible to fully automate non-critical time-consuming tasks such as selecting the necessary sequences and segmentation, as well as partially automating diagnosis and the associated documentation. The methods developed can also be used for similar tasks e.g. image feature based explanations for diagnosis of liver imaging based on LIRADS or breast imaging based on BI-RADS.