Zielsetzung: Das Erkennen und Bewerten von Risikofaktoren einer Wurzelkanalbehandlung (WKB) stellt einen entscheidenden Schritt bei der Therapieplanung zahnärztlicher Behandler*innen dar. Das maschinelle Lernen (ML) fand innerhalb der letzten Dekade vermehrt auch Anwendung in der Zahnmedizin. Das Ziel unserer Studie war es zum einen, Zusammenhänge zwischen zahn-, patienten- und behandlungsspezifischen Faktoren und der Prognose einer WKB zu detektieren und folgend ein Faktorgewichtungsranking zu erstellen; zum anderen sollte analysiert werden, inwiefern durch die Anwendung komplexer ML Modelle Vorhersagen über den Erfolg oder Misserfolg einer WKB möglich werden.
Methodik: Es wurden Patientenfälle untersucht, die im Zeitraum von 2016 bis 2020 eine WKB am CharitéCentrum 03 für Zahn-, Mund- und Kieferheilkunde erhalten hatten und mindestens sechs Monate nachuntersucht worden sind. Bei der Analyse wurden sowohl Patientendaten als auch Röntgenbilder bewertet und nach zuvor festgelegten Kriterien ausgewertet. Ein Misserfolg der Behandlung war definiert durch das Bestehen klinischer Symptome und/oder radiologischer Auffälligkeiten. Mithilfe einer logistischen Regression (logR) wurden Zusammenhänge zwischen den einzelnen Faktoren detektiert. Neben der logR sollten komplexere ML Modelle (Random Forest (RF), Gradient Boosting Machine (GBM), Extreme Gradient Boosting (XGB)) eingesetzt werden, um Vorhersagen über den Erfolg oder Misserfolg einer WKB in einem Testdatensatz zu treffen. Zur Bewertung der Vorhersagegüte wurden ROC-Kurven (Receiver Operating Characteristic) und AUC-Werte (Area under the curve) eingesetzt. Anschließend wurde auf Basis der relativen Faktorgewichtung der einzelnen Modelle eine modellübergreifende Rangfolge der Faktoren erstellt, um deren Wichtigkeit für die Vorhersage zu beschreiben. Ergebnisse: Insgesamt wurden 591 Zähne von 458 Patient*innen (weiblich n = 216 (47,2%), männlich n = 242 (52,8%)) analysiert. Die Gesamterfolgsrate aller Behandlungen betrug 79,5%. LogR zeigte, dass vor allem zahnbezogene Faktoren einen signifikanten Einfluss auf den Ausgang einer WKB hatten. Die wichtigsten Variablen waren hierbei ein schwerer alveolärer Knochenabbau von 66-100% (OR 6,48; 95% CI [2,86; 14,89], p<0,001) und ein erhöhter Periapikaler Index von größer oder gleich 4 (OR 4,59 [2,44; 8,79], p<0,001). Misserfolge waren auch für Revisionstherapien signifikant häufiger (OR 1,77 [1,01; 2,86], p<0,01). Bei den patientenbezogenen Faktoren war lediglich das Rauchen mit einem Misserfolg einer WKB assoziiert (OR 2,05 [1,18; 3,53], p<0,05). Die Vorhersagegüte der verschiedenen ML Modelle blieb insgesamt stark begrenzt (ROCAUC: logR 0,63 [0,53; 0,73]; GBM 0,59 [0,50; 0,68]; RF 0,59 [0,50; 0,68]; XGB 0,60 [0,50; 0,70]).
Schlussfolgerungen: Misserfolge einer WKB waren primär mit zahnbezogenen Faktoren assoziiert. Vorhersagen über den Ausgang einer Behandlung waren auch mit komplexeren ML Modellen nur eingeschränkt möglich.
Objective: Identifying potential risk factors of a root canal treatment (RCT) is a crucial step in endodontic treatment planning. Machine learning (ML) was found beneficial for health care applications in recent years; it has also been applied in dentistry. We intended to detect tooth-, patient- and treatment-level covariates associated with the outcome of endodontic therapy, and rank them according to their importance. Additionally, we aimed to apply ML for predicting the outcome of RCT.
Methods: We analyzed patients who received one or more RCT with at least six months follow-up at the Charité Dental Clinic between 2016 and 2020. To derive covariates, patient data including medical history and treatment protocols as well as periapical radiographs were employed. Failure was defined as persistent clinical symptoms and/or radiographical signs of persisting or progressing apical periodontitis. By using logistic regression (logR) on the full data set we analyzed associations between covariates and outcomes. LogR and more complex ML models (Random Forest (RF), Gradient Boosting Machine (GBM), Extreme Gradient Boosting (XGB)) were then trained and their performance for predicting success or failure of root canal therapy assessed on a separate test data. ROC (Receiver Operating Characteristic) curves and AUC (Area under the curve) values were employed to evaluate the predictive performance. Mean rank values were calculated to construct a ranking showing the relative importance of each factor.
Results: A total of 591 teeth from 458 patients (female n = 216 (47.2%), male n = 242 (52.8%)) were examined. The overall success rate of root canal treatments was 79.5%. LogR showed that tooth-related covariates were significantly associated with the outcome of root canal therapy, with severe alveolar bone loss (ABL 66-100%) (OR 6.48, 95% CI [2.86, 14.89], p<0.001) and a PAI-Score higher or equal to 4 (OR 4.59, 95% CI [2.44, 8.79], p<0.001) increasing the risk of failure. Retreatments showed similarly increased risks (OR 1.77, 95% CI [1.01, 2.86], p<0.01) and smoking was significantly associated with failure on patient-level (OR 2.05, 95% CI [1.18, 3.53], p<0.05). The predictive performance of all ML models was limited (ROCAUC: logR 0.63 [0.53, 0.73]; GBM 0.59 [0.50, 0.68]; RF 0.59 [0.50, 0.68]; XGB 0.60 [0.50, 0.70]).
Conclusions: Failure of root canal therapy was primarily associated with tooth-related factors. In general, predicting the outcome of RCT with ML models was only limitedly possible.