Inhaltszusammenfassung:
Das maligne Melanom zeichnet sich weiter als eine Erkrankung mit hohem Stellenwert im klinischen Alltag ab. Mit dem zunehmend relevanten Thema einer möglichst genauen Prognose der Erkrankung wurden in dieser Arbeit „convolutional neural network“-Modelle (CNN-Modelle) trainiert und bezüglich ihrer Prognose ausgewertet mit der Frage, welche Relevanz künstliche Intelligenz im Rahmen einer genauen Prognoseabgabe beim malignen Melanom einnehmen kann.
836 Melanomschnitte von Patienten mit dem Zeitpunkt der Erstdiagnose zwischen 2012 und 2015 wurden gesammelt und erstmalig digitalisiert. Über eine zufällige Verteilung wurden ca. 60% (502 Schnitte) für das Training der Modelle verwendet. Hierin wurden die zwei Klassen „alive“ und „dead“ innerhalb der „Google teachable machine“ trainiert. Bei der „Google teachable machine“ handelt es sich um ein allgemein zugängliches und benutzerfreundliches Tool, das es erlaubt, Modelle innerhalb von CNN-Plattformen zu erstellen. Die restlichen 40% (334 Schnitte) wurden durch die trainierten Modelle validiert. Die Prognoseaussage der CNN erfolgt anhand der Kategorien „dead“ und „alive“ und einer Prozentzahl, die aussagt, inwieweit der Schnitt aus „Sicht“ der CNN in die Kategorie hineinpasst. Die zwei trainierten Modelle unterschieden sich in Bezug auf die verwendeten digitalen Bilder. In einem ersten Modell wurde eine größere Aufnahme, die möglichst viel des feingeweblichen Schnittes beinhaltete, angefertigt. Das zweite Modell wurde nur mit und für die „areas of interest“ (AOI) trainiert, d.h. den krankheitsbestimmenden Arealen innerhalb der Schnitte
Das AOI-Modell zeigte sich gegenüber dem Übersichtsbild-Modell deutlich überlegen. Innerhalb des Übersichtsbild-Modells konnten 84,13% richtig als „alive“ eingeordnet werden, jedoch lag die Trefferquote bei den „dead“ Schnitten lediglich bei 20,83%. Bei dem AOI-Modell wurden 70,36% richtig als „alive“, und 52,08% richtig als „dead“ eingeordnet. In einer ROC-Analyse zeigte sich einerseits das AOI-Modell als signifikanter gegenüber dem Übersichtsbild-Modell. Weiterhin eignete sich die prozentuale Einordnung der CNN gegenüber der kategorialen in „dead“ und „alive“ besser.
In univariaten, logistischen Regressionsanalysen ließen sich die etablierten Prognosefaktoren Tumordicke nach Breslow verhältnisskaliert, die pT-Einteilung nach AJCC 2009, Ulzeration, histologischer Subtyp und Invasionslevel nach Clark, sowie die erstmals in dieser Arbeit erhobenen morphologischen Parameter Zellatypie, Mitosen, Wachstumsmuster und Pigmentierung als signifikante Einflussfaktoren auf die Prognose der CNN nachweisen.
Mit dem weiteren Ziel, ein möglichst hochwertiges Prognosemodell zu erstellen, wurden innerhalb logistischer Regressionsanalysen diverse Modelle erstellt und in ROC-Analysen ausgewertet. Die etablierten Prognosefaktoren zeigten sich gegenüber den hier erhobenen morphologischen Faktoren als überlegen. Weiterhin ließen sich Modelle, die die CNN Prognose beinhalteten, durchgehend als besser nachweisen. Dies galt sowohl bei Modellen, die alle Faktoren beinhalteten, als auch bei Modellen, die nur die etablierten Faktoren beinhalteten. Das beste Modell dieses Projekts konnte mit der Einbeziehung der fünf genannten etablierten und der vier genannten morphologischen Faktoren, sowie die prozentuale und kategoriale Einteilung der CNN (AOI-Modell) erstellt werden.
In einem anderen Schritt wurden ROC- und Überlebensanalysen der etablierten Prognosefaktoren durchgeführt. Hierin konnten die Erkenntnisse des aktuellen wissenschaftlichen Standes bestätigt werden. Die Tumordicke nach Breslow und die Ulzeration sind zentral in der Prognose des malignen Melanoms. Das Invasionslevel nach Clark und der histologische Subtyp sind zwar signifikant, in der prognostischen Aussagekraft den Faktoren Tumordicke und Ulzeration jedoch unterlegen.
Aus den Ergebnissen lässt sich schließen, dass eine zunehmend relevante Rolle der KI im Rahmen der Prognoseabgabe des malignen Melanoms zu erwarten ist. Das zweite CNN-Modell (AOI-Modell) zeigte eine zufriedenstellende Übereinstimmung bei der Prognoseabgabe und eine hohe Signifikanz und hervorragende Ergebnisse in den nachfolgenden Analysen. Für die komplette Ersetzung der etablierten Prognosefaktoren und der diagnostischen Arbeit eines Dermatopathologen reichen die Ergebnisse noch nicht aus, aber es bleibt, die zukünftigen Entwicklungen abzuwarten.