Rofo 2024; 196(09): 890
DOI: 10.1055/a-2315-4527
Brennpunkt

Kommentar zu „KI – Deep-Learning-gestützte Triage von Thorax-Röntgenaufnahmen“

Daniel Pinto Dos Santos
1   Institute for Diagnostic and Interventional Radiology, Faculty of Medicine and University Hospital Cologne, Köln, Germany
› Author Affiliations

In unserem kollektiven radiologischen Gedächtnis wird für alle Zeit der berühmte Ausspruch von Geoffrey Hinton aus dem Jahre 2016 eingebrannt bleiben, der voller Überzeugung prophezeite, dass wir im Grunde aufhören könnten, Radiologinnen und Radiologen auszubilden, diese würden in wenigen Jahren ohnehin komplett von künstlicher Intelligenz (KI) ersetzt werden können [1]. Inzwischen hat sich die Wahrnehmung von künstlicher Intelligenz in der Radiologie grundlegend verändert – eine Vielzahl kommerzieller Anbieter hat sich auf dem Markt etabliert, Radiologinnen und Radiologen arbeiten in nahezu unveränderter Weise und der generelle Konsens scheint zu sein, dass, statt von KI ersetzt zu werden, KI eines unter vielen Werkzeugen ist, das Radiologinnen und Radiologen bei ihrer Arbeit unterstützt. Neben potenziellen Verbesserungen der diagnostischen Genauigkeit wird dabei auch immer wieder ins Feld geführt, dass KI genutzt werden könnte, um dem Fachkräftemangel zu begegnen, indem repetitive oder intellektuell weniger fordernde Aufgaben von der KI übernommen werden und wir uns um die herausfordernderen Aufgaben kümmern bzw. gewonnene Zeit für eine persönlichere Betreuung von Patientinnen und Patienten investieren können.

In diesem Spannungsfeld präsentieren Yoon et al. in ihrer Arbeit „Use of artificial intelligence in triaging of chest radiographs to reduce radiologists’ workload“ durchaus spannende Ergebnisse. In einem Szenario, in dem nur solche Röntgenbilder des Thorax, die nicht die geringste von der KI vorhergesagte Wahrscheinlichkeit für das Vorliegen von Pathologien hatten, von Radiologen oder Radiologinnen befundet wurden, konnten sie keine Verschlechterung der Gesamtsensitivität feststellen bei sogar etwas verbesserter Gesamtspezifität. Die Versuchung scheint bei solchen und ähnlichen Ergebnissen groß, entsprechende KI-Systeme großflächig auszurollen und endlich die so oft zitierten Potenziale von KI in der klinischen Routine zu realisieren. Bei allem Enthusiasmus der neuen Technologie gegenüber ist hier aus meiner Sicht jedoch noch etwas Geduld anzuraten, denn viele offene Fragen bleiben auch nach der Lektüre der Arbeit von Yoon et al..

Eines der offensichtlichsten Probleme solcher Arbeiten ist, dass zumeist ein Goldstandard im Konsensusverfahren definiert wird. Doch gerade bei Röntgenaufnahmen des Thorax ist dies bekanntermaßen nur eingeschränkt verlässlich und noch dazu kann diese Methode auch so gelesen werden, dass die Teilnehmenden des Konsensusverfahrens per Definition eine 100%ige Sensitivität und Spezifität haben, die KI allein aber auch alle anderen Teilnehmenden – mit oder ohne KI – nur eine geringere diagnostische Genauigkeit haben können. Ein anderes verhältnismäßig klares Problem ist die Tatsache, dass die Angabe einer Gesamtsensitivität letztlich nur begrenzt aufschlussreich ist. Zum einen, weil dies keine Rückschlüsse auf die Quote zu erwartender falsch positiver bzw. falsch negativer Befunde zulässt, zum anderen, weil vermutlich nicht jede Pathologie gleich relevant ist – ein kleiner Randwinkelerguss (vermutlich hohe Prävalenz) mag irrelevant sein, eine Destruktion mehrerer Rippen bspw. aufgrund eines nicht bekannten extrapulmonalen Tumors (vermutlich sehr niedrige Prävalenz – wenn überhaupt unter den Pathologien, die von der KI erkannt werden) hingegen mag von überaus hoher Relevanz sein. Und nicht zuletzt sollte erwähnt werden, dass aus regulatorischer Sicht ein solcher Einsatz vollautomatischer KI-Systeme im Gesundheitswesen zukünftig voraussichtlich unmöglich sein wird, da bspw. der kürzlich verabschiedete EU AI Act [2] fordert, dass KI-Systeme im Gesundheitswesen adäquat von Menschen überwacht werden.

Trotz aller genannter Probleme soll dies aber nicht bedeuten, dass die Arbeit von Yoon et al. keinen wertvollen Beitrag zur Diskussion um KI in der Radiologie darstellt. Im Gegenteil, solche und ähnliche Studien sind wichtige Bausteine in der Diskussion, wie wir KI für uns und natürlich auch unsere Patientinnen und Patienten gewinnbringend einsetzen. Es liegt an uns, in Zukunft die oben genannten Herausforderungen mit Akribie und Geduld zu untersuchen und so verlässliche Evidenz zu generieren, die einen verantwortungsvollen Einsatz vertrauenswürdiger KI-Systeme in der klinischen Routine ermöglicht.



Publication History

Article published online:
15 August 2024

© 2024. Thieme. All rights reserved.

Georg Thieme Verlag KG
Rüdigerstraße 14, 70469 Stuttgart, Germany