Aktuelle Urol 2025; 56(02): 191
DOI: 10.1055/a-2315-3978
Leserbrief

Antwort

Rezensent(en):
Johannes Frank
1   Urology Department, University of Lübeck, Lubeck, Germany (Ringgold ID: RIN9191)
,
Axel S. Merseburger
2   Urologie, Universitätsklinikum Schleswig-Holstein, Campus Lübeck, Lübeck, Germany
,
Johannes Landmesser
3   Urology Department, University of Luebeck, Luebeck, Germany (Ringgold ID: RIN9191)
,
Silvia Brozat-Essen
4   Urology Department, University of Luebeck, Luebeck, Germany (Ringgold ID: RIN9191)
,
Peter Schramm
5   Department for Neuroradiology, University of Luebeck, Luebeck, Germany (Ringgold ID: RIN9191)
,
Laura Freimann
6   Data Protection, University Medical Center of the Johannes Gutenberg University Mainz, Mainz, Germany (Ringgold ID: RIN39068)
,
Alexander Kleehaus
7   IT Consulting, PricewaterhouseCoopers Switzerland, Zurich, Switzerland (Ringgold ID: RIN504202)
,
Christian Elsner
8   Center for Artificial Intelligence, University of Luebeck, Luebeck, Germany (Ringgold ID: RIN9191)
› Institutsangaben

vielen Dank, dass Sie sich die Zeit genommen haben, uns ein Feedback zu unserer Veröffentlichung „Große Sprachmodelle zur schnellen Vereinfachung der Eingabe von Qualitätssicherungsdaten: Feldversuch mit realen Daten im Kontext der Tumordokumentation in der Urologie“ zu geben. Wir bedanken uns für Ihre Kritik und möchten auf die von Ihnen angesprochenen Bedenken eingehen.

Was zunächst die begrenzte Stichprobengröße von 25 Patienten betrifft, so erkennen wir an, dass größere Stichprobengrößen in diesem Fall wünschenswert wären. Uns ist jedoch wichtig, darauf hinzuweisen, dass unsere Studie als erste Untersuchung der Machbarkeit und des potenziellen Nutzens der Anwendung von KI, insbesondere von ChatGPT 4.0, bei der Tumordokumentation in der Urologie konzipiert war. Sie liefert aus unserer Sicht daher trotzdem wertvolle Einblicke in die Anwendung von KI in diesem Bereich und könnte als Grundlage für künftige Untersuchungen mit größeren Kohorten dienen.

In Bezug auf Ihre Bedenken bezüglich des fehlenden Vergleichs zwischen KI-generierten Befunden und menschlicher Leistung stimmen wir zu, dass solche Vergleiche für die Bewertung der Wirksamkeit von KI-Systemen wertvoll sind. Wie von uns beschrieben, dient insbesondere unsere Kostenkalkulation als Anhaltsmodell, die jedoch als grobe Abschätzung der Wirtschaftlichkeit zu verstehen ist. Zukünftige Iterationen unserer Forschung könnten vergleichende Analysen beinhalten, um ein umfassenderes Verständnis der KI-Fähigkeiten im Verhältnis zur menschlichen Expertise zu erhalten. Was mögliche Verzerrungen in den vom KI-System verwendeten Trainingsdaten betrifft, so haben wir strenge Vorverarbeitungs- und Validierungsverfahren durchgeführt, um diese zu minimieren und die Integrität der Daten zu gewährleisten.

Bezüglich der Einschränkungen und Nachteilen bei der Nutzung von KI im medizinischen Kontext haben wir uns bewusst sehr fokussiert und kurz mit dem Thema auseinandergesetzt und eher auf eine in weiteren Arbeiten zu führende Diskussion verwiesen. Auch wenn unsere Studie vereinzelte Probleme mit KI-generierten Antworten aufgezeigt hat, sind wir der Meinung, dass diese Probleme in der Anfangsphase der KI-Einführung inhärent sind und durch eine kontinuierliche Verfeinerung und Optimierung der KI-Algorithmen gelöst werden können.

Abschließend möchten wir sagen, dass wir Ihr Feedback zu schätzen wissen und die in Ihrem Schreiben aufgezeigten verbesserungswürdigen Bereiche anerkennen. Wir danken Ihnen nochmals für Ihren wertvollen Beitrag und freuen uns auf den weiteren Dialog und die Zusammenarbeit in diesem wichtigen Forschungsbereich.



Publikationsverlauf

Artikel online veröffentlicht:
03. April 2025

© 2025. Thieme. All rights reserved.

Georg Thieme Verlag KG
Oswald-Hesse-Straße 50, 70469 Stuttgart, Germany