Schlüsselwörter Epidemiologie - CT-Angiographie - Embolie/Thrombose
Hintergrund
Die Lungenarterienembolie (LAE) ist nach dem akuten Myokardinfarkt und dem Schlaganfall
die dritthäufigste kardiovaskuläre Erkrankung [1 ]. Aufgrund der Gefahr eines Rechtsherzversagens durch Obstruktion der Lungenstrombahn
geht sie unbehandelt mit einer hohen Letalität von ca. 30% einher. Da das Risiko an
einer LAE zu versterben innerhalb der ersten Stunden nach Symptombeginn am höchsten
ist, ist eine frühzeitige Diagnose von größter Bedeutung [2 ]. Die CT-Angiografie ist der international anerkannte Referenzstandard zur Diagnosestellung
einer LAE [3 ]
[4 ]. Die CT ist nicht nur in der Erkennung von Thromben in der Lungenstrombahn sehr
sensitiv, sondern ermöglicht auch eine einfache Quantifizierung einer möglicherweise
vorliegenden Rechtsherzbelastung, als Surrogatparameter für ein drohendes Rechtsherzversagen
[4 ]
[5 ]. Aufgrund der geschilderten Dringlichkeit ist eine schnelle und korrekte Befundung
dieser CTs durch die Radiologie essenziell.
Ein Großteil der radiologischen Befunde, inklusive der für CT-Angiografien bei Verdacht
auf LAE (LAE-CTs), werden noch immer in einer Freitextform verfasst. Freitextbefunde
haben eine hohe Variabilität hinsichtlich Inhalt und Struktur. Zudem fehlen in Freitextbefunden
nicht selten für den klinischen Zuweiser relevante Informationen [6 ]
[7 ]. Neben der Freitextbefundung ist die strukturierte Befundung (engl. Structured reporting ; SR) in den letzten Jahren in den Fokus gerückt. Vorteile von SR gegenüber Freitextbefundung
konnten in dutzenden Studien belegt werden. Strukturierte Befunde sind unter anderem
besser lesbar, besser vergleichbar, vollständiger und detaillierter als Freitextbefunde
[6 ]
[7 ]
[8 ]. Dies konnte auch explizit für LAE-CTs belegt werden [9 ]. Sowohl klinische Zuweiser als auch Radiologen bevorzugen strukturierte Befunde
gegenüber Freitextbefunden [10 ].
In der klinischen Routine konnte sich SR trotz der mannigfaltigen Vorteile dennoch
bisher nicht durchsetzen. Die Nutzung ist in den meisten radiologischen Abteilungen
gering [10 ]. Dieses Phänomen hängt sehr wahrscheinlich mit Einschränkungen zusammen, die im
Rahmen einer SR-Implementation entstehen können. Die Einführung von SR-Lösungen in
den klinischen Reporting workflow kann mitunter technisch schwierig und mit großem Aufwand verbunden sein. Zudem ist
sie stark vom jeweiligen Anbieter des Picture Archiving and Communication System (PACS) und Radiology Information System (RIS) abhängig [11 ]
. Weiter ist die Integration der Spracherkennung in die SR bisher unzureichend. Anders
als Freitextbefunde, müssen strukturierte Befunde größtenteils händisch mit Maus und
Tastatur befüllt werden, was einerseits unbequem sowie zeitaufwändig ist und andererseits
von den eigentlichen Bilddaten ablenken kann [12 ].
Neben den Vorteilen bezüglich der Befundqualität bietet die strukturierte Befundung
als IT-basierte Methode auch die Möglichkeit, große hoch strukturierte Datenmengen
in Datenbanken automatisiert anzureichern und sekundär auszuwerten. Dieses (begrifflich
aus dem Englischen kommende) Data-Mining von strukturierten Befunden kann zur Beantwortung vielfältiger Fragestellungen genutzt
werden.
So können beispielsweise Daten zur Epidemiologie der Erkrankung einschließlich der
Setting-spezifischen Prävalenz basierend auf den Befunddaten erhoben werden. Erste
Anstrengungen in diesem Feld wurden in unserer Abteilung 2017 in einer Machbarkeitsstudie
unternommen. Diese umfasste knapp über 500 Patienten, die bei Verdacht auf LAE ein
CT erhielten. Da die strukturierte Befundung von LAE-CTs zu diesem Zeitpunkt noch
nicht in der klinischen Routine implementiert war, mussten alle zugehörigen Freitextbefunde
retrospektiv händisch strukturiert werden [13 ]. Epidemiologische Daten, die primär aus strukturierten Befunden, die in der klinischen
Routine erhoben wurden, generiert wurden, gibt es in der Literatur kaum [14 ]. Darüber hinaus eignet sich Data-Mining von strukturierten Befunden auch für wissenschaftliche Fragestellungen. So konnte
basierend auf strukturierten Befunddaten ein neues Bewertungssystem zur Abschätzung
der Thrombuslast bei LAE-Patienten entwickelt werden [15 ]. Auch für das Training und die Validierung von Künstlicher Intelligenz (KI) sind
strukturierte Befunddaten ideal geeignet [16 ].
Aufbauend auf der beschriebenen Machbarkeitsstudie war das Ziel dieser Arbeit, alle
in der klinischen Routine erhobenen strukturierten Befunde zu LAE-CTs der letzten
5 Jahre aus der Datenbank unserer Abteilung mit Hilfe eines Data-Mining -Algorithmus auszuwerten. Zur internen Qualitätssicherung sollten neben epidemiologischen
Daten und Krankheitscharakteristika auch Erkenntnisse zu möglichen innerklinischen
Unterschieden in der Prävalenz einer LAE gewonnen werden.
Methoden
In unserer Klinik wurde 2016 eine web-basierte, Integrating the Health Enterprise Management of Radiology Report Templates (IHE MRRT)-kompatible Plattform zur SR entwickelt und für die Nutzung in der klinischen
Routine implementiert [17 ]. Seitdem konnten zahlreiche Befundvorlagen (Templates) für verschiedene Untersuchungstypen
in den Modalitäten Ultraschall, CT und MRT entwickelt und zur Nutzung gebracht werden
[10 ]. Das Template zur Befundung der CT-Angiografie zum Lungenembolieausschluss wurde
im 3. Quartal 2018 klinisch implementiert. [Abb. 1 ] zeigt die aktuelle Version der Befundmaske. Die Templates werden während des Befundvorgangs
typischerweise mit Maus und Tastatur befüllt. Die Bestimmung der Größenverhältnisse
von rechtem und linkem Ventrikel (RV/LV-Index) zur Quantifizierung einer möglichen
Rechtsherzbelastung erfolgte durch Vermessung der jeweils maximalen Ventrikelbreite
in axialer Schnittführung und wird durch das Template nach Eintragung beider Werte
automatisch berechnet. Das Vorliegen einer Rechtsherzbelastung wurde im Einklang mit
den Richtlinien der European Society of Cardiology als ein RV/LV-Index >1 definiert
[18 ].
Abb. 1 Strukturiertes Befundungstemplate CT-Angiografie Lungenarterienembolie.
Alle in der klinischen Routine mit Hilfe von Templates erhobenen und freigegeben Befunde
werden in der Befundungsplattform automatisch gespeichert und sind somit sekundären
Auswertungen gut zugänglich. Von der Befundungsplattform können Befunde systematisch
mit Hilfe der Software RapidMiner Studio (RapidMiner, Cambridge, USA) über einen zuvor
definierten Zeitraum ausgelesen werden. Dabei können einerseits gezielt einzelne Bestandteile
der Befunde (wie z.B. das Vorliegen einer Rechtsherzbelastung) oder aber auch der
gesamte Inhalt der Befunde ausgelesen werden. Die Ergebnisse werden als .csv-Datei
ausgegeben und können anschließend mit Hilfe einer Statistiksoftware ausgewertet werden.
[Abb. 2 ] zeigt eine grafische Darstellung des hier beschriebenen Arbeitsablaufs.
Abb. 2 Grafische Darstellung des Arbeitsablaufs für die sekundäre Auswertung strukturierter
Befunde (Data-Mining).
Für die in dieser Arbeit untersuchten Fragstellungen wurden die folgenden Inhalte
aus dem LAE-Template ausgelesen: Patientenalter und -geschlecht, innerklinischer Zuweiser,
Zuweisungsart (ambulant, Normalstation, Intensivstation), Vorliegen einer Lungenarterienembolie,
Ausprägung einer möglichen Lungenarterienembolie (Hauptstamm, Lobärarterie, Segmentarterie,
subsegmentale Arterie), Seitangabe der Embolie (rechts, links, beidseitig), Vorliegen
einer Rechtsherzbelastung (RV/LV-Index >1) sowie Datum und Uhrzeit der Untersuchung.
Alle seit Implementation des Templates erstellten Befunde von 08/2018 bis 07/2023
wurden eingeschlossen.
Die statistischen Auswertungen wurden mit Hilfe der Software R (The R Foundation für
Statistical Computing, Wien, Österreich) durchgeführt. Binäre und kategoriale Daten
wurden als absolute Zahlen und Prozentsätze ausgedrückt. Kontinuierliche Daten wurden
als Mittelwert und Standardabweichung (SD) angegeben. Nicht normalverteilte Daten
wurden als Median und Interquartilsabstand (IQR) angegeben. Auf statistische Signifikanz
wurde mittels des Kruskal-Wallis-Tests geprüft. Hierfür wurde das Signifikanzniveau
auf α = 0,05 festgelegt.
Ergebnisse
Insgesamt wurden 2790 strukturierte Befunde von Patienten, bei denen ein LAE-CT durchgeführt
wurde, eingeschlossen.
Eine Lungenarterienembolie bestand bei 24% (n = 678) des Gesamtkollektivs. Das mediane
Patientenalter betrug 71 Jahre (IQR: 58 – 80), das Verhältnis von Männern zu Frauen
betrug 1,2 / 1 ([Abb. 3 ]).
Abb. 3 Alters- und Geschlechtsverteilung der Lungenarterienembolie anhand eines Baumdiagramms.
Es zeigten sich zum Teil deutliche Unterschiede in der Prävalenz einer LAE in Abhängigkeit
der Zuweisungsart. Von den ambulant zugewiesenen Patienten, die insgesamt 69% (n =
1913) der Gesamtkohorte ausmachten, hatten nur 23% (n = 441) einen positiven Befund.
Von den insgesamt 678 von Normalstationen zugewiesen Patienten hatten 27% (n = 182)
eine LAE. Im relativ kleinen Patientenkollektiv, dass von der(?) Intensivstation zugewiesen
wurde (n = 199), zeigte sich eine höhere Rate an positiven Befunden von 30% (n = 59)
([Abb. 4 ]A). Auch zeigten sich Unterschiede in der Prävalenz einer Lungenarterienembolie in
Abhängigkeit der zuweisenden klinischen Disziplin. Insgesamt 75% (n = 2104) der Patienten
wurden von internistisch geführten Abteilungen zugewiesen. Von diesen hatten 22% (n
= 470) eine LAE. Von den 453 chirurgisch zugewiesenen Patienten hatten 34% (n = 155)
eine LAE. Die übrigen hier aggregiert als „Sonstige“ dargestellten Abteilungen wiesen
233 Patienten zu, von denen24 % (n = 57) eine LAE hatten ([Abb. 4 ]B).
Abb. 4 Auftreten einer LAE in Abhängigkeit der Zuweisungsart (ambulant, Normalstation, Intensivstation
(A ) und in Abhängigkeit der zuweisenden klinischen Abteilung (B ).
Von den 678 Patienten mit LAE hatten 32% (n = 215) eine zentrale Embolie, 25% (n =
172) eine lobäre Embolie, 33% (n = 228) eine segmentale Embolie und 10% (n = 69) eine
subsegmentale Embolie. 65% aller LAEs zeigten eine beidseitige Ausprägung (n = 444),
10% (n = 71) eine einseitig linksseitige und 35% (n = 167) eine einseitig rechtsseitige
Ausprägung. Eine Rechtsherzbelastung lag bei insgesamt 43% (n = 292) der Patienten
mit LAE vor.
Eine weiterführende Auswertung zeigte, dass zentrale Embolien mit höheren RV/LV-Indizes
als lobäre, segmentale oder subsegmentale Embolien assoziiert sind ([Abb. 5 ]A). Zudem trat eine Rechtsherzbelastung mit 73% bei zentralen Embolien deutlich häufiger
auf als bei lobären (38%), segmentalen (26%) und subsegmentalen Embolien (13%) ([Abb. 5 ]B).
Abb. 5 RV/LV-Index in Abhängigkeit der höchsten Lokalisation einer Embolie im pulmonalarteriellen
Gefäßsystem (A ) und Auftreten einer Rechtsherzbelastung in Abhängigkeit der höchsten Lokalisation
einer Embolie im pulmonalarteriellen Gefäßsystem (B ). RV/LV-Index in Abhängigkeit der Seite des Auftretens einer LAE (C ) und Auftreten einer Rechtsherzbelastung in Abhängigkeit der Seite des Auftretens
einer LAE (D ). RHB = Rechtsherzbelastung.
Analog dazu waren auch beidseitige Embolien mit höheren RV/LV-Indizes assoziiert verglichen
mit einseitigen Embolien ([Abb. 5 ]C). Bei 54% aller beidseitigen Embolien lag eine Rechtsherzbelastung vor, während
dies bei einseitigen Embolien nur in 27% linksseitig und 19% rechtsseitig der Fall
war ([Abb. 5 ]D).
Diskussion
Die erhobenen Daten zeigen, dass mit Hilfe der konsequenten Anwendung von SR ohne
großen Aufwand Prävalenzstatistiken und epidemiologische Daten erhoben werden können,
wie hier am Beispiel der Lungenarterienembolie demonstriert. Die Daten bieten einen
wertvollen Überblick über die Patientenpopulation und die Verteilung von Krankheitsmerkmalen
und Krankheitsausprägung. Zudem bieten sie ein wichtiges Feedback für klinische Zuweiser
und Radiologen.
Die in der untersuchten Kohorte ermittelte Alters- und Geschlechtsverteilung der LAE
(medianes Patientenalter 71, Verhältnis von Männern zu Frauen 1,2 zu 1) zeigt Übereinstimmung
mit mehreren anderen epidemiologischen Studien zur LAE [19 ]
[20 ]
[21 ]. Die ermittelte Prävalenz einer LAE von 24% in der Gesamtkohorte deckt sich ebenfalls
mit der 2017 durchgeführten Machbarkeitsstudie in der Freitextbefunde einer kleineren
Kohorte (n = 500) retrospektiv strukturiert wurden [13 ]. Eine amerikanische Arbeit, in der Freitextbefunde von über 500 LAE-CTs manuell
ausgewertet wurden, beschreibt die Prävalenz einer LAE mit 9% hingegen deutlich niedriger,
schließt aber nur Patienten ein, die von einer Notaufnahme zugewiesen wurden [22 ]. Hierbei ist zudem zu beachten, dass in den USA aufgrund anderer Rechtsbedingungen,
die Indikation zur CT mitunter niederschwelliger getroffen wird.
Auch in dieser Arbeit ließen sich Unterschiede in der Wahrscheinlichkeit für einen
positiven Befund in Abhängigkeit der Zuweisungsart nachweisen. Die dabei niedrigere
Rate von 23% bei ambulanten Patienten im Gegensatz zu 27% bei Patienten von Normalstation
und 30% bei Intensivpatienten lässt sich in erster Linie dadurch erklären, dass im
stationären Setting bei einer neuaufgetretenen typischen Symptomatik etwa nach einer
Operation oder längerer Immobilisation die Diagnose einer LAE naheliegender ist als
im ambulanten Setting. In letzterem dient das LAE-CT nicht selten bei uneindeutiger
Symptomatik und positivem D‑Dimer im Labor eher zum Ausschluss einer LAE als zur Diagnosebestätigung.
Diese Überlegungen werden auch durch die niedrigere Rate von positiven Befunden bei
internistisch zugewiesenen Patienten (22%) im Gegensatz zu chirurgisch zugewiesenen
Patienten (34%) gestützt. Eine signifikant zunehmende Rechtsherzbelastung bei zentralen
Embolien verglichen mit peripher gelegenen Embolien konnte Hahiharan et al. für eine
kleinere Kohorte von Patienten, bei der Bild- und Befunddaten aufwändig händisch ausgewertet
wurden, belegen [23 ]. Dieser Zusammenhang konnte mit Hilfe des hier durchgeführten SR-basierten Data-Mining -Ansatzes an einer mehr als doppelt so großen Kohorte belegt werden.
Letztlich liegen die ermittelten Ergebnisse dieser Arbeit im Rahmen des erwartbaren.
Die eigentliche Innovation liegt in der Methodik selbst, mit der diese generiert wurden.
Diese ermöglicht es, Daten aus der Bildgebung schnell und ohne den Einsatz größerer
personeller Ressourcen zu erfassen, was hingegen beim Einsatz von Freitextbefundung
nur mühevoll unter Durchsicht einzelner Befunde möglich wäre. Auf der anderen Seite
muss jedoch berücksichtigt werden, dass die primäre Erstellung der strukturierten
Befunde in der klinischen Routine aufwändiger sein kann als konventionelle Freitextbefundung.
Weiter besteht eine vielfältige Anwendbarkeit für die Daten. Sowohl für klinische
Zuweiser als auch für den Radiologen ist es essenziell, Wahrscheinlichkeiten für das
Vorliegen eines positiven Befunds bei radiologischen Untersuchungen zu kennen. Insbesondere
bei Untersuchungen, bei denen Röntgenstrahlung zum Einsatz kommt, wie der CT, wären
bei niedrigen Wahrscheinlichkeiten im Sinne des Strahlenschutzes Qualitätssicherungsmaßnahmen
erforderlich. Weiter eignen sich Bildgebungs-basierte strukturierte Daten bestens,
um Registerdatenbanken, die es in verschiedenen europäischen Ländern für LAE-Patienten
bereits gibt, anzureichern [24 ]. Diese beinhalten für gewöhnlich vor allem klinische Daten und könnten zusätzlich
durch Bildparameter noch optimiert werden. Dies könnte auch die Entwicklung von KI-Modellen,
beispielsweise zur Vorhersage von Rezidivrisiken, ermöglichen. Darüber hinaus könnten
die Daten in Zukunft auch in im Rahmen der Medizininformatikinitiative an den Universitätsklinika
eingerichteten Datenintegrationszentren aufgenommen werden, was eine standortübergreifende
Nutzung für Forschungszwecke ermöglichen würde.
Neben des hier gezeigten Data-Mining -Ansatzes von strukturierten Befunden können auch Freitextbefunde retrospektiv durch
die Nutzung von Natural Language Processing (NLP) zur sekundären Datennutzung ausgewertet
werden [25 ]
[26 ]
[27 ]. NLP ist als KI-verwandte Technologie dazu in der Lage, automatisch Freitext zu
analysieren, relevanten Inhalt zu extrahieren und zu strukturieren [27 ]. Die Methode ist jedoch einerseits dadurch eingeschränkt, dass die dafür genutzten
Freitextbefunde nicht immer alle benötigen Informationen enthalten [6 ]
[7 ]. Andererseits haben sich NLP-Algorithmen in den letzten Jahren zwar deutlich verbessert,
eine vollständig richtige Erkennung des Inhalts aus Freitextbefunden ist jedoch weiter
hin nicht garantiert [26 ]. Darüber hinaus sind Large Language Models , wie Chat GPT-4, dazu in der Lage, ganze Freitextbefunde retrospektiv in einen strukturierten
Befund umzuwandeln [28 ]. Letztlich ist der hier praktizierte SR-basierte Ansatz jedoch geeigneter, da vollständige
Datensätze ohne die Notwendigkeit eines zusätzlichen Transformationsschrittes primär
in einer hoch strukturierten Form generiert und direkt ausgewertet werden können.
Die vorliegende Studie hat Einschränkungen. Um eine hohe Aussagekraft von epidemiologischen
Daten und Prävalenzstatistiken, die mittels des SR-basierten Data-Mining- Ansatzes erhoben wurden, zu gewährleisten, ist eine hohe klinische Nutzungsrate der
SR essenziell. Für die meisten strukturierten Befundungstemplates konnten in unserer
Klinik hohe Nutzungsraten nachgewiesen werden (z.B. Polytrauma CT 97%, Prostata MRT
92% oder Urolithiasis CT 91% im Jahre 2022). Wohingegen die Nutzungsrate des LAE-Templates
mit 58% im Jahre 2022 relativ geringer ausfiel, seit der Implementierung des Templates
im Jahre 2018 (hier 18%) aber stetig anstieg [10 ]. Letztlich ist die SR nicht für alle Untersuchungstypen gleich gut geeignet und
ihre Nutzung an unserer Klinik nicht verpflichtend. Im Falle des LAE-CTs bestehen
in bis zu 33% der Untersuchungen alternative Diagnosen [22 ]. Für die genaue Beschreibung alternativer Diagnosen und bei sehr komplexen Fällen
könnten Radiologen das Befundungstemplate ungeeignet finden und von einer Nutzung
absehen. Gemäß dieser Annahme ist davon auszugehen, dass die tatsächliche Wahrscheinlichkeit
eines positiven Befunds im LAE-CT niedriger liegt als im ausgewerteten Patientenkollektiv.
Unabhängig der Anwendbarkeit auf einzelne Untersuchungstypen besteht weiterhin Potenzial,
die SR zu optimieren und die klinische Anwendung somit weiter zu fördern. Dies könnte
durch eine verbesserte Integration der Spracherkennung in strukturierte Befundungstemplates
mit Hilfe von NLP, was Gegenstand aktueller Forschungsarbeiten ist, gelingen [29 ].
Darüber hinaus betrachtet diese Bildgebungs-basierte Studie die Erkrankung nur zu
einem definierten Zeitpunkt. Aussagen zum Krankheitsverlauf können daher nicht getroffen
werden. Letztlich wurden auch Patienten, die zur Diagnosestellung beziehungsweise
zum Diagnoseausschluss eine andere Untersuchung als ein CT erhalten haben, wie beispielsweise
ein MRT oder eine Szintigrafie, nicht eingeschlossen. Im spezifischen Falle der spezifischen
Fragestellung LAE ist dieser Anteil an Patienten jedoch als relativ gering einzuordnen
[30 ].
Schlussfolgerung
SR ermöglicht es durch Data-Mining von Befunden ohne großen Einsatz von Zeit oder Ressourcen epidemiologische Daten
und Prävalenzstatistiken zu erheben. Für das Fallbeispiel der Lungenarterienembolie
konnten so zum Beispiel Unterschiede in der innerklinischen Prävalenz in Abhängigkeit
des klinischen Zuweisers und der Zuweisungsart gezeigt werden. Die generierten Daten
bieten vielfältige Anwendungsbereiche, wie beispielweise zur internen Qualitätssicherung,
wissenschaftlichen Auswertungen sowie zur Anreicherung von Registerdatenbanken. Um
von diesen Vorteilen zu profitieren, ist die Implementation und konsequente Nutzung
von SR unerlässlich und wird auch deshalb empfohlen.
Klinische Relevanz
Die konsequente klinische Anwendung von SR ermöglicht es durch Data-Mining ohne den Einsatz großer Ressourcen epidemiologische Daten und innerklinische Prävalenzstatistiken
zu erheben
Für das Fallbeispiel der Lungenarterienembolie können so Unterschiede in der innerklinischen
Prävalenz in Abhängigkeit des Zuweisers und der Zuweisungsart, sowie Wahrscheinlichkeiten
für das Vorliegen einer Rechtsherzbelastung in Abhängigkeit der Ausprägung der Embolie
berechnet werden.
Die Kenntnis von Wahrscheinlichkeiten für das Vorliegen eines positiven Befunds bei
radiologischen Untersuchungen bietet sowohl für Radiologen als auch für klinische
Zuweiser ein wichtiges Feedback.
Die generierten Daten bieten darüber hinaus vielfältige Anwendungsbereiche, wie zum
Beispiel zur inneren Qualitätssicherung, Strahlenschutz, wissenschaftlichen Auswertung
oder zur Anreicherung von Registerdatenbanken.
Abkürzungen
CT:
Computertomografie
LAE:
Lungenarterienembolie
SR:
Structured Reporting ; strukturierte Befundung
IHE MRRT:
Integrating the Health Enterprise Management of Radiology Report Templates
KI:
Künstliche Intelligenz
NLP:
Natural Language Processing
RV/LV-Index:
Rechtsventrikulärer / Linksventrikulärer Index