Schlüsselwörter Notfallrettung - GKV-Daten - Sekundärdaten - Datenlinkage - patientenbezogene Gesundheitsdaten
Key words Emergency Medical Services - Health Insurance - Claims Data - Data Linkage - Data science
Einleitung
Forschung und Qualitätssicherung zur Versorgung von
Rettungsdienstpatient*innen beziehen sich häufig auf kleine
regionale Einheiten (z. B. einzelne Rettungsdienstbereiche), einzelne
Erkrankungsbilder oder für die Bewertung der Patient*innenversorgung
nur bedingt aussagekräftige Einsatzzeiten und -intervalle der beteiligten
Einsatzkräfte. Um Empfehlungen für die Optimierung der
präklinischen Notfallversorgung ableiten zu können, benötigt
es jedoch überregionale und umfassendere Analysen, die über den
Zeitraum des einzelnen Rettungsdiensteinsatzes hinausgehen, zumal wesentliche
Outcomes von Patient*innen oft erst nach Einsatzende sichtbar werden (vgl.
[2 ]).
Im vom Innovationsfonds geförderten Projekt „Integrierte
Notfallversorgung: Rettungsdienst im Fokus“ (kurz:
„Inno_RD“; FKZ 01VSF17032) werden über Sektorengrenzen
hinweg Versorgungsabläufe untersucht, an welchen der Rettungsdienst
beteiligt ist. Hierfür sind Sekundärdatenquellen notwendig, die den
gesamten Einsatz abbilden, inklusive der vor- und nachlaufenden
patient*innenbezogenen Informationen. In Inno_RD liegen dazu unter anderem
Einsatzprotokolle von nicht-ärztlichem Rettungsdienstpersonal sowie
Notärzt*innen vor. Komplementiert werden diese durch
Abrechnungsdaten gesetzlicher Krankenkassen.
Potenziell ergibt sich durch die Sekundärdatenverknüpfung
gegenüber alleinig auf Kassendaten gestützten Analysen, die zu
Rettungsdiensteinsätzen im Wesentlichen nur abrechnungsrelevante
Informationen enthalten, ein erheblicher Informationszugewinn gerade in Hinblick auf
Inhalte zum Notfallgeschehen (z. B. gesundheitliche Beschwerden) oder der
Versorgung (z. B. Medikamentengabe) in der Präklinik.
Erforderlich ist für die Verknüpfung von
Rettungsdienst-Einsatzprotokollen und Abrechnungsdaten allerdings ein Algorithmus,
welcher neben einer möglichst hohen Quote verknüpfter Fälle
auch eine hohe Qualität der Verknüpfung gewährleistet.
Beschrieben und verglichen werden im vorliegenden Beitrag dazu 2 prototypische
Vorgehen zur versichertenbezogenen Verknüpfung von Einsatzprotokollen
nicht-ärztlichen Rettungsdienstpersonals mit Abrechnungsdaten gesetzlicher
Krankenversicherungen. Neben einer deterministischen Verknüpfung unter
Nutzung der Krankenversichertennummer (KVNR) wird ein probabilistischer Ansatz
herausgearbeitet, der eine Zusammenführung auch dann ermöglicht,
wenn dieser Personenidentifikator nicht in allen Einsatzprotokollen vorliegt.
Charakterisierung von Rettungsdienst-Einsatzprotokollen und Abrechnungsdaten
gesetzlicher Krankenkassen
Charakterisierung von Rettungsdienst-Einsatzprotokollen und Abrechnungsdaten
gesetzlicher Krankenkassen
An primären Notfalleinsätzen des Rettungsdienstes, d. h. der
Versorgung von Patient*innen am Einsatzort sowie ihrem zumeist erfolgenden
Transport in eine zur Weiterversorgung geeignete Einrichtung, sind verschiedene
Akteure beteiligt. In Folge eines von einer Leitstelle aufgefassten Ereignisses
(z. B. ein eingehender Notruf) werden benötigte Ressourcen,
insbesondere Transportmittel und Einsatzkräfte, identifiziert und mit der
Einsatzdurchführung beauftragt. Die Disposition kann ausschließlich
mit nicht-ärztlichem Fachpersonal besetzte Rettungsmittel wie Rettungswagen
(RTW) umfassen, oder im Falle notwendiger ärztlicher Hilfeleistungen
Notarzteinsatzfahrzeuge (NEF), Notarztwagen (NAW) oder Rettungshubschrauber (RTH).
Mehrere Einsatzmittel können bei einem Notfallereignis zusammenwirken,
z. B. patient*innentransportierende RTW sowie NEF, die
Notärzt*innen zum Einsatzort bringen. (vgl. [3 ]
[4 ])
Verpflichtender Bestandteil von Rettungsdiensteinsätzen ist ihre
adäquate Dokumentation. In Protokollform werden dabei wichtige Sachverhalte
in Hinblick auf die Einsatzdurchführung, Bedarfe zur Weiterbehandlung,
Abrechnung und Qualitätssicherung festgehalten. Ein für ganz
Deutschland rechtlich bindender Standard in Hinblick auf Inhalte oder Form der
Einsatzdokumentation existiert gegenwärtig nicht. Die Fachgesellschaft
„Deutsche Interdisziplinäre Vereinigung für Intensiv- und
Notfallmedizin“ (DIVI) veröffentlichte allerdings den
„Minimalen Notfalldatensatz“ (MIND) [5 ]
[6 ], der Mindestanforderungen an
eine präklinische Notfall-Dokumentation beschreibt. Dabei wurden inhaltlich
relevante Merkmale und Merkmalsbeschreibungen sowie Art und Eigenschaften der zu
ihrer Erfassung erforderlichen Datenfelder definiert. Vielerorts werden auf dem MIND
basierende Einsatzdokumentationen mit starken Modifikationen genutzt.
Charakteristische Inhalte umfassen dabei neben personenidentifizierenden
Patient*innendaten (wie Name, Anschrift, Krankenversichertennummer) bspw.
Befunde, durchgeführte Assessments und Maßnahmen (inklusive
verabreichter Medikamente) sowie Rahmeninformationen zum Einsatz selbst
(z. B. Zeitpunkte, genauer Einsatztyp).
In [Abb. 1 ] sind Einsatzprotokolle aus
struktureller Sicht vereinfacht dargestellt. Im Regelfall spiegelt sich in einem
Einsatzprotokoll die medizinische Versorgung und/oder der Transport einer
Person wider, siehe dazu „Einsatz 1“ mit der Person p1 .
Im Folgenden werden entsprechende Einsatzprotokolle als
„NF-Protokolle“ bezeichnet (Notation: e). Für identische
Patient*innen p können dabei mehrere NF-Protokolle vorliegen,
z. B. wenn im Rahmen von voneinander unabhängigen
Notfallanlässen an unterschiedlichen Tagen ein Kontakt mit dem
Rettungsdienst stattfindet. Mitunter erfordern allerdings
Rettungsdiensteinsätze auch die Versorgung mehrerer Personen (1 Einsatz: n
Patient*innen), was für den Einsatz entsprechend viele NF-Protokolle
impliziert (siehe [Abb. 1 ], „Einsatz
2“ mit Patient*in p2 und p3 ). Im vorliegenden
Paper werden Informationen zu einzelnen Patient*innen auch bei
Mehrpersoneneinsätzen jeweils als unabhängige NF-Protokolle
betrachtet. In den entsprechenden NF-Protokollen können jedoch
Rahmeninformationen zum Einsatz, etwa der Zeitpunkt der Alarmierung oder das
individuelle Einsatzmittel, identisch sein.
Abb. 1 Datenstruktur. Schematisierte Einsatzprotokolle und
Abrechnungsdaten der Krankenkassen (vereinfacht). Legende: p1…p3:
Patient*innen bzw. versicherte Personen; e1…e3:
NF-Protokolle für Versorgungsfälle p1…p3;
p1l1…p3l2: Leistungen in den Abrechnungsdaten.
Auf Grundlage des § 60 SGB V müssen versorgte und/oder transportierte
Patient*innen für ihren Rettungsdiensteinsatz in den meisten
Fällen nur einen kleinen Eigenbeitrag in der Höhe von 10 Euro
leisten. Die Rettungsdienste rechnen den Großteil der Einsatzkosten direkt
mit den Krankenkassen der Patient*innen ab. Die Krankenkassen erhalten dazu
von den Rettungsdienstorganisationen, gegebenenfalls vermittelt über
intermediäre Stellen wie die „Zentrale Abrechnungsstelle für
den Rettungsdienst in Bayern“ (ZAST), grobe Informationen zu
Einsätzen sowie versorgten Patient*innen. Innerhalb dieser
Abrechnungsdaten werden allerdings keine medizinischen Daten übermittelt
(d. h. bspw. keine Angaben zu Maßnahmen oder Verdachtsdiagnosen).
Die Kassen erfahren neben personenidentifizieren Informationen zu den
Patient*innen lediglich einsatztechnische Merkmale wie Einsatztag,
Einsatzzeiten, Rettungsmitteltyp, Einsatz- und Zielort. Die entsprechenden
Informationen können direkt den Rettungsdienst-Einsatzprotokollen
entstammen.
In den Abrechnungsdaten gesetzlicher Krankenkassen ist die Notfallrettung –
gemeinsam mit Krankentransporten und Krankenfahrten – unter dem Stichwort
„Krankentransportleistungen“ im § 302 SGB V für
„Sonstige Leistungserbringer“ verortet. Strukturell sind die
Abrechnungsdaten durch eine Hierarchie gekennzeichnet, bei der pro versicherter
Person (Notation: p) eine oder mehrere Leistungen (Notation: l) dokumentiert sein
können. Exemplarisch weist dazu in [Abb.
1 ] (rechte Seite) die/der versicherte Person p1 eine
einzige Leistung auf, während für die Personen p2 mit
p2 l1 und p2 l2 sowie p3
mit p3 l1 und p3 l2 jeweils 2 Leistungen
vorliegen. Liegen für identische Personen mehrere Leistungen vor, so kann es
sich dabei bspw. um die Abrechnung voneinander unabhängiger
Rettungsdiensteinsätze handeln, welche zu unterschiedlichen Tagen
stattfanden. Entsprechend sind diese durch ein unterschiedliches Leistungsdatum
gekennzeichnet. Taggleich vorliegende Leistungen werden auf Ebene identischer
Personen hingegen typischerweise durch mehrere, an einem Notfallereignis beteiligte
Einsatzmittel (z. B. Einsatz eines RTW sowie eines NEF) bedingt. Ursache
können jedoch auch hier mehrere, voneinander völlig
unabhängige Versorgungsanlässe am gleichen Tag sein (z. B.
ein Einsatz morgens, ein zweiter Einsatz abends). In den vorliegenden
Abrechnungsdaten geht die Zusammengehörigkeit personenbezogener, taggleicher
Leistungen zu einem Einsatz allerdings nicht immer eindeutig hervor. Der Umgang mit
dieser Datenstruktur wird daher jeweils in den folgenden Abschnitten zur
Datenverknüpfung näher beschrieben.
Selektion und Aufbereitung der Einsatzprotokolle
Selektion und Aufbereitung der Einsatzprotokolle
In Inno_RD liegen aus 5 Rettungsdienstbereichen in Bayern sowie einem
Rettungsdienstbereich in Baden-Württemberg NF-Protokolle von
Notfallsanitäter*innen oder sonstigem nicht-ärztlichem
Rettungsdienstpersonal vor. NF-Protokolle aus Bayern umfassen dabei den
Gesamtjahreszeitraum 2016. Das bayerische Rettungsdienstgesetz sieht in Artikel 46
(3) eine landesweit nach einheitlichen Grundsätzen geartete Dokumentation
explizit vor, sodass alle aus dem Bundesland vorhandenen NF-Protokolle einem
einheitlichen Dokumentationsstandard folgen. Die Protokollführung erfolgte
vollständig mithilfe von mobilen elektronischen Informationssystemen (vgl.
[7 ]). Sofern an der Versorgung von
Patient*innen Notfallsanitäter*innen und
Notärzt*innen gemeinsam beteiligt sind, dokumentieren in Bayern
beide Berufsgruppen in getrennten, eigenständigen Protokollen. Für
nicht-ärztliche Einsatzkräfte in Baden-Württemberg befand
sich die elektronische Dokumentationsweise 2016 noch im Aufbau, wodurch die in
Inno_RD vorliegenden Daten auf das letzte Quartal des Jahres beschränkt
sind. Der dabei verwendete Dokumentationsstandard zeigt zudem im Vergleich zu Bayern
große Unterschiede. Um die Komplexität zu reduzieren, wird im
vorliegenden Beitrag ausschließlich die Verknüpfung von
NF-Protokollen aus bayerischen Rettungsdienstbereichen dargestellt.
Das Aufgabengebiet des Rettungsdienstes ist nicht auf die Notfallrettung
beschränkt. Krankentransporte, die einer ärztlichen Verordnung
bedürfen, umfassen die Beförderungen von nicht akut verletzten oder
erkrankten Personen durch qualifiziertes medizinisches Personal (vgl. [4 ]
[8 ]).
Sekundärtransporte zwischen Behandlungseinrichtungen können mit oder
ohne dringende medizinische Indikation erfolgen; eine Erstversorgung von
Patient*innen am Einsatzort findet typischerweise jedoch nicht statt (vgl.
[9 ]). Es existieren in Bayern Vorgaben,
wonach Notfalleinsatzprotokolle nur im Rahmen von Einsätzen der
Notfallrettung ausgefüllt werden sollen. Jedoch kann nicht gänzlich
ausgeschlossen werden, dass sich im Datenbestand NF-Protokolle befinden, welche
Kranken- oder Sekundärtransporte widerspiegeln. Daher erfolgt für
die insgesamt ne =150 048 NF-Protokolle aus Bayern
zunächst anhand der dokumentierten Einsatztypen eine Eingrenzung auf
Einsätze der Notfallrettung (siehe [Abb.
2 ], „NF-Protokolle“). Aus den verbliebenen
ne =142 342 NF-Protokollen werden zudem
Fehleinsätze sowie bei Krankenkassen nicht abrechnungsfähige
Hilfeleistungen ausgeschlossen (insgesamt ne =35 971
NF-Protokolle). Dabei handelt es sich bspw. um Einsätze, bei denen noch im
Rahmen der Anfahrt ein Einsatzabbruch erfolgt oder sich am Einsatzort ein Transport
bzw. eine Behandlung als nicht notwendig, unerwünscht oder unmöglich
herausstellt (vgl. [8 ]
[10 ]). Es verbleiben
ne =106 371 NF-Protokolle von abrechnungsfähigen
Einsätzen der Notfallrettung. Angaben in den NF-Protokollen zum Geschlecht
der Patient*innen umfassen zu 49,9%
(ne =46 073) Männer, das Durchschnittsalter liegt
bei 59,4 Jahren (siehe Tab. 3
im
Anhang ).
Abb. 2 Datenselektion. Selektion NF-Protokolle (linke Seite) sowie
GKV-Abrechnungsdaten (rechte Seite). Legende: ne : Anzahl
NF-Protokolle; np : Anzahl Personen; nl : Anzahl
Leistungen.
Selektion und Aufbereitung der Abrechnungsdaten
Selektion und Aufbereitung der Abrechnungsdaten
Von np =462 475 bei 10 unterschiedlichen
Betriebskrankenkassen (BKK) versicherten Personen liegen insgesamt
nl =7 463 345 abgerechnete Leistungen aus dem Jahr
2016 vor. Leistungen, welche sich speziell auf den Einsatztyp Notfallrettung
beziehen, sind nur anhand der sechsstelligen Abrechnungspositionsnummern für
Krankentransportleistungen (vgl. [11 ])
implizit abschätzbar, welche Angaben zum verwendeten Einsatzmittel
enthalten. Im Sinne der G-BA Richtlinie (vgl. [12 ]) deutet bspw. die Taxi-Nutzung auf eine Krankenfahrt hin, der
alleinige Einsatz eines Krankentransportwagens auf einen Krankentransport und die
Nutzung eines Rettungswagens auf einen Einsatz zur Notfallrettung (bzw.
Rettungsfahrt). Anhand der Abrechnungspositionsnummer werden daher Leistungen
selektiert, welche von den für die Notfallrettung charakteristischen
Einsatzmitteln RTW, NAW/NEF oder RTH erbracht wurden (Ausschluss:
nl =7 021 059). Weiter erfolgt ein Ausschluss
reiner Sekundärtransportleistungen anhand der Abrechnungspositionsnummer
(Ausschluss: nl =9593). Eine räumliche Eingrenzung auf
Leistungen oder Versicherte aus den Modellregionen erfolgt hingegen nicht. Im
Ergebnis liegen Informationen zu np =173 580 Versicherten
vor, für die im Jahr 2016 nl =432 693 Leistungen
abgerechnet wurden (siehe [Abb. 2 ],
„GKV-Abrechnungsdaten”). Im Schnitt sind die Versicherten 55,4 Jahre
alt; 52,3% (np =90 697) sind Männer (siehe
Tab. 3 im Anhang).
Verknüpfung von Einsatzprotokollen und Abrechnungsdaten
Verknüpfung von Einsatzprotokollen und Abrechnungsdaten
In den NF-Protokollen- und den Krankenkassendaten ist das gleiche
personenidentifizierende Kriterium in Form der Krankenversichertennummer (KVNR)
vorgesehen (siehe dazu auch [Abb. 1 ]): Die
KVNR ist auf Personenebene eineindeutig, im Regelfall lebenslang gültig und
in nur sehr seltenen Ausnahmefällen gesetzlich geregelten Änderungen
unterworfen (vgl.[ 13 ]). Aufgrund ihrer
datenschutzrechtlichen Stellung und den Vorschriften der Sozialgesetzgebung (SGB X
§ 67ff.) ist ihre Verarbeitung für Forschungszwecke im Klartext
allerdings erschwert. In Inno_RD werden daher mithilfe einer von der
Projekt-Treuhandstelle entwickelten Software die in den Rettungsdienst- und
Kassendaten vorliegenden realen KVNR durch numerische Pseudonyme ersetzt (vgl. [14 ]). Aufgrund softwareinterner
Plausibilitätsprüfungen erfolgt der Pseudonymisierungsprozess nur,
wenn eine formal gültige KVNR vorliegt. Die entsprechend erzeugten
Pseudonyme werden daher im Folgenden (vereinfachend) als „vorliegende
KVNR“ (o. Ä.) bezeichnet. Wird hingegen durch die Software in den
Originaldaten keine KVNR festgestellt, so wird keine Pseudonymisierung
durchgeführt. In diesen Fällen wird von einer „nicht
vorliegenden KVNR“ (o. Ä.) gesprochen. Andere im Einzelnen oder in
ihrer Kombination personenidentifizierende Merkmale wie Name, vollständige
Anschrift oder vollständiges Geburtsdatum werden unter Einhaltung des
Datenschutzes nicht verarbeitet bzw. nicht von den Dateneignern
übermittelt.
Abrechnungsinformationen lassen sich nur mit denjenigen NF-Protokollen sinnvoll
zusammenführen, in denen eine Patient*innen-Zugehörigkeit zu
einer der 10 an Inno_RD datenliefernden Krankenkassen vermerkt ist. Die Anzahl an
NF-Protokollen, in denen eine entsprechende Projekt-Kasse dokumentiert ist, kann als
Richtwert für die maximale Anzahl verknüpfbarer NF-Protokolle
interpretiert werden. Daher erfolgt eine Abschätzung anhand der durch die
Einsatzkräfte notierten Kassennamen bzw. Institutionskennzeichen. Erfasste
Kassen, für welche bis zum Jahr 2016 eine Fusionierung mit einer an Inno_RD
beteiligten Kasse erfolgte, wurden letzteren jeweils zugeordnet. Laut Eintragungen
des Rettungsdienstes deuten ne =5921 NF-Protokolle darauf hin,
dass es einen entsprechenden Abrechnungsfall bei den an Inno_RD datenliefernden
Krankenkassen geben sollte. Eine Selektion dieser Fälle erfolgt im Vorfeld
der Datenverknüpfung allerdings bewusst nicht, da von den
Einsatzkräften manuell erfasste Kassenzugehörigkeiten Fehler
aufweisen könnten, z. B. durch falsche Selbstangaben der
Patient*innen. Stattdessen werden alle NF-Protokolle, unabhängig von
dem notierten Kassennamen, fortbetrachtet.
Deterministische Verknüpfung – Methode
Deterministische Verknüpfung – Methode
Auf Grundlage der pseudonymisierten KVNR werden im Folgenden Kassendaten und
NF-Protokolle deterministisch verknüpft. Um dabei an unterschiedlichen Tagen
erfolgte Rettungsdienstkontakte identischer Patient*innen unterscheiden zu
können, wird zudem das Datum der Rettungsdienstleistung als
Schlüsselvariable einbezogen. Ausgangslage bilden die insgesamt
ne =106 371 auf Einsätze der Notfallrettung
eingeschränkten NF-Protokolle. Von diesen liegt in 71,2%
(ne =75 743) der Fälle eine KVNR vor (siehe
[Abb. 2 ]; Informationen zu Alter
(basierend auf Geburtsjahr) und Geschlecht in Tab.
3 im Anhang). Verschiedene Gründe sind für diese
Füllquote möglicherweise ausschlaggebend, z. B. privat oder
im Ausland versicherte Patient*innen, welche schlichtweg keine KVNR
besitzen. Möglich ist jedoch auch, dass existierende KVNR im Verlauf der
Notfallrettung nicht erfasst werden konnten, bspw. wenn eine Gesundheitskarte am
Notfallort nicht vorlag oder nicht ausgelesen werden konnte. Von den
ne =5921 NF-Protokollen, welche aufgrund des Kassennamens
potenziell verknüpfbar mit den vorhanden Krankenkassendaten scheinen, weisen
nur 79,4% (ne =4701) eine KVNR auf. Die deterministische
Verknüpfung sollte näherungsweise diese Anzahl
zusammenführen.
Da anhand der herangezogenen Schlüsselvariablen eine Unterscheidung von
taggleichen NF-Protokollen/taggleichen Kassendaten-Leistungen identischer
Personen nicht möglich ist, wird jeweils pro Person und Einsatzdatum nur ein
NF-Protokoll/eine Leistung für die Verknüpfung herangezogen
(Linkage 1:1). Eine entsprechende Selektion ist in beiden Datenquellen erforderlich.
In den Kassendaten werden dazu Leistungen priorisiert, welche sich anhand der
Positionsnummer auf RTW oder NAW zurückführen lassen, da
insbesondere bei diesen von der Anlage eines NF-Protokolls auszugehen ist. Liegen
diese nicht vor, erfolgt die Auswahl willkürlich. Es verbleiben im Anschluss
nl =221 436 Leistungen in den Kassendaten.
75 563 NF-Protokolle liegen nach der Reduktion auf ein Protokoll pro
Einsatzdatum und Patient*in vor, wobei als Kriterium jeweils der
früheste Alarmierungszeitpunkt fungiert.
Deterministische Verknüpfung – Ergebnisse
Deterministische Verknüpfung – Ergebnisse
In [Tab. 1 ] sind die Ergebnisse des
deterministischen Linkages dargestellt. Insgesamt ne =4327
NF-Protokolle werden mit Abrechnungsfällen der Krankenkassendaten
zusammengeführt. Anteilig an den NF-Protokollen mit abgeschätzter
Zugehörigkeit zu einer der 10 Projekt-Krankenkassen sowie gültig
vorliegendem KVNR-Pseudonym können damit 92,0% der Datenmenge
verknüpft werden; bezogen auf alle NF-Protokolle mit entsprechend
dokumentierten Krankenkassen (d. h. jene NF-Protokolle mit und ohne KVNR)
können 73,0% verknüpft werden. Im verknüpften
Datensatz sind durch Auszählen des Personenidentifikators KVNR
np =3810 zugrundeliegende Personen mit einem Durchschnittsalter
von 54,7 Jahren und einem Männeranteil von 53,6% feststellbar (Tab. 3 im Anhang). 90,2% dieser
Personen (np =3435) wurde genau ein NF-Protokoll aus 2016
zugespielt, das Maximum pro Person hingegen liegt bei 9 NF-Protokollen (bzw.
Einsatztagen) pro Jahr.
Tab. 1 Ergebnisse der Verknüpfung von NF-Protokollen und
GKV-Abrechnungsdaten: Abgleich der Übereinstimmung von
Schlüsselvariablen (auf Grund von Missing-Values sind
gegenüber der Gesamtzahl der Verknüpfungen Abweichungen
möglich).
Indikatoren
Deterministisch
Probabilistisch (sofern vorhanden inklusive KVNR)
gelinkt ne =4327
gelinkt und akzeptiert ne =5379
Schlüsselvariablen
Abgleich
ne
Spaltenprozent
ne
Spaltenprozent
Einsatzdatum
stimmt überein
Schlüssel
geblockt
[100,0%]
stimmt nicht überein
[0,0%]
KVNR
stimmt überein
Schlüssel
4337
[80,6%]
stimmt nicht überein
20
[0,4%]
nicht vorliegend in NF-Daten
1022
[19,0%]
Kassenname
stimmt überein
4311
[99,6%]
5361
[99,7%]
stimmt nicht überein
16
[0,4%]
15
[0,3%]
Geschlecht
stimmt überein
4319
[100,0%]
4968
[99,4%]
stimmt nicht überein
2
[0,0%]
30
[0,6%]
Geburtsjahr
stimmt überein
4324
[99,9%]
5376
[99,9%]
stimmt nicht überein
3
[0,1%]
3
[0,1%]
Fahrstrecke [km]
stimmt überein
4230
[97,8%]
5270
[98,0%]
stimmt nicht überein
96
[2,2%]
109
[2,0%]
Leistungserbringer
stimmt überein
4321
[99,9%]
geblockt
[100,0%]
stimmt nicht überein
6
[0,1%]
[0,0%]
Personen np
3810
4680
Eine Plausibilisierung der deterministischen Verknüpfung erfolgt durch einen
genaueren Blick auf [Tab. 1 ] (Spalte
„Deterministisch“). Verschiedene, jeweils in beiden Datenquellen
vorhandene Variablen werden dabei in Hinblick auf (Nicht-)Übereinstimmung
untersucht. Geschlecht, Geburtsjahr sowie die nominale Kassenzugehörigkeit
weisen eine hohe Übereinstimmung auf, was auf eine hohe Güte der
Verknüpfung schließen lässt. Die im geringen Umfang
vorhandenen Nicht-Übereinstimmungen können dabei
möglicherweise darauf zurückgeführt werden, dass es sich bei
Alter und Geschlecht um in beiden Sekundärdatenquellen getrennt erhobene
Merkmale handelt. Während die Informationen in den NF-Protokollen von den
Einsatzkräften nach Augenschein, Patientenangabe oder durch Einlesen der
Gesundheitskarte erfasst wurden, handelt es sich in den Abrechnungsdaten um
zugespielte Informationen aus dem Stammdatenbestand der Krankenkassen (siehe Tab. 4 im Anhang). Gut 2%
(ne =96) Nicht-Übereinstimmungen zeigen sich zudem in
Hinblick auf die von den Einsatzkräften notierten Fahrstrecken der
Rettungsmittel. Vor dem Hintergrund, dass anhand der Schlüsselvariablen pro
Patient*in und Einsatztag nur die Verknüpfung eines
NF-Protokolls sowie einer Leistung erfolgt, tatsächlich allerdings
mehrere NF-Protokolle wie auch abgerechnete Leistungen existieren können,
sind Nicht-Übereinstimmungen hier leicht erklärbar. Insgesamt
gelingt mittels des deterministischen Verfahrens auf Grundlage der
personengebundenen KVNR und des Einsatzdatums offenbar für einen
Großteil der Fälle die Verknüpfung tatsächlich
zusammengehöriger NF-Protokolle und abgerechneter Leistungen.
Probabilistische Verknüpfung – Methode
Probabilistische Verknüpfung – Methode
Es liegt nahe, dass Rettungsdienste Informationen über versorgte
Patient*innen an die kostenerstattenden Krankenkassen auch dann weiterleiten
können, wenn KVNR nicht vorliegen, bspw. anhand anderer
personenidentifizierender Informationen wie Vorname, Nachname oder
vollständiges Geburtsdatum. Im Inno_RD-Datenbestand dürften sich
damit auch NF-Protokolle befinden, welche im deterministischen Linkage allein
aufgrund des Fehlens des entsprechenden Pseudonyms keinem Abrechnungsvorgang
zugeordnet werden können. Neben einem nicht ausgeschöpften
Fallzahlpotenzial sind damit Selektionseffekte denkbar, wenn bspw. durch das
deterministische Verfahren vermehrt Einsätze mit spezifischer
Soziodemografie, Notfallanlässen oder Outcomes unverknüpft bleiben.
Verwiesen sei dazu auf den Umstand, dass sich in NF-Protokollen ohne
gültigen Personenidentifikator KVNR ein um knapp 10 Jahre niedrigeres
mittleres Lebensalter sowie ein um nahezu 10 Prozentpunkte höherer Anteil
von Männern zeigt (siehe Tab. 3
im Anhang ).
NF-Protokolle ohne vorliegende KVNR sollen daher in den Algorithmus integriert und
simultan mit NF-Protokollen, welche den Personenidentifikator aufweisen,
verknüpft werden. Die KVNR soll dabei als direkte Schlüsselvariable
erhalten bleiben und durch indirekte Schlüsselvariablen ergänzt
werden. Letztere verweisen zwar nicht auf explizite Personen, es lässt sich
aber insbesondere durch Merkmalskombinationen von einer Verknüpfung
zusammengehöriger Einheiten ausgehen (vgl. [15 ]
[16 ]). Vor dem Hintergrund der
hohen Übereinstimmungen im Rahmen der deterministischen Verknüpfung
([Tab. 1 ]) eignen sich als
Schlüsselvariablen Geschlecht, Geburtsjahr, nominelle
Kassenzugehörigkeit sowie die Fahrstrecke des Rettungsmittels. Speziell die
Variablen Geschlecht und Geburtsjahr (respektive Alter) finden sich als
Schlüssel in mehreren Studien aus dem englischsprachigen Raum, in denen
Rettungsdienst-Einsatzdokumentation deterministisch oder probabilistisch mit
verschiedenartigen klinischen Daten verknüpft werden (vgl. [17 ]
[18 ]
[19 ]
[20 ]
[21 ]
[22 ]). Zudem erfolgt die Wahl
der indirekten Schlüsselvariablen unter Berücksichtigung ihrer
jeweiligen Füllquoten (siehe Tab. 4
im Anhang): Für die nominelle Kassenzugehörigkeit sowie das
Geburtsjahr ergibt sich in den NF-Protokollen eine Füllquote von
99,9%, für das Geschlecht 86,8%. Angaben zur
Kilometerleistung des Einsatzmittels liegen in 100,0% der NF-Protokolle
vor.
Für eine simultane Verknüpfung von NF-Protokollen mit vorliegender
bzw. nicht vorliegender KVNR ist ein fehlertolerantes Verfahren erforderlich (vgl.
[15 ]
[16 ]): Ist die KVNR in NF-Protokollen und Kassendaten identisch, so muss
die Übereinstimmung dieser Schlüsselvariable durch den Algorithmus
erkannt werden. Ist allerdings in NF-Protokollen keine KVNR vorhanden, darf dies
nicht automatisch die Nicht-Verknüpfung mit den Kassendaten nach sich
ziehen. Für die Wahl eines fehlertoleranten Linkageverfahrens spricht
außerdem, dass eine Verknüpfung auch dann erfolgen kann, wenn
– wie im deterministischen Linkage festgestellt – die indirekten
Schlüsselvariablen im gewissen Umfang widersprüchliche Inhalte oder
Missing-Values aufweisen.
Die Umsetzung der Datenverknüpfung erfolgt mithilfe des Paketes
„reclin“ [23 ] für die
Software RStudio, welches auf die Ende der 1960er Jahre von Fellegi und Sunter
entwickelte Idee des probabilistischen Linkages (vgl. [24 ]) zurückgreift. Im verwendeten Paket
werden anhand von Vergleichsfunktionen Wahrscheinlichkeiten für die
Übereinstimmung der Schlüsselvariablen unter der Annahme
geschätzt, dass diesen identische oder nicht-identische Einheiten zugrunde
liegen. Auf Grundlage eines für jede mögliche Verknüpfung
abgeleiteten Gewichtes können dann hinreichend schlüssige Linkages
identifiziert werden. Dabei erhöht sich mit ansteigendem Gewicht die
Wahrscheinlichkeit für die tatsächliche Zusammengehörigkeit.
Der Ansatz der Gewichtung beruht auf dem Umstand, dass für
Schlüsselvariablen mit nur wenigen Ausprägungen (z. B.
Geschlecht) die Wahrscheinlichkeit einer rein zufälligen
Übereinstimmung höher ist als im Fall einer
Schlüsselvariable, die vielfältige Ausprägungen aufweist
(wie die KVNR oder die Fahrtstrecke in km). Stimmen pseudonymisierte KVNR und
Fahrtstrecke überein, so ist als Konsequenz mit einem höheren
Gewicht zu rechnen als bei Fällen, bei denen nur Geschlecht und Kassenname
übereinstimmen.
Ausgangspunkt für das probabilistische Linkage bilden die insgesamt
nl =432 693 Leistungen (GKV-Daten) sowie
ne =106 371 NF-Protokolle ([Abb. 2 ]). Für dieses Verfahren ist
eine Reduktion auf nur ein NF-Protokoll oder eine abgerechnete
Leistung pro Einsatzdatum im Vorfeld der Verknüpfung nicht erforderlich. In
Hinblick auf das Einsatzdatum und die ausführende Rettungsdienstorganisation
erfolgt ein klassisches Blocking: (vgl. [15 ]
[16 ]). Die
Übereinstimmung von Einsatzdatum und Rettungsdienstorganisation ist damit
Voraussetzung für den paarweisen Abgleich der Schlüsselvariablen;
eine Nicht-Übereinstimmung schließt eine Verknüpfung aus. Da
es sich bei Einsatzdatum sowie ausführender Rettungsdienstorganisation um
Informationen handelt, die an die Krankenkassen übermittelt werden und die
keine Änderung im Rahmen des Abrechnungsprozesses der Krankenkassen erfahren
dürften, wird von einer exakten Entsprechung ausgegangen. Praktisch wird
durch das Blocking sichergestellt, dass NF-Protokolle ausschließlich mit
Leistungen aus dem Pool der Abrechnungsdaten verknüpft werden
können, welche taggleich und vom identischen Leistungserbringer
durchgeführt wurden. Eine Verringerung des Risikos falsch-positiver
Verknüpfungen ist als Konsequenz zu erwarten. Die für das Blocking
erforderlichen Informationen zu Einsatzdatum und ausführender
Rettungsdienstorganisation liegen sowohl in NF-Protokollen als auch Abrechnungsdaten
zu 100,0% vor (siehe Tab. 4 im
Anhang).
Für die indirekten Schlüsselvariablen erfolgt der Vergleich der
Wertepaare aus beiden Datenquellen mithilfe eines Abgleichs auf exakte
Übereinstimmung. Da speziell die Kilometerleistung des Einsatzmittels die
Höhe der durch die Kassen erstatteten Kosten beeinflussen kann, sind im Zuge
des Abrechnungsvorgangs bei den Krankenkassen Bearbeitungen des Merkmals denkbar. Um
diese bei der Datenverknüpfung zu berücksichtigen, scheint die
Verwendung komplexer Funktionen für den Vergleich der
Schlüsselvariablen (z. B. Fahrtstrecke ± Toleranzbereich
Kilometeranzahl) denkbar. Da allerdings exakte Informationen zu Bearbeitungen in den
vorliegenden Anrechnungsdaten nicht enthalten sind, findet auch für die
Kilometerleistung ein einfacher Abgleich statt.
Fehlende Angaben bei den Schlüsselvariablen werden als Missing-Values
deklariert und gehen als Folge in die Berechnung des Gewichtes nicht ein. Sofern
durch das Linkageverfahren identische NF-Protokolle mit mehreren verschiedenen
Leistungen aus den Kassendaten gleichzeitig verknüpft werden (und vice
versa), wird jeweils nur derjenige Fall mit dem größten errechneten
Gewicht fortbetrachtet. Im Anschluss liegen ausschließlich eineindeutige
Verknüpfungen vor (insgesamt ne =5660). Da allerdings noch
unplausible Fälle mit einem typischerweise niedrigen Gewicht verbleiben,
wird ein Schwellenwert für plausibel akzeptierte Verknüpfungen
angesetzt. Bei dessen Wahl ist zu berücksichtigen, dass
Verknüpfungen von NF-Protokollen ohne vorliegende KVNR – unter sonst
gleichen Umständen – ein per se niedrigeres Gewicht aufweisen als
Verknüpfungen, bei denen dieser Personenidentifikator übereinstimmt.
Entsprechende Visualisierungen beider Gruppen zeigen die Gewichte unterschiedlich
verteilt (siehe Abb. 3 im Anhang). Der
Schwellenwert wird so gesetzt, dass sich seine Anhebung nicht (mehr) in der
verbesserten Übereinstimmung der in beiden Datenquellen vorhandenen
indirekten Schlüsselvariablen niederschlägt. Für die
Akzeptanz einer Verknüpfung ist ein minimales Gewicht von 4,5 erforderlich.
Insgesamt ne =281 der eineindeutig verknüpften
Fälle erreichen dieses Gewicht nicht.
Probabilistische Verknüpfung – Ergebnisse
Probabilistische Verknüpfung – Ergebnisse
In [Tab. 1 ] (Spalte
„Probabilistisch“) sind die Ergebnisse der probabilistischen
Verknüpfung zusammengefasst. Mit ne =5379 akzeptierten
NF-Protokollen ergibt sich im Vergleich zur deterministischen Variante eine
Fallzahlerhöhung um 24,3%. Dieser Anstieg ist in kleinem Umfang auch
darauf zurückzuführen, dass zusätzliche Fälle mit
vorliegender KVNR gelinkt werden können: Da im Vorfeld der probabilistischen
Verknüpfung keine Reduktion auf ein NF-Protokoll/eine
Leistung pro Tag erforderlich ist, steigt die Anzahl der mit (gültig)
übereinstimmender KVNR zusammengeführten NF-Protokolle
gegenüber der deterministischen Verknüpfung um
ne =10. Insgesamt 90,8% der auf Projekt-Kassen
zurückgeführten 5921 NF-Protokolle können somit
verknüpft werden. Die anhand der KVNR in den Kassendaten ausgemachte Anzahl
an zugrundeliegenden Personen beträgt np =4680 (Anstieg um
22,8%). Stratifiziert nach Vorliegen oder Nicht-Vorliegen der KVNR in den
NF-Protokollen zeigt sich für letztere Fälle, wie bereits vor der
Verknüpfung, ein niedrigeres Durchschnittsalter (siehe Tab. 3 im Anhang).
Im Folgenden ist das Ziel zu überprüfen, ob das probabilistische
Linkage auch für Fälle geeignet ist, in denen die KVNR nicht
vorliegt. Vertiefend erfolgt daher eine Prüfung der dargestellten
probabilistischen Verknüpfung für die Subgruppe derjenigen
NF-Protokolle, für welche in beiden Datensätzen KVNR gültig
vorliegen (ne =75 743;
nl =432 693). Für diese Subgruppe werden getrennt
2 probabilistische Verknüpfungen durchgeführt: 1.) anhand der KVNR
sowie den indirekten Schlüsselvariablen sowie 2.) ausschließlich
anhand der indirekten Schlüsselvariablen, d. h. die eigentlich
vorhandenen KVNR bleiben für das Linkage unberücksichtigt. Alle
weiteren Aspekte der Datenaufbereitung bleiben unverändert. Die jeweils
verknüpften Fälle werden allerdings nicht anhand des im
vorausgegangenen probabilistischen Linkage genutzten Schwellenwertes für das
Gewicht (konkret 4,5) beschnitten, sondern auf dessen Über- bzw.
Unterschreitung hin klassifiziert und gemeinsam mit der Information zur
(Nicht-)Übereinstimmung des KVNR-Pseudonyms in einer Vier-Felder-Tabelle
abgebildet. Die Interpretation erfolgt im Sinne eines binären
Klassifikators.
Unter Einbezug der KVNR (siehe [Tab. 2 ],
Spalte „Linkage inklusive KVNR“) fallen insgesamt
ne =4357 verknüpfte Fälle über den
für das Gewicht angesetzten Schwellenwert, was exakt der Fallzahl der
probabilistischen Verknüpfung in [Tab.
1 ] entspricht. Davon weisen ne =4337 eine
übereinstimmende KVNR auf; sie werden als richtig-positiv interpretiert. Der
positive prädiktive Wert (PPV) [24 ]
liegt damit oberhalb von 0,99. Es verbleiben allerdings ne =20
akzeptierte Verknüpfungen mit widersprüchlicher KVNR.
Vordergründig handelt es sich dabei um falsch-positive Fälle, bei
denen unterschiedliche Personen zusammengeführt wurden. Jedoch besteht auch
die Möglichkeit, dass – bspw. durch den Rettungsdienst in der
Einsatzpraxis – inkorrekt dokumentierte KVNR hier die
Nicht-Übereinstimmung der Pseudonyme hervorrufen, tatsächlich
allerdings identische Personen zugrunde liegen. Weitere abgeglichene
Personenmerkmale, welche für die Verknüpfung nicht
berücksichtigt wurden (z. B. Postleitzahl des Wohnorts), deuten
darauf hin.
Tab. 2 Qualitätsprüfung. Linkage der
Abrechnungsfälle (GKV-Daten) und Einsatzprotokolle für
die Subgruppe der Fälle, die im Original in beiden
Datensätzen eine Krankenversichertennummer (KVNR) aufweisen.
Probabilistische Verknüpfung für Subgruppe, die
im Original eine KVNR enthalten
Klassifikation
Verknüpfung inklusive KVNR
Verknüpfung exklusive KVNR
ne KVNRNF =KVNRGKV
ne KVNRNF ≠KVNRGKV
ne Gesamt
ne KVNRNF =KVNRGKV
ne KVNRNF ≠KVNRGKV
ne Gesamt
ne akzeptierte Verknüpfungen
(Gewicht≥Schwellenwert)
4337 RP (99,5%)
20 FP (0,5%)
4357 (100,0%)
4319 RP (99,5%)
22 FP (0,5%)
4341 (100,0%)
ne nicht akzeptierte Verknüpfungen
(Gewicht<Schwellenwert)
0 FN (0,0%)
1091 RN (100,0%)
1091 (100,0%)
17 FN (1,5%)
1091 RN (98,5%)
1108 (100,0%)
ne Gesamt
4337 (79,6%)
1111 (20,4%)
5448 (100,0%)
4336 (79,6%)
1113 (20,4%)
5449 (100,0%)
Die Verknüpfung der gleichen Subgruppe anhand der ausschließlich
indirekten Schlüsselvariablen, d. h. ohne KVNR, zeigt eine etwas
geringere, jedoch nach wie vor hohe Zahl richtig-positiver Verknüpfungen
(siehe [Tab. 2 ], Spalte „Linkage
exklusive KVNR“). Es wird daher davon ausgegangen, dass die indirekten
Schlüsselvariablen den Informationsgehalt fehlender KVNR gut ersetzen.
Bemerkt sei darüber hinaus die erhöhte Zahl falsch-negativer
Verknüpfungen, wenn die KVNR nicht als Schlüssel fungiert
(ne =17): Nach manueller Prüfung handelt es sich
hierbei um Fälle, bei denen die im Rahmen des fehlertoleranten Linkages im
gewissen Umfang zulässigen Nicht-Übereinstimmungen der indirekten
Schlüsselvariablen ein Gewicht unterhalb des Schwellenwertes hervorrufen.
Der Einbezug der KVNR als Schlüsselvariable, sofern diese gültig
vorliegt, scheint vor diesem Hintergrund auch für das probabilistische
Linkage berechtigt.
Schlussfolgerungen und Diskussion
Schlussfolgerungen und Diskussion
Mit dem in der vorliegenden Arbeit geschilderten Vorgehen wird auf
Patient*innen- bzw. Versicherten-Ebene eine belastbare Verknüpfung
von Rettungsdienst-Einsatzprotokollen und Abrechnungsdaten der gesetzlichen
Krankenversicherung umgesetzt. Durch die kombinierte Betrachtung von Informationen
aus beiden Sekundärdatenquellen können sowohl die
präklinische Versorgung von Rettungsdienstpatient*innen als auch
deren längerfristige Outcomes im Längsschnitt erforscht werden. Eine
systematische prozess- und ergebnisbezogene Evaluation von
Rettungsdiensteinsätzen ist damit möglich (siehe exemplarische
Umsetzung in Inno_RD [25 ]).
Auch wenn sich im deutschen Rettungswesen erhebliche Unterschiede, gerade in Hinblick
auf die Dokumentation durchgeführter Einsätze zeigen, lässt
sich u. a. aufgrund der bundesweit geltenden Abrechnungsvorgaben der GKV von
einer grundsätzlichen Übertragbarkeit auf andere Gebiete
Deutschlands ausgehen. Zu verweisen ist an dieser Stelle zudem auf den Umstand, dass
die in Inno_RD zur Pseudonymisierung der KVNR genutzte Software [26 ] Open Source verfügbar ist.
Die dargestellte deterministische Verknüpfung von Kassendaten und
Rettungsdienst-Einsatzprotokollen auf Grundlage der KVNR führt zu einem
hohen Anteil verlinkter Datensätze (73,0% aller NF-Protokolle, die
gemäß der von den Einsatzkräften erfassten Kassennamen zu
einer für Inno_RD datenliefernden Krankenkasse gehören). Auch wenn
in dieser Veröffentlichung Einsatzprotokolle nicht-ärztlichen
Rettungspersonals verknüpft wurden, ist davon auszugehen, dass sich die
Einschränkungen und Möglichkeiten auch auf Einsatzprotokolle von
Notärzt*innen übertragen lassen (z. B.
mittelmäßige Füllquote der KVNR; gute
Linkage-Qualität der KVNR und des Einsatzdatums). Es bleibt abzuwarten, ob
die zunehmende Verbreitung von mobilen elektronischen Informationssystemen oder
Möglichkeiten zum elektronischen Einlesen von Gesundheitskarten zu einer
Verbesserung der Datenqualität beitragen. Aus Sicht der Forschung sind alle
Maßnahmen begrüßenswert, welche die möglichst
häufige Dokumentation der KVNR zum Ziel haben, da somit sowohl die
Verknüpfungsquote des vorgestellten deterministischen als auch
probabilistischen Verfahrens erhöht werden kann.
Mit hoher Sicherheit konnten auf Grundlage der probabilistischen Verknüpfung
90,8% aller NF-Protokolle, welche Kassennamen einer datenliefernden
Krankenkasse aufweisen, mit Abrechnungsdaten verknüpft werden. Aufgrund
methodischer Unterschiede sind Referenzwerte probabilistischer Verknüpfungen
aus der Literatur nur bedingt sinnvoll. Die Untersuchungen von Newgard [21 ] sowie Downing et al. [22 ] kommen mit 96,1%
(Verknüpfung mit Traumaregisterdaten) bzw. 84,2%
(Verknüpfung mit Notaufnahmedaten) zu vergleichbaren Ergebnissen, wobei
allerdings keine expliziten Personenidentifikatoren genutzt wurden.
Die probabilistische Verknüpfung erfolgte zugleich für alle
NF-Protokolle, d. h. unter Einschluss von NF-Protokollen mit als auch ohne
vorhandener KVNR. Als methodische Alternative dazu besteht die Möglichkeit,
für alle NF-Protokolle mit vorliegender KVNR ein deterministisches Linkage
anhand dieses Personenidentifikators durchzuführen und den probabilistischen
Ansatz ausschließlich auf NF-Protokolle ohne diesen zu beschränken.
Erforderlich wäre dabei im Vorfeld der deterministischen Verknüpfung
für den entsprechenden Teil der Daten allerdings (wie im Paper beschrieben)
wieder die Einschränkung auf ein NF-Protokoll sowie eine
abgerechnete Leistung pro Tag und Person. Im Rahmen der probabilistischen
Verknüpfung ist diese Beschränkung hingegen nicht notwendig, was die
tatsächlichen Datenstrukturen – Patient*innen können
zum selben Einsatztag mehrere Rettungsdiensteinsätze aufweisen –
besser widerspiegelt. Da zudem alle mit einer übereinstimmenden KVNR
probabilistisch zusammengeführten Fälle ohnehin ein Gewicht deutlich
über dem für die Akzeptanz erforderlichen Schwellenwert nach sich
ziehen (siehe Abb. 3 im Anhang), scheint
die simultane Verknüpfung von NF-Protokollen mit und ohne vorliegender KVNR
zumindest im vorliegenden Fall als praktikablere Lösung.
Durch die probabilistische Verknüpfung wurde zudem eine Kompensation von im
gewissen Umfang vorhandenen Nicht-Übereinstimmungen der indirekten
Schlüsselvariablen (z. B. widersprüchlichen Geburtsjahren)
oder Missing-Values ermöglicht. Grundsätzlich haben sich als
indirekte Schlüsselvariablen Geburtsjahr, Geschlecht sowie nominelle
Kassenzugehörigkeit bewährt. Speziell letztere erforderte allerdings
durch uneinheitliche Benennungen identischer Krankenkassen in den NF-Protokollen
einen hohen Aufwand bei der Datenaufbereitung. Mumma et al. [19 ] berichten von ähnlichen Problemen
mit Schlüsselvariablen aus Einsatzdokumentationen des Rettungsdienstes.
Voraussetzung für entsprechend geeignete Schlüsselvariablen stellen
sowohl eine hohe Füllquote als auch Datenqualität dar. Gerechnet
werden kann mit diesen in Sekundärdaten allerdings nicht per se (vgl. [27 ]).
Bei der manuellen Prüfung wurde eine Reihe von verknüpften
Fällen gerade unterhalb des für die Akzeptanz erforderlichen
Schwellenwertes identifiziert, welche in den NF-Protokollen durch fehlende Angaben
zum Geschlecht gekennzeichnet sind. Höhere Füllquoten der
Schlüsselvariable würden mutmaßlich ein höheres,
akzeptables Gewicht nach sich ziehen. Der angesetzte Schwellenwert ist demnach eher
konservativ gewählt mit der Priorität, jene Verknüpfungen zu
akzeptieren, bei denen die Fälle mit hoher Wahrscheinlichkeit in der
Realität übereinstimmen – anstatt möglichst viele
Fälle, darunter auch falsch-positive, zu akzeptieren (Qualität vor
Quantität).
In dieser Untersuchung wurden die Krankenkassendaten danach vorselektiert, ob ein
Rettungsmittel abgerechnet wurde, das einer „Rettungsfahrt“ nach
G-BA-Richtlinie [12 ] entspricht. Aus
Gesprächen mit Rettungsdienstmitarbeiter*innen und hier nicht
dargestellten Analysen geht hervor, dass es in seltenen Fällen zu unklaren
Abgrenzungen zwischen Krankentransporten und Rettungsfahrten kommen kann,
d. h. bspw. Einsatzprotokolle aus der Notfallrettung vorliegen, aber
ausschließlich KTW abgerechnet wurden. Für die Kassendaten ist daher
zukünftig ein Identifikator wünschenswert, der Rettungsfahrten
explizit kennzeichnet.
Zu guter Letzt sei auf den Umstand verwiesen, dass zur besseren Nachvollziehbarkeit
die Darstellung des Verknüpfungsprozesses ausschließlich für
Einsatzprotokolle aus Bayern erfolgte, wenngleich in Inno_RD auch ärztliche
und nicht-ärztliche Daten aus Baden-Württemberg verarbeitetet
werden. Hintergrund ist hier, dass unterschiedliche räumliche
Entitäten oder Rettungsdienstorganisationen sowie uneinheitliche
Dokumentationsstandards teils erhebliche Unterschiede in Hinblick auf geeigneten
Schlüsselvariablen mit sich bringen. Eine Adaption aller geschilderten
Verfahren auf die aus Baden-Württemberg vorliegenden Daten ist jedoch
ausdrücklich möglich. Dabei zeigt sich bspw. in den
baden-württembergischen NF-Protokollen eine vergleichbare Füllquote
der KVNR, sodass der Ansatz der probabilistischen Verknüpfung auch
für dieses Bundesland von Bedeutung ist. Die flächendeckendere
Etablierung von Standards bei der Rettungsdienst-Einsatzdokumentation, wie bspw. dem
Minimalen Notfalldatensatz [5 ]
[6 ], könnte zukünftig die
Verknüpfung von Sekundärdaten aus der Notfallversorgung erleichtern.
Entsprechende Forderungen zur bundesweit – oder mindestens landesweit
– standardisierten Einsatzdokumentation im Rettungsdienst werden,
insbesondere vor dem Hintergrund der Qualitätssicherung, bereits seit
einiger Zeit diskutiert und z. T. umgesetzt (vgl. [2 ]
[6 ]
[28 ]
[29 ]
[30 ]).