Zusammenfassung
Einleitung In Deutschland wurde der Rettungsdienst im Jahr
2016/2017 bei insgesamt rund 7,3 Mio. Notfallereignissen aktiv [1 ]. Informationen zu der dabei erfolgenden
prähospitalen Versorgung von Patient*innen finden sich in
unterschiedlichen Sekundärdatenquellen; jedoch ist die kombinierte
Analyse dieser Daten auf Fall-/Einsatz- oder Patient*innen-Ebene
selten der Fall. Um dies zu ändern, ist die Erforschung von Merkmalen
und Methoden erforderlich, anhand derer Sekundärdaten, welche
präklinische Inhalte umfassen, verknüpft werden
können.
Methode Es werden Rettungsdienst-Einsatzprotokolle aus 5 bayerischen
Rettungsdienstbereichen mit Abrechnungsinformationen 10 gesetzlicher
Krankenkassen zusammengeführt (Daten aus 2016). Demonstriert werden 2
Verknüpfungsansätze auf Ebene patient*innenindividueller
Einsätze bzw. abgerechneter Leistungen. Zuerst erfolgt die
Verknüpfung deterministisch anhand des Personenidentifikators
Krankenversichertennummer (KVNR). Der zweite Verknüpfungsansatz beruht
auf einem probabilistischen Verfahren, das neben der nur in einem Teil der
Einsatzprotokolle verfügbaren KVNR indirekte Schlüsselvariablen
berücksichtigt. Dabei handelt es sich um die Kassenzugehörigkeit
der Patient*innen, ihr Geschlecht und Geburtsjahr sowie die
zurückgelegte Wegstrecke des eingesetzten Rettungsmittels. Zur
Prüfung sowohl der deterministischen als auch probabilistischen
Verknüpfung werden Übereinstimmungsquoten verschiedener, in
beiden Datenquellen vorhandener Variablen ermittelt.
Ergebnisse Ausgangspunkt für die Datenverknüpfungen
stellen 106 371 Rettungsdienst-Einsatzprotokolle (unabhängig von
der Krankenkasse) sowie 432 693 bei Krankenkassen abgerechnete
Leistungen (unabhängig vom Rettungsdienstanbieter) aus dem Bereich der
Notfallrettung dar. Von 5921 Einsatzprotokollen, in denen eine an Inno_RD
datenliefernde Krankenkasse dokumentiert ist, können 4327
Einsatzprotolle deterministisch unter Rückgriff auf die KVNR mit den
Abrechnungsdaten zusammengeführt werden. Im Rahmen der probabilistischen
Verknüpfung lässt sich diese Anzahl auf 5379 Einsatzprotolle
steigern. Alle Prüfungen deuten sowohl für den deterministischen
als auch den probabilistischen Ansatz auf eine hohe
Verknüpfungsqualität hin.
Schlussfolgerung Eine personen- und einsatzbezogene Verknüpfung
von Einsatzprotokollen des Rettungsdienstes mit Abrechnungsdaten ist
möglich. Als Alternative zur deterministischen Verknüpfung
anhand der KVNR hat sich in Inno_RD ein probabilistischer Ansatz
bewährt, auf dessen Grundlage Einsatzprotokolle auch dann sinnvoll
verknüpft werden können, wenn KVNR nicht vorliegen sowie
indirekte Schlüsselvariablen im geringen Umfang
Nicht-Übereinstimmungen oder Missing-Values aufweisen.
Abstract
Introduction In Germany, Emergency Medical Services (EMS) were involved in
a total of 7.3 million emergency cases in 2016/2017. Information on
prehospital care is stored in several secondary data sources, yet combined
analysis of these data at the level of individual patients or EMS cases happens
rarely. Research is needed on which methods and variables are suitable for the
linkage of these data sources.
Methods We linked EMS records from five Bavarian emergency service
districts to health claims data belonging to ten statutory health insurers (data
from 2016). Two linkage approaches at the level of individual patient’s
EMS case/reimbursement case were demonstrated. First, a deterministic
linkage was conducted based on the patient‘s unique identifying health
insurance number. The second linkage was probabilistic. As linkage variables, it
comprised the only partially available health insurance number plus several
non-unique key variables, the latter being a patient’s health insurance
provider, sex, year of birth and distance travelled. In order to verify the
deterministic and the probabilistic linkages’ quality, rates of
accordance of several variables present in both data sources were
calculated.
Results The starting point for our data linkage were 106,371 EMS records
(independent of certain health insurance companies) and 432,693 EMS services
reimbursed by health insurers (independent of specific EMS providers). 4,327 EMS
records could be linked to health claims data – out of 5,921 EMS records
that coded a health insurance company contributing claims data to Inno_RD. With
a probabilistic linkage, it was possible to increase this number to a total of
5,379 linked EMS records. All checks carried out indicated a high linkage
quality for both the deterministic and the probabilistic approach.
Conclusion A linkage of EMS records with health claims data is possible.
In Inno_RD, a probabilistic approach has proven a valuable alternative to
deterministic linkage via health insurance number since EMS records can be
linked meaningfully even if the health insurance number is unavailable or where
a minority of non-unique key variables show non-accordance or missing
values.
Schlüsselwörter Notfallrettung - GKV-Daten - Sekundärdaten - Datenlinkage - patientenbezogene Gesundheitsdaten
Key words Emergency Medical Services - Health Insurance - Claims Data - Data Linkage - Data science