Key words Claims Data - Clinical Data - Data Linkage - Stroke - Care Pathway - Health Services
Research
Hintergrund
Nachweis von Nutzen, Kosten und Effizienz innovativer Versorgungsformen
Mit dem Innovationsgeschehen im Gesundheitswesen sind in aller Regel Nutzenerwartungen
der relevanten Player hinsichtlich Sicherheit, Qualität und Wirtschaftlichkeit verbunden.
Im Arzneimittelbereich ist die Verpflichtung, Nutzenbelege beizubringen, in vielen
Ländern bereits etabliert; im Bereich der Medizintechnik und der Medizinprodukte werden
Nutzennachweise zumindest diskutiert. Anders verhält es sich bislang bei Prozessinnovation,
wie bspw. Methoden der medizinischen Leistungserbringung. Hier sind Nutzenbelege bis
dato zumeist nicht verpflichtend, sie können jedoch, z. B. im Zuge von Erstattungsentscheidungen,
unterstützend wirken. Für die solidarisch finanzierte Krankenversicherung ist die
gesundheitsökonomische Evaluation von Innovationen wie Disease-Management-Programmen
oder Modellen der Integrierten Versorgung in vielerlei Hinsicht bedeutsam [1 ]. Sie soll belastbare Aussagen zu medizinischem Nutzen, Kosten und Effizienz (Kosteneffektivität)
der Programme liefern und den Kostenträgern Belege (Evidenz) für informierte Entscheidungen
über die Implementierung liefern [2 ].
Da sich klinische Randomized Controlled Trials (RCT) nur begrenzt für die Nutzenbewertung
unter medizinischen Alltagsbedingungen eignen [3 ], werden in umschriebenen Versorgungsbereichen wie z. B. der Arzneimittelversorgung
[4 ] Nutzen- und Effizienzbelege aus dem Versorgungsprozess selbst bezogen, genutzt werden
hierfür [5 ] die sog. Sekundärdaten.
Sekundärdaten des Gesundheitswesens in der Versorgungsevaluation
Sekundärdaten haben den Vorteil, dass sie nicht durch systematische Fehler des Settings
von klassischen RCT verzerrt sind, die durch mehr oder weniger restriktive Ein- und
Ausschlusskriterien bedingt sein können. Da sie für große Populationen über lange
Zeiträume in vergleichbarer Systematik und Qualität vorliegen und eine Bewertung von
Interventionen unter den Bedingungen des Versorgungsalltages ermöglichen, sind sie
für die Nutzen- und Effizienzbewertung von zunehmender Relevanz [6 ].
Diese Vorteile gehen mit dem Nachteil einher, dass Nutzenvergleiche verschiedener
Interventionen infolge der meist fehlenden Randomisierung durch Confounding verzerrt
sein können, was die Interpretierbarkeit und das Ableiten kausaler Aussagen von Analysen
zu Nutzen-, Schaden- und ökonomischen Effekten stark beeinträchtigen kann [7 ]
[8 ]
[9 ]. Dennoch sind Sekundärdaten aufgrund der genannten Vorzüge von unschätzbarem Wert
für die Nutzenbewertung von (Prozess-)Innovationen im Versorgungsgeschehen und neue
Formen der Leistungserbringung, wozu – siehe oben – die Integrierte Versorgung zu
zählen ist.
Aufgrund der Zielsetzung, mit der diese Daten ursprünglich gesammelt werden, – im
Falle von Krankenkassendaten zum Zwecke der Abrechnung von Versorgungsleistungen –
können die Daten durch abrechnungsgetriggerte Phänomene (bspw. Upgrading/Upcoding
von Leistungspositionen im intramuralen Sektor) grundsätzlich einem Bias unterliegen.
Andererseits sind sie durch ihre ursprüngliche Zweckbestimmung in der Regel geeignet,
alle den Krankenkassen zur Erstattung übermittelten Leistungen abzubilden, indem sie
mehrere Sektoren umfassen, die an einem komplexen Versorgungsgeschehen insbesondere
bei chronisch-progredienten oder chronisch-exazerbierenden Erkrankungen beteiligt
sind; sie decken also sowohl die stationäre als auch die ambulante Versorgung ab.
Sekundärdaten haben jedoch den Nachteil, dass in ihnen für gewöhnlich keine klinischen
Befundparameter, (patho)physiologische Messwerte, Untersuchungs- oder Laborbefunde
enthalten sind. Auch ist die Patient/inn/enperspektive in Form von Patient Related
Outcomes wie etwa der gesundheitsbezogenen Lebensqualität nicht hinreichend abgebildet.
In der gesundheitsökonomischen Analyse multimodaler Versorgungsprogramme greift die
alleinige Nutzung von Sekundärdaten also oft zu kurz. Allerdings weisen auch eigens
erhobene klinische oder patient/inn/en-individuelle Primärdaten allein nicht den für
Zwecke der Evaluation erforderlichen Informationsgehalt auf.
Daher ist die Verknüpfung von Primär- und Sekundärdaten für die Evaluation von Therapieregimes
chronischer Erkrankungen, bei denen Patient/inn/en zwischen verschiedenen Versorgungssektoren
navigieren, die Methode der Wahl, denn ein allumfassendes Bild langfristiger Behandlungseffekte
sowie ihrer Kosten-Effektivität kann nur gezeichnet werden, wenn beide Datentypen
miteinander verknüpft werden.
In derartigen Evaluationsstudien wird typischerweise eine Gruppe von Probanden (Treatment Group ) der Versorgungsinnovation ausgesetzt und hinsichtlich der Struktur-, Prozess- und
Ergebnisqualität der Versorgung mit einer Gruppe von Probanden verglichen, die gemäß
Usual Care , dem geltenden Versorgungsstandard, behandelt werden (Control Group ). In der Post-hoc-Analyse wird dann nach Kontrolle für Störgrößen (Confounder ) der Zugewinn an Versorgungsqualität gegen den zusätzlichen Aufwand abgewogen, der
resultierende (Zusatz-)Nutzen wird dem zusätzlichen Prozessaufwand und den Zusatzkosten
in Form eines inkrementellen Kosteneffektivitätsverhältnisses gegenübergestellt [10 ]
[11 ].
Die vorliegende Arbeit beschreibt anhand eines Praxisbeispiels, wie bezüglich der
Zusammenführung von Primär- und Sekundärdaten für die gesundheitsökonomische Evaluation
verfahren werden kann.
Das Programm StrokeCard zur Integrierten Versorgung von Schlaganfall-Patient/inn/en
Im Rahmen einer multidisziplinären Kooperation wurde im Dezember 2013 unter der Bezeichnung
StrokeCard ein umfassendes Programm zum Versorgungsmanagement des Schlaganfalls an Tiroler Kliniken
lanciert. Dieses Post-Stroke-Disease-Management-Programm setzt auf dem in Tirol bereits
etablierten integrativen Schlaganfall-Netzwerk [12 ] auf. Mit ihm ist das übergeordnete Ziel verbunden, eine Früherkennung und Prävention
von post-ischämischen Komplikationen zu fördern und wissenschaftliche Belege dafür
zu liefern, dass das Disease-Management-Programm den funktionellen Outcome und das
Wohlbefinden der Patienten erhöht sowie die Sekundärprävention von Schlaganfällen
und anderen vaskulären Konsequenzen optimiert, ohne die damit verbundenen Kosten zu
steigern. Das StrokeCard -Programm wird gefördert vom Land Tirol und koordiniert von der CEMIT (Center of Excellence
in Medicine and IT GmbH). Projektpartner sind neben der UMIT (Private Universität
für Medizinische Informatik und Technik GmbH) die Unternehmen ESD (Evaluation Software
Development GmbH), die Tirol Kliniken (vormals TILAK – Tiroler Landeskrankenanstalten
GmbH) und die TGKK – Tiroler Gebietskrankenkasse (heute: Österreichische Gesundheitskasse,
Landesstelle Tirol).
Im Kontext dieses Gesamtprogrammes wurde zur Vorbereitung der gesundheitsökonomischen
Evaluation das Teilprojekt SeDaStro („Verknüpfung von Sekundär-Daten mit Primärdaten
des StrokeCard -Programmes“) durchgeführt, dessen Zielsetzung es war, die im Rahmen der medizinischen
Versorgung gewonnenen klinischen Primärdaten mit Abrechnungsdaten der Tiroler Gebietskrankenkasse
zu verknüpfen, um auf diese Wiese einen für die gesundheitsökonomischen Analysen geeigneten
operativen Datensatz zu schaffen.
Das StrokeCard -Programm ist als prospektive bizentrische blockrandomisierte offene Interventionsstudie
mit verblindetem Outcome-Assessment angelegt, das Studienprotokoll wurde registriert
bei ClinicalTrials.gov (NCT02156778) und 2018 publiziert [13 ]). Dieser Publikation ist auch der detaillierte Ablauf des klinischen Teils der StrokeCard -Studie zu entnehmen. Die Datenerhebung und Dokumentation wurde von den klinisch tätigen
Ärzt/inn/en sowie von Study Nurses vorgenommen, im Zuge der Dateneingabe fand eine
über die Eingabemaske vermittelte Qualitätssicherung der Datensammlung statt. Studienzentren
waren die Klinik für Neurologie der Medizinischen Universitätsklinik Innsbruck (PI:
Univ.-Prof. Dr. Johann Willeit) und die Neurologische Abteilung des Krankenhauses
der Barmherzigen Brüder Wien (PI: Univ.-Prof. Dr. Wilfried Lang). Patient/inn/en,
die in den beiden neurologischen Kliniken wegen eines akuten ischämischen Schlaganfalls
oder einer transitorischen Ischämischen Attacke (TIA) behandelt wurden, wurden in
einer 2:1-Ratio entweder einer intensivierten Versorgung nach dem StrokeCard -Konzept (Interventionsgruppe) oder einer Standardversorgung (Kontrollgruppe) zugeführt
und während der initialen stationären Behandlung in die Studie eingeschlossen. Die
Fallzahlgröße wurde mit 2.160 Patient/inn/en festgelegt, 1.440 in der StrokeCard -Gruppe und 720 in der Kontrollgruppe.
Zwölf Monate nach Studieneinschluss wurde ein verblindetes Outcome-Assessment durchgeführt.
Alle Outcomes werden sowohl auf Intention-to-Treat-Basis (Primär-Analyse) als auch
auf Per-Protocol-Basis (Sensitivitäts-Analyse) ermittelt.
Die primären Endpunkte der Studie umfassen:
Rekurrierende kardiovaskuläre Ereignisse (nach Entlassung aus dem Krankenhaus), zusammengesetzt
aus Myokard-Infarkt, Schlaganfall und gefäßbedingten Todesfällen;
die gesundheitsbezogene Lebensqualität (health-related QoL), gemessen mit dem Instrument
EQ-5D (European Quality of Life-5 Dimensions).
Sekundäre Endpunkte inkludierten Rezidiv-Schlaganfälle und TIAs, Gesamtmortalität,
funktionelles Outcome und die Erreichung der Zielwerte im Risikofaktor-Management.
Zusätzlich war eine gesundheitsökonomische Evaluierung der Effekte des StrokeCard -Programmes in Form einer inkrementellen Kosteneffektivitätsanalyse (incremental cost-effectiveness
analysis – CEA) vorgesehen, bei der die Kosten in monetären Einheiten ausgewiesen
werden, und der gesundheitsbezogene Nutzen gemessen wird als nicht monetärer patientenrelevanter
Outcome, z. B. in Form von gewonnenen qualitätsadjustierten Lebensjahren (quality-adjusted
life-years – QALY).
Die StrokeCard -Studie wurde von der Ethik-Kommission der Medizinischen Universität Innsbruck am
13. Dezember 2013 bewilligt (UN2013–0045, 331/4.19).
Forschungsfragen
Mit dem vorliegenden Projekt wurde den folgenden beiden Forschungsfragen nachgegangen:
Wie ist das methodische Vorgehen, um unter den Gegebenheiten der Datenverfügbarkeit
einen im Zuge der stationären Versorgung gewonnenen Primärdatensatz mit patient/inn/enbezogenen
Angaben zu klinischen Befund-, Prozess- und Outcomeparametern mit einem Sekundärdatensatz
(Routineabrechnungsdaten der Tiroler Gebietskrankenkasse – TGKK) mittels Datenlinkage
zu verknüpfen?
Kann ein so gebildeter operativer Datensatz den Anforderungen an den Variablenbestand
und den Informationsgehalt gerecht werden, der für eine gesundheitsökonomische Evaluation
einer komplexen Versorgungsintervention, wie sie das Tiroler StrokeCard-Programm darstellt,
erforderlich ist?
Über diese Fragestellungen hinausgehende Ergebnisse aus der gesundheitsökonomischen
Evaluation der post-stationären Nachbehandlung des Schlaganfalles sind dem Endbericht
des Projekts „Post-Stroke Disease Management »StrokeCard« – Gesundheitsökonomische Evaluation“ zu entnehmen [14 ] und sind nicht Gegenstand des vorliegenden Beitrages; eine entsprechende Fachpublikation
ist in Vorbereitung.
Methode
Zielvorgabe für das methodische Vorgehen war, dass für die gesundheitsökonomische
Evaluation des StrokeCard -Projektes sowohl Primärdaten verwendet werden sollten, die im Rahmen der medizinischen
Versorgung der Schlaganfall-Patient/inn/en erhoben wurden, als auch von der TGKK bereitgestellte
Routineabrechnungsdaten (=Sekundärdaten).
Die Primärdaten zur medizinischen Versorgung der Schlaganfall-Patient/inn/en umfassen
die Dimensionen des gesundheitlichen Zustandes und dessen Veränderungen über die Zeit
ebenso wie die Inanspruchnahme von Versorgungsleistungen (pharmakologische und internistische/chirurgische
Interventionen, Heil- und Hilfsmittel), die erst unter Hinzuziehung der Informationen
des Kostenträgers TGKK in monetären Einheiten ausgedrückt werden können. Zusätzlich
wurde im klinischen Kontext eine Erhebung der gesundheitsbezogenen Lebensqualität
(QoL) durchgeführt. Der gesundheitsbezogene Nutzen wird für den Studienzeitraum gemessen
als nicht-monetärer, nutzwert-adjustierter Outcome in QALYs (siehe oben).
Die Routineabrechnungsdaten der TGKK werden seitens der Krankenversicherung routinemäßig
kontinuierlich gesammelt. Diese Daten wurden übermittelt, auf Lesbarkeit und Vollständigkeit
geprüft, und es wurden Plausibilitätsprüfungen durchgeführt. Die Daten wurden anschließend
in eine für die gesundheitsökonomische Evaluation verwendbare Form transformiert und
adaptiert. Der hohe Aufwand dieses Vorgehens rechtfertigt sich durch den Vorteil,
dass solche aus dem tatsächlichen Routineablauf stammenden Daten als Real-World-Evidenz
die Routineversorgungssituation besser widerspiegeln, was neben der internen Validität
(die im vorliegenden Fall durch die Randomisierung gegeben ist) insbesondere von übergeordneter
Bedeutung für die externe Validität (Generalisierbarkeit) und die Reliabilität der
gesundheitsökonomischen Evaluationsergebnisse im Hinblick auf den Versorgungsforschungskontext
ist.
Mit Studienstart am 3. Januar 2014 erfolgte die Rekrutierung der Studienteilnehmer
der StrokeCard -Studie über einen Zeitraum von mehreren Jahren, um die Zielgröße von 2.160 Patient/inn/en
zu erreichen. Kennzeichnend für die gesundheitsökonomische Evaluation ist, dass vor
und nach der Phase der klinischen Akutversorgung eine Vor- und Nachbeobachtung anhand
von Prozessdaten der Sozialversicherung erfolgte, indem Krankenkassenabrechnungsdaten
der Studienteilnehmer über den Zeitraum von einem Jahr vor Rekrutierung und einem
Jahr ab/nach Krankenhausentlassung berücksichtigt wurden. [Abb. 1 ] gibt einen schematischen Überblick über die Rekrutierungsjahre und die jeweiligen
vor- und nachgeschalteten Beobachtungszeiträume.
Abb. 1 Rekrutierungsjahre und jeweils vor- und nachgeschaltete Beobachtungszeiträume in
den Krankenkassenabrechnungsdaten Quelle: [14 ].
Datengrundlage
Wie in der Einleitung erwähnt, bestand die Aufgabe des vorliegenden Projektes als
Teil des StrokeCard -Programmes [14 ] darin, einen operativen Datensatz aus Primär- und Sekundärdaten zu schaffen, der
für die gesundheitsökonomische Evaluation genutzt werden konnte. Da die Untersuchung
aus Kostenträgerperspektive durchgeführt werden sollte, wurden nur Patient/inn/en
des Tiroler Studienzentrums in die gesundheitsökonomische Evaluation eingeschlossen,
die bei der TGKK versichert waren und eine entsprechende Sozialversicherungsnummer
aufwiesen. Zu diesen Patient/inn/en wurden die Daten beider Quellen mittels Linkage
zusammengeführt (siehe Abschnitt „Datenlinkage“).
Im Folgenden wird zunächst die Studienpopulation mit den verwendeten Ein- und Ausschlusskriterien
dargestellt, anschließend werden der klinische Datensatz sowie der Versichertendatensatz
der TGKK beschrieben.
Studienpopulation
Entsprechend dem Studienprotokoll kamen alle an der Klinik für Neurologie der Medizinischen
Universität Innsbruck konsekutiv aufgenommenen Patient/inn/en für den Einschluss in
die Studie in Frage, auf die folgende Kriterien zutrafen:
Sie mussten die Klinik wegen eines ischämischen Schlaganfalls oder einer transitorischen
ischämischen Attacke (ABCD2-Score≥3) aufgesucht haben.
Sie mussten ihre Zustimmung zu der im Protokoll beschriebenen strukturierten Nachsorge
erteilt haben.
Sie mussten eine schriftliche Einverständniserklärung zur Teilnahme an der Studie
gegeben haben.
Klinischer Datensatz
Der klinische Datensatz enthielt neben sozio-demografischen Angaben (Alter, Geschlecht)
v. a. klinisch-medizinische Patient/inn/eninformationen wie Angaben zur Krankenhausverweildauer
(in Tagen), Medikation, Risikofaktoren (u. a. Nikotinkonsum, Dyslipidämie) und Komorbiditäten
(früherer Schlaganfall, Charlson Comorbidity Index, Hypertonie, Diabetes Mellitus,
Vorhofflimmern und Myokardinfarkt) zum Zeitpunkt des Studieneinschlusses. Für die
Beurteilung des Schweregrades des Schlaganfalls wurde die National Institute for Health
Stroke Scale (NIHSS-Score) [15 ] verwendet; physische Einschränkungen wurden gemessen mit dem Barthel-Index (BI)
und der modifizierten Rankin Skala (mRS) [16 ]
[17 ].
Datenlinkage
Die Datenzusammenführung erfolgte durch das nach ISO-9001 zertifizierte Institut für
klinische Epidemiologie der Tirol Kliniken (IET). Vom IET wurde eine geschützte Website
mit gesichertem Zugang eingerichtet, auf der MUI und TGKK die zu pseudonymisierenden
Daten im CSV-Format hochluden. Das IET führte eine Pseudonymisierung und ein exaktes
deterministisches Linkage [18 ] durch, basierend auf der Sozialversicherungsnummer (SVNR) als Schlüsselvariable
(Identifikator). Das dabei angewandte SHA-256-Verfahren garantierte, dass stets ein
und dieselbe SVNR immer auf dasselbe Pseudonym abgebildet wurde. Ein Fehler oder Missing
Link bei der Zuordnung der Identifier wurde a priori nicht erwartet und ist auch nicht
aufgetreten, was für die Qualität der Datendokumentation in den beiden Datensätzen
spricht. Im Nachgang hat die Analysestelle ausschließlich die pseudonymisierten Daten
der Studienteilnehmer erhalten. Auf diese Weise wurde den Anforderungen des Datenschutzes
entsprochen.
Im Juli 2016 wurden insgesamt n=946 gültige Pseudonymisierungsschlüssel für die entsprechenden
Sozialversicherungsnummern der bis dahin für die Studie rekrutierten Patient/inn/en
generiert. Die Klinik lieferte den der Analyse zugrundeliegenden Datensatz am 10.03.2017.
Dieser Datensatz enthielt n=1.099 Aufnahmen von Patient/inn/en. Die Verteilung nach
Rekrutierungsjahr ist in [Tab. 1 ] dargestellt.
Tab. 1 Klinischer Datensatz: Verteilung der Patient/inn/en nach Rekrutierungsjahr.
Rekrutierungsjahr
Anzahl der rekrutierten Patient/inn/en
2014
425
2015
438
2016
236
Summe
1 099
Quelle: [14 ]
Die Berücksichtigung der vorhandenen Angabe zur Übernahme in die Studie und des existierenden
Pseudonymisierungsschlüssels zur Aufnahmezahl gestattete es, die Daten von n=946 Patient/inn/en
zu filtern – mit entsprechender Zuordnung zur Kontroll- bzw. Interventionsgruppe,
im Folgenden als „StrokeCard -Studienarm“ bezeichnet. [Tab. 2 ] weist die Verteilung nach Rekrutierungsjahr aus.
Tab. 2 Klinischer Datensatz: Verteilung der Patient/inn/en nach Rekrutierungsjahr und Studienarm.
Studienarm
Anzahl der Versicherten nach Rekrutierungsjahr
N
2014
2015
2016
Kontrollgruppe
130
150
31
311
StrokeCard -Gruppe
287
286
62
635
Summe
417
436
93
946
Quelle: [14 ]
Sozialversicherungsdatensatz
Der Sozialversicherungsdatensatz, der von der TGKK bereitgestellt wurde, umfasst Datensätze
zu allen für die Schlaganfallversorgung relevanten Leistungsbereichen der gesetzlichen
Krankenversicherung. Darin enthalten sind Angaben zur Inanspruchnahme von Sachleistungen,
die bei Vertragspartnern der TGKK bzw. als Kostenerstattung infolge Konsultation von
Wahl-Gesundheitsdiensteanbietern erbracht wurden, die damit verbundenen Kosten im
stationären und ambulanten Versorgungssektor, diagnostische und therapeutische Interventionen,
Arzneimittelverordnungen sowie Heil- und Hilfsmittel, zuzüglich der Transportkosten
(und ggf. weiterer Finanzleistungen).
Da für eine Kostenanalyse von Bedeutung ist, Kosten vor und nach dem Schlaganfall
berechnen zu können, die Kosten jedoch nur im TGKK-Datensatz enthalten sind, mussten
diejenigen Versicherten in der TGKK-Datenbank identifiziert werden, die für den jeweiligen
Beobachtungszeitraum ([Abb. 2 ]) als durchgehend versichert eingestuft werden konnten. Unter „durchgehend versichert“
werden im vorliegenden Studiendesign solche Versicherten verstanden, für die gilt,
dass zu ihnen Sozialversicherungsdaten für den Zeitraum eines Jahres vor Rekrutierung
und eines Jahres ab/nach Entlassung aus der stationären Behandlung verfügbar waren
und sie bei der TGKK anspruchsberechtigt waren.
Abb. 2 TGKK-Leistungsbereiche und Inanspruchnahme von insgesamt n=649 Versicherten (Darstellung
auf Basis der Datensatzstruktur der TGKK) Quelle: Tiroler Gebietskrankenkasse (TGKK)
in Anlehnung an [14 ].
Im TGKK-Datensatz konnten für die relevanten Jahre 2013, 2014, 2015 und 2016 per 31.05.2017
(Stichtag des TGKK-Datenabzuges) Abrechnungsdaten von n=649 Versicherten gefunden
und exportiert werden. Für die im Jahr 2014 rekrutierten Patient/inn/en standen die
Daten von 2013 bis 2015 zur Verfügung, und für diejenigen Patient/inn/en, die im Jahr
2015 rekrutiert wurden, die Daten von 2014 bis 2016.
Naturgemäß nahmen nicht alle n=649 Versicherten Leistungen aller Bereiche in Anspruch.
Abbildung 2 gibt einen Überblick darüber, von wie vielen der n=649 Versicherten Leistungen
im jeweiligen Bereich in Anspruch genommen wurden.
Ergebnisse
Im Zuge des Datenlinkages wurden diejenigen Versicherten im TGKK-Datensatz identifiziert,
bei denen die vollständigen klinischen Daten vorhanden waren (n=649). N=93 dieser
Versicherten wurden bis Juli 2016 in die Studie aufgenommen. Diese Patient/inn/en
konnten nicht für diese Analyse berücksichtigt werden, da die Voraussetzung des Follow-up
für ein Jahr nicht erfüllt wurde, sodass zunächst n=556 eligible Patient/inn/en der
Studienpopulation verblieben. Von diesen fehlte bei n=13 Versicherten die Angabe eines
Entlassungsdatums, bei n=2 Versicherten fehlten die Follow-up-Daten, und bei n=1 Versichertem
wurde posthoc ein Verstoß gegen die Einschlusskriterien detektiert, infolgedessen
wurden diese n=16 Versicherten nicht in die Analyse einbezogen. Insgesamt wurden über
den Rekrutierungszeitraum von Januar 2014 bis Dezember 2015 somit n=540 für die Analyse
in Frage kommende Patient/inn/en identifiziert ([Tab. 3 ]).
Tab. 3 Klinischer Datensatz: Verteilung der Patient/inn/en nach Rekrutierungszeitpunkt,
zeitlicher Inanspruchnahme und Studienarm (VS=Versicherte).
Studienarm
Rekrutierungsjahr (MUI)
2014
2015
Summe
Versorgung in den Jahren 2013, 2014 und 2015
Versorgung in den Jahren 2014, 2015 und 2016
Kontrollgruppe
91
90
181
StrokeCard -Gruppe
199
176
375
Zwischensumme rekrutierter VS
290
266
556
VS ohne Follow-up-Daten
1
1
2
VS ohne Entlassungsdatum
3
10
13
VS mit Verstoß gegen Einschlusskriterien
1
0
1
Für die Analyse eligible VS
285
255
540
Quelle: [14 ]
Von diesen n=540 Patient/inn/en konnten schlussendlich n=367 der StrokeCard -Gruppe (also der Interventionsgruppe der StrokeCard -Studie) und n=173 der Standardversorgungsgruppe (also der Kontrollgruppe der StrokeCard -Studie) zugeordnet werden. N=11 Patient/inn/en haben das 1-Jahres-Follow-up nicht
beendet (n=7 Patient/inn/en der Interventionsgruppe vs. n=4 Patient/inn/en der Kontrollgruppe);
n=7 Patient/inn/en verstarben während der Studie (n=5 Patient/inn/en der Interventionsgruppe
vs. n=2 Patient/inn/en der Kontrollgruppe). Für alle n=540 Patient/inn/en waren Sekundärdaten
der TGKK für Zeiträume von jeweils einem Jahr vor Rekrutierung und einem Jahr nach
Entlassung aus der stationären Behandlung verfügbar, sodass ein 1:1-Linkage dieser
Personen ohne Verwurf auf klinischer Seite und ohne fehlende Matches auf Krankenversicherungsseite
möglich war. Alle im Ergebnis des Linkages verfügbaren Daten konnten für die gesundheitsökonomische
Evaluation des StrokeCard -Programmes verwendet werden.
Diskussion
Die vorliegende Arbeit beschreibt ein unseres Wissens in Österreich bis dato noch
nicht praktiziertes Vorgehen des exakten regelbasierten deterministischen Linkages
von Primär- und Sekundärdaten, das die Empfehlungen der Guten Praxis Datenlinkage
(GPD) [19; Abschnitt 5.3] erfüllt, wonach für das Linkage ein geeignetes, den Möglichkeiten
und Zielsetzungen des Vorhabens angepasstes technisches Verfahren zu wählen ist.
Mit dem SHA-256-Verfahren wurde zudem ein seit vielen Jahren etablierter Standard
gewählt, bei dem die Sozialversicherungsnummer als Anker herangezogen werden konnte;
auch dies ist ein gängiges Vorgehen. So werden bspw. auch die Leistungsdaten des österreichischen
Gesundheitssystems gemäß dem Bundesgesetz über die Dokumentation im Gesundheitswesen
(BGBl. Nr. 745/1996) auf dieser Grundlage zusammengeführt. Mithin handelt es sich
bei dieser Vorgehensweise ebenfalls um ein Datenlinkage – jedoch mit der Einschränkung,
dass Routinedaten der Sozialversicherung mit wiederum prozessgenerierten Abrechnungsdaten
zusammengeführt werden, also Daten derselben Spezies einem Linkage unterzogen werden.
Studien wie diese werden in Österreich v. a. vom Hauptverband der österreichischen
Sozialversicherung betrieben, z. B. im Zuge des von der FFG im Rahmen des Programmes
COMET geförderten sog. DEXHELPP-Projektes („Decision Support for Health Policy and
Planning: Methods, Models and Technologies based on Existing Health Care Data”) [20 ]. Bei unserem Vorgehen hingegen werden Routineabrechnungsdaten der Sozialversicherung
mit klinischen Primärdaten verknüpft; dies stellt derzeit noch ein Novum im österreichischen
Gesundheitssystem dar.
Das österreichische Sozialversicherungssystem, das anders als z. B. das deutsche System
kein freies Kassenwahlrecht vorsieht, begünstigt prinzipiell Forschungsansätze, bei
denen Krankenkassendaten mit Daten anderer Quellen verknüpft werden. Analoge Konzepte
würden bspw. in Deutschland einen hohen Aufwand allein schon dadurch auslösen, dass
Patient/inn/en einer stationären Einrichtung, deren Primärdaten mit Prozessdaten der
Sozialversicherung verknüpft werden sollen, bei vielen unterschiedlichen Krankenkassen
versichert sein könnten. Wollte man die Routineabrechnungsdaten dieser Versicherten
mit den klinischen Primärdaten zusammenführen, müssten entweder Kooperationsvereinbarungen
mit mehreren Krankenkassen geschlossen werden, oder es müssten die Primärdaten all
derjenigen Patient/inn/en, die nicht bei einer kooperierenden Krankenkasse versichert
sind, verworfen werden. Demgegenüber erleichtert das Versicherungssystem in Österreich
das Zuspielen von Sekundärdaten einer Gebietskrankenkasse zu den Primärdaten der Leistungserbringer
beträchtlich, da ein Großteil der Population des Landes zwangsläufig in einer Gebietskrankenkasse
versichert ist. So wurde für das Bundesland Tirol auf Grundlage einer österreichweit
koordinierten Ermittlung für das Jahr 2017 die Zahl der bei der Tiroler Gebietskrankenkasse
versicherten Personen (direkt Versicherte plus beitragsfrei mitversicherte Angehörige)
mit n=591.175 festgestellt, was einem Anteil von rund 80% der Tiroler Bevölkerung
entspricht [21 ]. In den übrigen österreichischen Bundesländern ist die Situation vergleichbar. Entsprechend
überraschend ist, dass die sich daraus für die österreichische Versorgungsforschung
ergebenden Chancen und Möglichkeiten bei Weitem nicht im zu erwartenden Maße realisiert
werden.
Gleichwohl gilt es zu bedenken, dass wie alle anderen auf eine Datenverarbeitung ausgerichtete
Methoden auch ein Datenlinkage mit einer Reihe von Limitationen eingehen kann. Beispielsweise
kann je nach Konfiguration eines Krankenkassen-Data-Warehouses die Erfassung von Wahlarztleistungen
eingeschränkt sein. Auch könnte im Falle des hier beschriebenen Modellprojektes die
Verallgemeinerbarkeit der Erkenntnisse dadurch eingeschränkt sein, dass die Versorgung
von Schlaganfallpatienten außerhalb der am StrokeCard-Programm teilnehmenden Krankenanstalten
nicht abgebildet wird. Derartige Limitationen könnten u. a. durch Analysen von Krankheitsregistern
aufgedeckt werden, wie sie in Europa inzwischen in vielen Ländern, insbesondere im
skandinavischen Raum, existieren oder zumindest im Gespräch sind, so z. B. auch in
Deutschland, wo im Zuge der jüngst erfolgten Ratifizierung des Gesetzes für mehr Sicherheit
in der Arzneimittelversorgung (GSAV) mit seinen Vorgaben für eine anwendungsbegleitende
Datenerhebung die Diskussion um Register neuen Auftrieb erfahren hat.
Würden solche Optionen genutzt, ergäben sich günstige Perspektiven sowohl für die
Versorgungsforschung als auch für die Versorgungsplanung und -steuerung. Man könnte
sich, wie bei StrokeCard geschehen, rein auf die empirischen Daten beschränken, man könnte aber auch so genannte
entscheidungsanalytische Modellierungen integrieren [22 ]. Zusätzlich könnten bereits während der Exposition einer Treatment-Gruppe unterschiedliche
Qualitätsmaße, Verlaufsinformationen und Befundparameter gesammelt und begleitend
analysiert werden [23 ]
[24 ]. Im Falle der Integrierten Versorgung von Schlaganfall-Patienten könnten so zum
einen streng medizinische Messgrößen in Verbindung mit Struktur- und Prozessparametern
erhoben werden, die bspw. die stationär-ambulanten Übergänge oder potenzielle Schnittstellen-Probleme
zwischen Akutversorgung, Rehabilitation und Pflege adressieren, zum anderen könnten
vergleichende Sekundärdatenanalysen mit Kontrollgruppen Hinweise auf die Wirksamkeit
innovativer Versorgungsformen liefern [5 ]
[25 ]. Auch könnten Leistungserbringer die Entwicklung der Parameter während des Behandlungsprozesses
monitorieren und ggf. steuernd in die medizinische Versorgung eingreifen (Paradebeispiel
für ein System der „lernenden Versorgung“). Ergebnisse derartiger Studien könnten
neben ihrer unmittelbaren Verwertbarkeit in der Nutzenbewertung auch Ausgangspunkt
für gesundheitsökonomische Extrapolationen und Hochrechnungen auf zukünftige Versorgungspotenziale
sein [1 ]
[5 ].
Für die Versorgungsforschung an sich, wie sie hier am Bespiel des post-akuten Managements
des Schlaganfalles konzipiert und mittels Datenlinkage vorbereitet wurde, eignen sich
Pragmatische Trials ganz besonders, da hier sowohl eine initiale Randomisierung erhalten
bleibt, die für Kausalanalysen als Instrumentalvariable genutzt werden kann, jedoch
durch die Einbettung in die Routineversorgung nur geringere Verzerrungen durch ein
rigides Studiendesign bzw. Monitoring zu erwarten sind [26 ]. Das StrokeCard -Programm verwendete eine Randomisierung in diesem Sinne (siehe Abschnitt „Sekundärdaten
des Gesundheitswesens in der Versorgungsevaluation“). Gegenüber der Mehrzahl der bislang
durchgeführten Versorgungsforschungsstudien, die methodisch in der Regel den Charakter
reiner Beobachtungsstudien haben, hat StrokeCard damit einen nennenswerten Vorteil. Der potentielle Nachteil eines je nach Fragestellung
eintretenden Selektionseffektes aufgrund der Tatsache, dass wie oben erwähnt ca. 80%,
nicht jedoch 100% der Tiroler Versicherten in der TGKK versichert sind, relativiert
sich im Vergleich zu möglichen Routinedatenzugängen in anderen Ländern, bei denen
die jeweils eingeschlossenen Krankenkassenpopulationen einen mitunter weitaus geringeren
Anteil an der gesamten Krankenversicherungspopulation des betreffenden Landes haben.
Für derartige Analysen bedarf es somit eines umfassenden Datensets, das zum einen
die genannten medizinisch-klinischen Versorgungsdaten (Primärdaten), zum anderen die
Prozess- und Abrechnungsdaten des Versorgungskontextes (Sekundärdaten) umfasst. Beide
Teildatenkörper konnten im vorliegenden Projekt über ein Datenlinkage-Verfahren erfolgreich
miteinander verknüpft und der gesundheitsökonomischen Analyse zugänglich gemacht werden.
Schlussfolgerungen
Das Linkage klinischer Primärdaten von Patient/inn/en mit Routineabrechnungsdaten
der Sozialversicherung, die als Sekundärdaten in wissenschaftliche Untersuchungen
eingehen können, bietet großes Potenzial und eröffnet weitreichende Perspektiven für
die Analyse der aktuellen und der zukünftigen medizinischen Versorgung. Das österreichische
Gesundheitssystem verfügt über einen nur begrenzten Erfahrungsschatz, was Datenlinkage-Verfahren
anbelangt, obwohl Studien, die auf einer Verknüpfung klinischer Patient/inn/en-Daten
und administrativer Daten basieren, in Österreich auf besonders günstige Ausgangsbedingungen
treffen und zugleich für die Evaluation komplexer multisektoraler Versorgungsschemata
unerlässlich sind.
Mit dem vorliegenden Projekt wurde die Machbarkeit der Verknüpfung solcher Datensätze
unterschiedlicher Provenienzen untersucht. Die Erfahrung in diesem Projekt zeigt exemplarisch,
dass ein unter den Kautelen des Datenschutzes betriebenes Linkage gelingen und eine
empirische Bereicherung insbesondere für gesundheitsökonomische Analysen darstellen
kann. Dies sollte als Anregung verstanden werden, in derartigen Evaluationsstudien
die Prinzipien des Datenlinkages in Zukunft in verstärktem Maße zum Einsatz kommen
zu lassen. Im Zuge der aktuell vollzogenen Umgestaltung im österreichischen Krankenversicherungswesen
bietet sich die Chance, Strukturänderungen zugleich auch für solche Strukturinnovationen
zu nutzen, die Evaluierungen der Krankenkassen und des medizinischen Versorgungssystems
ermöglichen.