Schlüsselwörter
GKV Routinedaten - Covid-19 Pandemie - Handlungsempfehlungen - Evidenz
Key words
claims data - Covid-19 pandemic - recommendations for action - evidence
Einleitung
Mit Beginn der COVID-19 Pandemie im Februar 2020 wurde deutlich, dass zeitnah
empirische Datengrundlagen zur Pandemiesteuerung benötigt werden
würden. Dabei mussten sowohl Fragen zu den Risikofaktoren, zur Behandlung
und Versorgung von COVID-19 Patient_innen als auch zur Aufrechterhaltung der
Gesundheitsversorgung von nicht an COVID-19 erkrankten Personen beantwortet werden.
Das übergeordnete Ziel des Arbeitspaketes 0 (AP0) – Daten
für die Pandemiesteuerung)[
1] im BMBF-Verbundprojekt egePan-Unimed des Netzwerk
Universitätsmedizin (Förderkennzeichen 01KX2021) war die
Bereitstellung potenziell relevanter Test-, Verlaufs- und Outcomedaten und ihre
Bewertung im Hinblick auf ihre Eignung für ein (regionales)
Pandemiemanagement.
Insbesondere die Nutzung und die Rolle von Sekundärdaten im Rahmen der
Pandemiebekämpfung und des Pandemiemonitorings war zum Zeitpunkt des
Projektbeginns nur eingeschränkt erfolgt. Zu Sekundärdaten
zählen insbesondere aber nicht ausschließlich Abrechnungsdaten der
gesetzlichen Krankenkassen. Im Vergleich zu einer Primärdatenstudie
ermöglicht die Analyse von Sekundärdaten die Untersuchung
großer Populationen mit vergleichsweise geringem Aufwand. Die nachfolgend
benannten fünf Anwendungsfälle, die zwischen Sommer 2020 und
Dezember 2021, zumeist aufgrund akuter Relevanz, bearbeitet wurden, liefern
dafür Prototypen:
-
Schätzung der Prävalenzen von Risikofaktoren schwerer
COVID-19 Verläufe
-
Hierarchisierung von Risikofaktoren für schwere COVID-19
Erkrankungsverläufe
-
Bestimmung der Hintergrundinzidenz von Sinusvenenthrombose und
Myokarditis
-
Analysen zu Häufigkeit und Verlauf von Post-COVID
-
Untersuchungen zu Veränderungen der Inanspruchnahme und von
leitlinienorientierten, sektorübergreifenden Versorgungssequenzen
psychiatrisch-psychosomatisch-psychotherapeutischer Leistungen in Folge der
COVID-19 Pandemie (Covid-Psy).
Diese sog. use cases bildeten, zusammen mit Ergebnissen aus Workshops,
Recherchearbeiten und Interviews aus AP0, die Grundlage für die Ableitung
von Empfehlungen im Sinne eines Leitfadens für die zukünftige
Nutzung von Routinedaten in einer pandemischen Versorgungslage. Ziel dieses Papiers
ist es die Anwendungsfälle inhaltlich und hinsichtlich der gewählten
methodischen und organisatorischen Vorgehensweise zu beschreiben. Die im Projekt
erarbeiteten und hier beschriebenen allgemeinen und spezifischen
Handlungsempfehlungen sollen einen Rahmen für die erweiterte Nutzung von GKV
Routinedaten, auch über die aktuelle pandemische Versorgungslage hinaus,
geben. Im Fokus stehen dabei prozedurale, methodische, technische und rechtliche
Aspekte, die in zukünftigen Pandemien oder sonstigen Situationen mit
mangelhafter Evidenzlage handlungsleitend für die Evidenzgenerierung mittels
GKV Routinedaten sein können.
Methodik
Die Bearbeitung der Fragstellungen erfolgte auf Basis von GKV Routinedaten in
verschiedenen Projektteams. Im Folgenden soll das prozedurale, methodische und
technische Vorgehen für jedes Teilprojekt skizziert werden.
Prävalenzen Risikofaktoren schwerer COVID-19 Verläufe
In Anbetracht begrenzter Impfdosen zu Beginn der Impfkampagne im Jahr 2021 war
das Ziel eine größtmögliche Zahl von COVID-19 bezogenen
Hospitalisierungen und Todesfällen zu vermeiden. Eine vorab definierte
Priorisierungsstrategie sah vor, zunächst ältere und
vorerkrankte Personen sowie Berufstätige in Pflege und
Gesundheitsversorgung zu impfen [1]. Zur
Modellierung des Nutzens verschiedener Impfstrategien wurden vom Robert
Koch-Institut (RKI) Prävalenzraten bekannter Risikofaktoren für
einen schweren COVID-19 Verlauf benötigt. Für die Analysen
konnten anonymisierte Daten von insgesamt etwa acht Millionen GKV Versicherten
der AOK PLUS Sachsen und von etwa 60 Betriebskrankenkassen aus dem gesamten
Bundesgebiet genutzt werden. Die Auswertungen erfolgten im Zentrum für
Evidenzbasierte Gesundheitsversorgung (ZEGV) und dem Institut für
angewandte Gesundheitsforschung Berlin GmbH (InGef). Ambulante und in der
stationären Versorgung dokumentierte Diagnosen (ICD-10 Code) sowie
indikationsspezifische Arzneimittelverordnungen wurden zur Falldefinition von 27
Erkrankungen, die mit einem moderatem bzw. hohen Risiko für einen
schweren COVID-19 Verlauf assoziiert waren [2], herangezogen. Für das Jahr 2019 wurden die
Prävalenzraten von Risikofaktoren für einen moderaten bzw.
schweren COVID-19 Verlauf stratifiziert nach Alter, Geschlecht und Bundesland
berichtet. Außerdem wurden direkt altersstandardisierte
Prävalenzraten der Risikofaktoren berechnet. Als Standardpopulation
wurde die deutsche Bevölkerung zum 31.12.2019 genutzt [3].
Hierarchisierung von Risikofaktoren für schwere COVID-19
Erkrankungsverläufe
Ergänzend zur vorherigen Fragestellung benötigte das RKI zur
Weiterentwicklung der Impfkampagne im Pandemieverlauf empirische Daten zur
Quantifizierung der Relevanz bekannter Risikofaktoren. Besonderes Interesse galt
der Frage, ob das zeitgleiche Auftreten mehrerer Risikofaktoren bei
multimorbiden Patient_innen mit einem höheren Risiko für einen
schweren COVID-19 Verlauf assoziiert ist.
Ziele dieses Teilprojektes waren 1) die Umsetzung der aktuellen Impfempfehlung im
Versorgungalltag durch eine einfache Identifikation von Personen mit einem hohen
Risiko für einen schweren COVID-19 Verlauf zu unterstützen und
2) die Entwicklung eines Scores, der das zeitgleiche Auftreten von mehreren
Vorerkrankungen berücksichtigt.
Zur Bearbeitung dieser Fragestellung wurde eine Kohorte mit Personen, die
zwischen 27.01.2020 und 30.06.2020 bzw. 31.12.2020 an COVID-19 (ICD-10 Code
U.07.1!) erkrankt waren, aus GKV Routinedaten der folgenden Krankenkassen
selektiert: AOK Bayern, AOK PLUS Sachsen, 60 Betriebskrankenkassen, BARMER, DAK
und Techniker Krankenkasse (TK). Als Endpunkt der Analysen wurden schwere
COVID-19-bedingte Erkrankungsverläufe anhand von COVID-19-assoziierter
intensivmedizinischer Behandlung, Beatmung oder Tod im zeitlichen Zusammenhang
mit einer COVID-19-Erkrankung definiert. Durch die Beteiligung vieler
Krankenkasse konnten Daten der ambulanten und stationären Versorgung
sowie ambulante Arzneimitteldaten von ca. 38 Mio. Versicherten für die
Analyse genutzt werden.
Das absolute Risiko für einen schweren Verlauf wurde über den
Anteil an Personen mit dem entsprechenden Risikofaktor, die eine
COVID-19-assoziierte Intensivbehandlung erhielten oder verstarben,
geschätzt. Mittels meta-analytischer Verfahren wurden die auf den
Datensätzen der einzelnen Krankenkassen erzielten
Schätzergebnisse durch das ZEGV gepoolt.
Zur Ableitung eines Risikoscores wurden altersstratifizierte
Poisson-Regressionsmodelle mit robusten Standardfehlern basierend auf
zufällig selektierten Trainingsdatensätzen (90% der
Studienpopulation) der einzelnen Datenhalter berechnet. Der finale Score wurde
in den Testdatensätzen hinsichtlich seiner Performance, das Outcome
schwerer COVID-19 Verlauf vorherzusagen, evaluiert. Basis für
die Analysen war ein in der Projektgruppe zuvor abgestimmtes Studienprotokoll in
dem die Selektion der Studienpopulation, die Definition der Kovariaten und
Outcomes sowie die statistische Analysemethoden beschrieben wurden.
Außerdem wurde eine einheitliche Datensatzbeschreibung entwickelt, um
Variablennamen und -ausprägungen zu homogenisieren. Die Analysen
erfolgten getrennt durch die jeweiligen Datenhalter bzw. analyseberechtigten
Institutionen und wurden im Anschluss mittels meta-analytischer Verfahren
gepoolt. Die Auswahl relevanter Interaktionen von Alter und Risikofaktoren
basierte auf den Empfehlungen klinischer Expert_innen.Die so
ausgewählten Interaktionen wurden in Regressionsanalysen mit den
ausgewählten Interaktionstermen berücksichtigt. Im Anschluss
erfolgt eine finale meta-analytische Poolung der Ergebnisse am ZEGV. Die
Regressionskoeffizienten wurden mittels min-max Normalisierung auf Werte
zwischen 0 und 20 normalisiert [4].
Hintergrundinzidenz Sinusvenenthrombose und Myokarditis
Im Verlauf der Impfkampagne mit der Vektor-Impfung von AstraZeneca traten mehrere
Fällen von Sinusvenenthrombosen (SVT) auf. Nach einer Impfung mit dem
mRNA Impfstoff von Biontech entwickelten wenige geimpfte Personen eine
Myokarditis. Um beurteilen zu können, inwiefern es sich bei den
beobachteten Erkrankungsfällen um unerwünschte
Arzneimittelwirkungen (UAW) handelt, wurden Informationen zur
Hintergrundinzidenz beider Erkrankungen von der Ständigen Impfkommission
(STIKO) benötigt.
Die Falldefinitionen zur Identifikation von SVT und Myokarditiden in den GKV
Routinedaten wurden zusammen mit klinischen Expert_innen bestimmt. Ambulant und
stationär dokumentierte Diagnosen (ICD-10 GM) sowie ambulant
abgerechnete Leistungen (EBM; Einheitlicher Bewertungsmaßstab) und
stationäre erbrachte Prozeduren (OPS; Operationen- und
Prozedurenschlüssel) wurden zur Falldefinition genutzt.
Zusätzlich zur Ermittlung der Hintergrundinzidenz von SVT wurde der
Anteil der SVT Patient_innen mit begleitender Thrombozytopenie bestimmt. Die
Inzidenz der Myokarditis wurde sowohl in der Gesamtbevölkerung als auch
in einer Population von COVID-19 Erkrankten untersucht. Als Datengrundlage
dienten anonymisierte Routinedaten von etwa sieben Millionen BKK Versicherten
der InGef Forschungsdatenbank in den Jahren 2015 bis 2020. Die Ergebnisausgabe
erfolgte stratifiziert nach Alter und Geschlecht.
Epidemiologie von Post-COVID in Deutschland
Im Sommer 2021 fehlte Evidenz zur Häufigkeit, Schwere und Risikofaktoren
zum Krankheitsbild Post-COVID, insbesondere bei Kindern und Jugendlichen, zur
Planung angemessener und zielgruppenspezifischer Public Health
Maßnahmen. Das RKI, zu diesem Zeitpunkt Mitglied einer
interministeriellen Arbeitsgruppe (IMA), die durch das Bundesministerium
für Gesundheit geleitet wurde und an der das Bundesministerium
für Bildung und Forschung; das Bundesministerium für Arbeit und
Soziales; das Bundesministerium für Familie, Senioren, Frauen und
Jugend; das Bundesministerium für Ernährung und Landwirtschaft;
das Bundesministerium des Inneren, für Bau und Heimat sowie das
Bundeskanzleramt beteiligt waren, trat deshalb an die Arbeitsgruppeheran, um
gemeinsam Fragestellungen zu Post-COVID bei Kindern und Jugendlichen wie auch
bei Erwachsenen in GKV Routinedaten zu analysieren.
Die Ziele des Projektes waren zu untersuchen 1) ob eine COVID-19 Erkrankung mit
einer erhöhten Wahrscheinlichkeit für das inzidente Auftreten
ausgewählter Erkrankungen (z. B. chronische Lungenerkrankungen
und verschiedene psychische Erkrankungen) assoziiert ist und 2) welche COVID-19
Folgeerkrankungen in bestimmten Subgruppen (insb. Kinder und Jugendliche)
auftreten und 3) inwiefern der Schweregrad der COVID-19 Erkrankung einen
Einfluss auf das Risiko von COVID-19 Folgeerkrankungen hat.
Unter Koordination des ZEGV wurde gemeinsam mit der AOK Bayern, der AOK PLUS, der
BARMER, der DAK, dem InGef und der TK eine gematchte Kohortenstudie auf Basis
von GKV Routinedaten von ca. 38 Mio. Versicherten durchgeführt. Mittels
exaktem Matching sowie Propensity Score Matching (PSM) wurden Personen mit
COVID-19 Erkrankung und Personen aus der Allgemeinbevölkerung ohne
COVID-19 Erkrankung verglichen. Poisson Regressionsmodelle wurden genutzt um
Incidence Rate Ratios für das inzidente Auftreten von COVID-19
Folgeerkrankungen zu bestimmen.
Covid-Psy - Routinedatenanalysen zu Veränderungen der Inanspruchnahme
im psychiatrisch-psychosomatisch-psychotherapeutischen GKV-Versorgungssystem in
Folge der COVID-19 Pandemie
Beispielhaft für vielfältige Fragestellungen, die sich aus der
eingeschränkten Gesundheitsversorgung und Inanspruchnahme
während des ersten und zweiten bundesweiten Lockdowns im
Frühjahr und Winter 2020 ergaben, wurde in Kooperation mit der
Forschungsgruppe psychiatrische Versorgungsforschung der
Universitätsklinik Mainz die Versorgung psychisch erkrankter Personen in
diesem Zeitraum untersucht.
Das Ziel dieser Studie war es, Veränderungen von Angebot und
Inanspruchnahme sowie von beispielhaften leitlinienorientierten,
sektorübergreifenden Versorgungssequenzen des
psychiatrisch-psychotherapeutischen Versorgungssystems in der COVID-19-Pandemie
unter besonderer Berücksichtigung der beiden bundesweiten Lockdowns zu
beschreiben.
Unter Koordination des ZEGV wurden anonymisierte GKV Routinedaten von insgesamt
8,8 Millionen GKV Versicherten der AOK PLUS Sachsen und von 60
Betriebskrankenkassen für die Analysen genutzt. Die Analyse der Daten
erfolgte separat durch die nutzungsberechtigen Institutionen ZEGV und InGef. Die
aggregierten Ergebnisse der Analysen wurden abschließend an das ZEGV zur
Evidenzsynthese versandt.
Mittels einer Zeitreihenanalyse wurde innerhalb einer Kohorte von Personen mit
psychischer Erkrankung oder Verhaltensstörung zwischen Januar 2016 und
März 2021 der Einfluss des ersten (03/2020) und des zweiten
(12/2020) Lockdowns der COVID-19 Pandemie auf das akute
stationäre und ambulante Versorgungsangebot untersucht. Die Modellierung
der Zeitreihen erfolgt mittels eines informed time series fore-casting Ansatzes,
der auf Likelihood-basierte Schätzmethoden für die Analyse und
Modellierung von Zählzeitreihen nach verallgemeinerten linearen Modellen
zurückgreift [5].
Ergebnisse
Arbeitsmodus
Sofern mehr als eine Institution bzw. Krankenkasse an der Bearbeitung einer der
oben beschriebenen Fragestellungen beteiligt war, wurde eine
Projektmanagementplattform (Confluence) installiert, auf der das in der
Projektgruppe a priori abgestimmt Studienprotokoll sowie Referenztabellen
abgelegt wurden. Zusätzlich wurden für jedes Projekt
Datensatzbeschreibungen konsentiert, in der einheitliche Variablennamen und
Ausprägungen festgelegt wurden. Die Analyse der Daten erfolgte getrennt
durch die jeweiligen Datenhalter bzw. zugriffsberechtigten Institutionen. Im
Anschluss wurden die aggregierten Ergebnisse gepoolt und mit allen
Projektbeteiligten diskutiert.
Die Gute Praxis Sekundärdatenanalyse der Deutschen Gesellschaft
für Epidemiologie [6] sowie die
aktuelle internationale wissenschaftliche Evidenz sowie die medizinischen
Expertise und Kenntnis der GKV Routinedaten im Konsortium waren die Grundlage
für die erfolgreiche Bearbeitung der skizzierten Fragestellungen.
(Wissenschaftliche) Verwertung und Nutzung der Projektergebnisse
Auf eine detaillierte Darstellung der Ergebnisse der einzelnen
Anwendungsfälle wird an dieser Stelle verzichtet. Diese werden in einem
detaillierten Abschlussbericht[2]
veröffentlicht. Vielmehr wird allgemein die Verwendung und
wissenschaftliche Verwertung der Ergebnisse beschrieben.
Die Prävalenzschätzungen von Erkrankungen mit einem
erhöhten Risiko für einen schweren COVID-19 Verlauf wurden dem
RKI zur mathematischen Modellierung verschiedener Impfstrategien zur
Verfügung gestellt.
Die Ergebnisse zur Schätzung der Hintergrundinzidenz der SVT wurden in
der 4. Aktualisierung der COVID-19 Impfempfehlung vom 22. April 2021
berücksichtigt [7].
Außerdem wurden die Ergebnisse im Anschluss bei PLOS ONE als Short
Report eingereicht und vorab als pre-print veröffentlicht [8]. Die Ergebnisse zur Hintergrundinzidenz
der Myokarditis fanden Eingang in die 9. Aktualisierung der COVID-19
Impfempfehlung [9].
Im Epidemiologischen Bulletin 19|2021 [10] wurde im Mai 2021 eine Rangfolge von 24 Erkrankungen bzw.
Altersgruppen, die mit einem höheren absoluten Risiko für einen
schweren COVID-19-Verlauf assoziiert waren, veröffentlicht und im
Anschluss der STIKO vorgestellt.
Die Ergebnisse zum Vergleich von Personen mit dokumentierter COVID-19-Erkrankung
und Kontrollpersonen aus der Allgemeinbevölkerung hinsichtlich des
Auftretens von COVID-19 bedingten Folgeerkrankungen (Post-COVID) wurden als
Preprint veröffentlicht und bei einem Peer-Review Journal eingereicht
[11].
Weitere Veröffentlichungen der Projektergebnisse zur Entwicklung des
Scores zur Impfpriorisierung sowie zur Versorgung von psychisch erkrankten
Personen, während der COVID-19 Pandemie werden aktuell bearbeitet.
Aus den pandemiespezifischen Anwendungsfällen abgeleitete
Handlungsempfehlungen
Zusätzlich zu den in der Guten Praxis Sekundärdatenanalyse [3] konkretisierten, allgemeinen
Empfehlungen zur Planung, Vorbereitung, Durchführung, Auswertung und
Berichterstattung von GKV Routinedatenanalysen ergaben sich im Rahmen der aus
der Bearbeitung der oben beschriebenen Anwendungsfälle folgende
kontextspezifische Handlungsempfehlungen:
-
Fragestellungen zur akuten Pandemiebewältigung bzw. mit akuter
Public Health Relevanz, die mittels GKV Routinedaten beantwortet werden
können, sollten auf Basis ihrer Public Health und klinischen
Relevanz sowie dem vorhandenen Grad an Unsicherheit priorisiert
werden.
-
Durch Nutzung etablierter Kooperationspartnerschaften kann kurzfristig
Evidenz zu Fragestellungen mit großer Public Health Relevanz zur
Verfügung gestellt werden. Zusätzlich zur
zügigen Zusammenstellung einer Projektgruppe, sollte
geprüft werden, inwiefern bereits aufbereitete Daten, die in
anderen Projekten generiert wurden, als Datengrundlage genutzt werden
können. Voraussetzung dafür bleibt die Zustimmung der
zuständigen Aufsichtsbehörde.
-
Die interdisziplinäre Zusammenarbeit von Personen mit
epidemiologischer, medizinischer und biometrischer Expertise im
Konsortium und die direkte Einbindung von Mitarbeitenden der
Krankenkassen hat sich bewährt.
-
Das Poolen aggregierter, deskriptiver GKV Routinedatenanalysen
verschiedener Datenhalter und der Einsatz meta-analytischer Verfahren
ermöglicht es, Ergebnisse verschiedener Analysestellen
datenschutzkonform zusammenzuführen. Auf diese Weise
können die Vorteile einer breiten Datenbasis genutzt werden,
ohne eine zeitaufwändige und rechtlich problematische
Zusammenführung der Individualdaten zu erfordern.
-
Standardisierte Datensatzbeschreibungen und Variablenformate sowie die
Abstimmung auf die verwendete Statistiksoftware erlauben die
Entwicklung, Prüfung und Anwendung von einheitlichen
Analyseskripten. Das ermöglicht eine zeitnahe und einheitliche
Analyse der Daten mit geringerer Fehleranfälligkeit.
-
Perspektivisch sollte geprüft werden inwiefern die
Zeiträume der Datenbereitstellung von GKV Routinedaten und damit
die Erhöhung der Aktualität der Ergebnisse
möglich ist und welche Voraussetzungen für eine
schnellere Datenverfügbarkeit von Daten aus einzelnen
Versorgungssektoren erfüllt sein müssen. Denkbar
wäre beipielsweise, dass zur Beantwortung von Fragen mit hoher
Public Health Relevanz ggf. (nichtgeprüfte) Daten der
Kassenärztlichen Vereinigungen (KVen) genutzt werden
könnten.
-
Bei der Etablierung kurzfristiger und niedrigschwelliger
Finanzierungsmöglichkeiten von Projekten mit akuter Public
Health Relevanz, sollte die Aufwandsentschädigung der
Dateneigner, in diesem Fall der kooperierenden gesetzlichen
Krankenversicherungen, mit bedacht werden.
-
Durch die (einfache und zeitnahe) Verknüpfung von GKV
Routinedaten und anderen Datenbestände (z. B. Meldedaten
der COVID-19, Impfinformationen, Labordaten) könnten
weiterführende Fragestellungen beantwortet werden, die als
Evidenzgrundlage für das Pandemiemanagement eine sehr hohe
Relevanz haben können. Dies gilt insbesondere für die
Ermöglichung der Verknüpfbarkeit von Impfdaten mit GKV
Daten, um die u. a. die Wirksamkeit und Sicherheit der Impfungen
im Versorgungskontext bewerten zu können.
Diskussion
Die Bearbeitung vielfältiger Fragestellungen sowie deren Verwendung und
wissenschaftliche Nutzung während der COVID-19 Pandemie reflektiert den
großen Nutzen und die umfassenden Nutzungsmöglichkeiten von GKV
Routinedaten – auch im Rahmen eines (regionalen) Pandemiemanagements.
Aufgrund ihres eindeutigen Bevölkerungs- und Personenbezugs sind GKV
Routinedaten eine verlässliche Quelle zur Prävalenzschätzung
von Risikofaktoren für einen schweren COVID-19 Verlauf oder von schweren
Erkrankungen, die als mögliche Impfnebenwirkung diskutiert werden und
für deren Prävalenz es in der Allgemeinbevölkerung keine
oder keine ausreichende Datengrundlage gibt. Das Risiko von Verzerrungseffekten wie
sie beispielweise durch Selbstselektion, Drop-out, Recall- oder Interviewerbias
entstehen könnten, kann durch die Nutzung von GKV Routinedaten insgesamt als
gering eingestuft werden [12]
[13]. Durch die Beteiligung verschiedener
Krankenkassenarten und der damit einhergehenden großen Datenbasis kommt
dieser grundsätzliche Vorteil von GKV Routinedaten in diesem Projekt
besonders zum Tragen.
Die längsschnittliche und personenbezogen Abbildung von
Krankheitsverläufen erlaubt die Nutzung von GKV Routinedaten zur
Identifikation von Risikogruppen für einen schweren COVID-19 Verlauf und von
COVID-19 assoziierten Spätfolgen (Post-COVID). Empfehlungen zur Versorgung
von Personen, die nicht unmittelbar von einer COVID-19 Infektion betroffen sind,
lassen sich aus dem Teilprojekt zur Behandlung psychiatrisch erkrankter Personen
ableiten. Die im Teilprojekt AP0 des BMBF geförderten Projektes
egePan-Unimed untersuchten Fragestellungen konnten sowohl einen Beitrag zur
Beantwortung von Fragestellungen mit direktem Bezug (z. B. Risikofaktoren
für und Folgen einer COVID-19 Infektion) als auch mit indirektem Bezug
(veränderte Versorgung von psychiatrisch erkrankten Personen) zur COVID-19
Pandemie, leisten.
Limitationen von GKV Routinedaten im Rahmen des Pandemiemanagements
Die noch breitere Nutzung von Routinedaten zur Pandemiebewältigung ist
beschränkt durch die generellen Limitationen, denen diese Daten
unterliegen [12]
[13]
[14]. Besonders hervorzuheben ist in diesem Zusammenhang die
Verzögerung, mit der die Abrechnungsdaten von ambulanten
Leistungserbringern zur Verfügung stehen. Hier können die
quartalsbezogenen Daten regelhaft erst ca. 4 bis 6 Monate nach Abschluss des
Quartals genutzt werden, so dass beispielsweise eine Leistung, die im Januar in
einer Praxis erbracht wurde, frühestens im dritten Quartal des Jahres
bei der Krankenkasse verfügbar ist. Aufgrund dessen konnten für
das Post-COVID Projekt ausschließlich Personen mit COVID-19 Infektion im
ersten Halbjahr 2020 eingeschlossen werden, um einen Nachbeobachtungszeitraum
von einem halben Jahr zu gewährleisten. Eine beschleunigte
Bereitstellung von Routinedaten zur Bearbeitung wissenschaftlicher
Fragestellungen mit akuter Public Health Relevanz wäre aus Sicht der
Autor_innen wünschenswert.
Ferner enthalten GKV Routinedaten keine klinischen Informationen über die
nach ICD-, OPS, ATC- und anderen Klassifizierungssystemen dokumentierten
Entitäten hinaus. Die Identifikation von Personen mit COVID-19 Infektion
aus den GKV Routinedaten hängt daher stark von der korrekten
Dokumentation der Erkrankung von den Leistungserbringern ab. Hinzu kommt im Fall
von COVID-19 die neue Klassifikationsziffer im ICD-Katalog, die sich erst
schrittweise etablieren musste.
Auch zur Überwachung des Impfstoffsicherheit wäre die Nutzung von
GKV Routinedaten denkbar. Wünschenswert wäre es, Informationen
zum Impfstatus und den verabreichten Impfstoffen von Personen, die in den
Impfzentren, einschließlich der bei ihnen angegliederten mobilen
Impfteams, in Arztpraxen, die nicht an der vertragsärztlichen Versorgung
teilnehmen und bei beauftragten Betriebsärzten oder die durch andere
Stellen geimpft wurden, an die gesetzlichen Krankenkassen zu
übermitteln. Aktuell liegen diese Informationen nur dem RKI vor. Das
schränkt die Nutzbarkeit der GKV Routinedaten zur Impfsurveillance und
zur Sicherheitsüberwachung der COVID-19 Impfstoffe erheblich ein. Hier
bedürfte es einer konsentierten Ergänzung der gesetzlich an die
Kostenträger zu übermittelnden Abrechnungsdaten.
Anzustreben ist die Schaffung datenschutzkonformer und praktikabel umsetzbarer
Lösungen zur Verknüpfung von GKV Routinedaten mit anderen
versorgungsnahen Daten wie Registerdaten, Klinikdaten und Daten des
öffentlichen Gesundheitsdienstes (ÖGD). Die Ergänzung
der GKV Daten um Outcomedaten und weitere klinische Daten hätte ein
großes Potenzial, um zukünftig noch verlässlichere
Evidenz in pandemischen wie auch in nicht pandemischen Zeiten aus den GKV Daten
abzuleiten.
GKV Routinedaten sind auch im Kontext des Pandemiemonitorings und der
Evidenzgenerierung zur Pandemiesteuerung eine z. B. im Vergleich zu
traditionellen Kohortenstudien schnell verfügbare und valide
Datenquelle zur Ableitung angemessener Public Health Maßnahmen.
Voraussetzung für die Bereitstellung valider Ergebnisse zur
Pandemiesteuerung unter Nutzung von GKV Routinedaten erfordert Kenntnis der
Stärken und Limitationen der Daten sowie umfassende Erfahrung in der
Aufbereitung und Analyse der Daten. Die Kooperation von
Wissenschaftler_innen an Universitäten, forschenden Instituten und
bei gesetzlichen Krankenkassen hat sich bewährt, um
bestmögliche Evidenz rasch verfügbar zu machen. Das Netzwerk
Universitätsmedizin hat einen angemessenen Rahmen geboten, um
effizient methodische Expertise mit klinischer Expertise der
Universitätsmedizin zu verbinden und so rasch drängende
Fragen zur Patientenversorgung in der COVID-19 Pandemie und zum
Pandemiemanagement beantworten zu können.