Liebe Kolleginnen und Kollegen,liebe Leserinnen und Leser,
im Rahmen des nun bereits 3. AGENS-Supplements des Gesundheitswesens
werden wieder Beiträge zur Validierung, zum Datenlinkage
und zu methodischen Herausforderungen in der Arbeit mit
Routinedaten veröffentlicht. Bereits in einem der früheren Schwerpunkhefte
des Gesundheitswesens aus dem Jahr 2010 wurde das
Thema der internen Validierung von ambulanten Diagnosen in Routinedaten
der gesetzlichen Krankenversicherung (GKV) umfassend
beleuchtet und das sog. M2Q-Kriterium – also das Vorhandensein
von mind. zwei Quartalen mit entsprechender Diagnose innerhalb
eines Kalenderjahres - als ein wesentlicher Pfeiler für die interne
Diagnosevalidierung bzw. Plausibilisierung beschrieben [1]. Externe
Validierung von GKV-Daten mit anderen Datenquellen setzt hingegen
ein personenbezogenes Datenlinkage voraus. Obwohl bereits
seit über fünf Jahren Standards für ein Datenlinkage in
Deutschland beschrieben sind [2], existieren seit Jahren Forderungen
nach einer forschungsfreundlicheren Datenlinkageinfrastruktur
in Deutschland [3, 4]. Zumal weiterhin erschwerend hinzukommt,
dass bisher zwar Blaupausen für mögliche Infrastrukturen
zum Datenlinkage existieren, diese jedoch immer nur einmalig projektspezifisch
vorhanden sind und entsprechend bei neuen Projekten
auch erneut etabliert und datenschutzrechtlich bzw. mit allen
Beteiligten abgestimmt werden müssen.
Zum 26.03.2024 ist nun das Gesundheitsdatennutzungsgesetz
(GDNG) in Kraft getreten und es verspricht bereits im Titel eine verbesserte
Nutzung von Gesundheitsdaten
[5]. Auch das sich gerade
im Aufbau befindliche Forschungsdatenzentrum Gesundheit beim
Bundesinstitut für Arzneimittel und Medizinprodukte (BfArM) kündigt
nach mehreren Jahren des für Außenstehende nicht erkennbaren
Fortschritts die Annahme erster Nutzungsanträge in der
zweiten Jahreshälfte 2024 an [6].
Die Neuerungen könnten den Zugang
und die Nutzungsmöglichkeiten von Routinedaten im Gesundheitswesen
deutlich erleichtern und auch eine Vielzahl von
methodischen Fragestellungen beantworten. Es geht voran! Allerdings
ist gerade aus den bisherigen Erfahrungen sowohl was neue
Gesetze und deren Umsetzungen insgesamt als auch den gemeinsamen
Datenpool zur Nutzung von GKV-Routinedaten angeht, ein
gesunder Pessimismus hierzu nicht die schlechteste Grundhaltung.
Was dies letzten Endes wirklich für die Forschung bedeutet, müssen
also die nächsten Jahre zeigen. Noch wurde also keine Geschichte
gemacht! Trotzdem bleibt keine Atempause, denn es werden
weitere Anforderungen bestehen bleiben, um das Potenzial
von Routinedaten im Gesundheitswesen insgesamt sowie spezifisch
von den im Forschungsdatenzentrum Gesundheit vorhandenen
Daten ausschöpfen zu können. Dies betrifft insbesondere das
Datenlinkage. Hier ist zumindest durch das GDNG erstmalig die
Möglichkeit geschaffen worden, dass durch das Forschungsdatenzentrum
Gesundheit Daten gesetzlich geregelter medizinischer Register
verknüpfbar sind [5]. Hier spielen vor allem die klinischen
Krebsregister eine wichtige Rolle, die aber aktuell noch landesspezifisch
geregelt sind. Nicht abschließend geregelt sind dagegen die Möglichkeiten des individuellen Datenlinkage mit Primärdaten,
weswegen hier auf absehbare Zeit vor allem Erfahrungsberichte
und Lösungsansätze für Forscher:innen hilfreich sein werden. Und
so werden sich weitere Herausforderungen ergeben, sei es methodischer
Natur oder sei es beispielsweise in Bezug auf Schulungsund
Beratungsbedarf neuer Nutzergruppen. Hier kann die durch
das GDNG neu einzurichtende zentrale Datenzugangs- und Koordinierungsstelle
für Gesundheitsdaten hilfreich sein [5],
allerdings
bleiben auch hier Fragen. Insbesondere erscheint uns weiterhin unklar,
warum diese Stelle beim BfArM anzusiedeln ist, da es sich dabei
nicht um eine behördliche Aufgabe handelt und an sich prioritär
eine forschungsorientierte Umsetzung notwendig ist. Es bleibt aber
auf jeden Fall spannend, was die Zukunft hier bringt und vor allem
wann.
Vier der Beiträge in diesem Schwerpunktheft fokussieren Themen
der internen bzw. externen Validierung. In zwei Beiträgen werden
zudem die Potentiale aber auch die Grenzen des Datenlinkage
bzw. der Routinedaten herausgearbeitet. Im letzten Abschnitt wird
das Thema der Nutzung von Routinedaten in der Versorgungsforschung
aufbereitet, um den Einstieg für Forschende in diese komplexen
Daten und deren Handhabung transparenter zu gestalten.
Epping et al. thematisieren in Ihrem Betrag unterschiedliche
Aufgreifkriterien für die Prävalenzschätzung chronischer Erkrankung
anhand einer Datenquelle. Im Fokus der internen Validierung
stehen dabei bewusst nur ambulante GKV-Diagnosedaten. Insgesamt
wurden fünf Szenarien anhand von acht verschiedenen chronischen
Erkrankungen analysiert, beginnend mit einer einmaligen
Diagnosenennung im Betrachtungszeitraum eines Jahres bis hin zu
mindestens einer zweimaligen Nennung mit Blick auf den Behandlungsfall
(selber, unterschiedliche) bzw. die Quartale (unterschiedliche
[M2Q], aufeinander folgend). Als Fazit zeigt sich, dass stringentere
Vorgaben auch zu niedrigeren Prävalenzschätzungen führen.
Zudem postulieren die Autor:innen, das eher kontinuierliche
Systemnutzende identifiziert werden.
Ebenfalls mit der Thematik der Prävalenzschätzung in GKV-Daten
befassen sich Reitzle et al. in ihrem Beitrag am Beispiel der mikrovaskulären
Komplikationen des Diabetes. Analog Epping et al.
erfolgte eine interne Validierung. Im Fokus jedoch standen nicht
nur ambulante Diagnosen, sondern alle für die Thematik relevanten
Kodierungen unterschiedlicher Sektoren unterteilt in drei Kategorien.
Hierbei zeigte die Verwendung komplexerer Kodierungen
(Kategorie 3) eine höhere Prävalenz (Ausnahme diabetisches
Fußsyndrom) und konnte das M2Q-Kriterium als ausschlaggebendes
Kriterium bestätigen. Darüber hinaus wurden die Falldefinitionen
zusätzlich im Zeitverlauf analysiert. Dabei zeigte sich eine Unterschätzung
von Komplikationen in Abhängigkeit von der Länge
des Beobachtungszeitraums, mit deutlich geringeren Prävalenzen
bei kürzeren Zeiträumen.
Wicke et al. fokussieren in ihrem Beitrag die Wirkung der Grippe-impfung
anhand von GKV-Daten unter Betrachtung der Krankenhausaufenthalte
als Endpunkt. Mittels externer Validierung und
Verwendung der Methode des Prospensity Score-Matchings (PSM)
gelang es den Autor:innen die Schätzung des Robert Koch-Instituts
zu bestätigen, was sowohl die Verwendung der Datenquelle als
auch die Methode des PSM legitimiert.
Über die Evaluation von Modellvorhaben in der Psychiatrie
(EVA64-Studie) einzig anhand von GKV-Daten berichten Neumann
et al. und arbeiten die Vor- und Nachteile als Quintessenz in ihrem
Beitrag heraus. Dabei wurden Daten von ca. 70 gesetzlichen Krankenkassen
verwendet. Die Autor:innen arbeiten dabei umfassend
die Eignung von GKV-Daten heraus und deren Potenzial auch für
den Einsatz als Qualitätssicherungs- und Steuerungsgrundlage.
Nichtsdestotrotz werden zudem Limitationen aufgrund der Verwendung
von lediglich einer Datenquelle thematisiert. So können
für die Psychiatrie wichtige Aspekte der Patient:innen aber auch
Leistungserbringer wie Ressourcen, Präferenzen etc. nicht abgebildet
werden. Hierfür bedarf es zusätzlicher Datenquellen und im
optimalen Fall deren Verknüpfung (Datenlinkage), welches die
Autor:innen als Goldstandard forcieren.
Der Beitrag von Schlack et al. stellt ein umfassendes Methodenpapier
des Projektes INTEGRATE-ADHD dar. Im Rahmen des Projektes
ist eine umfassende externe Validierung der Diagnose von
ADHS bei Kindern und Jugendlichen sowohl mittels GKV-Daten als
auch mit klinischen und Befragungsdaten geplant. Dabei bedient
sich das Forscherteam der Methodik des Datenlinkages um Limitationen
der einzelnen Datenquellen zu überwinden und Synergien
zur Beantwortung dieser komplexen Fragestellung nutzen zu können.
Das Vorgehen wird in dem Beitrag ausführlich dargestellt und
unterstreicht anhand eines Praxisbeispiels das von Neumann et al.
postulierte Potenzial des Datenlinkage als Goldstandard.
Der letzte Beitrag fungiert eher auf einer Meta-Ebene. Dabei
werden in dem Beitrag von Ihle et al. fünf Leitfragen der Versorgungsforschung
ausführlich diskutiert. Diese Fragen sollen Forschende
unterstützen bei der Entscheidungsfindung und deren Beurteilung
der Eignung von GKV-Daten für forschungsrelevante Fragestellungen,
aber auch insbesondere für die Kommunikation mit
datenhaltenden Stellen. Die Fragen orientieren sich am gesamten
Forschungsprozess, beginnend mit der Formulierung der Forschungsfrage
und Definition der Zielgruppe über die Wahl des für
die Frage relevanten und realistischen Zeitraumes bis hin zur Auswahl
der benötigten Informationen und dem abschließenden Praxistransfer.
Zum Abschluss bleibt uns nur noch, Ihnen einerseits eine anregende
Lektüre zu wünschen und gleichzeitig darauf hinzuweisen:
Nach dem Schwerpunktheft ist vor dem Schwerpunktheft! Also
wenn Sie spannende Beiträge haben, können Sie jederzeit ein Manuskript
dafür einreichen und beim Hochladen ankreuzen, dass dieses
für das AGENS-Supplement bestimmt ist.
Zitierweise für diesen Artikel
Gesundheitswesen 2024 ; 86 (Suppl. 3): S183–S185. doi:
10.1055/a-2373-2600