Liebe Kolleginnen und Kollegen,liebe Leserinnen und Leser,
im Rahmen des nun bereits 3. AGENS-Supplements des Gesundheitswesens werden wieder
Beiträge zur Validierung, zum Datenlinkage und zu methodischen Herausforderungen in
der Arbeit mit Routinedaten veröffentlicht. Bereits in einem der früheren
Schwerpunkhefte des Gesundheitswesens aus dem Jahr 2010 wurde das Thema der internen
Validierung von ambulanten Diagnosen in Routinedaten der gesetzlichen
Krankenversicherung (GKV) umfassend beleuchtet und das sog. M2Q-Kriterium – also das
Vorhandensein von mind. zwei Quartalen mit entsprechender Diagnose innerhalb eines
Kalenderjahres - als ein wesentlicher Pfeiler für die interne Diagnosevalidierung
bzw. Plausibilisierung beschrieben [1]. Externe Validierung von GKV-Daten mit anderen Datenquellen setzt hingegen
ein personenbezogenes Datenlinkage voraus. Obwohl bereits seit über fünf Jahren
Standards für ein Datenlinkage in Deutschland beschrieben sind [2], existieren seit Jahren Forderungen
nach einer forschungsfreundlicheren Datenlinkageinfrastruktur in Deutschland [3]
[4]. Zumal weiterhin erschwerend
hinzukommt, dass bisher zwar Blaupausen für mögliche Infrastrukturen zum
Datenlinkage existieren, diese jedoch immer nur einmalig projektspezifisch vorhanden
sind und entsprechend bei neuen Projekten auch erneut etabliert und
datenschutzrechtlich bzw. mit allen Beteiligten abgestimmt werden müssen.
Zum 26.03.2024 ist nun das Gesundheitsdatennutzungsgesetz (GDNG) in Kraft getreten
und es verspricht bereits im Titel eine verbesserte Nutzung von Gesundheitsdaten
[5]. Auch das sich gerade im
Aufbau befindliche Forschungsdatenzentrum Gesundheit beim Bundesinstitut für
Arzneimittel und Medizinprodukte (BfArM) kündigt nach mehreren Jahren des für
Außenstehende nicht erkennbaren Fortschritts die Annahme erster Nutzungsanträge in
der zweiten Jahreshälfte 2024 an [6].
Die Neuerungen könnten den Zugang und die Nutzungsmöglichkeiten von Routinedaten im
Gesundheitswesen deutlich erleichtern und auch eine Vielzahl von methodischen
Fragestellungen beantworten. Es geht voran! Allerdings ist gerade aus den bisherigen
Erfahrungen sowohl was neue Gesetze und deren Umsetzungen insgesamt als auch den
gemeinsamen Datenpool zur Nutzung von GKV-Routinedaten angeht, ein gesunder
Pessimismus hierzu nicht die schlechteste Grundhaltung. Was dies letzten Endes
wirklich für die Forschung bedeutet, müssen also die nächsten Jahre zeigen. Noch
wurde also keine Geschichte gemacht! Trotzdem bleibt keine Atempause, denn es werden
weitere Anforderungen bestehen bleiben, um das Potenzial von Routinedaten im
Gesundheitswesen insgesamt sowie spezifisch von den im Forschungsdatenzentrum
Gesundheit vorhandenen Daten ausschöpfen zu können. Dies betrifft insbesondere das
Datenlinkage. Hier ist zumindest durch das GDNG erstmalig die Möglichkeit geschaffen
worden, dass durch das Forschungsdatenzentrum Gesundheit Daten gesetzlich geregelter
medizinischer Register verknüpfbar sind [5]. Hier spielen vor allem die klinischen Krebsregister eine wichtige
Rolle, die aber aktuell noch landesspezifisch geregelt sind. Nicht abschließend
geregelt sind dagegen die Möglichkeiten des individuellen Datenlinkage mit
Primärdaten, weswegen hier auf absehbare Zeit vor allem Erfahrungsberichte und
Lösungsansätze für Forscher:innen hilfreich sein werden. Und so werden sich weitere
Herausforderungen ergeben, sei es methodischer Natur oder sei es beispielsweise in
Bezug auf Schulungs- und Beratungsbedarf neuer Nutzergruppen. Hier kann die durch
das GDNG neu einzurichtende zentrale Datenzugangs- und Koordinierungsstelle für
Gesundheitsdaten hilfreich sein [5],
allerdings bleiben auch hier Fragen. Insbesondere erscheint uns weiterhin unklar,
warum diese Stelle beim BfArM anzusiedeln ist, da es sich dabei nicht um eine
behördliche Aufgabe handelt und an sich prioritär eine forschungsorientierte
Umsetzung notwendig ist. Es bleibt aber auf jeden Fall spannend, was die Zukunft
hier bringt und vor allem wann.
Vier der Beiträge in diesem Schwerpunktheft fokussieren Themen der internen bzw.
externen Validierung. In zwei Beiträgen werden zudem die Potentiale aber auch die
Grenzen des Datenlinkage bzw. der Routinedaten herausgearbeitet. Im letzten
Abschnitt wird das Thema der Nutzung von Routinedaten in der Versorgungsforschung
aufbereitet, um den Einstieg für Forschende in diese komplexen Daten und deren
Handhabung transparenter zu gestalten.
Epping et al. thematisieren in Ihrem Betrag unterschiedliche Aufgreifkriterien für
die Prävalenzschätzung chronischer Erkrankung anhand einer Datenquelle. Im Fokus der
internen Validierung stehen dabei bewusst nur ambulante GKV-Diagnosedaten. Insgesamt
wurden fünf Szenarien anhand von acht verschiedenen chronischen Erkrankungen
analysiert, beginnend mit einer einmaligen Diagnosenennung im Betrachtungszeitraum
eines Jahres bis hin zu mindestens einer zweimaligen Nennung mit Blick auf den
Behandlungsfall (selber, unterschiedliche) bzw. die Quartale (unterschiedliche
[M2Q], aufeinander folgend). Als Fazit zeigt sich, dass stringentere Vorgaben auch
zu niedrigeren Prävalenzschätzungen führen. Zudem postulieren die Autor:innen, das
eher kontinuierliche Systemnutzende identifiziert werden.
Ebenfalls mit der Thematik der Prävalenzschätzung in GKV-Daten befassen sich Reitzle
et al. in ihrem Beitrag am Beispiel der mikrovaskulären Komplikationen des Diabetes.
Analog Epping et al. erfolgte eine interne Validierung. Im Fokus jedoch standen
nicht nur ambulante Diagnosen, sondern alle für die Thematik relevanten Kodierungen
unterschiedlicher Sektoren unterteilt in drei Kategorien. Hierbei zeigte die
Verwendung komplexerer Kodierungen (Kategorie 3) eine höhere Prävalenz (Ausnahme
diabetisches Fußsyndrom) und konnte das M2Q-Kriterium als ausschlaggebendes
Kriterium bestätigen. Darüber hinaus wurden die Falldefinitionen zusätzlich im
Zeitverlauf analysiert. Dabei zeigte sich eine Unterschätzung von Komplikationen in
Abhängigkeit von der Länge des Beobachtungszeitraums, mit deutlich geringeren
Prävalenzen bei kürzeren Zeiträumen.
Wicke et al. fokussieren in ihrem Beitrag die Wirkung der Grippe-impfung anhand von
GKV-Daten unter Betrachtung der Krankenhausaufenthalte als Endpunkt. Mittels
externer Validierung und Verwendung der Methode des Prospensity Score-Matchings
(PSM) gelang es den Autor:innen die Schätzung des Robert Koch-Instituts zu
bestätigen, was sowohl die Verwendung der Datenquelle als auch die Methode des PSM
legitimiert.
Über die Evaluation von Modellvorhaben in der Psychiatrie (EVA64-Studie) einzig
anhand von GKV-Daten berichten Neumann et al. und arbeiten die Vor- und Nachteile
als Quintessenz in ihrem Beitrag heraus. Dabei wurden Daten von ca. 70 gesetzlichen
Krankenkassen verwendet. Die Autor:innen arbeiten dabei umfassend die Eignung von
GKV-Daten heraus und deren Potenzial auch für den Einsatz als Qualitätssicherungs-
und Steuerungsgrundlage. Nichtsdestotrotz werden zudem Limitationen aufgrund der
Verwendung von lediglich einer Datenquelle thematisiert. So können für die
Psychiatrie wichtige Aspekte der Patient:innen aber auch Leistungserbringer wie
Ressourcen, Präferenzen etc. nicht abgebildet werden. Hierfür bedarf es zusätzlicher
Datenquellen und im optimalen Fall deren Verknüpfung (Datenlinkage), welches die
Autor:innen als Goldstandard forcieren.
Der Beitrag von Schlack et al. stellt ein umfassendes Methodenpapier des Projektes
INTEGRATE-ADHD dar. Im Rahmen des Projektes ist eine umfassende externe Validierung
der Diagnose von ADHS bei Kindern und Jugendlichen sowohl mittels GKV-Daten als auch
mit klinischen und Befragungsdaten geplant. Dabei bedient sich das Forscherteam der
Methodik des Datenlinkages um Limitationen der einzelnen Datenquellen zu überwinden
und Synergien zur Beantwortung dieser komplexen Fragestellung nutzen zu können. Das
Vorgehen wird in dem Beitrag ausführlich dargestellt und unterstreicht anhand eines
Praxisbeispiels das von Neumann et al. postulierte Potenzial des Datenlinkage als
Goldstandard.
Der letzte Beitrag fungiert eher auf einer Meta-Ebene. Dabei werden in dem Beitrag
von Ihle et al. fünf Leitfragen der Versorgungsforschung ausführlich diskutiert.
Diese Fragen sollen Forschende unterstützen bei der Entscheidungsfindung und deren
Beurteilung der Eignung von GKV-Daten für forschungsrelevante Fragestellungen, aber
auch insbesondere für die Kommunikation mit datenhaltenden Stellen. Die Fragen
orientieren sich am gesamten Forschungsprozess, beginnend mit der Formulierung der
Forschungsfrage und Definition der Zielgruppe über die Wahl des für die Frage
relevanten und realistischen Zeitraumes bis hin zur Auswahl der benötigten
Informationen und dem abschließenden Praxistransfer.
Zum Abschluss bleibt uns nur noch, Ihnen einerseits eine anregende Lektüre zu
wünschen und gleichzeitig darauf hinzuweisen: Nach dem Schwerpunktheft ist vor dem
Schwerpunktheft! Also wenn Sie spannende Beiträge haben, können Sie jederzeit ein
Manuskript dafür einreichen und beim Hochladen ankreuzen, dass dieses für das
AGENS-Supplement bestimmt ist.