Schlüsselwörter Versorgungsnahe Daten - Linkage - Einwilligung - Universitätsmedizin - Versorgungsforschung - Infrastruktur
Keywords routine healthcare data - linkage - consent - university medicine - infra structure - health services research
Kontext
Das Bundesministerium für Bildung und Forschung (BMBF) fördert mit der
Medizininformatik-Initiative (MII) [1 ]
[2 ]
[3 ] und dem Netzwerk Universitätsmedizin
(NUM) [4 ]
[5 ] zwei richtungsweisende
strukturbildende Maßnahmen, die die sichere, wissenschaftlich hochwertige Nutzung
von Klinik- und Studiendaten ermöglichen. Beide Initiativen werden nun
zusammengeführt und die Datenintegrationszentren (DIZ) der MII als harmonisierte
Core Facilities für die Datenaufbereitung im NUM verstetigt [6 ]. Mit den DIZ sowie ihrer
verbindenden Strukturen wurde die Basis dafür gelegt, die Daten aus der klinischen
Routinedokumentation in den Klinikinformationssystemen für die multizentrische
Forschung innerhalb der NUM-Forschungsinfrastruktur technisch verfügbar und
nachnutzbar zu machen [7 ].
Grundlage für die regulatorisch und rechtlich sichere Nutzung der in DIZen
verfügbaren Daten ist der über die MII entwickelte bundesweit mit allen
Datenschutzaufsichtsbehörden und Ethikkommissionen abgestimmte „Broad Consent“ der
Universitätsmedizin. Das standortübergreifend einheitliche Einwilligungsformular
sieht neben der grundsätzlichen Einwilligungsmöglichkeit in die Nachnutzung von
Daten aus der klinischen Routinedokumentation mehrere zusätzliche Module vor, in die
getrennt eingewilligt werden kann [8 ].
Im so genannten Kassenmodul können die Patient:innen auch der Nutzung ihrer bei den
Krankenversicherungen gespeicherten Daten zustimmen. Diese Daten als Vertreter
versorgungsnaher Daten (VeDa) sind geeignet, das Versorgungsgeschehen und
Inanspruchnahmeverhalten komplementär zu medizinischen Klinik- und Studiendaten
abzubilden.
Für das patientenbezogene Linkage dieser sektorübergreifenden Daten mit den
detailreichen klinischen Daten der NUM und deren gemeinsame Nutzung für die
Forschung ist die derzeitige NUM/MII-Infrastruktur datenspezifisch anzupassen.
Ausgangspunkt ist die Kooperationsbereitschaft der gesetzlichen und privaten
Krankenversicherungen, die Versichertendaten an eine zentrale Datenannahmestelle des
NUM zu übermitteln. Nach Aufbereitung und Harmonisierung dieser Daten können diese
verlinkt mit den klinischen NUM/MII-Daten für die Forschung genutzt werden.
Dieser Beitrag beschreibt die Ausgangsposition und die Herausforderungen für das
Gesundheitssystem, diese Daten für die Forschung langfristig bereitzustellen. Die
hierfür notwendigen Prozesse und die Erweiterung der NUM Forschungsinfrastruktur
sind von den beteiligten Partnern, des NUM, den Krankenversicherungen und den
Forschenden gemeinsam zu erarbeiten und zu verstetigen.
Ausgangssituation
Das Gesundheitssystem steht vor großen Herausforderungen: Strukturelle und
infrastrukturelle Probleme, Fachkräftemangel, unzureichende Steuerung und
Koordination zwischen Sektoren, Fachgebieten und Berufsgruppen mit konsekutiven
Kostensteigerungen, gleichzeitig weiter steigende Versorgungsbedarfe aufgrund des
demographischen Wandels sowie ausgeprägte regionale Unterschiede und ein
Nebeneinander von Über- und Unterversorgung. So diagnostizierte der
Sachverständigenrat Gesundheit und Pflege kürzlich dem deutschen Gesundheitssystem
ein Defizit an Krisenfestigkeit (Resilienz) [9 ]. Im Bereich der empirischen Gesundheitsforschung ist Deutschland, wie
nicht zuletzt die Corona-Pandemie zeigte, derzeit im internationalen Vergleich nicht
konkurrenzfähig.
Eine wesentliche Ursache für diesen Standortnachteil in der Gesundheitsforschung wie
auch Gesundheitsversorgung sind die in Deutschland, verglichen mit unseren
Nachbarländern, deutlich eingeschränkten Möglichkeiten, Daten aus der
Gesundheitsversorgung zeitnah und anwendungsfreundlich für die Forschung nutzen zu
können. Dabei stehen auch in Deutschland sehr umfangreiche versorgungsnahe Daten
(VeDa) zur Verfügung. VeDa umfassen alle Daten, die in der administrativen
Bearbeitung von Institutionen im Gesundheitswesen entstehen und für eine sekundäre
Nutzung im Rahmen der Forschung herangezogen werden können [10 ]
[11 ]
[12 ]
[13 ]. Wesentliche Quellen von VeDa sind
neben den Daten aus Klinik- und Praxisinformationssystemen und zukünftig aus der
elektronischen Patientenakte (ePA) gemäß §§ 341ff. SGB V v. a. Routinedaten der
gesetzlichen und privaten Krankenversicherung (GKV und PKV) und Daten
krankheitsbezogener Register, beispielsweise der klinischen und epidemiologischen
Krebsregister (KKR) der Bundesländer nach §65c SGB V. Die wissenschaftlichen
Methoden und Standards für die Nutzung von VeDa und ihr Linkage mit anderen
Datenquellen sind weit entwickelt, ebenso wie die Konzepte für den sicheren Umgang
mit VeDa aus ethischer und datenschutzrechtlicher Sicht [14 ]
[15 ]. Eine Verlinkung dieser
verschiedenen Datenquellen auf Individualebene ist der entscheidende Schlüssel für
eine konsequente wissenschaftliche Nutzung dieser Daten für die
Gesundheitsforschung. Datenverfügbarkeit und Transparenz sind wichtige
Voraussetzungen, die Qualität, Sicherheit und die Kosten-Effektivität der
medizinischen Versorgung wissenschaftlich fundiert zu bewerten, evidenzbasiert zu
verbessern und auch die Resilienz unseres Gesundheitssystems zu stärken [9 ]
[16 ]. Positive Beispiele einer
personenbezogenen Verknüpfung von GKV-Daten sind beispielsweise die
NORAH-Lärmwirkungsstudie am Frankfurter Flughafen [17 ]
[18 ], die VersKiK-Studie mit
probabilistischem Linkage von GKV- und Registerdaten [19 ]
[20 ] oder eine Analyse der Wirksamkeit
der individualisierten molekularen Behandlung von Patient:innen mit
nicht-kleinzelligem Lungenkarzinom im nationalen Netzwerk Genommedizin (nNGM) [21 ].
Die in Deutschland bestehenden erheblichen datenschutzrechtlichen, regulatorischen
und organisatorischen Hürden führen jedoch dazu, dass wir trotz der immensen
Bedeutung von Gesundheit und Gesundheitsversorgung für die Bevölkerung das Potenzial
der wissenschaftlichen Nutzung von VeDa nicht annähernd so nutzen, wie dies andere
Länder schon seit Jahrzehnten tun. Prof. Gerlach, der ehemalige Vorsitzende des
Sachverständigenrats Gesundheit und Pflege, forderte deshalb anlässlich des
Digitalisierungsgutachtens: „Auch der Sachverständigenrat hält es für
unabdingbar, dass Gesundheitsdaten nicht in falsche Hände fallen. Zugleich
müssen sie in richtige Hände gelangen können. In Hände, die Leben und Gesundheit
schützen wollen“
[22 ]. Gemäß
dem Sachverständigenrat ist es daher „notwendig, Datenschutz im Gesundheitswesen
als Teil von Lebens- und Gesundheitsschutz auszugestalten, nicht als deren
Gegenteil. Datenschutz muss vor allem die sichere Nutzung von Gesundheitsdaten
für bessere Versorgung und Forschung ermöglichen“
[22 ]. Mit diesem Ansatz der Ausrichtung
am Patientenwohl könnte auch die Datensolidarität, wie sie etwa aktuell gemeinsam
von The Lancet und Financial Times gefordert wird, für die Bevölkerung
in Deutschland umgesetzt werden [23 ]
[24 ].
Hauptbarrieren der wissenschaftlichen Nutzung von VeDa in Deutschland sind aktuell
formale und operative datenschutzrechtliche Hürden. Die fehlende Harmonisierung
führt zu Mehrfachprüfungen durch einrichtungsinterne und externe Datenschützende und
zu Zuständigkeiten mehrerer Aufsichtsbehörden, die sich aufgrund unterschiedlicher
Auffassungen häufig gegenseitig widersprechen. In der Summe können diese Abläufe ein
Forschungsprojekt unmöglich machen. Eine wesentliche Ursache hierfür ist eine
Fokussierung auf theoretisch konzipierte, oftmals praxisferne Risiken, die bspw.
Forschenden ein Interesse an De-Anonymisierung unterstellt, und die dennoch häufig
ausschlaggebend für datenschutzrechtliche Entscheidungen sind. Der Nutzen durch ein
konkretes Forschungsprojekt für die Bevölkerung und die Versichertengemeinschaft
wird dagegen sehr viel niedriger priorisiert. Der regelmäßige Austausch zwischen
(Versorgungs-)forschenden und Datenschützenden findet in Deutschland derzeit nicht
auf Augenhöhe statt und ist insgesamt viel zu gering ausgeprägt.
Frau Prof. Buyx, die Vorsitzende des Ethikrates, kritisierte kürzlich, dass zu sehr
auf die Risiken und zu wenig auf den zu erwartenden gesellschaftlichen Nutzen der
Digitalisierung und Sekundärnutzung von VeDa durch die Forschung fokussiert wird
[25 ]. Dies ist auch insofern
kritisch, als das Zustandekommen von VeDa solidarisch , also v. a. aus
GKV-Mitteln und damit Beiträgen des überwiegenden Teils der deutschen Bevölkerung,
finanziert wurde. Anders als im Recht, in dem nur in Ausnahmefällen Nicht-Handeln
relevant ist (z. B. unterlassene Hilfeleistung), ist in der Ethik hingegen jedes
Nicht-Handeln prinzipiell genauso relevant wie das spiegelbildliche Handeln, sprich
begründungs- und abwägungsbedürftig. Auch und gerade aus ethischer Sicht ist es also
dringend geboten, die Potenziale aus der wissenschaftlichen Nutzung von VeDa für die
Evidenzgenerierung, Steuerung und Weiterentwicklung unserer Gesundheitsversorgung zu
heben. Die Fragestellungen, die nur bzw. besonders gut durch die wissenschaftliche
Nutzung von VeDa bearbeitet werden können, umfassen u. a. Fragestellungen zu
seltenen Erkrankungen, seltenen unerwünschten Arzneimittelwirkungen, zur
Patientensicherheit und Qualitätssicherung, Versorgungsgerechtigkeit, Abschätzung
des aktuellen und zukünftigen Versorgungsbedarfs, zur Wirtschaftlichkeit oder zu
gesundheitsökonomischen Themen, sowie zur Implementierung und zur Akzeptanz von
Versorgungsangeboten und medizinischen Innovationen [26 ]. Die wissenschaftliche Nutzung von
VeDa liegt damit im Individualinteresse ebenso wie im Kollektivinteresse der
Bürger:innen. Besonders klar wurde dies während der Corona-Pandemie, in der aufgrund
des fehlenden Zugangs zu aktuellen Routinedaten und anderer repräsentativer VeDa
gesundheitspolitische Konsequenzen etwa bzgl. der Schulschließungen nicht
rechtzeitig gezogen werden konnten und wir noch immer keine Evidenz zu wichtigen
Fragestellungen haben, wie z. B. zu den erwünschten und unerwünschten Effekten der
Corona-Impfung oder zu Folgen der eingeschränkten Krebsfrüherkennungsmaßnahmen
während der ersten Corona-Wellen [27 ]
[28 ]
[29 ].
Verknüpfung mit Routinedaten der Krankenversicherungen: Potenziale und
Herausforderungen
Verknüpfung mit Routinedaten der Krankenversicherungen: Potenziale und
Herausforderungen
Ein besonders hohes wissenschaftliches Potenzial bietet die Verknüpfung von
medizinischen und administrativen Daten aus Klinikinformationssystemen, Daten
klinischer Register und/oder personenbezogenen Studiendaten mit den Routinedaten der
Krankenversicherungen [15 ]. Aus
Forschungssicht ist es hierbei zunächst unerheblich, ob es sich um Routinedaten der
gesetzlichen oder der privaten Krankenversicherung handelt, da in beiden
Versicherungsarten die jeweils verfügbaren Abrechnungsdaten das Versorgungsgeschehen
abbilden. Bzgl. Datenzugang und Datenverfügbarkeit ergeben sich allerdings größere
Unterschiede: Die Datennutzung der gesetzlichen Krankenversicherung (GKV) zeichnet
sich durch weitgehend homogene Prozesse hinsichtlich der Abrechnungs- und
Datenübermittlungsprozesse [30 ] aus
und hat eine lange Tradition, die in die 1980er Jahre ihren Anfang nahm (eine
Übersicht zur Datennutzung findet sich in [31 ]). Zudem sind ca. knapp 90% der Bevölkerung Deutschlands
GKV-versichert. Gleichwohl sind die Abrechnungsdaten der PKV-Versicherung, bei denen
ca. 10,5% der Bevölkerung versichert sind, unter Berücksichtigung ihrer
Besonderheiten bei ihrer Entstehung und im Inhalt analog zu den GKV-Routinedaten
wissenschaftlich nutzbar, beispielsweise zur Frage der Arzneimittelversorgung bei
Privatversicherten [32 ]. Für die
Erschließung, Linkage und Nutzung der PKV-Daten kann die NAKO-Gesundheitsstudie als
Vorreiter dienen, die für ca. der Hälfte der privat versicherten Probanden die
Routinedaten aus der PKV erhält. Die in der NAKO gesammelten Erfahrungen und
entwickelten Prozesse können die Grundlage für das hier vorgestellte Vorhaben
bilden. Auch auf der rechtlichen Ebene zeigen sich Unterschiede bei der
Datennutzung: Während vor einer Nutzung von GKV-Routinedaten eine aufwändige
Antragstellung nach § 75 SGB X notwendig ist, entfällt dieser Schritt bei einer
Datenanfrage bei der PKV. Andererseits ist hier ergänzend zu einer Informierten
Einwilligungserklärung eine schriftliche Schweigepflichtentbindungserklärung
notwendig.
Unabhängig von diesen teilweise deutlichen Unterschieden wird im Weiteren allgemein
von der Nutzung der Routinedaten von beiden Krankenversicherungsarten ausgegangen,
auch deshalb, weil patientenbezogene Forschung die Grenzen der Versicherungssysteme
überwinden muss, um populationsbezogene Evidenz zu generieren. Wenn die
strukturellen oder rechtlichen Rahmenbedingungen dies erfordern, wird im Text auf
Unterschiede von GKV und PKV jeweils hingewiesen.
Das eingangs erwähnte Datenlinkage von Daten der Versorgungsdokumentation in den DIZ
und aus klinischen Studien der Universitätsmedizin mit den Routinedaten der
Krankenversicherungen ist notwendig, da keine Datenquelle allein ein vollständiges
Bild der medizinischen Versorgung zeichnet. So bilden Routinedaten sehr gut, d.h.
nahezu vollständig, unverzerrt, sektorenübergreifend und im zeitlichen Verlauf, die
verschreibungspflichtige Arzneimittelversorgung, die Versorgung mit Heil- und
Hilfsmitteln, die Inanspruchnahme der ambulanten und stationären
Gesundheitsversorgung, die im Versorgungsgeschehen dokumentierten Diagnosen,
Arbeitsunfähigkeits-Zeiten und Leistungen der Pflegeversicherung sowie Kostenaspekte
ab. Lücken bestehen in den Routinedaten hingegen etwa bezüglich der Ergebnisse
durchgeführter Untersuchungen (z. B. Labordaten, Befunde aus Bildgebung) und bei der
klinischen Phänotypisierung (Erkrankungsstadien, Schweregrade, etc.). Diese Lücke
können administrative und medizinische Klinikdaten und Registerdaten regelhaft
schließen. Studiendaten, z. B. aus Patientenbefragungen sind wiederum eine geeignete
Methode, um die in den genannten VeDa fehlende Patientenperspektive abzubilden wie
Risikofaktoren, Lebensqualität, Patient-Reported Outcome (PROMs) und Experience
Measures (PREMs). Gerade für kausale Schlussfolgerungen zu Interventionseffekten auf
Mikro-, Meso- oder Makrolevel ist daher das Linkage von komplementären Daten auf
Patientenebene der internationale wissenschaftliche Standard.
Projekte auf Basis von Routinedaten der Krankenversicherungen und insbesondere, wenn
ein Linkage mit weiteren Datenquellen für die Bearbeitung der Forschungsfrage
erforderlich ist, sind in der Regel durch aufwändige und zeitintensive Vorarbeiten
über viele Monate oft sogar mehr als ein Jahr charakterisiert, bis die Datenbasis
für die Analyse verfügbar ist. Für aktuelle, zeitkritische Planungs-, Steuerungs-
und Monitorierungsaufgaben ist jedoch eine aktuell vorgehaltene
Forschungsdateninfrastruktur erforderlich, innerhalb dieser die Daten bereitstehen
und durch abgestimmte normierte Genehmigungsverfahren, beispielsweise durch ein
abgestimmtes Use and Access Verfahren, diese verlinkten Daten zeitnah genutzt werden
können. Hier kann die im Folgenden beschriebene Forschungsdateninfrastruktur auf der
Basis einer rechtlich belastbaren individuellen Einwilligungserklärung in
Deutschland einen Quantensprung in der Nutz- und Verknüpfbarkeit ermöglichen, der
dem expliziten aufgeklärten und informierten Wunsch der Betroffenen Rechnung trägt
und allen Beteiligten, insbesondere auch den Dateneignern, enorme administrative
Aufwandsreduzierung brächte.
Ein Meilenstein ist hierbei die mit Ethikkommissionen und Datenschutzbeauftragten
konsentierte Implementierung des „Broad Consent “ der MII, mit dem
Patient:innen nach entsprechender Information ihre Einwilligung zur Nutzung der
Daten aus ihrer klinischen Versorgung für die medizinische Forschung geben können.
Der modulare „Broad Consent“ ermöglicht Patient:innen darüber hinaus im sogenannten
Kassenmodul auch die Einwilligung zur Nutzung und zum Linkage der über sie
vorliegenden Routinedaten [8 ]. Im
Nationalen Pandemie Kohorten Netz (NAPKON), einer NUM Forschungsaktivität zu
COVID-19, wurde ähnlich diesem Kassenmodul ein studienspezifischer Informed Consent
implementiert, mit dem Teilnehmende ebenfalls in das Linkage von
Long-Covid-Studiendaten mit Routinedaten einwilligen können. Sowohl „Broad Consent“
der MII als auch studienspezifischer Informed Consent wurden von den zuständigen
Ethikkommissionen positiv beschieden und sind in der Forschungspraxis
implementiert.
Die überwiegende Mehrzahl der Patient:innen willigt in die Datennutzung und das
Record-Linkage ein. Bis Mai 2024 lagen bundesweit etwa von 235.000 Patient:innen
gültige „Broad Consent“ vor, etwa 155.000 Patient:innen hatten zusätzlich in das
Kassenmodul eingewilligt. Aus den NAPKON-Kohorten liegen derzeit insgesamt rund
4.000 Studieneinwilligungen für das Verwenden von Kassendaten vor.
Jedoch ist die Einwilligung der Patient:innen und die positive Bewertung durch die
Ethikkommissionen aufgrund der beschriebenen datenschutzrechtlichen Hürden derzeit
noch nicht ausreichend, um die Daten tatsächlich wissenschaftlich nutzen zu können:
Weiterhin notwendig ist die Unterstützung durch die Krankenkassen, deren
Datenschutzprüfung, sowie die Prüfung und Genehmigung durch die für die gesetzlichen
Krankenkassen zuständigen Aufsichtsbehörden (Antrag nach § 75 SGB X zur
wissenschaftlichen Nutzung von Sozialdaten an das Bundesamt für Soziale Sicherung
(BAS) bzw. Sozialministerien der Länder). Die Situation der Krankenkassen wiederum
ist herausfordernd, weil sehr viele Anträge auf Routinedatennutzung und -linkage an
sie herangetragen werden und die Datenbereitstellung einen nicht unerheblichen
Aufwand erfordert. Gleichzeitig gehört die Unterstützung von Forschung nicht zum
gesetzlichen Auftrag der Krankenkassen. Gerade die vielen kleineren der über 90
Krankenkassen in Deutschland können die Ressourcen für die Nutzbarmachung der
GKV-Routinedaten ihrer Versicherten kaum selbst aufbringen. Zur Umsetzung des „Broad
Consent“ müssten Forschende derzeit das Genehmigungsverfahren zudem mit jeder Kasse
einzeln und für jedes Projekt erneut aushandeln, was in der Praxis für beide Seiten
nicht umsetzbar ist.
Forschende, klinisch Tätige und auch Patientenvertretungen fordern seit langem, dass
die regulatorischen Hürden insofern reduziert werden, dass bei informierter
Einwilligung mündiger Bürger:innen und Zustimmung der zuständigen Ethikkommissionen
die wissenschaftliche Nutzung der VeDa ohne weitere datenschutzrechtliche Prüfungen
ermöglicht wird [26 ]. Dass dies noch
nicht in das Gesundheitsdatennutzungsgesetz (GDNG) aufgenommen wurde, sehen wir als
Einschränkung des Rechts auf informationelle Selbstbestimmung der vielen
Patient:innen, die die wissenschaftliche Nutzung ihrer Daten ausdrücklich wünschen.
Das informationelle Selbstbestimmungsrecht bezeichnet das Recht des Einzelnen,
„selbst über die Preisgabe und Verwendung seiner persönlichen Daten zu
bestimmen“ . [33 ] Dieses Recht
hat in Deutschland das Bundesverfassungsgericht 1983 im Volkszählungsurteil als
Grundrecht anerkannt.
Die hier aufgeworfene Problematik der Missachtung des individuellen informationellen
Selbstbestimmungsrechts der Bevölkerung stellt keine hypothetische Hürde dar. Schon
in der seit 2013 laufenden und mit erheblichen Mitteln von Bund und Ländern
geförderten NAKO Gesundheitsstudie (www.nako.de), der mit 205.000 Teilnehmenden
bislang größten deutschen Kohortenstudie, wurde einerseits schnell eine sehr hohe
Bereitschaft der Teilnehmenden erkennbar, auf der Basis eines schriftlichen Informed
Consent ihre Abrechnungsdaten der Forschung zur Verfügung zur stellen
(Einwilligungsquote liegt bei rund 90 Prozent). Andererseits waren die Forschenden
durch Auflagen des Datenschutzes gezwungen, trotz dieser schriftlichen Einwilligung
mit allen gesetzlichen Krankenkassen, bei denen die NAKO-Teilnehmenden versichert
sind und mit weiteren Sozialversicherungsträgern, Anträge nach § 75 SGB X zu
stellen. Dieser immense Aufwand verzögert auch nach zehn Jahren Laufzeit noch immer
die volle Ausschöpfung des wissenschaftlichen Potenzials der NAKO, das besonders in
der Verlinkung von Primär- und Sekundärdaten liegt [34 ]. Die Möglichkeit eines Datenlinkage
ohne einen ergänzenden § 75-Antrag ergäbe einen höheren wissenschaftlichen Ertrag
bei gleichzeitig geringeren Aufwänden der datenliefernden gesetzlichen
Krankenkassen.
Zukünftig können die Routinedaten aller GKV-Versicherten im Forschungsdatenzentrum
(FDZ) Gesundheit und Daten aus der elektronischen Patientenakte (ePA) auf Antrag für
die Forschung in einer sicheren Auswertungsumgebung genutzt werden [35 ]. Die für ein personenbezogenes
Linkage und Nutzung dieser gelinkten Daten für die Forschung notwendigen Strukturen,
beispielsweise ein Identitätsmanagement, und auch die Bereitstellung von FDZ-Daten
per Export sind derzeit nicht vorgesehen [36 ]. Inwieweit die nach Gesundheitsdatennutzungsgesetz geplante
Verlinkung der FDZ-Daten mit den Daten der Krebsregister [37 ] weitergehende Möglichkeiten und
Strukturen schafft und bis wann diese umgesetzt sind, ist aktuell noch nicht
abzusehen.
Vor dem geschilderten Hintergrund streben NUM und MII eine strategische Partnerschaft
mit den gesetzlichen und privaten Krankenversicherungen an. Gemeinsam mit den
kooperierenden Krankenversicherungen soll gezeigt werden, dass in der unten
beschriebenen Forschungsinfrastruktur ein sicheres, datenschutzkonformes Linkage von
GKV- und PKV-Routinedaten mit DIZ-Daten, Studiendaten und Registerdaten durch die
wesentliche Verbesserung der medizinischen Forschungsmöglichkeiten einen hohen
Individualnutzen und Kollektivnutzen für die Patient:innen bietet. Die
Krankenversicherungen sind dabei nicht ausschließlich Datenlieferanten, sondern
gestalterische Partner bei der Realisierung und Implementierung der notwendigen
Arbeitsschritte einschließlich der wissenschaftlichen Nutzung eines
versicherungsübergreifenden Datenkörpers. Der Beitrag beschreibt im Folgenden die
dafür nötige Infrastruktur einschließlich der Datenflüsse, Prozesse und
Partizipationsmöglichkeiten.
Konzept der kooperativen Forschungsdatenplattform
Konzept der kooperativen Forschungsdatenplattform
Erklärtes Ziel ist es, innerhalb des NUM mit den darin verorteten
Datenintegrationszentren (DIZ) der MII auf der Basis des eingeführten „Broad
Consent“ und dem exemplarischen studienspezifischen Consent der
NAPKON-Kohortenstudien in einer sicheren, transparenten und partizipativen
Forschungsinfrastruktur das auf der Rechtsgrundlage der informierten
Patienteneinwilligung basierende Datenlinkage und die Nutzung der verknüpften Daten
als Musterlösung für Deutschland umzusetzen. Dazu wollen wir den hohen Wert der
verknüpften Daten exemplarisch aufzeigen. Die Forschung mit anonymisierten
GKV-Routinedaten ist nicht im Fokus der hier vorgestellten Infrastruktur. Die
Einwilligung in das Kassenmodul des „Broad Consent“ beinhaltet die Erlaubnis,
GKV-Routinedaten und PKV-Abrechnungsdaten für jeweils fünf Beobachtungsjahre vor und
nach dem Zeitpunkt der Einwilligung bei der Krankenversicherung des Versicherten
anzufordern, zu linken und zu nutzen. Bei Privatversicherten ist die Länge der
Gültigkeit der Schweigepflichtentbindung analog. Die Nutzung dieser Daten ist
insgesamt über einen Zeitraum von 30 Jahren zulässig.
Durch einen intensivierten Roll-Out des „Broad Consent“ der MII an allen
Universitätskliniken und der Kooperation der Krankenversicherungen halten wir ein
Linkage der in den DIZ verfügbaren Klinikdaten mit den Daten der
Krankenversicherungen für mindestens 1 Mio. Versicherte innerhalb von 3 Jahren für
erreichbar. Damit stünde eine Patientenkohorte zur Verfügung, die substanzielle
Analysen auch zu seltenen Erkrankungen, Ereignissen und Interventionen erlaubt.
Zur Realisierung der Verknüpfung von Klinikdaten mit Abrechnungsdaten der
Krankenversicherungen und anderen VeDa (bspw. Krebsregisterdaten) soll die
NUM-Infrastruktur um eine Datenannahme- und Aufbereitungsstelle innerhalb von
NUM-NUKLEUS (NUM Klinische Epidemiologie und Studienplattform,
https://www.netzwerk-universitaetsmedizin.de/projekte/nukleus) ergänzt werden. Die
Datenannahme- und Aufbereitungsstelle übernimmt die Schritte der
Annahme von Abrechnungsdaten von den beteiligten Krankenversicherungen
(Schritt A5a in [Abb.
1 ]),
Rückmeldung und ggf. Nachforderung fehlender Daten (Schritt A5b in [Abb. 1 ]),
Harmonisierung, Aufbereitung, Plausibilisierung der Daten und
Indikatorenbildung (Schritt A6 in [Abb. 1 ]) und
deren (vorübergehende) Speicherung/Haltung.
Abb. 1 Schaubild der Datenflüsse und Infrastruktur zum Linkage von
Abrechnungsdaten Verwendete Abkürzungen: ICU – Interaktionskern; EC –
Ethik-Koordination; BCU – Bioprobenkern; ECU – Epidemiologiekern; THS –
Treuhandstelle, DIZ – Datenintegrationszentrum; GKV – gesetzliche
Krankenversicherung; PKV – private Krankenversicherung.
Die NUM-NUKLEUS-Infrastruktur ist eine Weiterentwicklung des zentralen
Datenmanagements des Deutschen Zentrums für Herz-Kreislaufforschung (DZHK) zusammen
mit den im Rahmen von NAPKON etablierten Methodenkernen. In NUM wurde diese
Infrastruktur erfolgreich für das Datenmanagement der drei bereits etablierten
NAPKON-Kohorten verwendet.
Die NUM-NUKLEUS Infrastruktur bietet die Möglichkeit, einwilligungsbasiert
projektspezifisch an den Standorten primär erhobene Studiendaten mit klinischen
Routinedaten der Universitätskliniken, Bilddaten und Informationen aus Bioproben zu
einem einheitlichen Projektdatensatz zusammenzuführen. Die hier vorgestellte
Architektur erweitert die Linkage-Option zusätzlich um Abrechnungsdaten der
gesetzlichen und privaten Krankenversicherungen. Ein Kernelement hierfür ist die
Schaffung einer zentralen Annahme- und Aufbereitungsstelle für die Daten der
Krankenversicherung ([Abb. 1 ]).
Bei der Datenharmonisierung sind die Datenstrukturen, der Erhebungskontext sowie die
Abrechnungsmodalitäten, die für GKV- und PKV-Daten unterschiedlich sind, zu
berücksichtigen. Diese Datenkörper sind daher separat aufzubereiten und auch bei der
Auswertung sind unterschiedliche Methoden einzusetzen, die den spezifischen
Anforderungen der Daten Rechnung tragen. Die Datenannahme- und Aufbereitungsstelle
übernimmt zudem die Datenausgabe an die Datenbereitstellung in NUM (Schritt A7;
[Abb. 1 ]).
Das erforderliche Identitätsmanagement erfolgt über eine Erweiterung der vorhandenen
Treuhandstelle (Schritte A1, A2, A3, A4 in [Abb. 1 ]). Parallele Datenzusammenführungs-, Aufbereitungs- und
Ausgabeschritte erfolgen für die Klinikdaten über die DIZ und die
Datenmanagementstelle des NUM (Schritte B2, B3 in [Abb. 1 ]). Analog werden in den
Rekrutierungszentren der beteiligten Zentren im Rahmen von NUM-Studien primär
erhobene Daten in die Zentrale Datenhaltung eingegeben (Schritt B4). Koordination
und Freigabe für die Datennutzung im Rahmen von Forschungsprojekten erfolgt je nach
Art des Projektantrags und der beantragten Datenquellen durch das Deutsche
Forschungsdatenportal Gesundheit (FDPG, siehe hierzu auch nachfolgender Absatz), das
Use & Access Committee (UAC) der beteiligten NUM-Standorte und/oder das
gemeinsame UAC von NUM und Krankenversicherungen (Schritt B1 in [Abb. 1 ]), bevor der finale
Datenzuschnitt sowie eine projektspezifische Pseudonymisierung für den Datentransfer
(Schritte B5a bis B5e in [Abb. 1 ])
erfolgt. Damit wird sichergestellt, dass die administrativen und
datenschutzrechtlichen Rahmenbedingungen (UAC, Genehmigung nach §75 SGB X, Verträge
zur Datennutzung, ggfs. Ethikvotum, Passung des modularen Broad Consent) in jeder
der Nutzungsarten gewahrt sind.
Die Nutzung klinischer Behandlungsdaten und Bioproben der MII-Standorte wird über das
Deutsche Forschungsdatenportal Gesundheit (FDPG) der MII-Infrastruktur realisiert.
Seit Mai 2023 ist der Zugang für Forschende geöffnet. Die Voraussetzungen für ein
Linkage mit Kassendaten kann über automatisierte Machbarkeitsabfragen geprüft werden
(auf Basis des Kassenmoduls im „Broad Consent“). Perspektivisch soll auch die
inhaltliche Nutzung der Kassendaten zur Kohortendefinition bei Machbarkeitsabfragen
ermöglicht werden. Ein positives Ethikvotum der institutionellen
Forschungseinrichtung ist bei Antragstellung in der Regel erforderlich. Technisch
wird der projektspezifische Datensatz mit projektspezifischen Exportpseudonymen über
die Transferstelle herausgegeben.
Bei geplanten Nutzungen von Daten aus der klinischen Routineversorgung und von
Abrechnungsdaten der GKV und PKV wird das NUM Use and Access Verfahren um eine
Prüfung der Verwendbarkeit der GKV-/PKV-Daten für die jeweilige Fragestellung
ergänzt. Hierzu kann auf die aktuell im NUM-NUKLEUS aufgebaute
VeDa-Methodenkompetenz zurückgegriffen werden.
Grundsätzliches Ziel ist der Aufbau einer einheitlichen Dateninfrastruktur und die
verlinkte Datennutzung für unterschiedliche Forschungsfragen, ohne dass hierzu
jeweils projektbezogen Datenschutz- und Datenmanagement-konzepte aufwändig
erarbeitet, abgestimmt und implementiert werden müssen. Ein Datenschutz- und
Datenmanagementkonzept wird vielmehr
einmalig
erarbeitet und
etabliert, eine projektbezogene Prüfung und Anpassung wird möglichst entbehrlich.
Somit kann die vorgesehene kooperative Infrastruktur einen Leuchtturm für
Bürokratievermeidung bilden.
Den gesetzlichen und privaten Krankenversicherungen bieten wir eine privilegierte
Partnerschaft an, in deren Rahmen sie die verknüpften Daten über das Use and Access
Verfahren auch selbst nutzen können. Die Kassenzugehörigkeit der Versicherten wird
entfernt, um Einblicke in Geschäftsgeheimnisse der Krankenversicherungen von vorne
herein auszuschließen. Um den Aufwand für teilnehmende Krankenversicherungen so
gering wie möglich zu halten, schlagen wir als Datensatz die bereits bestehende
Datensatzbeschreibung vor, nach der die Krankenkassen Daten an das FDZ-Gesundheit
liefern [38 ]. Wir planen weiterhin in
Absprache mit den Krankenversicherungen definierte, einheitliche Schnittstellen und
bieten an, die gesetzlichen Krankenkassen soweit möglich bei der Erstellung und dem
Management von aktuell noch benötigten Anträgen (nach §75 SGB X) bei den
Aufsichtsbehörden und bei der Projektabwicklung zu unterstützen. Im Rahmen der
privilegierten Partnerschaft sehen wir vor, die ersten Fragestellungen gemeinsam zu
priorisieren und als Proof of Concept Studien umzusetzen.
Der Datenfluss der klinischen Versorgungsdaten erfolgt über die DIZ der beteiligten
Institutionen. Im Regelfall sind an einem Forschungsprojekt mehrere oder alle im NUM
kooperierenden Kliniken beteiligt. Die für solche Verbundprojekte notwendige
Integration der klinischen Daten bzw. Teilergebnisse föderierter Analysen aus
mehreren DIZ erfolgt in einer Datenmanagement-Stelle. Für alle Patient:innen, deren
informierte Einwilligung das Kassenmodul des „Broad Consent“ umfasst, können die
dort gespeicherten Klinikdaten mit den Daten ihrer Krankenversicherung verknüpft
werden.
Durch die Verknüpfung von Klinikdaten des NUM mit Abrechnungsdaten der
Krankenversicherungen stehen komplementäre Informationen zur Verfügung, welche
Auswertungen zulassen, die für jede Datenquelle einzeln nicht möglich wären (z. B.
Modellierung von Outcomes unter simultaner Adjustierung für diagnostische und
therapeutische Informationen aus Klinikdaten sowie der sektorübergreifenden
Behandlungshistorie aus Abrechnungsdaten und wechselseitige Validierung). Zusätzlich
kann die gleichzeitige Nutzung mehrerer Datenquellen auch zu einer Absicherung von
Evidenz dienen, welche allein aus Studien- oder Klinikdaten gewonnen wurde, etwa
durch Kontrollziehung oder Target Trial Emulations [39 ]. Letztere verbinden hohe interne
Validität mit hoher Generalisierbarkeit durch Abbildung der Routineversorgung, was
herkömmliche experimentelle Studien aufgrund restriktiver Einschlusskriterien und
Klinikdaten, bspw. durch die in der Praxis häufige Beschränkung auf den stationären
Sektor, typischerweise nicht leisten können. Auch die Einbettung von Linkagestudien
mit GKV-/PKV-Routinedaten in Klinische Prüfungen nach Arzneimittelgesetz (AMG) soll
ermöglicht werden. Damit könnten die Patientenpopulationen klinischer Studien zum
einen noch umfassender phänotypisiert werden, die Übertragbarkeit von
Studienergebnissen auf die breitere Gruppe der Versicherten könnte überprüft und
Langzeit-Outcomes auf Basis der GKV-/PKV-Daten ergänzend zu den klinischen
Endpunkten erfasst werden. Ein solches Studiendesign mit Kombination von Verfahren
der klinischen Prüfung nach AMG und Routinedatenlinkage wäre auch im internationalen
Vergleich innovativ und würde den Forschungsstandort Deutschland beflügeln. Die
vorgeschlagene Dateninfrastruktur kann solche Studien ermöglichen, was aufgrund von
Vorgaben des Arzneimittelgesetzes sog. Trusted Research Environments nicht leisten
könnten.
Insgesamt ist festzuhalten, dass ohne die Nutzung der komplementären Informationen
aus den verschiedenen Datenquellen in Analysen jeweils nur ein begrenzter Ausschnitt
der Gesundheitsversorgung bzw. der Ursachen und Wirkungen bestimmter Maßnahmen im
Gesundheitssystem analysiert werden kann. Für die gesamtheitliche und valide Analyse
von Fragestellungen der Gesundheitsversorgung ist in der zunehmend vernetzten Welt
jedoch ein möglichst breiter Blick über die verschiedenen Datenquellen hinweg
erforderlich. Evidenz für multifaktorielle Wirkmechanismen im Gesundheitswesen
können nur durch simultane Nutzung möglichst gut verlinkter komplementärer
Datenquellen abgeleitet werden. Nur so sind valide Schlussfolgerungen als
Voraussetzung für eine Translation zurück in die Routine der Gesundheitsversorgung
möglich.
Um das enorme Potenzial dieser Daten nutzen zu können, müssen Wissenschaftlerinnen
und Wissenschaftler schnell und einfach auf die Daten zugreifen und eigenständig
oder mit Unterstützung von Methodenexperten Analysen durchführen können. Derzeit ist
der Kreis der Forschenden mit ausgewiesener Expertise im Umgang mit GKV-/PKV-Daten
jedoch begrenzt. Die Bereitstellung von methodischer Expertise und von
Beratungsleistungen ist daher integraler Bestandteil der NUM Infrastruktur zur
VeDa-Nutzung. Im NUM wurde daher bereits im sogenannten Epidemiologiekern
(NUKLEUS-ECU) eine Plattform für methodische Beratung aufgebaut und Expertise zu
VeDa gebündelt. Experten aus der MII und dem NUM, Fachorganisationen wie die
Arbeitsgemeinschaft zur Erhebung und Nutzung von Sekundärdaten (AGENS) der Deutsche
Gesellschaft für Sozialmedizin und Prävention (DGSMP), Deutschen Gesellschaft für
Epidemiologie (DGEpi) und des Deutsches Netzwerk Versorgungsforschung (DNVF), das
DNVF mit seinen Arbeitsgruppen „Versorgungsnahe Daten (VeDa)“ und „Validierung und
Linkage von Sekundärdaten“ sind darüber hinaus in einer gemeinsamen AG von NUM und
MII eingebunden (Autorengruppe dieses Papiers).
Zur Qualitätssicherung und Sicherstellung der Berücksichtigung der Guten Praxis
Sekundärdatenanalyse wird eine kontinuierliche projektbezogene methodische Beratung
durch Expertinnen und Experten der NUKLEUS-ECU angeboten. Die Beratung durch die ECU
umfasst dabei 2 Schritte:
In der Planungsphase bietet die ECU eine allgemeine Methodenberatung zu den
Besonderheiten im Umgang mit GKV-/PKV-Routinedaten und deren Analyse an. Für
Personen ohne eigene Vorerfahrungen in der Analyse von GKV-/PKV-Routinedaten
ist die allgemeine Methodenberatung für die Beantragung von Daten für eigene
Forschung beim FDPG und den zuständigen UAC der NUM-Standorte dringend
empfohlen.
Eine Beratung durch die ECU erfolgt fakultativ nach Genehmigung der
Datennutzung im zuständigen Use and Access Prozess. Diese kann entweder
durch die antragstellenden Forschenden oder durch die für
Datenharmonisierung, Plausibilisierung und Indikatorenbildung zuständigen
Expert:innen der Datenannahme- und Aufbereitungsstelle initiiert werden.
Letzteres sollte der Fall sein, wenn im bereitgestellten
GKV-/PKV-Routinedatenkörper Besonderheiten bestehen, die bei der Analyse
beachtet werden müssen (z. B. sensitive und spezifische
Falldefinitionen).
Vorgesehene Maßnahmen und nächste Schritte
Vorgesehene Maßnahmen und nächste Schritte
Im Sinne der avisierten privilegierten Partnerschaft mit Krankenkassen und
-versicherungen werden wir die Partizipation der beteiligten Kassen und
Versicherungen an den Daten und Ergebnissen ermöglichen. Konkret bedeutet dies, dass
Kassen und Versicherungen auch berechtigt werden, Datennutzungsanträge für
Forschungsprojekte zu stellen und etwa auch Beteiligungen bei Publikationen
vorgesehen sind. Perspektivisch streben wir neben der Partnerschaft mit Vertretern
der GKV auch die Integration von privaten Krankenversicherungen an. Zur Begleitung
dieses für den Forschungs- und Medizinstandort Deutschland aus unserer Sicht
richtungsweisenden Datenlinkage-Projektes halten wir die Einrichtung einer
High-Level-Group aller Akteure (Kassen, Hochschulmedizin, Aufsichtsbehörden, etc.),
koordiniert insbesondere durch die AG externe Daten der NUM und MII für geboten. Die
Gruppe erarbeitet und konkretisiert in der Implementierungsphase die vorgeschlagenen
Prozesse und unterstützt das Ziel, durch ein sicheres Datenlinkage und eine
forschungsermöglichende Dateninfrastruktur einen wesentlichen Nutzen für Individuen
und die ganze Gesellschaft zu erbringen.
Die Zusammenführung und Nutzung von Daten aus heterogenen Quellen und diversen
Institutionen ist der Schlüssel zum Fortschritt und zur Weiterentwicklung im
Gesundheitswesen. Der dabei geschaffene Mehrwert zeichnet sich vor allem dadurch
aus, dass:
durch die Zusammenführung von komplementären Daten die Patientensicherheit
sowohl individuell als auch krankheits- und kohortenspezifisch
evidenzbasiert verbessert werden kann,
der Zugang zu komplementären Daten somit eine deutlich höhere systemische
Resilienz ermöglicht, insbesondere bei der Bewertung und dem Management von
epidemischen und pandemischen Krisensituationen,
der notwendige Umbau des Gesundheitssystems hin zu mehr Transparenz,
Effizienz und Outcome-Orientierung empirisch unterstützt und begleitet
werden kann.
Um dies zu erreichen, schaffen NUM und MII gemeinsam eine sichere, praktikable und
kooperative Forschungsinfrastruktur zur wissenschaftlichen Nutzung verlinkter
Informationen aus GKV- und PKV-Routinedaten, klinischen Versorgungsdaten der DIZe
und Daten aus Beobachtungs- und Interventionsstudien. Vor dem Hintergrund der
derzeitigen, wenig forschungsfreundlichen gesetzlichen Rahmenbedingungen werben wir
bei gesetzlichen Krankenkassen und privaten Krankenversicherungen um die
Unterstützung des Vorhabens und bieten eine Beteiligung auf Augenhöhe im Sinne einer
privilegierten Partnerschaft an. Wir möchten so aufzeigen, dass die
wissenschaftliche Nutzung gelinkter VeDa und Studiendaten auf Basis der informierten
Einwilligung mündiger Bürger:innen entscheidenden Nutzen für die Verbesserung der
Versorgungsqualität und Patientensicherheit liefert. Hierbei ist es entscheidend,
dass die verschiedenen Interessengruppen nicht gegeneinander und konkurrierend,
sondern in Kooperation diese notwendigen Schritte gemeinsam angehen.
Die Forschungsinfrastruktur der MII und des NUM stellt die unterschiedlichen
patientenbezogenen Daten – Klinikdaten und VeDa – aufbereitet, harmonisiert und
verlinkt für Forschungsanfragen zur Verfügung. Der primäre Vorteil ergibt sich aus
der Mehrfachnutzung. Aufwändige und jeweils projektspezifische Abstimmungs- und
Implementierungsprozesse entfallen. Mehrfachnutzung fördert auch die Validität und
Belastbarkeit der Daten im Hinblick auf die Forschungsfrage. Die Bereitstellung von
Beratungsservices zur Beantragung und Auswertung der Daten fördert die Effizienz und
die Qualität der vernetzten Forschung. Die bereits gravierende Situation in Bezug
auf die eingeschränkte Wettbewerbsfähigkeit des Forschungsstandorts Deutschland, die
geringe Resilienz des deutschen Forschungs- und Gesundheitsversorgungssystems und
die sich zuspitzenden Probleme in der Gesundheitsversorgung mit Fachkräftemangel,
fehlender Steuerung, Nebeneinander von Über-, Unter- und Fehlversorgung,
strukturellen Mängeln sowie eine immer weniger auskömmliche Finanzierung gebieten
ein hohes Tempo bei der Umsetzung der vorgeschlagenen Maßnahmen, um somit auch die
internationale Anschlussfähigkeit hochwertiger medizinscher Forschung herzustellen
und zu stärken.
*Mitglieder der Arbeitsgruppe
*Mitglieder der Arbeitsgruppe
Andreas Baumgart (Universitätsklinikum Münster), Johannes Bickenbach
(Universitätsklinikum Aachen), Rainer Blaser (Klinikum rechts der Isar TU München),
Martin Boeker (Klinikum rechts der Isar TU München), Felix Dreyer (Universität
Bielefeld), Joachim Fischer (Medizinische Fakultät Mannheim der Universität
Heidelberg), Timo Fuchs (Universitätsklinikum Regensburg), Thomas Ganslandt
(Friedrich-Alexander-Universität Erlangen-Nürnberg), Ana Grönke (Universität Köln),
Alexander Hapfelmeier (Klinikum rechts der Isar der TU München), Dirk Hellwig
(Universitätsklinikum Regensburg), Elisa Henke (Medizinische Fakultät Carl Gustav
Carus TU Dresden), Christina Jäger-Schmidt (Medizinische Fakultät Mannheim der
Universität Heidelberg), Thomas Koss (Universitätsklinikum Heidelberg), Frank Kramer
(Universität Augsburg), Torsten Leddig (Universitätsmedizin Greifswald), Markus
Löffler (Universität Leipzig), Gabriele Müller (Universitätsklinikum Dresden),
Tobias Niedermaier (Ludwig-Maximilians-Universität München), Hans-Ulrich Prokosch
(Friedrich-Alexander Universität Erlangen-Nürnberg), Editha Räuscher (TMF e.v.
Berlin), Ulrich Sax (Universitätsmedizin Göttingen), Josef Schepers (Berliner
Institut für Gesundheitsforschung in der Charité), André Scherag
(Universitätsklinikum Jena), Fabian Siegel (Universität Heidelberg), Jens Weidner
(Universitätsklinikum Dresden), Samira Zeynalova (Universität Leipzig)
Hinweis
Dieser Artikel wurde gemäß des Erratums vom 31.01.2025
geändert.
Erratum
Im oben genannten Artikel wurden Institutsangaben angepasst.