Subscribe to RSS
DOI: 10.1055/s-0034-1386955
Datenlinkage von Routinedaten und Primärdaten
Einleitung/Hintergrund: In der Forschung werden derzeit sowohl Primär- als auch Routinedaten für Analysen verwendet, verbunden mit je spezifischen Vor- und Nachteilen der jeweiligen Instrumente und Datenkörper. Um deren Stärken synergetisch zu nutzen, bietet sich ein Datenlinkage verschiedener Quellen an [1]. Ob es sich beim Datenlikage um einen „Königsweg“ handelt, soll hier kritisch skizziert werden.
Daten/Methodik: Ausgehend von der Begriffsdefinition und der rechtlichen Einordnung des Datenlinkages werden die verschiedenen technischen Aspekte erläutert. Es werden sowohl das personenbezogene Datenlinkage mit informed consent als auch das Datenlinkage ohne informed consent vorgestellt. Beide Linkageverfahren werden kritisch diskutiert und anhand aktueller Beispiele veranschaulicht.
Ergebnisse: Bei jeder Verknüpfung von Datenquellen sind die datenschutzrechtlichen Aspekte auf deren Geltung hin zu prüfen und entsprechend anzuwenden. So ist ggf. beim personenbezogenen Datenlinkage ein schriftliches Einverständnis der Person, deren Daten verknüpft werden sollen, notwendig (informed consent) [2]. In großem Maßstab wird dies in der Nationalen Kohorte – gefördert durch das Bundesministerium für Bildung und Forschung (BMBF, Förderkennzeichen: 01ER1301A), die Helmholz-Gemeinschaft und 14 Bundesländer – angestrebt [3]. Deren Prätest zeigte, dass 94% der Befragten ihr Einverständnis gaben, ihren Befragungsdaten auf personenbezogener Ebene Krankenkassendaten und Daten der Erwerbsbiografie zuspielen zu lassen [2]. Die lidA – leben in der Arbeit – Studie (BMBF gefördert, Förderkennzeichen: 01ER0825, 01ER0826, 01ER0827 und 01ER0806) stellt ein Beispiel für ein personenbezogenes Datenlinkage ohne informed consent dar [4]. Aus Daten verschiedener gesetzlicher Krankenkassen soll hier eine Work-Health-Matrix (aggregiert nach Jahrgang, Geschlecht und Berufsangaben) erstellt werden. Diese wird auf aggregiertem Niveau den Befragungsdaten zusätzlich zugespielt [5]. Hierfür konnten mit derzeit elf Krankenkassen Verträge geschlossen werden.
Diskussion/Schlussfolgerung: Das Linkage von Primärdaten mit Routinedaten im Rahmen (versorgungs-) epidemiologischer Studien ist in Deutschland noch wenig verbreitet. Die genannten Studien haben Pioniercharakter beim Matching diverser Datenquellen miteinander. Ein Datenlinkage ist immer auch mit einem hohen organisatorischen und personellen Aufwand verbunden, der teilweise nur schwer im Vorfeld kalkulierbar ist. Dennoch eröffnet das Datenlinkage eine Vielzahl neuer Analysestrategien [2]. Die beiden Studien zeigen, dass verbreitete Skepsis bei Studienteilnehmern bzgl. des Datenlinkage überwunden und die Unterstützung der Dateneigner für derart aufwändige Studienprotokolle gewonnen werden kann.