Gesundheitswesen 2011; 73(12): e126-e132
DOI: 10.1055/s-0031-1280754
Originalarbeit

© Georg Thieme Verlag KG Stuttgart · New York

Erfahrungen mit der Datenverknüpfung von Primär- und Sekundärdaten in einer Interventionsstudie

Experience with the Linkage of Primary and Secondary Claims Data in an Intervention TrialE. Swart1 , D. Thomas1 , S. March1 , T. Salomon2 , O. v. d. Knesebeck3
  • 1Institut für Sozialmedizin und Gesundheitsökonomie (ISMG), Medizinische Fakultät der Otto-von-Guericke-Universität Magdeburg (Ltg. Prof. Dr. med. B.-P. Robra, M.P.H.)
  • 2Zentrum für Sozialpolitik (ZeS), Universität Bremen
  • 3Institut für Medizinische Soziologie, Sozialmedizin und Gesundheitsökonomie (IMSG), Universitätsklinikum Hamburg-Eppendorf (Ltg. Prof. Dr. O. v. d. Knesebeck)
Further Information

Publication History

Publication Date:
13 July 2011 (online)

Zusammenfassung

Die Datenverknüpfung von Primär- und Sekundärdaten wird in der Versorgungsforschung als Möglichkeit gesehen, die Vorteile beider Datenquellen synergistisch zu nutzen und dabei deren Nachteile zu überwinden. Für die Evaluation einer Intervention im Kontext eines Projekts zur Integrierten Versorgung (,Gesundes Kinzigtal‘) werden Rahmenbedingungen und Voraussetzung für eine individuelle Verknüpfung von Primärdaten (Befragungen) und Routinedaten einer gesetzlichen Krankenversicherung dargestellt. Die Hinzuziehung von Sekundärdaten erlaubt über die Evaluation der Intervention bzgl. körperlicher Aktivität, Ernährung und sozialer Teilhabe bei älteren Menschen (,AGil‘) hinaus die Analyse der Auswirkungen des Programms auf die Inanspruchnahme medizinischer Leistungen. Aus den Erfahrungen der AGil-Studie werden Empfehlungen für die Datenverknüpfung von Primär- und Sekundärdaten im Rahmen der Versorgungsforschung abgeleitet. Die Empfehlungen betreffen die Wahl geeigneter Pseudonymisierungsalgorithmen für Primär- und Sekundärdaten, das Matching-Verfahren und Ansätze zur Verringerung der Missmatches und deren Validierung sowie die rechtlichen Grundlagen einer derartigen Datenverknüpfung. Insgesamt stellt eine individuelle Verlinkung von Primär- und Sekundärdaten kein technisches Problem dar. Zwar müssen dabei eine Reihe von datenschutzrechtlichen Vorschriften beachtet werden (z. B. Verhinderung einer De-Pseudonymisierungsmöglichkeit; Sicherstellung, dass keine Studiendaten an die Krankenkasse geraten), doch zugunsten eines maximalen Erkenntnisgewinns bietet sich eine individuelle Datenverknüpfung für viele versorgungsepidemiologische Fragestellungen als Königsweg an.

Abstract

The data linkage of health-related primary and secondary data provides new opportunities for health services research. The advantages of both data sources can be used synergistically, in this way their disadvantages can be overcome. In the context of the evaluation of a health intervention – the integrated health services project (,Gesundes Kinzigtal‘) – the conditions and requirements for an individualised data linkage of primary data (survey) and claims data of a statutory health insurance are described in this paper. The integration of secondary data permits us not only to assess the intervention concerning physical activity, nutrition and social participation of elderly people (,AGil‘) but, above all, also to measure and analyse the program effects on the utilisation of health care services. Recommendations regarding the data linkage of primary and secondary data in health services research are derived from the results and experiences of the AGil study. Suggestions are made concerning the suitable pseudonymisation algorithm for primary and secondary data, the matching method, approaches to reduce mismatching and their validation, as well as the legal basis for such a data linkage. Overall, an individualised data linkage of primary and secondary data does not pose any technical problems. Nevertheless a couple of data protection rules have to be followed; the data linkage offers a high knowledge insight to many health and epidemiological research questions and might be the new gold standard for health services research.

Literatur

  • 1 Mitchell JB, Bubolz T, Paul JE. et al . Using Medicare claims for outcome research.  Med Care. 1994;  32 (7) JS38-JS51
  • 2 Wennberg JE, Roos N, Sola L. et al . Use of claims data systems to evaluate health care outcomes.  JAMA. 1987;  257 (7) 933-936
  • 3 Swart E, Ihle P. Hrsg. Routinedaten im Gesundheitswesen. Handbuch Sekundärdatenanalyse: Grundlagen, Methoden und Perspektiven. Bern: Hans Huber Verlag; 2005
  • 4 Potosky AL, Riley GF, Lubitz JD. et al . Potential for cancer related health care services research using a linked medicare-tumor registry database.  Med Care. 1993;  31 (8) 732-748
  • 5 March S, Thomas D, Rauch A. et al . Datenschutzrechtliche Vorgehensweise bei der Verknüpfung von Primär- und Sekundärdaten in einer Kohortenstudie: die lidA-Studie.  Das Gesundheitswesen (eingereicht)
  • 6 John J, Krauth C. Verknüpfung von Primärdaten mit Daten der Gesetzlichen Krankenversicherung in gesundheitsökonomischen Evaluationsstudien. Erfahrungen aus zwei KORA-Studien. In: Swart E, Ihle P Hrsg. Routinedaten im Gesundheitswesen. Handbuch Sekundärdatenanalyse: Grundlagen, Methoden und Perspektiven. Bern: Hans Huber Verlag; 2005: 215-234
  • 7 Stallmann M. Die Güte von retrospektiven Antworten aus standardisierten Befragungen am Beispiel von Eigenangaben zur medizinischen Rehabilitation.  Zeitschrift für Gesundheitswissenschaft. 1999;  7 (1) 100-115
  • 8 Andrich S, Moebus S, Jöckel K-H. Die gesundheitsökonomische Begleit­evaluation der Heinz Nixdorf Recall Studie.  Vortrag auf dem 1. AGENS-Methodenworkshop; Magdeburg, 13. März 2009; 
  • 9 Meier-Baumgartner HP, Dapp U, Anders J. Aktive Gesundheitsförderung im Alter. Stuttgart: Kohlhammer; 2006
  • 10 Hermann C, Hildebrandt H, Richter-Reichhelm M. et al . Das Modell „Gesundes Kinzigtal“ – Managementgesellschaft organisiert Integrierte Versorgung einer definierten Population auf Basis eines Einsparcontractings.  Gesundheits- und Sozialpolitik. 2006;  60 (5/6) 11-29
  • 11 Hofreuter-Gätgens K, Mnich E, Thomas D. et al . Gesundheitsförderung für ältere Menschen in einer ländlichen Region: Prozessevaluation.  Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz (zur Publikation angenommen)
  • 12 Karmel R, Rosman D. Linkage of health and age care services events: comparing linkage and event selection methods.  BMC Health services research. 2008;  8 149 DOI: (doi:10.1186/1472-6963-8-149)
  • 13 Kelman CW, Bass AJ, Holman CDJ. Research use of linked health data – a best practice protocol.  Aust NZ J Public Health. 2002;  26 (3) 251-255
  • 14 du Prel J-B, Bender S, Gilberg R. et al . Inhaltliche und methodische Aspekte einer großen Längsschnittsuntersuchung zu Alter, Arbeit und Gesundheit: Die lidA (leben in der Arbeit)-Studie.  Z Med Psychol. 2010;  19 (Sonderheft): 15
  • 15 da Silveira DP, Artmann E. Accuracy of probabilistic record linkage applied to health databases: systematic review.  Rev Saúde Pública. 2009;  43 (5) 1-7
  • 16 Blakely T, Salmond C. Probabilistic record linkage and a method to calculate the positive predictive value.  Intern J Epid:. 2002;  31 (6) 1246-1252
  • 17 Schubert I, Ihle P, Köster I. Interne Validierung von Diagnosen in GKV-Routinedaten.  Konzeption mit Beispielen und Falldefinition Das Gesundheitswesen. 2010;  72 (6) 316-322
  • 18 Kelman C, Smith L. Itâs time: record linkage – the vision and the reality.  Aust NZ J Public Health. 1999;  24 (1) 100-101
  • 19 Hoffmann W, Bobrowski C, Fendrich K. Sekundärdatenanalyse in der Versorgungsepidemiologie.  Bundesgesundheitsblatt-Gesundheitsforschung-Gesundheitsschutz. 2008;  51 (10) 1193-1201
  • 20 White KL. The ecology of medical care: origins and implications for population-based healthcare research.  Health Serv Res. 1997;  32 (1) 11-21
  • 21 Hoffmann W, Latza U, Terschüren C. Leitlinien und Empfehlungen zur Sicherung Guter Epidemiologischer Praxis (GEP) – überarbeitete Fassung nach Revision.  Das Gesundheitswesen. 2005;  65 (3) 217-225
  • 22 Swart E. Arbeitsgruppe Erhebung und Nutzung von Sekundärdaten und Arbeitsgruppe Epidemiologische Methoden.  GPS – Gute Praxis Sekundärdatenanalyse: Revision nach grundlegender Überarbeitung Das Gesundheitswesen. 2008;  70 (1) 54-60
  • 23 Retchin SM, Ballard DJ. Commentary – Establishing standards for the utility of administrative claims data.  Health Serv Res. 1998;  32 (6) 861-866
  • 24 Swart E, Heller G. Nutzung und Bedeutung der (GKV) Routinedaten für die Versorgungsforschung. In: Janssen C, Borgetto B, Heller G Hrsg. Medizinsoziologische Versorgungsforschung Theoretische Ansätze, Methoden, Instrumente und empirische Befunde. Weinheim: Juventa; 2007: 93-112
  • 25 Schubert Köster I, Küpper-Nybelen J, Ihle P. Versorgungsforschung mit GKV-Routinedaten.  Nutzungsmöglichkeiten versichertenbezogener Krankenkassendaten für Fragestellungen der Versorgungsforschung. Bundesgesundheitsblatt-Gesundheitsforschung-Gesundheitsschutz. 2008;  51 (10) 1095-1105
  • 26 Virnig B, Durham SB, Folsom AR. et al . Linking the Iowa Womenâs Health Study Cohort to Medicare data: Linkage Results and Application to Hip Fracture.  Amer Journal Epid. 2010;  172 (3) 327-333
  • 27 Bödeker W, Friedel H, Friedrichs M. et al . The impact of work on morbidity-related early retirement.  J Public Health. 2008;  16 (2) 97-106
  • 28 Lane J, Schur C. Balancing access to health data and privacy: a review of the issues and approaches for the future.  Health Serv Res. 2010;  45 (5.2) 1456-1467
  • 29 Ahrend M. Massenstart mit zweihunderttausend Teilnehmern.  Einblick. 2008;  Heft 3 14-16
  • 30 Dembski U. Neuregelungen zur ,Datentransparenz‘ Sachstand und Bewertung aus Kostenträgersicht. In: Swart E, Ihle P Hrsg. Routinedaten im Gesundheitswesen. Handbuch Sekundärdatenanalyse: Grundlagen, Methoden und Perspektiven. Bern: Hans Huber Verlag; 2005: 363-369

1 Im Prozess der Datenverknüpfung und der Entstehung dieses Artikels haben unterstützend mitgewirkt: E. Mnich und K. Hofreuter-Gätgens (UKE Hamburg), H. Rothgang (Zentrum für Sozialpolitik, Universität Bremen) H. Dold und F. Beckebans (Gesundes Kinzigtal GmbH, Haslach), B. Kähler (PrivCom Datenschutz GmbH, Hamburg), K. Gaiser (AOK Baden-Württemberg, Stuttgart). Vielen Dank.

Korrespondenzadresse

Dr. E. Swart

Institut für Sozialmedizin und

Gesundheitsökonomie

Medizinische Fakultät der

Otto-von-Guericke-Universität

Magdeburg

Leipziger Straße 44

39120 Magdeburg

Email: enno.swart@med.ovgu.de