Subscribe to RSS
DOI: 10.1055/a-0962-9933
Gute Praxis Datenlinkage (GPD)
Good Practice Data LinkagePublication History
Publication Date:
08 August 2019 (online)
Zusammenfassung
Das personenbezogene Verknüpfen verschiedener Datenquellen (Datenlinkage) für Forschungszwecke findet in den letzten Jahren in Deutschland zunehmend Anwendung. Jedoch fehlen hierfür konsentierte methodische Standards. Ziel dieses Beitrages ist es, solche Standards für Forschungsvorhaben zu definieren. Eine weitere Intention ist es, dem Lesenden eine Checkliste zur Bewertung geplanter Forschungsvorhaben und Artikel bereitzustellen. Zu diesem Zweck hat eine aus Mitgliedern verschiedener Fachgesellschaften zusammengesetzte Expertengruppe seit 2016 insgesamt 7 Leitlinien mit 27 konkreten Empfehlungen erstellt. Die Gute Praxis Datenlinkage beinhaltet die folgenden Leitlinien: (1) Forschungsziele, Fragestellung, Datenquellen und Ressourcen, (2) Dateninfrastruktur und Datenfluss, (3) Datenschutz, (4) Ethik, (5) Schlüsselvariablen und Linkageverfahren, (6) Datenprüfung/Qualitätssicherung sowie (7) Langfristige Datennutzung für noch festzulegende Fragestellungen. Jede Leitlinie wird ausführlich diskutiert. Zukünftige Aktualisierungen werden wissenschaftliche und datenschutzrechtliche Entwicklungen berücksichtigen.
Abstract
Individual data linkage of different data sources for research purposes is being increasingly used in Germany in recent years. However, generally accepted methodological guidance is missing. The aim of this article is to define such methodological standards for research projects. Another aim is to provide readers with a checklist for critical appraisal of research proposals and articles. Since 2016, an expert panel of members of different German scientific societies have worked together and developed 7 guidelines with a total of 27 practical recommendations. These recommendations include (1) research aims, questions, data sources and resources, (2) infrastructure and data flow, (3) data privacy, (4) ethics, (5) key variables and type of linkage, (6) data validation/quality assurance and (7) long-term use for future research questions. The authors provide a rationale for each recommendation. Future revisions will include any new developments in science and data privacy.
-
Literatur
- 1 Swart E, Gothe H, Geyer S. et al. Gute Praxis Sekundärdatenanalyse (GPS). Leitlinien und Empfehlungen. Gesundheitswesen 2015; 77: 120-126
- 2 Hoffmann W, Latza U, Baumeister SE. et al. Guidelines and recommendations for ensuring Good Epidemiological Practice (GEP). A guideline developed by the German Society for Epidemiology. Eur J Epidemiol 2019; 34: 301-317
- 3 March S, Antoni M, Kieschke J. et al. Quo vadis Datenlinkage in Deutschland? Eine erste Bestandsaufnahme. Gesundheitswesen 2018; 80: e20-e31
- 4 Swart E, Bitzer EM, Gothe H. et al. STROSA-STandardisierte BerichtsROutine fur Sekundärdaten Analysen (STROSA) – ein konsentierter Berichtsstandard für Deutschland, Version 2. Gesundheitswesen 2016; 78: e145-e160
- 5 Elm von E, Altman DG, Egger M. et al. Das Strengthening the Reporting of Observational Studies in Epidemiology (STROBE-) Statement. Internist 2008; 49: 688-693
- 6 Vandenbroucke JP, Elm von E, Altman DG. et al. Strengthening the Reporting of Observational Studies in Epidemiology (STROBE). Explanation and elaboration. PLoS Med 2007; 4: e297
- 7 Wichmann H-E, Kaaks R, Hoffmann W. et al. Die Nationale Kohorte. Bundesgesundheitsbl 2012; 55: 781-787
- 8 Ahrens W, Jöckel K-H. Der Nutzen großer Kohortenstudien für die Gesundheitsforschung am Beispiel der Nationalen Kohorte. Bundesgesundheitsbl 2015; 58: 813-821
- 9 German National Cohort. The German National Cohort. Aims, study design and organization. Eur J Epidemiol 2014; 29: 371-382
- 10 Datenschutz-Grundverordnung. Verordnung (EU) 2016/679 des Europäische Parlaments und des Rates vom 27. April 2016 zum Schutz natürlicher Personen bei der Verarbeitung personenbezogener Daten, zum freien Datenverkehr und zur Aufhebung der Richtlinie 95/46/EG (04.05.2016). Online https://publications.europa.eu/de/publication-detail/-/publication/3e485e15-11bd-11e6-ba9a-01aa75ed71a1/language-de letzter Zugriff: 19.07.2019
- 11 Buneman P, Chapman A, Cheney J. et al. A Provenance Model for Manually Curated Data. In: Moreau L, Foster I. (Hrsg.) Provenance and Annotation of Data. International Provenance and Annotation Workshop. IPAW 2006; Chicago, IL, USA: May 3-5, 2006. Revised Selected Papers, 2006: 162-170
- 12 Bohensky MA, Jolley D, Sundararajan V. et al. Development and validation of reporting guidelines for studies involving data linkage. Aust N Z J Public Health 2011; 35: 486-489
- 13 Jacobs S, Stallmann C, Pigeot I. Verknüpfung großer Sekundär- und Registerdatenquellen mit Daten aus Kohortenstudien. Doppeltes Potenzial nutzen. Bundesgesundheitsbl 2015; 58: 822-828
- 14 Swart E, Stallmann C, Powietzka J. et al. Datenlinkage von Primär- und Sekundärdaten. Ein Zugewinn auch für die kleinräumige Versorgungsforschung in Deutschland?. Bundesgesundheitsbl 2014; 57: 180-187
- 15 Antoni M, Jacobebbinghaus P, Seth S. ALWA-Befragungsdaten verknüpft mit administrativen Daten des IAB (ALWA-ADIAB) 1975-2009. Aktualisierte Version vom 25.05.2012. FDZ Datenreport 05/2011. Nürnberg: Bundesagentur für Arbeit; 2011
- 16 Antoni M, Seth S. ALWA-ADIAB – Linked Individual Survey and Administrative Data for Substantive and Methodological Research. Schmollers Jahrbuch 2012; 132: 141-146
- 17 Czaplicki C, Korbmacher J. SHARE-RV: Verknüpfung von Befragungsdaten des Survey of Health, Ageing and Retirement in Europe mit administrativen Daten der Rentenversicherung. In Deutsche Rentenversicherung Bund. (Hrsg.) Gesundheit, Migration und Einkommensungleichheit. 2010. Aufl Berlin: Deutsche Rentenversicherung Bund; 2010: 28-37
- 18 Kajüter H, Geier AS, Wellmann J. et al. Kohortenstudie zur Krebsinzidenz bei Patienten mit Diabetes mellitus Typ 2. Record Linkage von kryptografierten Daten einer externen Kohorte mit Daten des Epidemiologischen Krebsregisters Nordrhein-Westfalen. Bundesgesundheitsbl 2014; 57: 52-59
- 19 Korbmacher JM, Czaplicki C. Linking SHARE survey data with administrative records: First experiences from SHARE-Germany. In Malter F, Börsch-Supan A. (Hrsg.) SHARE wave 4. Innovations & methodology. München: Munich center for the economics of aging; 2013: 47-52
- 20 Maier B, Wagner K, Behrens S. et al. Deterministisches Record Linkage mit indirekten Identifikatoren. Daten des Berliner Herzinfarktregisters und der AOK Nordost zum Herzinfarkt. Gesundheitswesen 2015; 77: e15-e19
- 21 March S, Rauch A, Thomas D. et al. Datenschutzrechtliche Vorgehensweise bei der Verknüpfung von Primär- und Sekundärdaten in einer Kohortenstudie. Die lidA-Studie. Gesundheitswesen 2012; 74: e122-e129
- 22 March S. Individual Data Linkage of Survey Data with Claims Data in Germany-An Overview Based on a Cohort Study. Int J Environ Res Public Health 2017; 14: 1543
- 23 Ohlmeier C, Hoffmann F, Giersiepen K. et al. Verknüpfung von Routinedaten der Gesetzlichen Krankenversicherung mit Daten eines Krankenhausinformationssystems. Machbar, aber auch “nützlich”?. Gesundheitswesen 2015; 77: e8-e14
- 24 Ohlmeier C, Langner I, Garbe E. et al. Validating mortality in the German Pharmacoepidemiological Research Database (GePaRD) against a mortality registry. Pharmacoepidemiol Drug Saf 2016; 25: 778-784
- 25 Ohmann C, Smektala R, Pientka L. et al. A new model of comprehensive data linkage – Evaluation of its application in femoral neck fracture. Z Evid Fortbild Qual Gesundhwes 2005; 99: 547-554
- 26 Swart E, Ihle P, Gothe H. et al. (Hrsg.) Routinedaten im Gesundheitswesen. Handbuch Sekundärdatenanalyse: Grundlagen. Methoden und Perspektiven. 2. Aufl Bern: Huber; 2014
- 27 Stallmann C, Ahrens W, Kaaks R. et al. Individuelle Datenverknüpfung von Primärdaten mit Sekundär- und Registerdaten in Kohortenstudien. Potenziale und Verfahrensvorschläge. Gesundheitswesen 2015; 77: e37-e42
- 28 Stang A, Jöckel K-H. Avoidance of representativeness in presence of effect modification. Int J Epidemiol 2014; 43: 630-631
- 29 Weiskopf NG, Weng C. Methods and dimensions of electronic health record data quality assessment. Enabling reuse for clinical research. J Am Med Inform Assoc 2013; 20: 144-151
- 30 Keller S, Korkmaz G, Orr M. et al. The Evolution of Data Quality. Understanding the Transdisciplinary Origins of Data Quality Concepts and Approaches. Annu Rev Stat Appl 2017; 4: 85-108
- 31 Watts S, Shankaranarayanan G, Even A. Data quality assessment in context. A cognitive perspective. Decision Support Syst 2009; 48: 202-211
- 32 March S, Swart E, Robra B-P. Können Krankenkassendaten Primärdaten verzerrungsfrei ergänzen? – Selektivitätsanalysen im Rahmen der lidA-Studie. Gesundh ökon Qual manag 2017; 104-115
- 33 Sozialgesetzbuch Zehntes Buch (SGB X) - Sozialverwaltungsverfahren und Sozialdatenschutz – (in der Fassung der Bekanntmachung vom 18. Januar 2001 (BGBl. I S. 130), das zuletzt durch Artikel 16 des Gesetzes vom 18. Dezember 2018 (BGBl. I S. 2639) geändert worden ist). Online http://www2.medizin.uni-greifswald.de/cm/fv/ship/datennutzung/ letzter Zugriff: 30.07.2019
- 34 NAKO Gesundheitsstudie. Online https://nako.de letzter Zugriff: 04.06.2019
- 35 Swart E, Thomas D, March S. et al. Erfahrungen mit der Datenverknüpfung von Primär – und Sekundärdaten in einer Interventionsstudie. Gesundheitswesen 2011; 73: e126-e132
- 36 Brown JS, Kahn M, Toh S. Data quality assessment for comparative effectiveness research in distributed data networks. Medical care 2013; 51: S22-S29
- 37 Purchase HC, Welland R, McGill M. et al. Comprehension of diagram syntax. An empirical study of entity relationship notations. Int J Hum Comput Stud 2004; 61: 187-203
- 38 Hassenpflug J, Liebs TR. Register als Werkzeug für mehr Endoprothesensicherheit. Erfahrungen aus anderen Ländern und dem Aufbau des Endoprothesenregisters Deutschland. Bundesgesundheitsbl 2014; 57: 1376-1383
- 39 Pommerening K, Drepper J, Helbing K et al. Leitfaden zum Datenschutz in medizinischen Forschungsprojekten. Generische Lösungen der TMF 2.0; 1. Aufl. 2014
- 40 March S, Rauch A, Bender S. et al. Data protection aspects concerning the use of social or routine data. FDZ-Methodenreport 12/2015. Nürnberg: Bundesagentur für Arbeit; 2015
- 41 Ihle P. Datenschutzrechtliche und methodische Aspekte beim Aufbau einer Routinedatenbasis aus der Gesetzlichen Krankenversicherung zu Forschungszwecken. Bundesgesundheitsbl 2008; 51: 1127-1134
- 42 Swart E, Stallmann C, Schimmelpfennig M. et al. Gutachten zum Einsatz von Sekundärdaten für die Forschung zu Arbeit und Gesundheit. 1. Aufl. Dortmund: Bundesanstalt für Arbeitsschutz und Arbeitsmedizin (BAuA); 2018
- 43 Deutsche Forschungsgemeinschaft. Denkschrift zur Sicherung guter wissenschaftlicher Praxis. Weinheim: Wiley-VCH; 2013
- 44 Bialke M, Bahls T, Havemann C. et al. MOSAIC – A Modular Approach to Data Management in Epidemiological Studies. Methods Inf Med 2015; 54: 364-371
- 45 Lablans M, Borg A, Ückert F. A RESTful interface to pseudonymization services in modern web applications. BMC Med Inform Decis Mak 2015; 15: 2
- 46 Schnell R, Bachteler T, Reiher J. Entwicklung einer neuen fehlertoleranten Methode bei der Verknüpfung von personenbezogenen Datenbanken unter Gewährleistung des Datenschutzes. Methoden, Daten, Analysen 2009; 203-217
- 47 Boyd J, Randall S, Ferrante AM. Application of Privacy-Preserving Techniques in Operational Record Linkage Centres. In Gkoulalas-Divanis A, Loukides G. (Hrsg.) Medical Data Privacy Handbook. Springer; 2015: 267-287
- 48 Randall SM, Ferrante AM, Boyd JH. et al. Privacy-preserving record linkage on large real world datasets. J Biomed Inform 2014; 50: 205-212
- 49 Vatsalan D, Christen P. Privacy-preserving matching of similar patients. J Biomed Inform 2016; 59: 285-298
- 50 Nonnemacher M, Nasseh D, Stausberg J. Datenqualität in der medizinischen Forschung. Leitlinie zum adaptiven Management von Datenqualität in Kohortenstudien und Registern. 2. Aufl. 2014
- 51 Sakshaug J, Antoni M. Errors in Linking Survey and Administrative Data. In Biemer PP, Leeuw EDd, Eckman S. et al. (Hrsg.) Total survey error in practice. Hoboken, New Jersey: John Wiley & Sons; 2017
- 52 Baldi I, Ponti A, Zanetti R. et al. The impact of record-linkage bias in the Cox model. J Eval Clin Pract 2010; 16: 92-96
- 53 Krawczak M, Weichert T. Vorschlag einer modernen Dateninfrastruktur für die medizinische Forschung in Deutschland. Kiel 2017
- 54 Christen P. Data Matching. Berlin, Heidelberg: Springer; 2012
- 55 Schnell R, Bachteler T, Reiher J. Private Record linkage with Bloom filters. Proceedings of Statistics Canada Symposium 2010. https://www.uni-due.de/~hq0215/documents/2010/Schnell_2010_Private_Record_Linkage_With_Bloom_Filters.pdf Zugriff am 04.06.2019
- 56 Rothman KJ, Greenland S, Lash TL. Modern Epidemiology. 3. Aufl Philadelphia: Lippincott Williams & Wilkins; 2008