Subscribe to RSS
DOI: 10.1055/a-1036-6364
Methodische Herausforderungen bei der Nutzung von Daten von mehr als 70 gesetzlichen Krankenkassen – Ein Werkstattbericht aus der EVA64-Studie
Methodological Challenges when Using Claims Data of more than 70 Statutory Health Insurances – A Progress Report from the EVA64 StudyKorrespondenzadresse
Publication History
Publication Date:
21 January 2020 (online)
Zusammenfassung
Ziel der Studie Die angemessene und bedarfsgerechte Betreuung psychisch erkrankter Patienten stellt besondere Anforderungen an die psychiatrische Versorgung. §64b SGB V eröffnet die Möglichkeit, psychisch Erkrankte durch multiprofessionelle, behandlungsphasen- und sektorenübergreifende Modellvorhaben zu betreuen und neue Finanzierungsformen zu implementieren. Diese Modellprojekte werden seit 2015 in einer prospektiven und retrospektiven sekundärdatenbasierten kontrollierten Kohortenstudie (EVA64) evaluiert.
Methode Im September 2016, und seitdem jährlich, erfolgte erstmalig die Datenbereitstellung aller an der Evaluation beteiligten gesetzlichen Krankenversicherungen (GKV) auf der Basis einer konsentierten Datensatzbeschreibung. Für die spätere Analyse sind die eindeutige Identifikation des Indexaufenthaltes und die Zuordnung zu Modell- oder Kontrollgruppe von Bedeutung. Die methodischen Herausforderungen der Datenbereitstellung durch die Dateneigner, das Einlesen, die formale und inhaltliche Prüfung sowie die anschließende Zusammenführung zu einem Auswertedatensatz werden ausführlich diskutiert und Fallstricke aufgezeigt.
Ergebnisse Insgesamt wurden bislang Daten von 71 Krankenkassen berücksichtigt. In jeweils 20 Tabellen pro Kasse wurden Leistungsdaten zur vertragsärztlichen, ambulanten und stationären Versorgung im Krankenhaus (inkl. Psychiatrische Insti-tutsambulanzen [PIA]), Arznei- und Heilmittelversorgung sowie Arbeitsunfähigkeit übermittelt. Nicht alle Tabellen konnten von den Krankenkassen vollständig gefüllt werden. Zudem bedingen neue inhaltliche Aspekte u. a. die Anpassung der Datenselektion. Trotz mehrmaliger Datenlieferungen kann noch nicht von einem Routinevorgehen gesprochen werden.
Schlussfolgerung Die kassenübergreifende Nutzung von Abrechnungsdaten zahlreicher GKVen im Rahmen einer Evaluationsstudie stellt eine große Herausforderung dar. Angesichts fehlender Richtwerte für Auffälligkeiten und Implausibilitäten war eine a-priori Festlegung von Prüfalgorithmen nur bedingt möglich; diese müssen vielmehr im Projektverlauf fortlaufend aktualisiert werden. Die resultierende individuelle Prüfung der Daten aller Krankenkassen gestaltet sich dadurch sehr aufwändig. Die ausführliche Dokumentation dieser Prüfprozesse und möglicher Fallstricke gibt Hilfestellung für zukünftige vergleichbare Studien.
#
Abstract
Aim of the study The adequate and need-based medical care of mentally ill patients places special demands on psychiatric care. The §64b Social Code Book (SGB) V enables mentoring mentally ill people through multiprofessional, cross-sectoral model projects across the treatment phase and implementing new forms of financing. These model projects have been evaluated in a prospective and retrospective claims data-based controlled cohort study (EVA64) since 2015.
Methods In September 2016 and since then annually, the data transfer of all statutory health insurance funds (SHI) involved in this evaluation took place for the first time on the basis of a consented data set description. For later analysis, the clear identification of the index hospital admission and the assignment to the model or control group are important. The methodological challenges of data provision by the data owner, the formal and content-related data preparation as well as the subsequent establishing of an evaluation data set are discussed in detail.
Results So far, data from 71 SHI has been taken into account. In each case 20 tables with claims data from outpatient and inpatient care (including psychiatric institute outpatient departments [PIA]), drug and medical supplies as well as data from incapacity to work and personal data of the insurees. Not all tables could be filled completely by the SHIs. In addition, updates of the study designs require the adaptation of the data selection process. Even though data sets have been delievered regularly the data preparation process is still not routine.
Conclusion The scientific use of claims data of numerous SHIs in the context of an evaluation study represents a great challenge. In the absence of reference values for abnormalities and implausibilities, an a priori determination of test algorithms was limited; instead they had to be updated every year. The individual examination of the data of all health insurance companies remains very complex. The detailed documentation of these algorithms provides support for future comparable studies.
#
Hintergrund
Integrative Versorgungsansätze für psychisch Erkrankte sind in der Gesundheitsversorgung von zentraler Bedeutung [1]. Die Erkrankten bedürfen einer angemessenen Versorgung, die besondere Anforderungen an sektorenübergreifende Versorgungsstrukturen stellt. Mit dem im Jahr 2012 in Kraft getretenen §64b Sozialgesetzbuch (SGB) V ist es möglich, psychisch Erkrankte durch multiprofessionelle, behandlungsphasen- und sektorenübergreifende Modellvorhaben zu betreuen. Ebenso können neue Finanzierungsformen implementiert werden. Sektorale Grenzen in der Versorgung sollen überwunden sowie ambulante, alternative Angebote gefördert werden. Das Setting der Behandlung (stationär, teilstationär, ambulant) hat dabei keinen Einfluss auf das Gesamtbudget, um ökonomische Fehlanreize zu vermeiden (§64b SGB V, [2]). Laut §65 SGB V [2] haben Krankenkassen (KK) oder ihre Verbände „eine wissenschaftliche Begleitung und Auswertung der Modellvorhaben […] nach allgemeinen anerkannten wissenschaftlichen Standards zu veranlassen“. Anstelle einer Einzelevaluation nach KK und Modellvorhaben haben sich 94 gesetzliche Krankenversicherungen (GKV) und ihre Verbände zusammengeschlossen, um alle 18 Modelle (Stand: 2016) einheitlich evaluieren zu lassen [3]. Die kassenübergreifende Evaluation sollte dabei allein auf anonymisierten Abrechnungsdaten der beteiligten KK basieren.
Nach einem öffentlichen Ausschreibungsverfahren erhielt das Bieterkonsortium (Auftragnehmer [AN]), bestehend aus dem Zentrum für evidenzbasierte Gesundheitsversorgung (ZEGV) am Universitätsklinikum Carl Gustav Carus Dresden, dem Wissenschaftlichen Institut für Gesundheitsökonomie und Gesundheitssystemforschung (WIG2) in Leipzig und dem Institut für Sozialmedizin und Gesundheitssystemforschung (ISMG) der Otto-von-Guericke-Universität Magdeburg, den Zuschlag, die Modellvorhaben gegenüber der Regelversorgung zu evaluieren.
Die Zuständigkeit für die Erschließung und Aufbereitung der GKV-Leistungsdaten und deren anschließende Weiterleitung an die Projektpartner zur wissenschaftlichen Auswertung obliegt dem ISMG. Im Rahmen dieses Werkstattberichtes sollen die methodischen Herausforderungen der Datenbereitstellung durch die Dateneigner, das Einlesen, die formale und inhaltliche Prüfung sowie die anschließende Zusammenführung zu einem Auswertedatensatz ausführlich diskutiert und Fallstricke aufgezeigt werden. Die Ausführungen sollen Beteiligten in ähnlich gelagerten Projekten Hinweise und Empfehlungen aufzeigen, welche Absprachen frühzeitig mit den Dateneignern getroffen werden und welche Prozesse und Strukturen in die Phasen der Datenaufbereitung und -validierung bei Sekundärdatennutzern zur Vermeidung häufiger Fehler implementiert werden sollten.
#
Methodik
Studiendesign
Die wissenschaftliche Evaluation der 18 Modellvorhaben erfolgt seit 2015 in einer prospektiven und retrospektiven sekundärdatenbasierten kontrollierten Kohortenstudie. Kliniken, die bis 31.12.2016 als Modellklinik gemäß §64b SGB V einen Vertrag mit einer oder mehreren GKVen des Konsortiums der Auftraggeber (AG) abgeschlossen haben [4], bilden die Gruppe der jeweiligen Modellkliniken, aus denen die Interventionsgruppe (IG) je Modell gebildet wird. Diese sollen mit strukturähnlichen Kliniken der Regelversorgung verglichen werden, die als Kontrollkliniken (KG) fungieren. Die primären Ziele von Modellprojekten zur Versorgung psychisch Erkrankter gemäß §64b SGB V sind bei Neumann et al. [5] beschrieben.
Um entsprechende Matchingpartner auf patientenindividueller Ebene zu ermitteln, werden vorab für jede Modellklinik bis zu zehn Kontrollkliniken für die Analyse ausgewählt. Mittels eines definierten Algorithmus basierend auf Merkmalen der standardisierten Qualitätsberichte der Kliniken nach §137 SGB V und auf sozioökonomischen raumbezogenen INKAR-Daten des Bundesinstituts für Bau-, Stadt- und Raumforschung (INKAR: Indikatoren und Karten zur Raum- und Stadtentwicklung) wurden die am besten passenden strukturell ähnlichen Kontrollklinken je Modellklinik bestimmt [6].
#
Einschlusskriterien und Datenbasis
Es werden alle Patienten, sowohl Kinder, Jugendliche als auch Erwachsene, die innerhalb von vier Jahren nach Modellbeginn in einer Modellklinik bzw. einer gematchten Kontrollklinik (inkl. der zugehörigen Psychiatrischen Institutsambulanzen [PIA]) aufgrund der in [Tab. 1] definierten Erkrankungen in einer psychiatrischen Fachabteilung oder PIA versorgt werden, inkludiert [5]. Maßgeblich für die Selektion ist das Vorliegen einer stationären Hauptdiagnose oder im Falle einer PIA einer gesicherten oder Zustand-nach-Diagnose ([Tab. 1]). Die Zuordnung zur IG bzw. KG erfolgt nach dem Intention-to-treat-Ansatz. Dies bedeutet, dass die erstmalige Behandlung (Referenzfall) nach Modellvorhabenbeginn die Zuordnung der Patienten zu einer der beiden Gruppen bestimmt.
ICD |
Diagnose |
|
---|---|---|
1 |
F00 |
Demenz |
2 |
F01 |
Vaskuläre Demenz |
3 |
F02 |
Demenz bei anderenorts klassifizierten Krankheiten |
4 |
F03 |
Nicht näher bezeichnete Demenz |
5 |
F07 |
Persönlichkeits- und Verhaltensstörung aufgrund einer Krankheit, Schädigung oder Funktionsstörung des Gehirns |
6 |
F10 |
Psychische und Verhaltensstörungen durch Alkohol |
7 |
F20–F29 |
Schizophrenie, schizotype und wahnhafte Störungen |
8 |
F30–F39 |
Affektive Störungen |
9 |
F43 |
Reaktionen auf schwere Belastungen und Anpassungsstörungen |
10 |
F45 |
Somatoforme Störungen |
11 |
F40–F48 |
Neurotische, Belastungs- und somatoforme Störungen |
12 |
F50 |
Essstörungen |
13 |
F60.31 |
Spezifische Persönlichkeitsstörungen vom Typ Borderline |
14 |
F70–F79 |
Intelligenzstörung |
15 |
F84 |
Tiefgreifende Entwicklungsstörungen |
16 |
F90–F98 |
Verhaltens- und emotionale Störungen mit Beginn in der Kindheit und Jugend |
Für die selektierten Versicherten wird durch die GKV ein Referenzdatum bestimmt, das das Datum der erstmaligen voll- oder teilstationären Behandlung in einer Modell- oder Kontrollklinik darstellt. Ausgehend von diesem wird versichertenindividuell ein zweijähriger Prä-Zeitraum berechnet [5].
Des Weiteren werden versichertenindividuell alle Leistungen der folgenden Versorgungssektoren (SGB V) selektiert, die in diesem Präzeitraum und/oder nach Erstbehandlung bis zur jeweiligen Datenziehung erbracht wurden: vertragsärztliche und stationäre (KH) bzw. ambulante Krankenhausbehandlungen (AMBO), Arznei- und Heilmittelverordnungen, Arbeitsunfähigkeit. Dies erfolgt unabhängig von der jeweiligen Einschlussdiagnose ([Abb. 1] und [2]).
Die Evaluierung der Modellprojekte umfasst einen Zeitraum von fünf Jahren nach jeweiligem Beginn des Modellvorhabens, um für alle Patienten ein mindestens einjähriges Follow-up zu gewährleisten. Maßgeblich für den Einschluss der Leistungen ist das jeweilige Behandlungsende abgeschlossener Fälle. Leistungen, die nur quartalsgenau ohne ein exaktes Erbringungsdatum dokumentiert sind, werden ausgewählt, wenn das zugehörige Quartal noch ganz oder teilweise im zweijährigen Prä-Zeitraum bzw. im Post-Zeitraum liegt.
#
Datenaufbereitung
94 GKVen und ihre Verbände sind Kooperationspartner dieses Projekts [3] und haben der Datenübermittlung und wissenschaftlichen Nutzung ihrer Daten zugestimmt. Das bedeutet, dass alle Verfahrensvorschriften einerseits die Vielfalt der internen Daten- und IT-Strukturen anerkennen sollten. Jedoch mussten andererseits möglichst exakte Festlegungen bzgl. Datenselektion und -übermittlung getroffen werden, um den Aufwand bei Entgegennahme und Aufbereitung möglichst gering zu halten. Die Festlegungen der ausführlichen und in mehrfachen Terminen mit den IT-Verantwortlichen der verschiedenen GKVen konsentierten Datensatzbeschreibung (DSB) können hier nur skizziert werden.
-
Es mussten zunächst Einschlusskriterien für die Selektion der Patienten bzw. der Versicherten festgelegt und operationalisiert werden. Dies betrifft die diagnosebezogenen Aufgreifkriterien bzgl. der 16 Indexdiagnosen ([Tab. 1]) und deren späteren Erweiterung ([Tab. 2]), die Festlegung der Modellkliniken und pro Modell bis zu zehn Kontrollkliniken sowie die Definition, was eine Behandlung in einer Fachabteilung für Psychiatrie, Kinder- und Jugendpsychiatrie bzw. Psychosomatik bedeutet. Nicht eingeschlossen wurden Patienten, die mit einer relevanten Diagnose in einer somatischen Fachabteilung aufgetreten sind, z. B. Suchtpatienten mit einer Akutbehandlung in einer Abteilung für innere Medizin.
-
Weiterhin mussten patientenbezogen Festlegungen zur Bestimmung des sog. ‚Referenzfalls‘, also der erstmaligen Behandlung in einer Modell- bzw. Kontrollklinik nach Beginn des Modellversuchs, getroffen werden. Diese Festlegungen enthielten Regelungen, welcher Fall bei zeitlich nahe beieinander liegenden oder sich überschneidenden Behandlungen als Referenzfall zu selektieren ist. Das ist bedeutsam, weil der Ort der Referenzbehandlung die Zuordnung zur IG oder KG für die Laufzeit der Evaluation beeinflusste, unabhängig von weiteren Behandlungen im Studienverlauf.
-
Besondere Beachtung bei der Festlegung der Datensatzstruktur verdienen Daten aus der hausarztzentrierten Versorgung. Diese sind in der Datenlieferung enthalten und über eine separate Variable identifizierbar. Dennoch liegen nicht alle Informationen zu den darin erbrachten Leistungen vor.
Die Identifikation der Versicherten entsprechend der selektierten Ein- und Ausschlusskriterien sowie ihrer Leistungsdaten aus den verschiedenen Leistungssektoren entsprechend (1) bis (3) erfolgen durch die einzelnen KK.
-
Bedeutsam war weiterhin die Definition der sog. Kassen-Modell-Matrix. Diese Matrix gibt an, welche Krankenkassen an welchen Modellvorhaben (und deren Evaluation) beteiligt sind. Diese Matrix steuert bei späteren Analysen die weitere Definition von Analyseteildatensätzen, denn bei den modellspezifischen Evaluationen werden nur Daten von kontrahierten und an der Evaluation beteiligten KK berücksichtigt. Es gibt Modelle mit einer Vielzahl von KK als Vertragspartner und gleichzeitig aber auch Modelle, die nur eine Vertrags-KK besitzen. Dadurch reduziert sich die Anzahl der tatsächlich datenliefernden KK entgegen den eigentlichen Vertrags-KK.
Hauptdiagnose zzgl. Bezeichnung |
nur in Verbindung mit Sekundärdiagnose |
||
---|---|---|---|
1a |
B22 |
Krankheiten infolge HIV-Krankheit |
F02.8 |
1b |
G20.0 |
Parkinson-Syndrom |
F02.3 |
1c |
G30.0 |
Alzheimer-Krankheit mit frühem Beginn |
F00.0 |
1d |
G30.1 |
Alzheimer-Krankheit mit spätem Beginn |
F00.1 |
1e |
G30.8 |
Sonstige Alzheimer-Krankheit |
F00.2 |
1f |
G30.9 |
Alzheimer-Krankheit, nicht näher bezeichnet |
F00.9 |
1g |
G31.0 |
Umschriebene Hirnatrophie |
F02.0 |
1h |
G31.8 |
Sonstige näher bezeichnete degenerative Krankheiten des Nervensystems |
F02.8 |
1i |
G91.29 |
Normaldruckhydrozephalus, nicht näher bezeichnet |
F02.8 |
Die Festlegung der Kassen-Modell-Matrix erfolgt durch das ISMG ausweislich der kassen- und modellspezifischen Kopfzahlmeldungen, die vertraglich festgelegt jährlich von den Kliniken an die AN zu liefern sind und angeben, wie viele Versicherte der einzelnen KK in den Modellen behandelt wurden. Da nicht von allen KK Versicherte in den Modellen behandelt wurden und aufgrund u. a. von Kassenfusionen nach Abschluss des Kooperationsvertrags, reduzierte sich die Zahl der in die Evaluation einbezogenen Kassen von 94 auf 71.
Die DSB enthält ebenfalls Festlegungen zum Zeitpunkt der Datenlieferungen und zum sicheren Datentransfer der selektierten Daten an das ISMG sowie Festlegungen bzgl. der Rückmeldungen an die datenliefernden Stellen. Die AG und der Landesdatenschutzbeauftragte des Landes Sachsen-Anhalt haben dieser Datensicherheitsstruktur zugestimmt. Die Ethikkommission der Medizinischen Fakultät der Universität Magdeburg hat die Beschreibung von Studiendesign und Datenschutzarchitektur zur Kenntnis genommen. Eine Prüfung war aufgrund der Verwendung von anonymen Daten nicht notwendig.
#
Datenschutzrechtliche Vorgaben
Unter datenschutzrechtlichen Aspekten werden anonymisierte Daten deutlich von pseudonymisierten Daten unterschieden [7]. Der Vorteil von pseudonymisierten Daten ist, dass über mehrere Jahre Daten geliefert und – unter Verwendung des identischen Pseudonyms für ein und dieselbe Person – im Längsschnitt über regelmäßige Ergänzungslieferungen zusammengeführt werden können. Die Nutzung anonymisierter Daten im Rahmen von Forschungsvorhaben benötigt dagegen keine Genehmigung der jeweiligen Aufsichtsbehörden [7] [8]. In der Diskussion dieser Vor- und Nachteile verständigten sich AG und AN auf die Verwendung anonymisierter Daten im gesamten Projektverlauf.
Dieses Vorgehen verhindert die sonst weit verbreiteten Add-on-Lieferungen. Es erfordert stattdessen bei der jährlich vereinbarten Datenlieferung eine Komplettlieferung aller Daten mit entsprechend sich wiederholenden Prozessen des Einlesens, Prüfens, Zusammenspielens und Aufbereitens für die wissenschaftlichen Analysen. Diese jährliche Datenlieferung ist notwendig, weil für jede der 18 Modelle zwei Zwischen- und ein Endbericht vereinbart sind und jedes Jahr demzufolge mehrere Berichte mit jeweils aktuellen Daten erstellt werden müssen.
In der konkreten Umsetzung bedeutet dies:
-
Sensible Stammdaten sind nur hoch aggregiert verfügbar (z. B. Geburtsjahr).
-
Stammdaten werden lediglich zu einem Stichtag für die jeweilige Datenlieferung zur Verfügung gestellt.
-
Mit jeder neuen Lieferung muss die Historie der Stammdaten der letzten Datenlieferungen ebenfalls zur Verfügung gestellt werden.
-
Versichertenzeiten liegen nicht taggenau vor, sondern werden zum Stichtag berechnet als Prä- und Posttage relativ zum Referenzdatum (Aufsummierung der Tage). Somit ist eine Berechnung von Personentagen unter Risiko nur bedingt möglich.
-
Die jährliche Neulieferung jeweils aller Daten führt zu einem kontinuierlichen Anstieg der jährlichen Datenmengen mit dem damit verbundenen zunehmenden Aufwand für das periodische Dateneinlesen und -aufbereiten. Die Verwendung von Algorithmen ist dabei zwingend notwendig, setzt aber die Einhaltung der konsentierten Datenformate voraus.
-
Eine Vergleichbarkeit neuer mit alten Daten ist nur bedingt möglich, da neue Anonyme verwendet werden und eine Plausibilisierung dadurch erschwert wird. Matchingpaare müssen bei jeder Lieferung neu gebildet werden.
-
Die KK als Dateneigner müssen Wege finden, bereits gelieferte Daten für die nächsten Datenlieferungen, teilweise auch über die gesetzlich zulässigen Aufbewahrungsfristen hinaus, den AN weiterhin zur Verfügung stellen zu können, z. B. über eine „Containerlösung“ (Speicherung aller bereits gelieferten Daten).
-
Bei Fusionen müssen Datenbestände auch rückwirkend zusammengeführt werden, was bei der Verwendung von unterschiedlichen Systemen zu einer Herausforderung werden kann.
-
Bei der Aufbereitung der Daten gilt das Prinzip des kleinsten gemeinsamen Nenners. Das heißt, wenn Angaben einzelner KK fehlen, hat dies Auswirkungen auf alle KK und bedingt ein Abweichen von ggf. vorab definierten Analyseschritten. Dies betrifft Arbeiten der Kooperationspartner in Dresden und Leipzig und kann hier nicht weiter thematisiert werden.
#
#
Ergebnisse
Nach Aufbereitung der 2018 gelieferten Daten liegen Angaben zu 1 715 231 Versicherten aus Modell- und Kontrollkliniken vor. Die Zahl der Versicherten pro KK reicht von n=309 942 bis n=5. Auf die fünf größten Kassen entfallen 65% der selektierten Versicherten, auf die zehn größten bereits 91%. Bei mehr als 70 beteiligten KK müssen jährlich 1400 Datentabellen standardisiert eingelesen und geprüft werden.
Im Folgenden wird auf Erfahrungen aus dem Datenaufbereitungs- und Validierungsprozess eingegangen.
Soziodemografische Angaben in KK-Daten
KK-Daten verfügen nur bedingt über soziodemografische Angaben. Neben Alter und Geschlecht können hierfür die Angaben des neunstelligen Tätigkeitskennzeichens herangezogen werden, das in dieser Form zum 30.11.2011 eingeführt worden ist. In diesem sind neben der aktuell ausgeführten Tätigkeit u. a. auch Angaben zur Schul- und Berufsbildung enthalten [9]. Die Validität des Tätigkeitskennzeichens wird derzeit kontrovers diskutiert [vgl. 10].
Auch wenn dieses Tätigkeitskennzeichen bereits seit 2011 in Deutschland im Rahmen der Meldung zur Sozialversicherung verpflichtend ist, stellen sich im Rahmen der EVA64-Studie die folgenden Herausforderungen:
-
Rentner, die bereits in 2011 verrentet waren, besitzen diesen neuen Tätigkeitsschlüssel nicht. Der alte fünfstellige Tätigkeitsschlüssel ist meist nicht mehr verfügbar und nur bedingt mit dem neuen neunstelligen Tätigkeitskennzeichen kompatibel [8].
-
Ähnliches gilt für familienversicherte Personen.
-
Diese Angaben stehen nur für Mitglieder zur Verfügung.
-
Für die Patienten mit einer psychischen Diagnose, die nur teilweise erwerbstätig sind, liegen diese Angaben nur in 50–70% der Studienpopulation vor.
Weitere versichertenbezogene Angaben wie die vierstellige Postleitzahl des Wohnortes, der Versichertenstatus, Pflegestufe bzw. Pflegegrad, Krankengeldberechtigung und Erwerbsunfähigkeitsstatus (samt Datum) wurden jeweils zum Zeitpunkt der Datenextraktion aus den Stammdaten ermittelt. Es liegt somit eine stichtagsbezogene, aber keine kontinuierliche Versichertenhistorie vor. Angaben zu Krankengeld und Erwerbsunfähigkeit konnten dann nicht von allen Krankenkassen bzw. ihren IT-Dienstleistern geliefert werden, wenn diese Angaben nicht im routinemäßigen Datentransfer enthalten sind.
#
Änderungen der Ein- und Ausschlusskriterien
Im Laufe des Projektes musste die im Vorfeld definierte Liste der Modell- und Kontrollkliniken erweitert und zusätzlich z. B. einige PIAs und Tageskliniken ergänzend aufgenommen werden. Der Herausforderung regionaler Besonderheiten in der Versorgung wurde mit einer Erweiterung der eingeschlossenen Institutionen begegnet. Datentechnisch bedeutet dies, dass lediglich die eindeutigen Institutskennzeichen der Modell- und Kontrollkliniken unverschlüsselt überliefert werden. Diese Liste der Kliniken musste somit entsprechend erweitert werden.
Zusätzlich zeigte sich im Laufe des Projektes eine Untererfassung der Demenzdiagnosen. Laut dem Kodiermanual Demenz ist die Kodierung der Demenz über eine somatische Symptomdiagnose und eine ätiologische Zuordnung vorgesehen [11]. Der Einschluss von lediglich (psychischen) F-Diagnosen wird dieser Vorgabe nicht gerecht und es mussten für Demenz weitere Diagnosekombinationen aus Haupt- und Sekundärdiagnosen als Indexdiagnosen eingeführt werden. Daher wurde die Liste der 16 Indexdiagnosen ([Tab. 1]) um die folgenden demenzrelevanten Diagnosen ([Tab. 2]) ergänzt.
Die Erweiterung der Einschlusskriterien, sowohl bezogen auf die Aufgreifkriterien der Demenz als auch der unverschlüsselten Liste der Modell- und Kontrollkliniken, konnte nicht bei allen beteiligten KK zeitgleich umgesetzt werden, bedingt u. a. durch kassenspezifische Besonderheiten. Erschwerend kommt hinzu, dass die von einigen Kassen gewählte Containerlösung (s. o.) den Nachteil besitzt, dass Änderungen von Einschlusskriterien nur noch für Folgelieferungen berücksichtigt werden können.
#
Fusionen Krankenkassen
Die Zahl der KK hat sich in den letzten Jahren stark reduziert [12]. Aktuell (Stand 13.05.2019) existieren noch 109 KK, Tendenz fallend [13]. Auch bei den beteiligten KK der EVA64-Studie kommt es zu Fusionen. Im besten Fall finden diese innerhalb einer Datenfamilie statt, d. h. dass die KK dieselbe IT-Infrastruktur verwenden, die eine Zusammenführung der Datenbestände erleichtert. Dennoch kommt es im Projekt zu Teillieferungen fusionierter KK, was den Aufwand erneut erhöht. Auch bei fusionierten Datenbeständen von zuvor getrennt gelieferten Daten steigt der Prüfaufwand, da aufgrund der bewusst gewählten anonymen Datenstruktur und möglichen Versichertendubletten in Teildatenbeständen nur bedingt ein Vergleich mit den Vorjahren möglich ist. Zudem können ggf. Historien der Stammdaten nicht vollständig geliefert werden. Bei Fusionen familienfremder KK, z. B. der BARMER mit der Deutschen BKK, steigt der Aufwand der Datenzusammenführung und kann sich über einen längeren Zeitraum erstrecken. Zudem können systembedingt Datenlücken entstehen. Die Überprüfbarkeit solcher fusionierter Datensätze ist nur bedingt möglich, da u. a. die KK-Merkmale nicht mehr enthalten sind und die lebenslange individuelle Krankenversicherungsnummer nach Fusion kassenspezifisch unterschiedlich anonymisiert wird.
#
Anzahl Krankenkassen
Die EVA64-Studie kooperiert mit knapp ¾ der in Deutschland existierenden gesetzlichen KK. Dies bringt Vor- und Nachteile mit sich, so kann EVA64 auf z. B. viele verschiedene Versicherte zurückgreifen. Demgegenüber sind einheitliche Absprachen teils schwer möglich, da unterschiedliche Strukturen bei den KK vorherrschen. Dies hat zur Folge, dass Anpassungen nur in festen Zeitfenstern und mit großem zeitlichem Vorlauf möglich sind. Insgesamt sind auch nach mehrjähriger Projektlaufzeit persistierende Kassenbesonderheiten bei der Datenlieferung und -aufarbeitung zu beachten.
#
#
Diskussion
Die Art der Zusammenarbeit (AG = Konsortium aus einer Vielzahl von KK-Vertretern), die Form der Evaluation und v. a. der Einzug so einer großen Zahl von KK stellt ein Novum bei der Analyse und Evaluation von Versorgungsstrukturen und -prozessen dar. Damit ergeben sich bezogen auf die Power der Analysen und der Übertragbarkeit auf die Gesamtheit gesetzlich versicherter psychisch Erkrankter neue Potenziale bei der späteren inhaltlichen Bewertung der Modellverfahren.
Gleichwohl ist trotz gesetzlicher Vorgaben bezüglich der Datenübermittlung an die Kostenträger eine große Vielfalt hinsichtlich der kasseninternen Speicherung und Verarbeitung der Leistungsdaten zu beobachten, was die Ausschöpfung dieses Potenzials erschwert. Insgesamt ist in einer wissenschaftlichen Kooperation mit mehreren GKVen eine sorgfältige Planung und möglichst Standardisierung der Prozesse der Datenbereitstellung und -übermittlung gefordert. Für die entsprechenden Absprachen mit der Fach- und IT-Ebene der KK sind ausreichende zeitliche Kapazitäten und Vorlaufzeiten vorzusehen. In dieser Planungsphase sind nach Möglichkeit Aspekte der späteren Datenaufbereitung und -validierung zu antizipieren. Änderungen in einer DSB während des Projektverlaufs sind nur aufwändig und ohne Gewähr auf eine komplette Umsetzbarkeit möglich.
Als Zwischenfazit für die EVA64-Studie kann gesagt werden, dass trotz mehrjähriger Laufzeit nicht von Routine bei der Datenentgegennahme und -aufbereitung gesprochen werden kann. Jede Datenlieferung erfordert wieder neue, nicht vorhersehbare Herausforderungen, wie bspw. durch KK-Fusionen, denen nur bedingt durch eine Verständigung auf eine gemeinsame DSB begegnet werden kann. Es fehlen bislang Vergleichswerte, die für eine Validierung herangezogen werden können und selbst Vergleiche mit Vorjahren sind durch kassenspezifische Änderungsprozesse nur begrenzt durchführbar. Diese anhaltenden kassenseitigen Optimierungsprozesse haben naturgemäß Auswirkungen auf nachgelagerte Prozesse wie die Übermittlung der aufbereiteten Daten an die Projektpartner und die dort folgenden Analysen und Berichterstattungen mit der Folge, dass a-priori festgelegte Analyseschritte ebenfalls der stetigen Überprüfung bedürfen.
Als konkrete Handlungsempfehlungen für das (Daten-)Management bei derartigen kassenübergreifenden (Evaluations-)Studien lassen sich formulieren:
-
Die DSB muss unter Einbeziehung sowohl der Fach- als auch der IT-Verantwortlichen (Datenlieferer, Datenbearbeiter und Auswerter) konsentiert vor der ersten Datenlieferung festgelegt werden. Vereinbaren Sie frühzeitig, unter welchen Bedingungen Anpassungen der DSB auch im Projektverlauf möglich sind.
-
Vereinbaren Sie nach Möglichkeit eine Testdatenlieferung durch alle beteiligten Kassen rechtzeitig vor der ersten regulären Datenlieferung.
-
Wichtig ist die frühzeitige und abschließende Festlegung von Ein- und Ausschlusskriterien unter Berücksichtigung einschlägiger Dokumentationsvorschriften. Es ist unbedingt darauf zu achten, dass alle Kassen diese Kriterien einheitlich und vollständig umsetzen. Von einzelnen Kassen nicht lieferbare Informationen führen möglicherweise zu einem Powerverlust bzw. können nicht ausgewertet werden und können dadurch Ursache von Verzerrungen sein.
-
Dokumentieren Sie die Aufbereitungsschritte kassenspezifisch und kassenübergreifend sowie die schrittweise Reduzierung der Fallzahlen nach Anwendung von Ein- und Ausschlusskriterien.
-
Vereinbaren Sie konkrete Rückkopplungsschleifen zwischen den Nutzern der aufbereiteten Daten einerseits und zu den datenliefernden Stellen andererseits, um Auffälligkeiten, die erst bei der Datenanalyse auftreten, an die Kassen in Vorbereitung der nächsten Datenlieferung zu kommunizieren.
-
Planen Sie ausreichend Zeit ein für Datenaufbereitung und -validierung sowie Rückkopplungsschleifen bei fehlerhaften oder unvollständigen Datenlieferungen. Eine Reduzierung der Ressourcen im Projektverlauf wird sich nicht zwangsläufig einstellen.
Dem zentralen Problem der unterschiedlichen, teilweise historisch bedingten Kassenbesonderheiten kann langfristig nur mit einem Forschungsdatenzentrum (FDZ) für KK-Daten entgegen gewirkt werden analog anderer Sozialversicherungsträger wie der Bundesagentur für Arbeit oder der Rentenversicherung [8] [12] [14] [15]. Nur so kann eine kassenübergreifende Datenbankstruktur erreicht werden, die eine konstante und datenschutzkonforme Datenbasis für eine Vielzahl von Kassen langfristig bereithält. Die im Rahmen der Datentransparenzverordnung an das Deutsche Institut für Medizinische Dokumentation und Information (DIMDI) gelieferten Daten des morbiditätsorientierten Risikostrukturausgleichs können wegen inhaltlicher Begrenzungen (z. B. keine vertragsärztlichen Einzelleistungen oder ambulante Leistungen am Krankenhaus, keine Identifizierbarkeit einzelner Leistungserbringer), der zeitlichen Verzögerungen bis zur Übermittlung an das DIMDI und der aktuellen Probleme bei der zeitnahen Bearbeitung von Nutzungsanträgen die Anforderungen an ein FDZ der GKV (noch) nicht erfüllen.
Es gibt keine Routine mit Routinedaten. Auch in einem mehrjährigen Projekt mit regelmäßigen Datenlieferungen auf der Basis einer a-priori-konsentierten DSB wird der Aufwand für Datenprüfung und -aufbereitung im zeitlichen Verlauf kaum geringer. Vielmehr muss auch in EVA64 von einem „lebenden, lernenden und sich ständig weiterentwickelnden System“ gesprochen werden, das keine starren Strukturen über die Zeit vorhält, sondern einem technischen, rechtlichen, personellen und organisatorischen Wandel im Laufe der Zeit unterliegt. Angestrebte ressourcensparende Effekte durch Nutzung bewährter und im Projektverlauf fortgeschriebener Algorithmen werden durch die Änderungen von Rahmenbedingungen und die Dominanz primärer kassenspezifischer Prozesse verringert bzw. komplett ausgeglichen.
Diese Problematik sollte bei größeren Forschungsprojekten unter Einbeziehung vieler Kassen bei der Planung berücksichtigt werden.
#
#
Interessenkonflikt
ZEGV, WIG2 und ISMG werden im Rahmen der EVA64-Studie, der Bundesweit einheitlichen Wissenschaftlichen Evaluation von Modellprojekten nach §64b SGB V, finanziert. Die Förderung dieser Studie erfolgt von einem Konsortium bestehend aus den nachfolgenden Gesetzlichen Krankenkassen (Stand Mai 2019, nachfolgende Änderungen werden nicht berücksichtigt; eine aktuelle Liste findet sich unter [13]): actimonda krankenkasse; AOK Nordost – Die Gesundheitskasse für Berlin, Brandenburg und Mecklenburg-Vorpommen; AOK Rheinland/Hamburg – Die Gesundheitskasse; AOK PLUS – Die Gesundheitskasse für Sachsen und Thüringen; AOK NORDWEST – Die Gesundheitskasse; AOK – Die Gesundheitskasse in Hessen; AOK – Die Gesundheitskasse für Niedersachsen; AOK Bayern – Die Gesundheitskasse; AOK Sachsen-Anhalt – Die Gesundheitskasse; AOK Bremen/Bremerhaven – Die Gesundheitskasse; AOK Rheinland-Pfalz/Saarland – Die Gesundheitskasse; AOK Baden-Württemberg; Audi BKK; BAHN-BKK; BARMER (fusioniert mit der Deutschen BKK zum 01.01.2017); Bertelsmann BKK; Betriebskrankenkasse der BMW AG (BMW BKK); Betriebskrankenkasse der MTU Friedrichshafen GmbH (BKK MTU); Betriebskrankenkasse Herford Minden Ravensburg (BKK HMR); Betriebskrankenkasse Mobil Oil; BKK Achenbach Buschhütten; BKK Aesculap; BKK Akzo Nobel; BKK B. Braun Melsungen AG; BKK BPW Bergische Achsen KG; BKK der Maschinenfabrik und Eisengießerei Meuselwitz (BKK MEM); BKK Deutsche Bank AG; BKK_DürkoppAdler; BKK evm; BKK EWE; BKK exklusiv; BKK Faber-Castell & Partner; BKK firmus; BKK GILDEMEISTER SEIDENSTICKER; BKK Groz-Beckert; BKK Herkules; BKK KRONES; BKK Linde (fusioniert mit der HEAG BKK zum 01.01.2016); BKK MAHLE; BKK Melitta Plus; BKK Pfaff; BKK Pfalz (fusioniert mit der BKK Vital zum 01.01.2018); BKK ProVita (fusioniert mit der BKK family zum 01.01.2016); BKK PwC; BKK Rieker Ricosta Weisser; BKK Scheufelen; BKK Schwarzwald-Baar-Heuberg (BKK SBH); BKK Stadt Augsburg; BKK Technoform; BKK VDN; BKK Verkehrsbau Union (BKK VBU) (fusioniert mit der Vereinigten BKK zum 01.01.2017 und mit der BKK DEMAG KRAUSS-MAFFEI, der BKK Schleswig-Holstein sowie der BKK Basell zum 01.01.2016); BKK VerbundPlus; BKK Voralb HELLER LEUZE TRAUB; BKK Werra-Meissner; BKK Wirtschaft und Finanzen; BKK Würth; BKK ZF & Partner; Bosch BKK; Brandenburgische BKK; Continentale Betriebskrankenkasse; DAK-Gesundheit (fusioniert mit der BKK Beiersdorf zum 01.07.2016); Daimler Betriebskrankenkasse; Debeka Betriebskrankenkasse; Deutsche Rentenversicherung Knappschaft-Bahn-See; DIE BERGISCHE KRANKENKASSE; Die Schwenninger Krankenkasse; energie-BKK (fusioniert mit der E.ON BKK zum 01.01.2017); Ernst & Young BKK; HEK – Hanseatische Krankenkasse; hkk; IKK Südwest; IKK classic; Kaufmännische Krankenkasse – KKH; Merck BKK; mhplus Betriebskrankenkasse (fusioniert mit der Metzinger BKK zum 01.01.2019); Novitas BKK; pronova BKK (fusioniert mit der BKK Braun-Gillette zum 01.01.2017); R+V BKK; SBK Siemens-Betriebskrankenkasse; SIEMAG BKK; SKD BKK; Sozialversicherung für Landwirtschaft, Forsten und Gartenbau; Südzucker BKK; Techniker Krankenkasse (TK); Thüringer Betriebskrankenkasse (TBK); Vaillant BKK; VIACTIV Krankenkasse (alter Name BKK vor Ort, Namensänderung per 01.01.2016); Wieland BKK; WMF Betriebskrankenkasse.
-
Literatur
- 1 Deister A. Erlösqualität optimieren. f&w 2015; 248-251
- 2 Sozialgesetzbuch Zehntes Buch (SGB X) – Sozialverwaltungsverfahren und Sozialdatenschutz - (Fassung der Bekanntmachung vom 18.01.2001 (BGBl. I S. 130), zuletzt durch Artikel 1a des Gesetzes vom 10.07.2018 (BGBl. I S. 1117) geändert). Online: https://www.gesetze-im-internet.de/sgb_10/BJNR114690980.html Stand: 13.05.2019
- 3 Lehmann G, Bührig S, Schmidt H. et al. Überzeugende Versorgungsverträge?. f&w 2015; 538-542
- 4 Garre P. Tapetenwechsel mit Tücken. Gesundheit und Gesellschaft 2016; 19: 31-35
- 5 Neumann A, Swart E, Häckl D. et al. The influence of cross-sectoral treatment models on patients with mental disorders in Germany. Study protocol of a nationwide long-term evaluation study (EVA64). BMC Psychiatry 2018; 18: 139
- 6 Petzold T, Neumann A, Seifert M. et al. Auswahl geeigneter Kontrollkliniken für die Durchführung der bundesweiten und einheitlichen Evaluation von Modellvorhaben nach § 64b SGB V. Analyse von Daten der Strukturierten Qualitätsberichte. Gesundheitswesen. 2019; 81: 63-71
- 7 March S, Rauch A, Bender S et al. Data protection aspects concerning the use of social or routine data. FDZ Methodenreport 12/2015. Bundesagentur für Arbeit, Nürnberg. Online: http://doku.iab.de/fdz/reporte/2015/MR_12-15_EN.pdf Stand: 13.05.2019
- 8 Swart E, Stallmann C, Schimmelpfennig M. et al. Gutachten zum Einsatz von Sekundärdaten für die Forschung zu Arbeit und Gesundheit. 1. Aufl Dortmund: Bundesanstalt für Arbeitsschutz und Arbeitsmedizin; 2018
- 9 Damm K, Lange A, Zeidler J. et al. Einführung des neuen Tätigkeitsschlüssels und seine Anwendung in GKV-Routinedatenauswertungen. Bundesgesundheitsbl 2012; 55: 238-244
- 10 March S, Iskenius M, Hardt J. et al. Methodische Überlegungen für das Datenlinkage von Primär- und Sekundärdaten im Rahmen arbeitsepidemiologischer Studien. Bundesgesundheitsbl 2013; 56: 571-578
- 11 Zentralinstitut für die Kassenärztliche Versorgung in Deutschland. Demenz. Zi-Kodier-Manual (2015). Online: https://www.zi.de/fileadmin/images/content/PDFs_alle/Kodiermanual_Demenz.pdf Stand: 13.05.2019
- 12 March S, Powietzka J, Stallmann C. et al. Viele Krankenkassen, Fusionen und deren Bedeutung für die Versorgungsforschung mit Daten der Gesetzlichen Krankenversicherung in Deutschland – Erfahrungen aus der lidA-(leben in der Arbeit)-Studie. Gesundheitswesen 2015; 77: e32-e36
- 13 GKV Spitzenverband. Krankenkassenliste. Online: http://www.gkv-spitzenverband.de/service/versicherten_service/krankenkassenliste/krankenkassen.jsp; Stand: 13.05.2019
- 14 March S, Rauch A, Thomas D et al. Datenschutzrechtliche Vorgehensweise bei der Verknüpfung von Primär- und Sekundärdaten in einer Kohortenstudie. Die lidA-Studie. Gesundheitswesen 2012; 74: e122–e129
- 15 March S. Individual Data Linkage of Survey Data with Claims Data in Germany-An Overview Based on a Cohort Study. IJERPH 2017; 14: 1543
Korrespondenzadresse
-
Literatur
- 1 Deister A. Erlösqualität optimieren. f&w 2015; 248-251
- 2 Sozialgesetzbuch Zehntes Buch (SGB X) – Sozialverwaltungsverfahren und Sozialdatenschutz - (Fassung der Bekanntmachung vom 18.01.2001 (BGBl. I S. 130), zuletzt durch Artikel 1a des Gesetzes vom 10.07.2018 (BGBl. I S. 1117) geändert). Online: https://www.gesetze-im-internet.de/sgb_10/BJNR114690980.html Stand: 13.05.2019
- 3 Lehmann G, Bührig S, Schmidt H. et al. Überzeugende Versorgungsverträge?. f&w 2015; 538-542
- 4 Garre P. Tapetenwechsel mit Tücken. Gesundheit und Gesellschaft 2016; 19: 31-35
- 5 Neumann A, Swart E, Häckl D. et al. The influence of cross-sectoral treatment models on patients with mental disorders in Germany. Study protocol of a nationwide long-term evaluation study (EVA64). BMC Psychiatry 2018; 18: 139
- 6 Petzold T, Neumann A, Seifert M. et al. Auswahl geeigneter Kontrollkliniken für die Durchführung der bundesweiten und einheitlichen Evaluation von Modellvorhaben nach § 64b SGB V. Analyse von Daten der Strukturierten Qualitätsberichte. Gesundheitswesen. 2019; 81: 63-71
- 7 March S, Rauch A, Bender S et al. Data protection aspects concerning the use of social or routine data. FDZ Methodenreport 12/2015. Bundesagentur für Arbeit, Nürnberg. Online: http://doku.iab.de/fdz/reporte/2015/MR_12-15_EN.pdf Stand: 13.05.2019
- 8 Swart E, Stallmann C, Schimmelpfennig M. et al. Gutachten zum Einsatz von Sekundärdaten für die Forschung zu Arbeit und Gesundheit. 1. Aufl Dortmund: Bundesanstalt für Arbeitsschutz und Arbeitsmedizin; 2018
- 9 Damm K, Lange A, Zeidler J. et al. Einführung des neuen Tätigkeitsschlüssels und seine Anwendung in GKV-Routinedatenauswertungen. Bundesgesundheitsbl 2012; 55: 238-244
- 10 March S, Iskenius M, Hardt J. et al. Methodische Überlegungen für das Datenlinkage von Primär- und Sekundärdaten im Rahmen arbeitsepidemiologischer Studien. Bundesgesundheitsbl 2013; 56: 571-578
- 11 Zentralinstitut für die Kassenärztliche Versorgung in Deutschland. Demenz. Zi-Kodier-Manual (2015). Online: https://www.zi.de/fileadmin/images/content/PDFs_alle/Kodiermanual_Demenz.pdf Stand: 13.05.2019
- 12 March S, Powietzka J, Stallmann C. et al. Viele Krankenkassen, Fusionen und deren Bedeutung für die Versorgungsforschung mit Daten der Gesetzlichen Krankenversicherung in Deutschland – Erfahrungen aus der lidA-(leben in der Arbeit)-Studie. Gesundheitswesen 2015; 77: e32-e36
- 13 GKV Spitzenverband. Krankenkassenliste. Online: http://www.gkv-spitzenverband.de/service/versicherten_service/krankenkassenliste/krankenkassen.jsp; Stand: 13.05.2019
- 14 March S, Rauch A, Thomas D et al. Datenschutzrechtliche Vorgehensweise bei der Verknüpfung von Primär- und Sekundärdaten in einer Kohortenstudie. Die lidA-Studie. Gesundheitswesen 2012; 74: e122–e129
- 15 March S. Individual Data Linkage of Survey Data with Claims Data in Germany-An Overview Based on a Cohort Study. IJERPH 2017; 14: 1543