Schlüsselwörter Herzinfarkt - Krankenkassendaten - Surveydaten - DEGS1 - Prävalenz - Vergleichsstudie
Key words myocardial infarction - health insurance claims data - survey data - GHIES - prevalence
- comparative study
Einleitung
Krankenkassendaten gehören in Deutschland bereits seit Jahrzehnten zur
Forschungslandschaft in der Epidemiologie, der Versorgungsforschung, der
medizinischen Soziologie und verwandten Disziplinen. Bekanntermaßen werden
Krankenkassendaten jedoch nicht für Forschungszwecke gesammelt und daher
auch als Routine- oder Sekundärdaten bezeichnet [1 ]. Gesundheitsbefragungen wie die Studie zur
Gesundheit Erwachsener in Deutschland (DEGS1) [2 ] zählen hingegen zu den sogenannten Primärdaten.
Mittlerweile werden beide Datenquellen zur Ermittlung der Morbidität in der
Bevölkerung verwendet [3 ]
[4 ]
[5 ]
[6 ]
[7 ]. Bisher offen bleibt, ob sich aus beiden
Datenquellen auf vergleichbarem Wege Morbiditätsindikatoren errechnen lassen
und wenn ja, wie stark sich die Ergebnisse unterscheiden.
Die Basis für die Ermittlung von Prävalenzen aus
Gesundheitsbefragungsdaten bilden bei den meisten Erkrankungen Selbstangaben der
Befragten. Die Befragten werden gebeten mitzuteilen, ob ein Arzt bei ihnen die
ausgewählte Erkrankung jemals festgestellt hat [8 ]. Bei einzelnen Erkrankungen, wie bspw.
Depression, werden auch klinische Interviews durchgeführt oder
Screeninginstrumente angewandt [9 ].
Die Prävalenzermittlung in Krankenkassendaten unterliegt mehreren
Bedingungen. So wird bspw. für ambulant vergebene Diagnoseschlüssel
häufig empfohlen, die Person erst dann als prävalent zu
zählen, wenn der Diagnoseschlüssel mit dem Zusatzkennzeichen
„gesichert“ versehen ist und in mindestens zwei Quartalen
(M2Q-Kriterium) im jeweiligen Jahr vergeben wurde [10 ]
[11 ]. Die Anwendung solcher
Bedingungen sollte jedoch stets von der Fragestellung abhängig gemacht
werden [10 ], denn für akute Ereignisse
eignet sich das M2Q-Kriterium weniger gut. Bei Krankenhaushauptdiagnosen wird
hingegen meist keine Notwendigkeit gesehen, eine Validierung vorzunehmen,
insbesondere wenn es sich um potenziell lebensbedrohliche akute Ereignisse wie einen
Herzinfarkt handelt [12 ].
Die Besonderheiten der beiden Datenquellen bzw. der Entstehung der jeweiligen Daten
bedingen die Limitationen, die mit den aus den Daten ermittelten Ergebnissen
verbunden sind. So kann davon ausgegangen werden, dass gesundheitlich
beeinträchtigte Personen schlechter für Befragungen erreicht werden
können bzw. eine geringere Teilnahmebereitschaft zeigen. Dies konnte in
zahlreichen Panelstudien gezeigt werden, die konsistent eine niedrigere
Teilnahmebereitschaft an Wiederholungsbefragungen bei gesundheitlich
beeinträchtigten Personen aufzeigten [13 ]
[14 ]
[15 ]
[16 ].
Somit kann in Surveys eine Unterschätzung der „wahren“
Prävalenz in Auswertungen vermutet werden.
Auf der anderen Seite können Abrechnungsmodalitäten der gesetzlichen
Krankenversicherung wie auch das Kodierverhalten der Ärzte nach Meinung
einiger Autoren dazu führen, dass Schätzungen aus Krankenkassendaten
die „wahre“ Krankheitsprävalenz in der Bevölkerung
übertreffen [17 ]. Unter anderem aus
diesem Grunde wird auf Prävalenzzahlen, die aus Krankenkassendaten
ermittelten werden, häufig der Begriff „administrative
Prävalenz“ angewendet [18 ].
Bisher durchgeführte vergleichende Analysen verwendeten die jeweilige
Population zur Berechnung der Prävalenzraten, ohne eine Vergleichbarkeit
durch die Parallelisierung der Stichproben herzustellen. Die Ergebnisse wurden
anschließend an die sogenannte Standardbevölkerung angepasst [19 ]
[20 ]
oder an die demografische Struktur einer der Datenquellen angeglichen [21 ]. Merkmale der sozialen Lage wurden dabei
nicht berücksichtigt, können den Prävalenzvergleich jedoch
entscheidend mitbeeinflussen. Eine Studie, bei der die zugrundeliegende Stichprobe
aus dem Gesundheitssurvey in Krankenkassen auch hinsichtlich der Merkmale der
sozialen Lage nachgebildet wird, ist den Autor:innen nicht bekannt.
In dieser Studie wurde die Diagnose Herzinfarkt für den Vergleich von
Prävalenzen zwischen den Angaben im Gesundheitssurvey DEGS1 und auf
Krankenkassendaten der AOK Niedersachsen (AOKN) basierten Berechnungen
ausgewählt. Der Herzinfarkt wurde ausgewählt, da er als
dokumentierte Hauptdiagnose im Krankenhaus eine hohe Validität in
Krankenkassendaten besitzt [22 ]
[23 ] und gleichzeitig von einer hohen
Erinnerungsrate unter den Befragten der DEGS1-Studie ausgegangen werden muss. Die
Forschungsfragen in dieser Studie lauten:
Wie können die Prävalenzen in Gesundheitssurveys und
Routinedaten auf vergleichbare Weise ermittelt werden?
Unterscheiden sich die Prävalenzen von Herzinfarkt zwischen Angaben
im Gesundheitssurvey und auf Routinedaten basierten Berechnungen?
Methodik
Die Basis für diese vergleichende Analyse bilden die Daten der Studie zur
Gesundheit Erwachsener in Deutschland (DEGS1), die zwischen 2008 und 2011 vom Robert
Koch-Institut (RKI) durchgeführt wurde [24 ], und die Abrechnungsdaten der AOK Niedersachsen (AOKN). DEGS1 ist Teil
des Gesundheitsmonitorings des RKI [25 ]. 8 152
Personen im Alter zwischen 18 und 79 Jahren wurden an einem der 180 Studienorte in
Deutschland zu ihrem Gesundheitsstatus, Gesundheitsverhalten und Lebensbedingungen
befragt [24 ]. Einen detaillierten Einblick in die
Gewinnung der Studienteilnehmenden und die Durchführung der Feldarbeit geben
Gößwald et al. [2 ]. Im
AOKN-Datensatz sind pseudonymisierte Daten von über 3 Millionen Versicherten
enthalten, die den Autor:innen durch die AOKN im Rahmen einer langjährigen
Kooperation unter Einhaltung der notwendigen Datenschutzbestimmungen zur
Verfügung gestellt wurden.
Definition der Herzinfarktfälle
Für die Prävalenzbestimmung aus DEGS1 wurde folgende Frage verwendet,
die allen Befragten im Alter ab 40 Jahren gestellt wurde: „Hat ein Arzt bei
Ihnen schon mal einen Herzinfarkt festgestellt?“. Der AOKN-Datensatz
enthält Informationen zur Inanspruchnahme stationärer Leistungen im
Zeitraum 2005 bis 2017 von über 3 Millionen Versicherten im Alter von 18 bis
112 Jahren. Zur Definition der Herzinfarktfälle in den AOKN-Daten wurden
stationäre Hauptdiagnosen mit dem Diagnosecode I21 nach ICD-10 GM [26 ] verwendet.
Zeitrahmen
Vor dem Hintergrund des zur Verfügung stehenden Zeitraums von
Herzinfarktinformationen in den Krankenkassendaten der AOKN (2005 bis 2017) wurde
der analysierte Zeitrahmen in DEGS1 angepasst. Dafür wurde folgende
Filterfrage verwendet: „Wann wurde der erste/letzte Herzinfarkt
diagnostiziert?“. Die Befragten konnten entweder das Jahr des Ereignisses
angeben („im Jahr …“) oder mitteilen wie alt sie dabei waren
(„im Alter von …“) oder angeben, vor wie vielen Jahren das
Ereignis stattgefunden hatte („vor … Jahren“). Für
die Analyse wurden nur Personen als prävalente Herzinfarktfälle
definiert, die angaben, innerhalb der 13 Jahre vor dem Befragungszeitpunkt einen
Herzinfarkt erlitten zu haben, um zwischen den Datensätzen hinsichtlich der
Beobachtungszeit Vergleichbarkeit herzustellen. Wenn die Befragten mehrere
Ereignisse angaben, wurde das letzte Ereignis berücksichtigt, um die
Herzinfarktprävalenz für den Zeitraum von 13 Jahren zu ermitteln.
Der Natur der DEGS1-Befragungsdaten entsprechend, können für diese
Analyse nur Personen berücksichtigt werden, die einen Herzinfarkt bis zum
Befragungszeitpunkt überlebt haben.
Im AOKN-Datensatz wurden dementsprechend nur Personen berücksichtigt, die im
Zeitraum der Datenverfügbarkeit 2005 bis 2017 durchgehend versichert waren.
Damit konnte eine lückenlose Beurteilung erfolgen, ob eine
Herzinfarktdiagnose vorlag. Auch aus den AOKN-Daten sind dementsprechend Personen
ausgeschlossen, die an bzw. nach einem Herzinfarkt vor Ende 2017 verstorben
sind.
Soziodemographische Merkmale
Die beiden Datensätze wurden im nächsten Schritt hinsichtlich der
soziodemografischen Struktur mit dem Ziel verglichen, die Stichproben zu
parallelisieren. Dabei wurden die Geschlechteranteile, das Alter wie auch der
Berufsbildungsabschluss berücksichtigt. Weitere sozio-ökonomische
Merkmale wie Berufsangaben oder Einkommen sind in den beiden Datensätzen
nicht in der gleichen Weise operationalisiert und bleiben deshalb
unberücksichtigt. So wird in DEGS1 das Haushaltseinkommen erhoben.
Demgegenüber enthält der AOKN-Datensatz nur Informationen
für das Individualeinkommen aus sozialversicherungspflichtiger
Tätigkeit. Für die Berufsbezeichnungen liegen in den AOKN-Daten
fünfstellige Berufscodes nach der Klassifikation der Berufe 2010 vor [27 ]. Die DEGS1-Daten enthalten die Gruppierung
Arbeiter/Angestellte/Beamte/Selbständige/Mithelfende
Familienangehörige als verfügbare Berufsangabe. Eine Angleichung der
fünfstelligen Berufscodes an diese Gruppierung ist nicht möglich.
Daher wird der Berufsbildungsabschluss zur Angleichung der soziodemografischen
Struktur der beiden Datensätze neben Geschlecht und Alter verwendet.
Die Angabe zum Berufsbildungsabschluss wurde in der DEGS1-Erhebung bei allen
Teilnehmenden erfragt. In Krankenkassendaten sind solche Angaben nur für
jemals sozialversicherungspflichtig Beschäftigte enthalten. Arbeitgeber sind
nach der Datenerfassungs- und übermittlungsverordnung im Rahmen der Meldung
zur Sozialversicherung verpflichtet, bestimmte Informationen an den
Sozialversicherungsträger zu übermitteln [28 ]. Diese Informationen enthalten auch den
Berufsbildungsabschluss. Diese Variable ist mit 4 Ausprägungen kodiert: ohne
Berufsbildungsabschluss, mit Berufsbildungsabschluss, mit Hochschulabschluss und
unbekannt.
Für die Parallelisierung wurden gleichzeitig die Variablen Geschlecht, Alter
in Jahren und Berufsbildungsabschluss verwendet, was 304 Merkmalskombinationen
ergab. Bis zum Alter von 77 Jahren enthielten die AOKN-Daten genügend
Personen für die Parallelisierung, ab 78 Jahren konnte nicht mehr nach allen
3 Kriterien parallelisiert werden. Um in den beiden Datensätzen
möglichst vergleichbare soziodemografische Verteilungen zu erreichen, wurde
die Altersspanne auf 40 bis 77 Jahre (statt 79 Jahre) reduziert.
Durchführung der Parallelisierung
Für die Ziehung der Vergleichsstichprobe aus den AOKN-Daten wurden
für jede Zelle in der Datenmatrix der 3 Variablen Geschlecht, Alter und
Berufsbildungsabschluss Verhältniszahlen gebildet. Dadurch konnte ermittelt
werden, wie viele Versicherte in der AOKN-Datenbasis einem Befragten aus DEGS1 mit
der gleichen Merkmalskombination entsprechen. Bis zum Alter von 69 Jahren konnten
mindestens 3 Männer und mindestens 6 Frauen für jede:n
DEGS1-Befragte:n für die Bildung einer Vergleichsstichprobe gezogen werden.
Für die DEGS1-Befragten im Alter zwischen 70 und 77 Jahren konnte mindestens
1 Person für jede Kombination der 3 soziodemografischen Variablen aus den
AOKN-Daten gezogen werden ([Abb. 1 ]).
Abb. 1 Durchführung der Parallelisierung nach Geschlecht,
Alter und Berufsbildungsabschluss. * die untere Altersgrenze ist
bedingt durch die Filtersetzung für die Frage nach Herzinfarkt (ab
40 Jahre) in den DEGS1-Daten. Die obere Altersgrenze ist bedingt durch die
fehlende Verfügbarkeit von AOKN-Versicherten für die
Parallelisierung nach allen 3 Merkmalen. Bei unter 70-Jährigen
wurden 3 Männer und 6 Frauen pro DEGS1-Befragte:n aus den AOKN-Daten
gezogen. Ab 70 Jahren wurde 1:1 gematcht.
Als Ergebnis wurden 7 123 Männer und 15 411 Frauen zufällig gezogen
(s. [Abb. 1 ]), was einem Verhältnis
von insgesamt DEGS1 zu AOK von 1 zu 3,9 entspricht. Zuvor wurden die Versicherten
mit einer zufälligen Zahl versehen, nach der die Reihenfolge der
Versicherten im Datensatz vor der Ziehung in eine zufällige Reihenfolge
gebracht werden konnte. So wurde vermieden, dass eine bestimmte Reihenfolge, in der
die Versicherten in der Basisdatei sortiert sind, Einfluss auf die Ziehung
ausübt.
In einem zweiten Schritt wurden Herzinfarktfälle für die erstellte
parallelisierte AOKN-Stichprobe in den stationären Diagnosedaten ermittelt.
Im Sinne einer Sensitivitätsanalyse wurden 9 weitere Zufallsstichproben aus
den AOKN-Daten gezogen.
Einfachheitshalber wird im Weiteren von Herzinfarktprävalenzen gesprochen,
wobei eine Periodenprävalenz von Herzinfarkt für den genannten
Zeitraum von 13 Jahren gemeint ist. Für diese Analyse wurde der
Gewichtungsfaktor in DEGS1- Daten nicht angewandt, da diese Studie nicht zum Ziel
hat eine repräsentative Analyse der Herzinfarktprävalenz
durchzuführen. Ein Vergleich der Herzinfarktprävalenz mit
Krankenkassendaten wäre nach der Anwendung eines Gewichtungsfaktors nicht
möglich. Die Daten wurden mit STATA 16.0 MP aufbereitet und analysiert.
Ergebnisse
[Tab. 1 ] zeigt die Struktur der beiden
Vergleichsgruppen nach soziodemografischen Merkmalen vor der Parallelisierung. Die
Bedingung, über den Beobachtungszeitraum von 13 Jahren hinweg durchgehend
versichert zu sein, wurde bereits berücksichtigt. Nach der Parallelisierung
waren die Anteile in der AOKN-Gruppe den Anteilen in der DEGS1-Stichprobe
entsprechend gleich.
Tab. 1 Soziodemografische Merkmale der DEGS1-Stichprobe und
AOKN-Population im Alter von 40 bis 77 Jahren. Bei AOKN gilt die
Bedingung der durchgehenden Versicherung zwischen 2005 und
2017.
DEGS1 n=5 779
AOKN n=769 539
Geschlecht: weiblich
52,7%
51,9%
Alter: Mittelwert (SD)
58,07 (10,85)
58,95 (10,15)
Median (IQR)
58 (49 – 68)
58 (51 – 67)
Berufsbildungsabschluss
ohne Berufsausbildung
8,4%
11,3%
mit Berufsausbildung
66,2%
42,6%
mit Hochschulabschluss
19,3%
1,9%
unbekannt
6,1%
44,2%
Wie aus der Tabelle erkennbar, unterschieden sich die Vergleichsgruppen hinsichtlich
der Merkmale Alter und Geschlecht kaum. Die in der Tabelle angeführten
Unterschiede in der Verteilung über die Bildungsabschlüsse wurden
über den Weg der Parallelisierung ausgeglichen ([Abb. 2 ]).
Abb. 2 Herzinfarktprävalenzen für DEGS1-Befragte und
AOKN-Versicherte aus der nach Geschlecht, Alter und Berufsbildungsabschluss
parallelisierten Stichprobe, stratifiziert nach Geschlecht.
Im nächsten Schritt wurden die Herzinfarktprävalenzen der
DEGS1-Befragten und der parallelisierten Stichprobe der AOKN-Versicherten errechnet.
Für Männer lag der Punktschätzer für die 13
Jahre-Herzinfarktprävalenz bei den AOKN-Versicherten mit 4,07%
(95% Konfidenzintervall (KI): 3,61–4,53%) unter dem Wert aus
der DEGS1-Stichprobe (4,79%; 95% KI: 3,99–5,59%).
Die Konfidenzintervalle überschneiden sich jedoch, so dass eher von
Tendenzen zu niedrigerer Herzinfarktprävalenz bei Männern in den
AOKN-Daten gesprochen werden kann, die jedoch statistisch nicht gesichert werden
können. Für Frauen liegt die Herzinfarktprävalenz bei den
AOKN-Versicherten bei 1,20% (95% KI: 1,03–1,37%) und
damit zwar etwas höher als bei DEGS1 mit 1,02% (95% KI:
0,66–1,38%). Doch auch hier überschneiden sich die
Konfidenzintervalle, was keine gesicherte Aussage über das Vorhandensein von
Unterschieden zwischen den Prävalenzzahlen erlaubt ([Abb. 3 ]).
Abb. 3 Herzinfarktprävalenzen in DEGS1 und die Gesamtprävalenz aus 10 Zufallsziehungen von
parallelisierten Stichproben aus den AOKN-Daten,
stratifiziert nach Geschlecht.
Im Sinne einer Sensitivitätsanalyse wurden weitere Zufallsstichproben aus den
AOKN-Daten gezogen und eine Gesamtprävalenz daraus ermittelt. Dafür
wurden prävalente und nicht-prävalente Fälle aller
Stichproben getrennt aufsummiert und miteinander dividiert. Nach der Ziehung von 9
weiteren Zufallsstichproben wurde sichtbar, dass sich die Gesamtprävalenz
nicht weiter veränderte und für Männer bei 3,89%
(95% KI: 3,45–4,34%) und für Frauen bei
1,12% (95% KI: 0,96–1,29%) lag. Diese
Gesamtprävalenzwerte sind grafisch in der [Abb. 3 ] dargestellt. Die grafische Präsentation der einzelnen
Prävalenzanteile für alle 10 parallelisierten Zufallsstichproben ist
im Zusatzmaterial (Abb. A1, online verfügbar ) zu finden.
Diskussion
In dieser Studie wurden in Abrechnungsdaten der AOK Niedersachsen
Herzinfarktprävalenzen ermittelt und mit den Antworten der Befragten der
DEGS1-Studie verglichen. Dafür wurde eine nach Geschlecht, Alter und
Berufsbildungsabschluss parallelisierte Stichprobe der AOKN-Versicherten gebildet,
um die soziodemografische Struktur der DEGS1-Stichprobe möglichst gut
nachzubilden. Im Ergebnis lässt sich festhalten, dass sich in der
Herzinfarktprävalenz weder bei Frauen noch bei Männern statistisch
belastbare Unterschiede zwischen den Gesundheitssurveydaten und Daten der AOKN
ergeben, nachdem die Stichproben in ihren zentralen Merkmalen angeglichen wurden.
Es
zeigte sich eine tendenziell niedrigere Herzinfarktprävalenz für
Männer in der parallelisierten AOKN-Stichprobe als in DEGS1. Dies entspricht
nicht der Erwartung an einen solchen Vergleich, denn für Krankenkassendaten
werden häufig Überschätzungen der Morbidität
vermutet [17 ] und für
Gesundheitsbefragungen eher Unterschätzungen u. a. aufgrund der
Selektivität in der Antwortbereitschaft morbider Personen [13 ]
[14 ]
[15 ]
[16 ].
Mehrere Ursachen können für die geringen Unterschiede in den
Herzinfarktprävalenzen in Frage kommen. So ist die Wahl der Erkrankung wie
auch die Operationalisierung auf Basis von stationären Daten ein erster
Grund dafür, dass die Prävalenz in den AOKN-Daten nicht deutlich
höher ausfällt als in DEGS1-Daten. Zweitens wurden aus den
AOKN-Daten nur Personen in die parallelisierte Stichprobe eingeschlossen, die jemals
im Beobachtungszeitraum erwerbstätig gewesen sind, da nur für sie
der Berufsbildungsabschluss für die Durchführung der
Parallelisierung vorlag. Dies kann überproportional zum Ausschluss
derjenigen aus der parallelisierten AOKN-Stichprobe geführt haben, die
höhere Morbidität aufweisen und aus diesem Grunde nie im
Beobachtungszeitraum erwerbstätig gewesen sind.
Eine Untererfassung der „wahren“ Prävalenz wird von vielen
Autoren in Befragungsstudien aus mehreren Gründen vermutet. Zum einen wurde
in mehreren Panelstudien gezeigt, dass gesundheitlich beeinträchtigte
Personen eine niedrigere Teilnahmebereitschaft an Folgebefragungen aufweisen [13 ]
[14 ]
[15 ]
[16 ]. Darüber hinaus konnte in der
Studie von Glickmann et al. ermittelt werden, dass mit der Zeit die Erinnerung an
ein Ereignis abnimmt [29 ]. Drittens ist die
Zeit von Bedeutung, die der befragten Person zur Beantwortung der Frage zur
Verfügung steht: Je kürzer die Zeit, desto unwahrscheinlicher ist
es, dass sich die befragte Person an ein Ereignis erinnert [30 ]. Vor diesem Hintergrund erscheinen
tendenziell höhere Herzinfarktprävalenzen bei Männern in
DEGS1-Daten verwunderlich.
Eine mögliche Erklärung für diese erhöhten Werte in
DEGS1-Daten könnten Erinnerungsfehler sein. Darauf weisen frühere
Ergebnisse aus Großbritannien hin [31 ]: In der British Regional Heart Study wurde 1998 ermittelt, dass
33% der befragten Männer im Alter zwischen 52 und 74 Jahren sich
fälschlicherweise an einen Herzinfarkt und 25% an einen Schlaganfall
zu erinnern meinten, obwohl keine solchen Ereignisse bei ihren Hausärzten
dokumentiert waren. Die Validierung dieser fehlenden Übereinstimmungen in
den Hausarztunterlagen ergab in vielen Fällen entweder Angina pectoris oder
einen Koronararterien-Bypass [31 ].
Eine weitere Erklärung bieten differenzierte Untersuchungen des Non-Response
bei Gesundheitssurveys, die mehr Inanspruchnahmen des Gesundheitssystems unter
Befragungsteilnehmern im Vergleich zu Nicht-Teilnehmern zeigen. Etter und Perneger
haben 1997 für 2 Schweizer Krankenversicherungen ermittelt, dass der Anteil
der Personen, für die erstattungsfähige Kosten ausgelöst
wurden, unter den Respondenten bei Gesundheitsbefragungen höher war als bei
Nicht-Teilnehmern [32 ]. In einer
französischen Befragungsstudie unter den Versicherten, die im
Bildungsbereich tätig sind, wurden höhere Anteile von Personen mit
Inanspruchnahme von Allgemeinärzten, Fachärzten oder
Zahnärzten unter den Respondenten festgestellt [33 ].
Der Vergleich der Prävalenzen zwischen Krankenkassen- und Befragungsdaten wie
in der vorliegenden Studie wurde in Deutschland bisher nur für Hypertonie
und Depression vorgenommen. Frank ermittelte Übereinstimmungen für
Hypertonieprävalenzen zwischen Krankenkassen- und DEGS1-Daten, jedoch nicht
mit GEDA-Daten [21 ]. Für Depression
lagen in dieser Studie die Werte in DEGS1- und GEDA-Daten nahe beieinander, jedoch
weit unter denen aus Krankenkassendaten ermittelten Anteilen [21 ]. Grobe et al. haben in ihrer Studie
über den direkten Vergleich der Depressionsprävalenzen hinaus
mehrere Sensitivitätsanalysen durchgeführt und stellten fest, dass
die administrative Prävalenz aus den Daten der BARMER-GEK deutlich absinkt
und den Prävalenzen in DEGS1 sehr ähnelt, wenn unspezifische
Depressionsdiagnosen ausgeschlossen werden [20 ]. Zusammenfassend lässt sich sagen, dass ein solcher
Prävalenzvergleich zwischen Krankenkassen- und Befragungsdaten eher
für gut erinnerbare Ereignisse oder Zustände sinnvoll ist, die
darüber hinaus möglichst zu bekannteren
„Volkskrankheiten“ zählen sollten. Weniger schwerwiegende
Diagnosen wie bspw. relativ symptomfreie Fettstoffwechselstörung
dürften für Patienten unbemerkt bleiben und damit in
Gesundheitsbefragungen schwerer erinnert werden.
Stärken und Limitationen
Im Gegensatz zu früheren Vergleichsstudien [20 ]
[21 ], die Prävalenzen anhand von Befragungs- und
Krankenkassendaten ermittelten und die Ergebnisse nur nach Alter und Geschlecht
standardisierten, konnte in dieser Studie der Berufsbildungsabschluss zur
Parallelisierung verwendet werden. Die hohen Fallzahlen in den
Krankenkassendaten ermöglichten es den Autor:innen, nach 3 Merkmalen
bzw. 304 Merkmalskombinationen parallelisierte Stichproben zu ziehen, um die
soziodemografische Struktur zwischen AOKN und dem Surveydatensatz
möglichst anzugleichen. Weiterhin wurde mit Herzinfarkt eine Diagnose
verwendet, die sich aufgrund ihrer Eindeutigkeit in Krankenkassendaten gut
definieren lässt. Unsere Untersuchung zeigt, wie aufwändig sich
die Herstellung der Vergleichbarkeit zwischen Daten aus verschiedenen Quellen
gestaltet, um Fehler auszuschließen. Einfache Vergleichsanalysen
verbieten sich damit.
Als Limitation ist erstens zu nennen, dass möglicherweise eine Selektion
von weniger morbiden Personen aus der AOKN-Datenbasis stattgefunden hat, da nur
Personen aus dem AOKN-Datensatz eingeschlossen werden konnten, die im
Beobachtungszeitraum jemals erwerbstätig gewesen sind. Somit ist
– ähnlich wie sonst für Gesundheitssurveys vermutet
– ein Morbiditätsbias in der vorliegenden parallelisierten
AOKN-Stichprobe möglich. Die Selektion von Befragten aus DEGS1, die in
den letzten 13 Jahren jemals erwerbstätig gewesen sind, war aufgrund von
fehlenden historischen Erwerbstätigkeitsinformationen nicht
möglich. Wäre die Altersspanne anders gewählt, so dass
potenzielle Rentner:innen ausgeschlossen bleiben, wäre diese Selektion
womöglich vermieden worden. Dieser Schritt hätte jedoch zur
starken Reduzierung der Herzinfarktfälle und somit weniger genauen
Bestimmung der Prävalenz geführt.
Des Weiteren handelt es sich bei dieser Analyse um unterschiedliche
Zeiträume (DEGS1: 1996–2008 und AOKN: 2005–2017), was
durch die Datenverfügbarkeit bei der AOKN wie auch durch den
Befragungszeitpunkt bei DEGS1 bedingt ist. Dies könnte ebenfalls zur
Erklärung der tendenziell höheren Prävalenzanteile in
DEGS1-Daten beitragen, da die Herzinfarktinzidenz über die Zeit sinkt
[34 ]
[35 ]. Die Begrenzung des Beobachtungszeitraums auf die Jahre
2005–2008 würde in einer sehr geringen Anzahl der berichteten
Herzinfarkte bei DEGS1 münden, mit der keine weiteren Analysen
möglich wären.
Eine wichtige Anmerkung betrifft die Repräsentativität dieser
Prävalenzwerte. In DEGS1 ist eine Hochrechnung auf die bundesdeutsche
Wohnbevölkerung nach Anwendung des Gewichtungsfaktors möglich.
Für diese Analyse wurde der Gewichtungsfaktor nicht angewandt, da
bevölkerungsbezogene Prävalenz nicht dem Ziel dieser Studie
entsprach.
Um Prävalenzanteile aus Gesundheitssurvey- und Krankenkassendaten zu
vergleichen, sollten mehrere Aspekte berücksichtigt werden. Zum
einen muss eine Diagnose ausgewählt werden, die sich valide genug in
Krankenkassendaten abbilden lässt wie auch in Gesundheitsbefragungen
gut erinnert werden kann. Zum anderen sollte die soziodemografische Struktur
der beiden Studienpopulationen angeglichen werden, möglichst mit
Berücksichtigung der Indikatoren der sozialen Lage. Dies kann in
Krankenkassendaten jedoch zu Selektivitäten führen. Des
Weiteren sollte der Zeitraum der Betrachtung zwischen den
Datensätzen angepasst werden.
Beim Vergleich der AOKN- mit DEGS1-Daten wurde eine tendenziell niedrigere
Herzinfarktprävalenz bei Männern in den AOKN-Daten
festgestellt. Dies kann mehrere Gründe haben, unter anderem
Erinnerungsfehler in Befragungsdaten oder ein Morbiditätsbias durch
die Verwendung von Berufsbildungsabschluss für die Parallelisierung,
der nur bei jemals Erwerbstätigen vorliegt.
Ähnliche Vergleiche für weitere Diagnosen wie Schlaganfall,
Bluthochdruck oder Stoffwechselstörungen könnten das Bild
zur Gegenüberstellung von Krankenkassen- und Surveydaten
vervollständigen. Diese Vergleiche sollten die Merkmale der sozialen
Lage berücksichtigen und die Datensätze entsprechend der
Verteilungen angleichen. Um solche Vergleiche leichter zu
ermöglichen, wäre es begrüßenswert, wenn
Merkmale der sozialen Lage in Krankenkassendaten grundsätzlich
verfügbar gemacht würden.