Einleitung
Die 8,7 Mio. Personen mit privater Krankenversicherung (PKV) im Jahr 2019 [1 ] entsprechen 11% der
Bevölkerung in Deutschland. Diese Personengruppe mit privater
Vollversicherung setzt sich aus Beamten, Selbstständigen und Freiberuflern
unabhängig von deren Einkommen sowie Arbeitnehmern mit einem Einkommen
oberhalb der Jahresarbeitsentgeltgrenze bzw. Versicherungspflichtgrenze, die nicht
freiwillig in der gesetzlichen Krankenversicherung (GKV) versichert sind, zusammen.
Grundsätzlich unterliegt die PKV in Deutschland dem
Äquivalenzprinzip, d. h. die Höhe der
Krankenversicherungsbeiträge bzw. -prämien stehen in
Abhängigkeit zum individuellen Krankheitsrisiko, zum Eintrittsalter und zum
gewählten Tarif mit entsprechendem Leistungsumfang. Des Weiteren arbeitet
die PKV auf der Basis des Kostendeckungsprinzips, d. h. Versicherte treten
in Vorleistung und erhalten eine (anteilige) Kostenerstattung von ihrem
PKV-Unternehmen [2 ]. Die Einreichung eines
Rechnungsbelegs zur Erstattung bei der PKV ist für die Versicherten nicht
verpflichtend und es besteht keine festgelegte Frist, bis wann ein Beleg eingereicht
werden muss. Es gibt Versicherungstarife mit einem absoluten oder relativen
Selbstbehalt, bis zu welchem die Versicherten durch die PKV keine Leistungen
erstattet bekommen. Bestimmte Personengruppen (z. B. Beamte und ihre
Familienangehörigen, Pensionäre) sind beihilfeberechtigt, was
bedeutet, dass Leistungen anteilig (50–80%) vom Dienstherrn (Bund,
Land oder Kommune) bezuschusst werden. PKV-Versicherte können eine
Beitragsrückerstattung erhalten, wenn in einem Jahr keine Leistungen zur
Erstattung eingereicht werden [3 ] und keine
ausschließenden Gründe vorliegen (z. B. Beitragsschulden,
Tarifart).
In der Versorgungsforschung sind PKV-Versicherte bislang unterrepräsentiert
[4 ]. Obwohl Besonderheiten der PKV-Daten
bereits beschrieben und diskutiert wurden [3 ]
[5 ], ist die wissenschaftliche
Nutzung von PKV-Daten in Deutschland auf wenige Ausnahmen, wie z. B.
Analysen des Wissenschaftlichen Instituts der PKV [6 ], zur Arzneimittelversorgung [7 ]
und im Rahmen der NAKO [8 ],
beschränkt. Zwar werden PKV-Versicherte auch in nationalen Befragungen zu
Gesundheitsthemen einbezogen (z. B. des Robert Koch-Instituts [9 ], der Kassenärztlichen
Bundesvereinigung [10 ], des Statistischen
Bundesamts [11 ]), sodass hier Daten vorliegen,
diese jedoch selten spezifisch zu PKV-Versicherten analysiert werden. Weiterhin
fehlen Forschungsarbeiten mit PKV-Daten, die neben Abrechnungsdaten zur
Morbidität und Inanspruchnahme auch die subjektive Ansicht von
PKV-Versicherten zur eigenen Gesundheit und zur gesundheitlichen Versorgung
berücksichtigen. Zudem liegt keine Aufarbeitung der Herausforderungen bei
der wissenschaftlichen Nutzung von PKV-Abrechnungsdaten vor, wie dies z. B.
von March et al. zur Nutzung von GKV-Daten beschrieben wurde [12 ].
Daher wird im Folgenden ein Datensatz des PKV-Unternehmens Debeka auf
wissenschaftliche Nutzbarkeit geprüft. Die Kooperation mit der Debeka kam im
Rahmen des Projekts IPHA (Integrating the Population Perspective in Health System
Performance Assessment) des Gesundheitsökonomischen Zentrums Berlin
(BerlinHECOR) zustande. IPHA verfolgt das übergeordnete Ziel, Unterschiede
bei der Bewertung der Leistungsfähigkeit des deutschen Gesundheitssystems
aus der Bevölkerungsperspektive zu untersuchen [13 ]. Die Debeka ist mit rund 2,4 Mio.
Vollversicherten (2018) das größte PKV-Unternehmen in Deutschland
[14 ] und wurde daher als
Kooperationspartner ausgewählt.
Ziel der vorliegenden Arbeit ist es, die wissenschaftliche Verwendbarkeit der
Debeka-Daten zu prüfen, methodische Herausforderungen und Lessons Learned im
Prozess der Datenaufbereitung und -analyse aufzuzeigen und zu diskutieren. Ein
weiterer Fokus liegt auf den Möglichkeiten von verknüpften
Abrechnungs- und Befragungsdaten zur Einschätzung der Morbidität und
Inanspruchnahme von Leistungen durch PKV-Versicherte ohne eingereichte Belege.
Methodik
Im vierten Quartal 2018 fand eine Querschnittserhebung bei 20 000
Vollversicherten der Debeka statt, die zur Teilnahme an einer Befragung (online
über SoSciSurvey oder Papierfragebogen) zur Bewertung des deutschen
Gesundheitssystems einmalig eingeladen wurden [13 ]. Die Befragungsdaten enthielten u. a. Angaben zur
Soziodemografie, zum subjektiven Gesundheitsstatus sowie zu Haus- oder
Facharztbesuchen in den letzten 12 Monaten. Die Debeka übermittelte
zusätzlich einen Datensatz, der Variablen enthielt, die ursprünglich
zu Abrechnungszwecken dienten.
Datengrundlage und Stichprobe
Die Debeka ist historisch als „Deutsche
Beamten-Krankenversicherung“ [15 ]
entstanden. Auch aktuell sind in der Debeka mehr Versicherte beihilfeberechtigt
(83,6%) [12 ] als in der Gesamtheit
der PKV-Versicherten (51%) [16 ].
Dies wurde bei der zufälligen Stichprobenziehung mittels einer
Stratifizierung (Alter, Geschlecht und Beihilfestatus) gemäß der
Verteilung aller PKV-Versicherten in Deutschland, basierend auf Daten des
Statistischen Bundesamts [17 ] und des
PKV-Verbands [18 ], berücksichtigt.
Zudem fand eine Überrekrutierung von 10% in der Altersgruppe der
18- bis 34-Jährigen statt, da sich in einer vorherigen Studie [19 ] eine geringere Teilnahme der
jüngeren Altersgruppen zeigte, wohingegen bei über
65-Jährigen 10% weniger rekrutiert wurde. Ausgeschlossen wurden
Versicherte mit Pflegegrad 4 oder 5, erheblich eingeschränkter
Alltagskompetenz sowie Aufenthalt in einem Hospiz. Mit dem Fragebogen wurde die
Einwilligung zur Übermittlung der Abrechnungsdaten eingeholt und damit
die Debeka von der Schweigepflicht entbunden (§203 Strafgesetzbuch), was
eine Übermittlung der pseudonymisierten Daten ermöglichte. Die
Einwilligungserklärungen wurden von den Fragebögen durch eine
Vertrauensstelle (gemäß §5 Bundesdatenschutzgesetz)
getrennt (detaillierte Informationen zum Vorgehen siehe Studienprotokoll [13 ]). Für Versicherte mit
vorliegender Einwilligungserklärung stellte die Debeka die Stammdaten
sowie die jeweiligen Abrechnungsdaten im Excel-Format u. a. zu
ambulanten (nach der Gebührenordnung für Ärzte –
GOÄ) und stationären Leistungen (Internationale statistische
Klassifikation der Krankheiten und verwandter Gesundheitsprobleme –
ICD-10, Operationen- und Prozedurenschlüssel – OPS) sowie
Arzneimitteln (Anatomisch-Therapeutisch-Chemische Klassifikation – ATC,
Pharmazentralnummer – PZN) zur Verfügung (Details s. [Tab. 1 ]). Daten zu
zahnärztlichen/kieferorthopädischen Behandlungen und
Informationen zu möglichen Zusatztarifen sind in dem vorliegenden
Datensatz nicht vorhanden. Die zu übermittelnden Variablen wurden im
Vorfeld mit der Debeka abgestimmt. Die Abrechnungsdaten umfassten eingereichte
Belege von Vollversicherten mit Behandlungsdatum im Jahr 2018, die bis zum
23.04.2019 durch die Debeka gebucht wurden. Es wurden auch Belege
berücksichtigt, für die keine Erstattung durch die Debeka
erfolgte, z. B. für Leistungen, die nicht tariflich abgedeckt
sind. Für die Studie liegt ein Ethik-Votum (EA4/075/18)
der Charité – Universitätsmedizin Berlin vor.
Tab. 1 Beschreibung des übermittelten
PKV-Datensatzes der Debeka nach Leistungsarten und Daten zur Person
(n=3109).
Variable
Ergänzender Kommentar
Ausprägung
Stammdaten
Haupttarif
57 verschiedene Tarife; keine Informationen zu Zusatztarifen
(n≤10 Personen ohne aktuellen Tarif zum Stand der
Datenübermittlung, daher fehlen Informationen zu
Tarif, Beihilfeberichtigung, Alter und Geschlecht)
Tarifname
Beihilfeberechtigung
B=beihilfeberechtigt, NB=nicht
beihilfeberechtigt
B/NB
Geburtsjahr
Bis Geburtsjahr 2000, da nur volljährige Personen
eingeschlossen wurden (Stand 2018)
JJJJ
Geschlecht
0=männlich, 1=weiblich; divers nicht
enthalten
0/1
Postleitzahl (PLZ) des Wohnsitzes
5-stellige PLZ
Ambulant-ärztliche Leistungen
Rechnungsbetrag
Je Beleg
€
Diagnosen
Fortschreibung von Diagnosen möglich
3-stellige ICD-10-Codes
Abrechnungsschlüssel gemäß
Gebührenordnung für Ärzte
(GOÄ)
GOÄ 2018
1- bis 6-stellige GOÄ-Ziffern (ohne
Sonderzeichen)
Leistungsart
3=ambulante Behandlung, 5=ambulanter
Eingriff
3/5
Datum Beginn Aufenthalt
Zwischen 01.01.2018 und 31.12.2018
TT.MM.JJJJ
Datum Ende Aufenthalt
Bis Ende Aufenthalt, d. h. auch im Jahr 2019
möglich
TT.MM.JJJJ
Summe Aufenthaltstage
Ggf. Zusammenfassung mehrerer Belege (z. B. bei
temporärer Entlassung über das Wochenende);
keine Aufenthaltsdauer bei Wahlleistung
Tage
Rechnungsbetrag
Je Beleg
€
Hauptdiagnose
Trennpunkte fehlen im übermittelten ICD-10-Code;
Wahlleistungen i.d.R. ohne Hauptdiagnose
3- bis 5-stelliger ICD-10-Code
Nebendiagnose(n)
Trennpunkte fehlen im übermittelten ICD-10-Code;
Wahlleistungen i.d.R. ohne Nebendiagnose
3- bis 5-stelliger ICD-10-Code
Operationen- und Prozedurenschlüssel (OPS)
OPS Version 2018; Trennpunkte und -striche fehlen im
OPS-Code; Wahlleistungen i.d.R. ohne OPS-Codes
4- bis 6-stelliger OPS-Code
Leistungsart
Kh=Krankenhausaufenthalt, wl=Wahlleistung
Kh/wl
Leistungen im Rahmen der Pflegeversicherung
Pflegegrad
Pflegegrad 4 oder 5 waren Ausschlusskriterien bei der
Stichprobenziehung
− /1/2/3
Rechnungsbetrag Pflegesachleistungen/Pflegegeld
Summe entspricht erstatteten Leistungen (nicht dem
Rechnungsbetrag)
€
Rechnungsbetrag voll-/teilstationäre
Pflege
Summe entspricht erstatteten Leistungen (nicht dem
Rechnungsbetrag)
€
Arzneimittelversorgung
Pharmazentralnummer (PZN)
Bei Datenübermittlung im Excel-Format werden
führende Nullen gelöscht
7- bis 8-stellige PZN
Anatomisch-Therapeutisch-Chemische Klassifikation
(ATC-Code)
Sofern für jeweiliges Produkt vorhanden
3-stelliger ATC-Code
Anzahl der verordneten Packungen
Auseinzelungen (z. B. die Abgabe einzelner Tabletten
aus einer Packung oder die Entnahme einer Impfdosis aus
einer Ampulle) sowie Mehrfachverordnungen (z. B. 3
Packungen eines Medikaments) möglich
Zahl mit bis zu 2 Nachkommastellen
Rechnungsbetrag
Je Beleg
€
Weitere Versorgungs-leistungen
Heilpraktikerbehandlung
Ja/nein
Präventionskurs
18 der 57 Tarife enthalten die Erstattung von
Präventionskursen
Ja/nein
Heilmittel Summe Rechnungsbeträge
€
Hilfsmittel Summe Rechnungsbeträge
€
Kur-/Sanatoriumsbehandlung Summe
Rechnungsbeträge
€
Gesamtsumme
Gesamtsumme aller Rechnungsbeträge
0 € möglich; alle Belege mit
Behandlungsdatum im Kalenderjahr 2018 und mit Buchungsdaten
1.1.2018-23.4.2019 wurden berücksichtigt; Tagegelder
sind nicht enthalten
€
Datenaufbereitung
Die Fragebögen wurden eingescannt, in einen SPSS-Datensatz
überführt und im Anschluss stichprobenartig (5%) auf
korrektes Einlesen der Daten geprüft. Die Datensätze des Online-
und des Papierfragebogens wurden vereinheitlicht und in einen Datensatz
integriert. Es fand eine Plausibilitätsprüfung aller Variablen
statt, Filterfragen und fehlende Werte wurden entsprechend kodiert.
Der Abrechnungsdatensatz wurde ebenfalls einer
Plausibilitätsprüfung unterzogen. Die Prüfung der
Ausprägungen ergab z. B. zu kurze PZN oder 4-stelllige
Postleitzahlen aufgrund fehlender führender Nullen in Excel. Weitere
Besonderheiten und Auffälligkeiten in den Daten, die sich z. B.
durch das maschinelle Scanverfahren der Belege zur Generierung ambulanter
Diagnosen ergeben, wurden in Rückkoppelungsschleifen mit der Debeka
besprochen. Die Fragebogen- und Abrechnungsdatensätze wurden anhand
eines Projektpseudonyms auf Versichertenebene verknüpft. Es fand eine
Plausibilitätsprüfung des verknüpften Datensatzes anhand
von Alter und Geschlecht statt, wobei unplausible Datensätze
ausgeschlossen wurden ([Abb. 1 ]). Alle
Schritte wurden gemäß der Guten Praxis Empfehlungen [20 ]
[21 ] detailliert dokumentiert.
Abb. 1 Flowchart – Ein- und Ausschluss der
Debeka-Versicherten.
Datenauswertung
Für ambulante und stationäre Diagnosen und Leistungen sowie
für Arzneimittel lagen je Versicherten die Abrechnungsdaten belegweise
vor und konnten über eine entsprechende ID zugeordnet werden.
Für Heil- und Hilfsmittel, Leistungen der Pflegeversicherung, Kur- und
Sanatoriumsbehandlungen sowie Präventionskurse wurden aggregierte Werte
je Versicherten übermittelt. In einem ersten Schritt wurden die
Häufigkeiten auf Versichertenebene aggregiert, um Summenwerte
z. B. für die Anzahl der Belege für Arzneimittel oder
Rechnungsbeträge zu erhalten. Für die Stichprobenbeschreibung
anhand von Alter, Anzahl von Belegen und Rechnungsbeträgen wurde der
Median (um eine Verzerrung des Mittelwertes durch Ausreißer zu
vermeiden) sowie das 25%- und 75%-Perzentil berechnet. Relative
Häufigkeiten wurden für Angaben aus den Fragebogendaten sowie
Belege je Leistungsbereich (z. B. Arzneimittel) ermittelt, um einen
Einblick in die Inanspruchnahme der Versicherten zu erhalten. Subgruppenanalysen
fanden für Männer und Frauen sowie für Versicherte mit
bzw. ohne eingereichte Belege statt. Die Analysen wurden mit R und
SPSS 27 vorgenommen.
Ergebnisse
Die Debeka stellte einen Abrechnungsdatensatz für 3 231
Vollversicherte zur Verfügung. Nach Verknüpfung der Abrechnungs- mit
den Fragebogendaten liegt ein finaler Datensatz für 3 109
Versicherte vor ([Abb. 1 ]), der als Grundlage
für die folgenden Analysen dient. Die Versicherten sind im Median 61 Jahre
alt, 64,9% sind männlich und 48,9% beihilfeberechtigt ([Tab. 2 ]). Eine Mehrheit der Versicherten hat
Belege für ambulante Behandlungen (77,2%) und für
Arzneimittel (73,0%) eingereicht, je ein Drittel Belege für Heil-
(31,8%) und Hilfsmittel (34,9%) und für 16,1% der
Versicherten ist mindestens ein Krankenhausaufenthalt belegt. Frauen weisen in allen
Leistungsbereichen höhere Anteile auf, wobei für Männer
höhere Rechnungsbeträge und eine höhere Anzahl an Belegen in
den Bereichen Arznei- und Hilfsmittel sowie Krankenhausbehandlungen vorliegen. Von
639 Versicherten (20,6%) wurden keine Belege eingereicht ([Tab. 3 ]).
Tab. 2 Stichprobenbeschreibung gesamt und nach Geschlecht mit
Angaben zu Häufigkeiten (%), Belegen und
Rechnungsbeträgen (Summenwerte) für das Jahr
2018.
Gesamt (n=3109)
Männlich (n=2017)
Weiblich (n=1091)
Beihilfeberechtigung (%) (n=3105)
48,9
41,8
62,1
Alter (Median, p25; p75)
61 [49; 70]
62 [50; 70]
59 [47; 69]
Ambulant-ärztliche Versorgung –
Einreichung (%)
77,2
73,9
83,4
Anzahl Belege (Median, p25; p75)
10 [6; 16]
9 [5; 15]
11,5 [7; 17]
Rechnungsbetrag in € (Median, p25; p75)
1620 [818; 2991]
1533 [743; 2901]
1805 [942; 3163]
Krankenhausbehandlung – Einreichung
(%)
16,1
16,0
16,3
Anzahl Belege (Median, p25; p75)
1 [1; 2]
1 [1; 2]
1 [1; 1]
Rechnungsbetrag in € (Median, p25; p75)
4040 [2515; 8111]
4193 [2512; 8807]
3813 [2577; 7711]
Arzneimittel – Einreichung (%)
73,0
70,3
78,0
Anzahl Belege (Median, p25; p75)
12 [5; 22]
12 [6; 23]
11 [5; 21]
Rechnungsbetrag in € (Median, p25; p75)
355 [123; 941]
390 [131; 1050]
305 [112; 762]
Heilmittel – Einreichung (%)
31,8
27,9
39,2
Rechnungsbetrag in € (Median, p25; p75)
556 [300; 1042]
507 [280; 891]
620 [350; 1200]
Hilfsmittel – Einreichung (%)
34,9
32,8
38,8
Rechnungsbetrag in € (Median, p25; p75)
426 [165; 1062]
449 [172; 1106]
390 [150; 979]
Kur-/Sanatoriumsbehandlung – Einreichung
(%)
1,2
1,0
1,4
Rechnungsbetrag in € (Median, p25; p75)
1622 [517; 2371]
1544 [499; 2531]
1673 [808; 1838]
Präventionskurs – Einreichung
(%)
≤0,3
0,0
≤1,0
Heilpraktikerbehandlung – Einreichung
(%)
9,2
6,6
13,9
Pflegegrad/Pflegeleistungen (%)
1,4
1,3
1,5
Gesamt – Einreichung (%)
79,4
76,4
85,0
p25/p75: 25./75. Perzentil; Belege lagen nicht vor
für: Heil- und Hilfsmittel, Kur-/Sanatoriumsbehandlung,
Präventionskurs, Heilpraktikerbehandlung, Pflegegrad;
Rechnungsbetrag lag nicht vor für: Präventionskurs,
Heilpraktikerbehandlung, Pflegegrad; Differenzen in der Summe zur
Geschlechtsangabe ergeben sich durch die Kategorie divers.
Tab. 3 Vergleich von Debeka-Versicherten mit und ohne Belege
nach ausgewählten Charakteristika.
Charakteristika
Versicherte mit Belegen (n=2470)
Versicherte ohne Belege (n=639)
Verknüpfter Datensatz
Alter (Median, p25; p75)
63 Jahre (51; 71)
54 Jahre (43; 65)
Geschlecht – männlich
62,5%
74,2%
Abrechnungsdaten
Beihilfeberechtigung (n=3105)
52,2%
35,8%
Fragebogendaten
Erwerbstätig (n=3081)
49,5%
73,1%
(Sehr) guter Gesundheitszustand (n=3092)
66,9%
90,6%
Chronische Erkrankung(en) (n=3096)
65,8%
33,0%
Arztbesuch in den letzten 12 Monaten
(n=3087)
98,6%
84,5%
Nachfolgend werden mögliche methodische Herausforderungen bei der Nutzung der
Debeka-Daten aufgeführt und daraus abgeleitete Lessons Learned dargestellt
([Tab. 4 ]).
Tab. 4 Übersicht von möglichen
Herausforderungen und Lessons Learned in der wissenschaftlichen Nutzung
von PKV-Daten der Debeka.
Themenbereich
Mögliche Herausforderungen
Hinweise auf Grundlage des vorliegenden Datensatzes
Lessons Learned
Versichertenstammdaten
Tarifvielfalt (Haupttarif)
Kein einheitlicher Leistungskatalog für PKV-Versicherte
der Debeka
Ggf. Zusatztarife für den Datensatz mit anfragen (da
einige Leistungen nur über Zusatztarife abgedeckt
sind)
Zeitpunkt der Stammdatenabfrage
Unvollständige Stammdaten bei großem Abstand zum
Betrachtungszeitraum
Zeitlicher Abstand der Datenabfrage zum Betrachtungszeitraum
gemäß Forschungsfrage abwägen
Datenerfassung beim Datenhalter
Keine Frist zur Einreichung von Belegen
Untererfassung der Inanspruchnahme bei geringem Abstand zum
Betrachtungszeitraum
Betrachtungszeitraum anhand des Behandlungs- bzw. Leistungsdatum
festlegen; zeitlicher Abstand der Datenabfrage zum
Betrachtungszeitraum gemäß Forschungsfrage
abwägen
Keine Pflicht zur Einreichung von Belegen
Nur Abbildung von eingereichten Belegen möglich,
Unterschätzung der Inanspruchnahme
Ggf. bei Versicherten ohne eingereichte Belege mit
Befragungsdaten ergänzen
Belege sind nicht standardisiert und werden per Scan erfasst
Prüfung der Datenvalidität
Datenqualität prüfen, ggf. mittels weiterer
verfügbarer Variablen validieren
Begrifflichkeiten in der PKV und Kontaktaufnahme zu
PKV-Versicherten
Spezifische Begrifflichkeiten in der PKV
Klare Definition von Begrifflichkeiten und Rücksprache
mit Datenhalter
Begrifflichkeiten variieren auch innerhalb der PKV (z. B.
Prämien vs. Beiträge), daher Begrifflichkeiten
vorab klären
Kontaktaufnahme zu PKV-Versicherten
Kontakt zu mitversicherten Personen nur über
Versicherungsnehmer (Stammleitperson) möglich
Im Anschreiben und in der Studienbeschreibung darauf hinweisen,
wer Adressat ist; ggf. nur Stammleitpersonen in Stichprobe
einschließen
Ambulant-ärztliche Versorgung
Ungültige bzw. nicht aktuelle ambulante Diagnosen
Ambulante Diagnosen werden per Scan aus Text erfasst;
Aktualität unklar da z.T. mitgeführte
Diagnosen
Ambulante Diagnosen z. B. mit stationären
Diagnosen oder Daten zu Arzneimitteln validieren
3-stellige ICD-10-Codes
Begrenzte Aussagekraft zu Diagnosen, da Generierung per
maschinellem Scanverfahren
Hinzunahme weiterer Variablen zur besseren Abbildung der
Morbidität
Ein Beleg entspricht nicht immer einem Arztkontakt
Belege können mehrere Behandlungstage abbilden und
einzelne Arztkontakte können mehrere Belege
enthalten
Behandlungsdatum für ambulant-ärztliche
Versorgung anfragen, um Anzahl der Arztkontakte
annähernd bestimmen zu können
Leistungsart „Ambulanter Eingriff“
unvollständig
Unterscheidung nur für einige Tarife relevant
Kodierung dieser Leistungsart für wissenschaftliche
Analysen nicht ausreichend
Krankenhausbehandlung
Getrennte Abrechnung von Krankenhausaufenthalt und
Wahlleistung
Unvollständige oder abweichende Diagnosen, OPS-Codes und
Aufenthaltstage für Wahlleistung
Diagnosen, OPS-Codes und Aufenthaltstage für
Wahlleistungen anfragen und mit den entsprechenden
Krankenhausaufenthalten abgleichen
Zusammenfassung kurzer Aufenthalte
Unklare Datenvalidität
Keine Zusammenfassung von Aufenthalten, da Verzerrung
möglich ist; alternativ Datum und Aufenthaltsdauer
abgleichen
Fehlende OPS-Codes
Unklare Datenvalidität
Unkenntnis der tatsächlich erbrachten Leistungen in
Analysen berücksichtigen
Leistungen im Rahmen der Pflegeversicherung
Unklare Datenkongruenz zwischen Pflegegrad und -leistungen
Abgleich Pflegegrad und Leistungen der Pflegeversicherung
Historischen Verlauf des Pflegegrads im Betrachtungszeitraum
anfragen
Arzneimittelversorgung
Faktor des Arzneimittels
Mehrfachverordnungen oder Auseinzelungen möglich
Mehrfachverordnungen bei Analysen berücksichtigen, da
z. B. eine Arzneimittelabgabe für eine
chronische Erkrankung nur einmal jährlich, jedoch mit
mehreren Packungen erfolgen kann
Ungültige PZN
Unklare Datenvalidität
Datenvalidität mittels ATC-Codes abgleichen
Abgabedatum nicht vorhanden
PZN kann sich im zeitlichen Verlauf ändern
Bei Übermittlung von PZN Abgabedatum anfordern, um
Validität der PZN zu gewährleisten
Weitere Versorgungsleistungen
Unklar, ob Leistungen in Haupt- oder Zusatztarifen enthalten
sind
Unterschätzung der Inanspruchnahme möglich
Relevanz von Haupt- und Zusatztarifen für Forschungsfrage
im Vorfeld mit Datenhalter klären und bei Datenabfrage
bedenken
Generelles bezüglich Studiendesign und Datensatz
Geringe Fallzahlen
Einige Variablen zeigen Fallzahlen n≤10
Mit Datenhalter vorab den Umgang mit kleinen Fallzahlen
(n≤10) festlegen, um die statistische Geheimhaltung zu
gewährleisten und das Reidentifizierungsrisiko zu
minimieren
Dateiformat des Datensatzes
Datensatz wurde im Excel-Format übermittelt,
führende Nullen gehen verloren (z. B. PLZ,
PZN)
Datenübermittlung in einem passenden Dateiformat
festlegen
Fehlende Informationen aufgrund nicht angefragter Variablen
Fehlende Informationen, z. B. Datum der Abgabe eines
Arzneimittels, historischer Verlauf des Pflegegrads im
Betrachtungszeitraum, Selbstbehalt,
Beitragsrückerstattung, erstattete Leistungen,
Zusatztarife, Versichertengruppe (Beamte,
Selbstständige, Freiberufler, Arbeitnehmer mit
freiwilliger PKV)
Planung der Datenanfrage und Variablenauswahl in enger
Rücksprache mit Datenhalter; ggf. Testdatenlieferung im
Vorfeld
Versichertenstammdaten
Bei PKV-Versicherten müssen grundsätzlich Unterschiede im
Beihilfestatus und bei den individuellen Tarifen (Haupt- und Zusatztarife)
berücksichtigt werden. Die im vorliegenden Datensatz identifizierten 57
Haupttarife unterscheiden sich in Beihilfetarife für Beamte, Basis-,
Standard-, Unisex- und Bisextarife, sowie hinsichtlich der Höhe und Art
(absolut oder relativ) des Selbstbehalts. Durch die Tarifvielfalt liegt
für PKV-Versicherte kein einheitlicher
„Leistungskatalog“ vor. So beinhalten z. B. 18 der 57
Tarife Präventionsleistungen, was für 7% der
Versicherten in der Stichprobe zutrifft, wobei nur wenige Versicherte
(n≤10) Gesundheitskurse als Präventionsleistungen zur Erstattung
einreichten.
Aufgrund des ggf. langen Zeitraums bis zur Einreichung von Belegen sollte nach
der Stichprobenziehung bzw. kurz vor Versand der Studieneinladung
überprüft werden, ob Versicherte zwischenzeitlich verstorben
sind.
Für Versicherte ohne aktuelle Versicherung (z. B. Aufnahme einer
in der GKV versicherungspflichtigen Beschäftigung) erfolgt keine
Aktualisierung der Stammdaten. Im vorliegenden Datensatz fehlen diese Stammdaten
für n≤10. Je länger der Abstand zwischen
Übermittlung der Abrechnungsdaten und Erfassungszeitraum ist, umso
wahrscheinlicher liegt eine Unvollständigkeit der Stammdaten vor.
Datenerfassung beim Datenhalter
Bei Inanspruchnahme von Leistungen treten PKV-Versicherte in Vorleistung und
reichen die Belege zur ggf. anteiligen Erstattung bei ihrem PKV-Unternehmen ein.
Hierfür gelten keine absoluten Fristen, d. h. Belege
können z. B. auch drei Jahre nach Inanspruchnahme zur Erstattung
eingereicht werden. Somit kann bei zeitnaher Datenauswertung eine
Unterschätzung der Inanspruchnahme angenommen werden. Zudem kann keine
Abbildung der Inanspruchnahme, sondern nur eine Abbildung der eingereichten
Leistungen erfolgen. Es kann z. B. nicht unterschieden werden, ob mit
dem Ziel einer Beitragsrückerstattung keine Belege eingereicht wurden
oder ob tatsächlich keine Inanspruchnahme vorlag. Auch ist aus den
vorliegenden Abrechnungsdaten nicht ersichtlich, ob die Erstattung anteilig
erfolgte oder ob die Belege nur zum Kostennachweis für den Selbstbehalt
eingereicht wurden.
Für ambulante Leistungserbringer bestehen kaum strukturelle Vorgaben zur
Rechnungsstellung [3 ]. Dies erschwert die
wissenschaftliche Nutzung der PKV-Abrechnungsdaten aufgrund einer unklaren
Datenvalidität. Die Erfassung von Belegen erfolgt bei der Debeka mittels
eines maschinellen Scanverfahrens sowie teilweise einer manuellen Nacherfassung.
So werden z. B. ambulante Diagnosen automatisiert aus Textstellen auf
den Belegen ermittelt, was teilweise zu ungültigen ICD-10-Codes
führt, wie z. B. „Gra, EUR, Nat, Sum, Unk, ()5,
)/2, (EC“. Im vorliegenden Datensatz gilt dies lediglich
für 108 (0,18%) der insgesamt 60 502
ambulant-ärztlichen ICD-10-Codes.
Begrifflichkeiten in der PKV und Kontaktaufnahme zu PKV-Versicherten
Es müssen PKV- sowie Debeka-spezifische Begrifflichkeiten differenziert
werden, z. B. ist der Versicherungsnehmer der Debeka über eine
individuelle „Servicenummer“ zu identifizieren, Prämien
werden bei der Debeka als Beiträge bezeichnet und Abrechnungsdaten als
Rechnungsdaten.
Bei der Kontaktaufnahme zu PKV-Versicherten der Debeka erfolgt der Kontakt zu
einer „mitversicherten Person“ nur über die
„Stammleitperson“ (Versicherungsnehmer) und deren postalischer
Adresse, was u.U. zu Differenzen zwischen gezogener und tatsächlicher
Stichprobe führt. Dies zeigte sich z. B. darin, dass
Einverständniserklärungen zur
Abrechnungsdatenübermittlung von der angeschriebenen Stammleitperson
unterschrieben wurden, die Abrechnungsdaten (anhand von Alter und Geschlecht)
jedoch zu der in der Stichprobe gezogenen mitversicherten Person (z. B.
Partner, Kind) gehörten. Aus diesem Grund wurde bei der Debeka
nachträglich angefragt, für welche Versicherungsnehmer
versicherte Personen vorlagen (14,3%). Anhand dieser Information
erfolgte ein Abgleich von Alter und Geschlecht mit den verknüpften
Fragebogendaten und Versicherte ohne Übereinstimmung in beiden
Datensätzen wurden ausgeschlossen ([Abb. 1 ]).
Abrechnungsdaten
Ambulant-ärztliche Versorgung
Auf ambulant-ärztlichen Rechnungen werden teilweise Diagnosen auf
Folgerechnungen „mitgeführt“, was insbesondere bei
Chronikern seine Berechtigung hat, jedoch nur eine eingeschränkte
Aussagekraft über die Aktualität von Diagnosen bedeutet.
Belege enthielten bis zu 42 Diagnosen sowie 87 verschiedene
GOÄ-Ziffern. Insgesamt lagen je Versicherten im Median 10 und
maximal 85 ambulant-ärztliche Belege aus dem Jahr 2018 vor.
Einerseits kann ein Beleg mehrere Behandlungstage enthalten und andererseits
können einem Arztbesuch mehrere Belege (z. B. Hausarzt und
Labor) zugeordnet werden. Für n≤10 von 28 242
Belegen wurde die tarifrelevante Leistungsart „ambulanter
Eingriff“ (zu Abrechnungszwecken) erfasst, was eine Untererfassung
vermuten lässt. Zum Beispiel wurden die GOÄ-Ziffer
„1802 Transurethrale Eingriffe in der Harnblase“ sowie
Zuschläge bei ambulanter Durchführung von operativen
Leistungen (440–449) als ambulante Behandlungen und nicht als
ambulante Eingriffe geführt.
Krankenhausbehandlung
Stationäre Rechnungen liegen in der Regel als Direktabrechnung
zwischen Krankenhaus und PKV-Unternehmen vor, können aber auch von
Versicherten eingereicht werden. Ein Krankenhausaufenthalt ist mit einem
Beleg gleichzusetzen, der stets eine Hauptdiagnose enthält. Die
Abrechnung von Krankenhausaufenthalten erfolgt getrennt von
ärztlichen Wahlleistungen (z. B. Chefarztbehandlung).
Wahlleistungen sind mit Vorsicht zu betrachten, da sie im vorliegenden
Datensatz keine Aufenthaltsdauer (nur Beginn und Ende der Behandlung; nicht
immer deckungsgleich mit Krankenhausaufenthalt) sowie teilweise
unvollständige oder abweichende Hauptdiagnosen enthalten.
Geringe Rechnungsbeträge (oftmals ohne Diagnose) können durch
Nebenkosten bei Krankenhausaufenthalten (z. B. Labor) oder
Wahlleistungen (z. B. poststationäres Ausstellen eines
Rezepts durch den Chefarzt) entstehen.
Kurze Krankenhausaufenthalte von weniger als 3 Tagen wurden in den
vorliegenden Abrechnungsdaten nach Absprache zusammengefasst und
können somit zu einer Verzerrung der Daten führen.
Insbesondere sollte auch ein Abgleich von Datum und Aufenthaltsdauer
erfolgen.
In den vorliegenden Abrechnungsdaten fehlen OPS-Codes für
16,2% der Krankenhausaufenthalte. Die Plausibilität sollte
im Einzelnen geprüft werden, z. B. erscheint ein
zweiwöchiger Krankenhausaufenthalt mit der Diagnose „S82
Fraktur des Unterschenkels, einschließlich des oberen
Sprunggelenkes“ mit einer Rechnungssumme von rund
13 000 € ohne OPS-Code, und damit in Unkenntnis der
tatsächlich erbrachten Leistungen in Bezug auf die Diagnose,
unplausibel. Die Debeka behält sich die Prüfung der
Rechnungsstellung im Einzelfall vor.
Leistungen im Rahmen der Pflegeversicherung
Für 1,3% der Versicherten (n=40) liegt ein Pflegegrad
1 bis 3 vor (Pflegegrad 4 und 5 wurden bei der Stichprobenziehung
ausgeschlossen), wobei für 15 der 40 Versicherten keine
Informationen über Leistungen der Pflegeversicherung vorhanden sind.
Für vereinzelte Versicherte wurden Leistungen gezahlt, obwohl kein
Pflegegrad ersichtlich ist. Da in den vorliegenden Daten der Pflegegrad eine
Momentaufnahme zum Zeitpunkt der Datenübermittlung (d. h.
zum 23.04.2019) darstellt, kann nicht rückwirkend ermittelt werden,
bei welchen Versicherten auch im Jahr 2018 ein Pflegegrad vorhanden war.
Grundsätzlich werden in den Daten erstattete Leistungen der
Pflegeversicherung nach Sozialgesetzbuch XI ausgewiesen und nicht die
tatsächliche Höhe der Kosten abgebildet.
Arzneimittelversorgung
Besonderheiten der PKV sind die Erstattungsfähigkeit
nicht-verschreibungspflichtiger Arzneimittel sowie die Möglichkeit
der Mehrfachverordnung (z. B. für die Abgabe von 15
Packungen). Zudem sind aus den Daten Auseinzelungen (d. h. die
Abgabe einzelner Tabletten oder Dosen) Belege ohne ATC-Codes (z. B.
Cremes, pflanzliche Arzneimittel, Betäubungsmittelgebühr)
sowie Belege ohne gültige PZN ersichtlich. Im vorliegenden Datensatz
ist das Abgabedatum des Arzneimittels nicht enthalten, was jedoch
z. B. bei Neuvergabe von PZN relevant für deren valide
Nutzung ist.
Weitere Versorgungsleistungen
Heilpraktiker-Behandlungen wurden von 9,2% und Kur- oder
Sanatoriumsbehandlungen von 1,2% der Versicherten eingereicht.
Teilweise werden Leistungen nur durch einen Zusatztarif abgesichert oder
sind mit einer zeitlichen Befristung der Erstattung versehen (z. B.
alle vier Jahre), wodurch eine Unterschätzung der Inanspruchnahme
möglich ist.
Unterschätzung der Inanspruchnahme bei Versicherten ohne eingereichte
Belege
Für 639 Versicherte (20,6% der Stichprobe) lagen keine Belege
vor, d. h. der Gesamtrechnungsbetrag liegt bei 0 €
für 2018. Die Verknüpfung mit Fragebogendaten ermöglicht
es, weitere Informationen zum Inanspruchnahmeverhalten von Versicherten ohne
eingereichte Belege zu erhalten.
Aus den Stammdaten sind Alter, Geschlecht und Haupttarif bekannt. Versicherte
ohne Belege sind im Vergleich zur Gesamtstichprobe jünger,
häufiger Männer und verfügen seltener über einen
Beihilfestatus ([Tab. 3 ]). Von den 408
(63,8%) Versicherten ohne Beihilfe hatten alle Versicherten einen Tarif
mit Selbstbehalt (bis auf einen Fall mit Sondertarif). Weitere Informationen
bietet der Fragebogendatensatz. Es berichteten 536 Versicherte (entspricht
84,5% der Versicherten ohne Informationen in den Abrechnungsdaten) von
medizinischer Versorgung bei einem Haus- oder Facharzt in den letzten 12
Monaten. Von einer oder mehreren chronischen Erkrankungen berichteten 210
(33,0%) Versicherte, davon 92,9% mit Kontakt zu einem Haus- oder
Facharzt in den letzten 12 Monaten. Den Gesundheitszustand schätzten die
meisten Versicherten ohne Abrechnungsdaten mit sehr gut oder gut ein, 60
Versicherte (9,4%) bewerteten diesen als mittelmäßig
(schlecht, sehr schlecht wurde nicht gewählt).
Diskussion
Obwohl Besonderheiten der PKV-Abrechnungsdaten bereits aufgearbeitet wurden, finden
diese bislang in der deutschen Versorgungsforschung wenig Anwendung [3 ]
[4 ]
[5 ]. So liegen z. B.
wenige Erkenntnisse zur Morbidität und Inanspruchnahme von PKV-Versicherten
vor. Daher wurden anhand eines konkreten PKV-Abrechnungsdatensatzes der Debeka
Herausforderungen und Lessons Learned im Umgang mit diesen Daten bei der
wissenschaftlichen Nutzung aufgezeigt, damit diese bei zukünftigen
Forschungsvorhaben berücksichtigt werden können.
Die besondere Versichertenstruktur der Debeka (83,6% beihilfeberechtigt)
wurde bei der Stichprobenziehung berücksichtigt [16 ], dennoch erschweren die Tarifvielfalt und
Unterschiede bei der Beihilfeberechtigung Verallgemeinerungen und Vergleiche mit
anderen PKV-Unternehmen und sollten bei der Interpretation der Abrechnungsdaten
bedacht werden. Die Art des Tarifs kann zudem das Einreichungsverhalten der
Versicherten beeinflussen, da z. B. aufgrund eines Selbstbehalts nicht alle
Belege eingereicht werden und dies zu einer Unterschätzung und
eingeschränkten Abbildung der Inanspruchnahme führt [3 ]. Insbesondere bei
Präventionsleistungen ist von einer deutlichen Unterschätzung
auszugehen, da diese gleichermaßen wie kurative Leistungen gewertet werden
und somit eine Beitragsrückerstattung verhindern. Gesunde Versicherte ohne
andere Versorgungsleistungen könnten zugunsten einer
Beitragsrückerstattung auf die Einreichung verzichten, wobei unklar bleibt,
ob ein Verzicht auf Präventionsleistungen erfolgt. Für das Jahr 2018
erhielten 402 515 der 2,4 Mio. Vollversicherten der Debeka (16,8%)
eine Beitragsrückerstattung [14 ]. In
den vorliegenden Daten haben 20,6% der Versicherten keine Belege eingereicht
und es ist anzunehmen, dass die meisten dieser Versicherten eine
Beitragsrückerstattung erhielten.
Für Versicherte ohne Belege liegen aufgrund des primären
Erhebungszwecks der Abrechnungsdaten (zur Abrechnung) keine Informationen zum
Gesundheitszustand und zur Inanspruchnahme vor. Grundsätzlich besteht die
Annahme, dass Versicherte ohne Einreichungen keine Leistungen in Anspruch genommen
haben, da sie gesund sind. Anhand der Ergebnisse der Fragebogendaten wird jedoch
gezeigt, dass bei einigen Versicherten dennoch relevante bzw. chronische
Erkrankungen vorliegen und somit die Morbidität unterschätzt wird,
wenn ausschließlich Abrechnungsdaten betrachtet werden. Folglich sollte bei
der Studienplanung berücksichtigt werden, wie mit Versicherten ohne Belege
zur Abbildung von Morbidität und Inanspruchnahme verfahren wird. Hier
wäre z. B. eine ergänzende Befragung denkbar (u. a.
subjektive Einschätzung der Gesundheit, chronische Erkrankungen,
Arztbesuche, Medikamenteneinnahme). Dies ermöglicht eine bessere
Aussagekraft über den Gesundheitszustand der Stichprobe und könnte
zugleich weiteren Aufschluss über die Validität der Abrechnungsdaten
liefern.
Die ambulant-ärztlichen Abrechnungsdaten bieten die Möglichkeit
anhand der Belege eine Annäherung an die Häufigkeit von
Arztkontakten darzustellen, wobei berücksichtigt werden muss, dass mehrere
Behandlungstage auf einem Beleg enthalten sein sowie einem Arztbesuch mehrere Belege
(z. B. Hausarzt und Labor) zugeordnet werden können. Zudem bleibt
die Datenvalidität der ambulanten Diagnosen aufgrund des maschinellen
Scanverfahrens unklar. Diese könnte z. B. durch stationäre
Daten oder Daten zu Arzneimitteln geprüft werden.
Limitationen der vorliegenden Studie sind die Datengrundlage eines einzelnen
PKV-Unternehmens sowie die Beschränkung der Abrechnungsdaten auf ein
Kalenderjahr. Zukünftig sollten die vorliegenden Ergebnisse durch Daten
anderer PKV-Unternehmen validiert werden, um die Übertragbarkeit zu
überprüfen. Um ein vollständigeres Bild der Inanspruchnahme
und Morbidität der PKV-Versicherten darstellen zu können, sollten
Abrechnungsdaten über mehrere Jahre betrachtet werden und nach
Rücksprache mit dem jeweiligen Datenhalter unter Abwägung von
Aktualität und realisierbarer Wartezeit der optimale Zeitpunkt für
den Datenabruf festgelegt werden.
Trotz der beschriebenen Herausforderungen ermöglichen PKV-Abrechnungsdaten
Einblicke in die Inanspruchnahme und Morbidität PKV-Versicherter und
können für die weiterführenden Analysen im Projekt IPHA
verwendet werden. Für zukünftige Forschungsvorhaben können
die beschriebenen methodischen Herausforderungen bereits bei der Planung des
Studiendesigns als Unterstützung herangezogen werden.