Zusammenfassung
Zielsetzung: Wegen der bei Kostendaten im
Gesundheitswesen üblichen schiefen Verteilung der abhängigen
Variablen ergeben sich bei der Berechnung linearer regressionsanalytischer
Kostenfunktionen mit der Ordinary-Least-Square (OLS)-Methode Probleme bei der
Schätzung der Standardfehler und der Konfidenzintervalle der
Regressionskoeffizienten. Die zur Behebung dieser Probleme üblicherweise
vorgenommene Transformation der abhängigen Variablen löst zwar das
Problem der Verteilungsschiefe, erschwert aber die Interpretation der
Regressionsparameter und die Rücktransformation der prädizierten
Werte. Mögliche Alternativen zur Transformation der abhängigen
Variablen bieten entweder die Modellierung nichtlinearer Zusammenhänge
über Verknüpfungsfunktionen oder die Schätzung von
Standardfehlern und Konfidenzintervallen mittels Bootstrappingtechniken.
Methodik: Im Rahmen der vorliegenden Untersuchung werden
diese drei Verfahren am Beispiel eines Modells zur Erklärung der Variation
der individuellen Behandlungskosten einer Stichprobe von 221 Patienten mit
schizophrenen Erkrankungen für den Zeitraum eines Jahres
gegenübergestellt. Ergebnisse: Im Vergleich zu den
Modellen mit einer logarithmischen Transformation bzw. einer logarithmischen
Verknüpfungsfunktion weist das OLS-Modell ohne Transformation zwar eine
stärkere Abweichung von der Normalverteilung und der
Homoskedastizität der Residuen, dafür jedoch eine stabilere
Parameterstruktur, eine bessere Modellanpassung und eine bessere an einer
50 %-Zufallsauswahl der Stichprobe überprüfte
Prädiktionsgüte auf. Schlussfolgerungen:
Angesichts dieser Ergebnisse kann das lineare OLS-Verfahren ohne Transformation
für die Berechnung von Kostenfunktionen als adäquates Verfahren
angesehen werden, wenn zur Schätzung der Standardfehler und der
Konfidenzintervalle eine gegenüber Abweichungen von Verteilungsannahmen
robuste nonparametrische Methode verwendet wird.
Abstract
Aim: The application of linear ordinary least
square regression in the analysis of health service cost data is frequently
associated with problems of the correct estimation of standard errors and
confidence intervals due to the skewed distribution of the dependent variable.
Transformation of the dependent cost variable may solve the problem of skewness
but causes difficulties in the interpretation of regression coefficients and
the retransformation of predicted values. As alternative methods to handle the
skewed distribution of health service cost data with the avoidance of the
problems caused by transformation the specification of non-linear link
functions or the estimation of robust standard errors and confidence intervals
by means of bootstrapping techniques can be used. Methods: For the evaluation of the practical advantages and
disadvantages of these methods regression models for the explanation of the
health service cost variance of patients with schizophrenia over a period of
one year have been computed. Results: In comparison with
the log transformed model and the log link model the OLS model without
transformation shows greater deviances from the normal distribution and the
homoscedasticity of the residuals but a more stable parametrical structure, a
better overall fit, and a better prediction of the health service costs.
Conclusion: When standard errors and confidence
intervals are assessed by nonparametric methods which are robust against
deviations from the normal distribution and the homoscedasticity of errors,
linear OLS regression without transformation seems the adequate method for the
analysis of health services cost data.
Schlüsselwörter
Kostenfunktionen - Regressionsanalyse - Versorgungskosten - Schizophrenie
Key words
Cost-function - Regression analysis - Service costs - Schizophrenia
Literatur
1
Amaddeo F, Beecham J, Bonizzato P, Fenyo A, Tansella M, Knapp M.
The costs of community-based psychiatric care for first-ever
patients. A case register study.
Psychol Med.
1998;
28
173-183
2 American Psychiatric Association .Diagnostic and statistical manual of mental disorders
(DSM-III-R). 3d ed. Washington DC; APA 1987
3 Angermeyer M C, Kilian R, Matschinger H. WHOQOL-100 und WHOQOL-BREF Handbuch für die
deutschsprachige Version der WHO Instrumente zur Erfassung von
Lebensqualität. Göttingen; Hogrefe Verlag 2000
4
Barber J A, Thompson S G.
Analysis of cost data in randomised trials: an application of
the non-parametric bootstrap.
Stat Med.
2000;
19
3219-3236
5 Beecham J, Hallam A, Knapp M, Baines B, Fenyo A, Asbury M. Costing care in hospital and in the community. In: Jeff J (Ed) Care in the community: illusion or reality. Chichester; John Wiley & Sons 1997: 93-108
6
Breusch T, Pagan A.
The LM test and its applications to model specification in
econometrics.
Review Econometric Studies.
1980;
47
239-254
7
Carpenter J, Bithell J.
Bootstrap confidence intervals: when, which, what? A
practical guide for medical statisticians.
Stat Med.
2000;
19
1141-1164
8 Chatterjee S, Price B. Regression analysis by example. 2nd ed. New York; John Wiley & Sons 1991
9
Chisholm D, Knapp M RJ, Knudsen H C et al.
Client Sociodemographic and Service Receipt Interview -
European Version.
Br J Psychiatry.
2000;
17
28-33
10
Cook R D, Weisberg S.
Diagnostics for heteroscedasticity in regression.
Biometrika.
1983;
70
1-10
11 Davidson A C, Hinkley D V. Bootstrap Methods and their application (1. ed). Cambridge; Cambridge University Press 1997
12
Diehr P, Yanez D, Ash A, Hornbrook M, Lin D Y.
Methods for analyzing health care utilization and costs.
Am Rev Public Health.
1999;
20
125-144
13
Duan N.
Smearing estimate: a nonparametric retransformation
method.
J Am Stat Assoc.
1983;
78
603-610
14 Efron B, Tibshirani R. An Introduction To The Bootstrap (Vols. 57). New York, London; Chapmann & Hall 1993
15
Efron B, Tibshirani R.
Bootstrap Methods for Standard Errors, Confidence Intervals,
and Other Measures of Statistical Accuracy.
Statistical Sciences.
1986;
1
54-77
16 Greene W H. Econometric Analysis, 3th ed. New Jersey; Prentice Hall 1997
17
Kilian R, Roick C, Bernert S, Mory C, Matschinger H, Becker T, Angermeyer M C.
Die europäische Standardisierung und die
deutschsprachige Adaptation von Instrumenten zur Erfassung der Ergebnisse und
der Kosten von Versorgungsleistungen für Menschen mit schweren psychischen
Erkrankungen.
Gesundheitswesen.
2001;
63
27-31
18
Kilian R, Roick C, Matschinger M, Bernert S, Mory C, Angermeyer M C.
Die Analyse von Kostenstrukturen im Bereich der
Schizophreniebehandlung mit einem standardisierten Instrumentarium.
Psychiat Prax.
2001;
28
102-108
19
Koenker R, Basset Jr G.
Regression quantiles.
Econometrica.
1978;
46
107-112
20
Koenker R, Basset Jr G.
Robust tests for heteroscedasticity based on regression
quantiles.
Econometrica.
1982;
50
43-61
21 Knapp M, Chisholm D, Leese M, Tansella M, Schene A, Thornicroft G, Vazques-Barquero J L, Knudsen H C, Becker T. Comparing patterns and costs of schizophrenia care in five
European countries: The Epsilon study. Soc Psychiatry Psychiatr Epidemiol (in
Press).
22
Knapp M, Chisholm D, Astin J, Lelliott P, Audine B.
Public, private and voluntary residential mental health care:
is there a cost difference?.
J Health Services Res Pol.
1998;
3
141-148
23
Knapp M, Chisholm D, Astin J, Lelliott P, Audini B.
The costs consequences of changing the hospital-community
balance: the mental health residential care study.
Psychol Med.
1997;
27
681-692
24
Knapp M, Marks I, Wolstenholme J, Beecham J, Astin J, Audini B, Connolly J, Watts V.
Home-based hospital-based care for serious mental illness.
Controlled cost-effectiveness study over four years.
Br J Psychiatry.
1998;
172
506-512
25
Knapp M.
Making music out of noise - the cost function approach to
evaluation.
Brit J Psychiatry.
1998;
173
7-11
26
Lukoff D, Nuechterlein K H, Ventura J.
Manual for the Expanded Brief Psychiatric Rating Scale.
Schizophr Bull.
1986;
12
594-602
27
Manning W G.
The logged dependent variable, heteroscedasticity, and the
retransformation problem.
J Health Econ.
1998;
17
283-295
28
MeCrone P, Leese M, Thronicroft G et al.
Reliability of the Camberwell Assessment of Need. European
Version.
Br J Psychiatry.
2000;
17
34-40
29
McCrone P, Beecham I, Knapp M.
Community psychiatric nurse teams: Cost-effectiveness of
intensive support versus generic care.
Brit J Psychiatry.
1994;
165
218-221
30 McCullagh P, Nelder J A. Generalized linear models. 2nd ed. London; Chapman & Hall 1989: 18
31
Rössler W, Salize J, Knapp M.
Die Kosten der Schizophrenie.
Fortsch Neurol Psychiat.
1998;
66
496-504
32
Roick C, Kilian R, Matschinger H, Bernert S, Mory C, Angermeyer M C.
Die deutsche Version des Client Sociodemographic and Service
Receipt Inventory: Ein Instrument zur Erfassung psychiatrischer
Versorgungskosten.
Psychiat Prax.
2001;
28
84-90
33
Salize H J, Rössler W.
The costs of comprehensive care of people with schizophrenia
living in the community.
Br J Psychiatry.
1996;
169
42-48
34
Graf von der Schulenburg J M, Uber A, Höffler J, Trenckmann U, Kissling W, Seemann U, Müller P, Rüther E.
Untersuchungen zu den direkten und indirekten Kosten der
Schizophrenie. Eine empirische Analyse. Gesundh ökon.
Qual manag.
1998;
3
81-87
35
Shapiro S S, Wilk M B.
An analysis of variance test for normality (complete
samples).
Biometrika.
1965;
52
591-611
36 StataCorp .Stata reference manual. Release 6. Stata Press - College Station 1999
37 Stine R. An introduction to bootstrap methods: Example and ideas. In: Fox J, Long JS (Eds) Modern methods of data analysis. Newbury Park; SAGE 1990: 325-373
38
Thompson S G, Barber J.
How should cost data in pragmatic randomised trials be
analysed.
BMJ.
2000;
320
1197-1200
39
White H.
A heteroscedasticity-consistent covariance matrix estimator
and a direct test for heteroscedasticity.
Econometrica.
1980;
48
817-838
40 Wonnacot T H, Wonnacott R J. Regression: A second course in statistics. New York; John Wiley & Sons 1981
41
Zheng B, Agresti A.
Summarizing the predictive power of a generalized linear
model.
Stat Med.
2000;
19
1771-1781
1 Das gleiche Problem stellt sich auch bei der so genannten
Quantilsregression nach Koenker und Basset [19 ]
[20 ], bei der im Unterschied zur
OLS-Regression eine Minimierung der Summe der gewichteten absoluten Residuen
Σ(|ŷi -yi | wi ) = min
erfolgt. Die Quantilsregression hat die allgemeine Form
Qq(y) = αq + β q,
1 x1 + β q,
2 x2 + β q, i xi ,
wobei q dem zu schätzenden Perzentil der Verteilung von y entspricht. Bei
einem q von 0,5 entspricht Q dem 50%-Perzentil, also dem Median, bei einem q
von 0,25 entspricht Q dem 25%-Perzentil bzw. dem 1. Quartil und bei einem q von
0,75 dem 75%-Perzentil bzw. dem 3. Quartil von y. Auch die Quantilsregression
liefert demzufolge bei schiefen Verteilungen der abhängigen Variablen
keine Prädiktion des arithmetischen Mittelwerts von y [36].
Dr. R. Kilian
Universität Leipzig · Klinik und Poliklinik für
Psychiatrie
Johannisallee 20 · 04317 Leipzig ·
eMail: kilr@medizin.uni-leipzig.de