Aspekte der Fallzahlkalkulation und Powerberechnung anhand von Beispielen aus der rehabilitationswissenschaftlichen Forschung
Aspects of Sample Size Determination and Power Calculation Illustrated on Examples from Rehabilitation ResearchM. Kutschmann1
, R. Bender2
, U. Grouven2
, G. Berg1
1AG Epidemiologie & International Public Health, Fakultät für Gesundheitswissenschaften, Universität Bielefeld
2Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen, Köln
Koordinatoren der Reihe „Methoden in der Rehabilitationsforschung”:
Prof. Dr. Dr. Hermann Faller, Würzburg; Prof. Dr. Thomas Kohlmann, Greifswald; Dr. Christian Zwingmann, SiegburgInteressenten, die einen Beitrag zur Reihe beisteuern möchten, werden gebeten, vorab Kontakt aufzunehmen, E-mail: christian.zwingmann@web.de
Vielfach wird in medizinischen Studien berichtet, dass ein vermuteter Effekt, z. B. bezüglich der Wirksamkeit einer Maßnahme, nicht gefunden werden konnte. Dies kann damit zusammenhängen, dass die Zahl der in die Studie eingeschlossenen Patienten zu klein war, um einen tatsächlich vorhandenen Effekt entdecken zu können. Oft ist dies darauf zurückzuführen, dass vor Beginn der Studie eine solide Fallzahlkalkulation nicht durchgeführt wurde. Damit fehlen Informationen darüber, wie viele Patienten man hätte einschließen müssen, um den vermuteten Effekt, sofern er vorhanden ist, auch nachweisen zu können. Auf der anderen Seite besteht die Gefahr einer fehlenden Fallzahlkalkulation darin, dass mehr Personen als nötig in die Studie eingeschlossen werden. Dies ist aus zeit- und kostenökonomischen, insbesondere aber auch aus ethischen Gründen bedenklich. Im vorliegenden Beitrag wird das Prinzip der Fallzahlkalkulation erläutert und auf seine Bedeutung - insbesondere in der rehabilitationswissenschaftlichen Forschung - eingegangen.
Abstract
Often it is reported in medical studies that an expected effect could not be detected. This may be the case if the sample size had been too small to detect an effect which actually exists. This often is due to the fact that sound sample size estimation had been omitted prior to the study outset. As a result, it is not known how many persons should have been involved in the study to detect this effect if present. On the other hand, if sample size estimation has not been realized, more persons than needed might be included in the study. This is problematic for economic and in particular for ethical reasons. The aim of this paper is to point out the principles of sample size estimation as well as to emphasize its importance not only in general but also in medical rehabilitation research.
Schlüsselwörter
Power - Fallzahl - Stichprobenumfang - Signifikanz - relevanter Unterschied
Key words
Power - sample size - significance - relevant difference
Literatur
1 Bock J. Bestimmung des Stichprobenumfangs für biologische Experimente und kontrollierte klinische Studien. München; Oldenbourg 1998: 1
11
Beaupre L A, Lier D, Davies D M, Johnston D BC.
The effect of a preoperative exercise and education program on functional recovery, health related quality of life, and health service utilization following primary total knee arthroplasty.
Journal of Rheumatology.
2004;
31 (6)
1166-1173
16
Schulz K F, Grimes D A.
Fallzahlschätzung in randomisierten Studien: ein Muss und ein Mysterium.
Zeitschrift für ärztliche Fortbildung und Qualität im Gesundheitswesen.
2006;
100
129-135
20
Ortseifen C, Bruckner T, Burke M, Kieser M.
An overview of software tools for sample size determination.
Informatik, Biometrie und Epidemiologie in Medizin und Biologie.
1997;
28
91-118
1 Der Zusammenhang dieser drei Größen wird im Abschnitt „Zusammenhang zwischen Fallzahl, Power, Signifikanzniveau, relevantem Unterschied und Zielgrößenvariabilität” noch ausführlicher erläutert.
2 Dabei wird das Konzept des Signifikanztests nach J. Neyman und E. Pearson zugrunde gelegt. Sie erweitern die Konzepte von R. A. Fisher, in denen lediglich eine Nullhypothese betrachtet wird, um die Alternativhypothese. Zum Fehler 1. Art kommt so noch der Fehler 2. Art hinzu, ohne dessen Berücksichtigung Fallzahlberechnungen und Powerkalkulationen nicht möglich wären.
3 Die relevante Differenz von 21 AU-Tagen wurde auf Grundlage der Überlegung gewählt, was eine Rehabilitationsmaßnahme mindestens leisten muss, um als erfolgreich betrachtet werden zu können. Man kam zu dem Schluss, dass dies der Fall ist, wenn die Zeit der Arbeitsunfähigkeit um mindestens drei Wochen reduziert werden kann.
Dr. Marcus Kutschmann
Universität Bielefeld · Fakultät für Gesundheitswissenschaften · AG Epidemiologie & International Public Health