Zusammenfassung
Ziel: Ein einfacher, aber flexibler Zugang zur Fallzahlplanung in referenzkontrollierten
Diagnosestudien soll tutoriell beschrieben und illustriert werden. Methoden: Es wird von der häufigen Situation ausgegangen, dass ein diagnostisches Novum einem
etablierten Standard gegenübergestellt werden soll. Die Studie soll zum Vergleich
der beiden Diagnostika die Sensitivität des Novums gegenüber dem Standard in den Vordergrund
stellen; beide Verfahren sollen einen zweiwertigen Befund („positiv”/„negativ”) liefern.
Über das Konfidenzintervall für die Sensitivität wird ein einfaches, aber flexibles
Vorgehen zur Vorhersage einer Mindestfallzahl der Studie beschrieben, welches klinisch
interpretierbare Vorinformationen in die Planung einbezieht. Das Vorgehen wird illustriert
an der Planung einer Studie zum Vergleich der MRT mit der Arthroskopie als Referenz
bei der Detektion von Rupturen des Innenmeniskus. Ergebnisse: Der Leiter der Klinischen Prüfung muss im Wesentlichen nur eine Vorgabe machen, in
welchem Wertebereich der Sensitivität er das diagnostische Novum als dem Standard
gleichwertig ansieht. Ferner muss vorgegeben werden, wie präzise das Studienergebnis
die Sensitivität des Novums bestimmen soll, d.h. wie breit deren Konfidenzintervall
maximal werden soll. Daraus kann direkt eine Mindestfallzahl für die Studie abgeleitet
werden. Das Vorgehen kann einfach auf den simultanen Einbezug von Sensitivität und
Spezifität des zu bewertenden diagnostischen Verfahrens erweitert werden. Schlussfolgerungen: Das flexible Vorgehen bei der Planung über das Konfidenzintervall der Sensitivität
gestattet eine Abwägung der Fallzahlen in Abhängigkeit von der Aussagekraft des resultierenden
Studienergebnisses. Es bietet somit eine schnelle Argumentationsbasis für den Studienleiter
bei der Initialisierung der Studie sowie eine dokumentierbare Rationale für die Entscheidung,
ob eine Studie mono- oder eher multizentrisch realisierbar erscheint.
Abstract
Purpose: A tutorial illustration of a flexible approach to determine the sample size in reference-controlled
diagnostic trials. Materials and Methods: Assuming the usual setting of a new diagnostic method to be compared with a reference
method, the emphasis is on the sensitivity of the new method in comparison with the
reference method, using a binary outcome (positive versus negative) for both methods.
Based on the confidence interval of the sensitivity, a simple but flexible procedure
for determining the sample size is described, which incorporates clinically interpretable
information. The procedure is illustrated by the fictious planning of a trial to assess
the diagnostic value of MRI versus arthroscopy as a reference, in the detection of
meniscal ruptures. Results: The principal investigator merely has to propose the range for the sensitivity in
which the new method is considered equal to the reference method. Furthermore, it
must be decided in advance how accurate the study outcome should determine the sensitivity
of the new method, i.e., how wide its maximum confidence interval may become. The
minimum sample size necessary for the trial can be directly derived from this outlined
strategy, which can easily be extended by simultaneous consideration of sensitivity
and specificity of the new method being tested. Conclusion: The flexible approach to planning by means of the confidence interval of the sensitivity
controls the desired confidence of the outcome of the diagnostic trial. It allows
a priori evaluation of study budget, study duration, number of study centers and,
above all, any ethical limitations. It provides arguments for the investigator to
proceed with the comparison and a rationale for the decision to conduct the comparison
as mono- or multicentric trial
Schlüsselwörter
Diagnostische Referenz - Sensitivität - Fallzahlen - Konfidenzintervall
Key words
Diagnostic reference - sensitivity - sample size - confidence intervals
Literatur
- 1 Rasch D, Herrendörfer G, Bock J, Victor N, Guiard V.
Verfahrensbibliothek - Versuchsplanung und -auswertung (Band II). 2002: 558-564
- 2
Donner A.
Approaches to Sample Size Estimation in the Design of Clinical Trials - A Review.
Stat in Med.
1984;
3
199-214
- 3
Krummenauer F, Kalden P, Kreitner K F.
Cohen's kappa oder McNemar's Test? Der Vergleich binärer Mehrfachbefunde.
Fortschr Röntgenstr.
1999;
170
226-232
- 4
Lachenbruch P A.
On the sample size for studies based on McNemar's test.
Stat in Med.
1992;
11
1521-1525
- 5
Obuchowski N A.
Sample size calculation in studies of test accuracy.
Stat Meth Med Res.
1998;
7
371-392
- 6
Baker S G, Connor R J, Kesser L G.
The partial testing design: a less costly way to test equivalence for sensitivity
and specificity.
Stat in Med.
1998;
17
2219-2232
- 7
Linnet K.
Comparison of quantitative diagnostic tests: type I error, power and sample size.
Stat in Med.
1987;
6
147-158
- 8
Obuchowski N A, Mc Clish D K.
Sample size determination for diagnostic accuracy studies involving binormal ROC curve
indices.
Stat in Med.
1997;
16
1529-1542
- 9
Kalden P, Kreitner K F, Wittlinger T, Voigtländer T, Krummenauer F, Schreiber W, Thelen M.
Beurteilung der Durchgängigkeit von koronaren Bypass-Gefäßen in einer 2D T2-gewichteten Turbo Spin-Echo-Sequenz (HASTE) in Atemanhaltetechnik.
Fortschr Röntgenstr.
1999;
170
443-448
- 10
Vogel N, Kauczor H U, Heussel C P, Ries B G, Thelen M.
Artefaktreduzierung bei der Lungenemboliediagnostik mittels Spiral-CT unter Verwendung
eines Kochsalzbolus.
Fortschr Röntgenstr.
2001;
173
460-465
- 11
Kalden P, Kreitner K F, Oberholzer K, Pitton M, Krummenauer F, Requardt M, Thelen M.
Kontrastmittelgestützte 3D-MR-Angiographie der Becken- und Beinarterien mit automatischer
Tischverschiebung bei 1,0 Tesla.
Fortschr Röntgenstr.
2000;
172
978-984
- 12
Herber S, Kalden P, Kreitner K F, Riedel C, Rompe J D, Thelen M.
MRT bei chronischer Epicondylitits humeri radialis an einem 1,0 T-Gerät - Kontrastmittelgabe
notwendig?.
Fortschr Röntgenstr.
2001;
173
454-459
- 13
Oberholzer K, Kreitner K F, Kalden P, Pitton M, Requardt M, Thelen M.
Kontrastverstärkte dreidimensionale MR-Angiographie der A. carotis bei 1,0 Tesla im
Vergleich zur i. a.-DSA: Ist die Methode für die Diagnostik von Karotisstenosen geeignet?.
Fortschr Röntgenstr.
2001;
173
350-355
- 14
Golder W.
Statistical Analysis of German radiologic periodicals: Development trends in the last
10 years.
Fortschr Röntgenstr.
1999;
171
232-239
- 15
Koch J A, Sketch M, Brinker J, Bernink P J. PGE1-Studiengruppe .
Prostaglandin E1 zur Prophylaxe kontrastmittelinduzierter Nierenfunktionsstörungen.
Fortschr Röntgenstr.
1999;
170
557-563
- 16
Duda S H, Feuls R, deJong P, Greiner W, Pusich B, Banz K.
Ökonomische Analysen in der Interventionellen Radiologie.
Fortschr Röntgenstr.
2002;
174
149-159
- 17
Ortseifen C, Bruckner T, Burke M, Kieser M.
An Overview of Software Tools for Sample Size Determination.
Informatik, Biometrie und Epidemiologie in Medizin und Biologie.
1997;
28
91-118
- 18
Krummenauer F.
Evaluation von Diagnosevorschriften mittels interkategorieller kappa-Maße.
Der Radiologe.
2000;
40
313-318
- 19
Krummenauer F, Genevriere I, Nixdorff U.
The biometrical comparison of cardiac imaging methods.
Comp Meth Progr Biomed.
2000;
62
21-34
- 20
Krummenauer F, Dick B, Schwenn O, Pfeiffer N.
Fallzahlplanung in ophthalmologischen Studien.
Klin Monatbl Augenheilkd.
2000;
216
2-9
PD Dr. Frank Krummenauer
Institut für Medizinische Biometrie, Epidemiologie und Informatik, Universität Mainz
Obere Zahlbacher Straße 69
55131 Mainz
Phone: + 49-6131-173107
Fax: + 49-6131-172968
Email: krummi@imsd.uni-mainz.de