RSS-Feed abonnieren
DOI: 10.1055/s-2002-36323
IV: Signifikanztests - wann welchen?
IV: Significance Tests - When to Apply Which One?Publikationsverlauf
Eingegangen: 31. Oktober 2002
Angenommen: 7. November 2002
Publikationsdatum:
19. Dezember 2002 (online)
Zusammenfassung
Gängige Statistik-Softwarepakete bieten etliche verschiedene Signifikanztests zur Anwendung an. Ein Problem stellt für den Anwender einer solchen Software eher die Auswahl des je nach Fragestellung und Datenlage sachgerechten Tests dar. Für die wichtigsten univariaten Problemstellungen wird daher eine Übersicht gegeben, wann welcher Signifikanztest zu empfehlen ist und wie daraus der resultierende p-Wert interpretiert werden kann. Die beiden zentralen Entscheidungskriterien stellen dabei das Skalenniveau des klinischen Endpunkts dar (kontinuierlich oder kategorial) sowie das Design der Studie (unverbunden, d. h. interindividueller Vergleich zweier Gruppen, oder verbunden, d. h. intraindividueller Vergleich zweier Messreihen an einer Gruppe z. B. vor und nach Medikation). Liegen keine normalverteilten Daten vor, wovon im Zweifelsfall ausgegangen werden sollte, so kann der unverbundene Wilcoxon-Test zum Vergleich zweier unverbundener und der Vorzeichentest zum Vergleich zweier verbundener Messreihen kontinuierlicher Daten eingesetzt werden. Für binäre Endpunkte sind der exakte Fisher-Test zum Vergleich zweier unverbundener und der McNemar-Test zum Vergleich zweier verbundener Messreihen anwendbar. Bei time to event-Daten bietet sich für beide Studiendesigns der Logrank-Test an. Soll eine Messreihe mit einem Referenzwert z. B. aus der Literatur verglichen werden, so können bei kontinuierlichen Daten der Vorzeichentest, bei binären der Binomial-Test herangezogen werden.
Abstract
Standard statistics software packages offer a variety of significance tests. The major problem, however, is the correct choice of an appropriate significance test for the underlying data and design setting. In general, the choice of significance tests should decide between two sample versus one sample (i.e. interindividual versus intraindividual) analyses; a further determinant is the clinical endpoint's scale level (mainly continuous or categorial). Two sample comparisons can be performed using the Wilcoxon test for continuous endpoints and the exact Fisher test for binary endpoints. Intraindividual comparisons become feasible using the sign test for continuous and the McNemar test for binary endpoints. Time to event data can be analysed using the log rank test. If one measurement series has to be compared to a single reference value, the sign test can be applied for continuous data, the binomial test for binary data.
Schlüsselwörter
Wilcoxon-Test - Vorzeichentest - Fisher-Test - McNemar-Test - Binomial-Test - Logrank-Test
Key words
Wilcoxon test - sign test - Fisher's exact test - McNemar test - log rank test - binomial test
PD Dr. Frank Krummenauer
Institut für Medizinische Biometrie, Epidemiologie und Informatik der Universität Mainz
Obere Zahlbacher Straße 69
55131 Mainz
Telefon: ++49/6131/173107
Fax: ++49/6131/172968
eMail: krummi@imsd.uni-mainz.de