Klin Monbl Augenheilkd 2002; 219(11): 817-820
DOI: 10.1055/s-2002-36323
Fortbildung
© Georg Thieme Verlag Stuttgart · New York

IV: Signifikanztests - wann welchen?

IV: Significance Tests - When to Apply Which One?Frank  Krummenauer1
  • 1Institut für Medizinische Biometrie, Epidemiologie und Informatik der Universität Mainz
Further Information

Publication History

Eingegangen: 31. Oktober 2002

Angenommen: 7. November 2002

Publication Date:
19 December 2002 (online)

Zusammenfassung

Gängige Statistik-Softwarepakete bieten etliche verschiedene Signifikanztests zur Anwendung an. Ein Problem stellt für den Anwender einer solchen Software eher die Auswahl des je nach Fragestellung und Datenlage sachgerechten Tests dar. Für die wichtigsten univariaten Problemstellungen wird daher eine Übersicht gegeben, wann welcher Signifikanztest zu empfehlen ist und wie daraus der resultierende p-Wert interpretiert werden kann. Die beiden zentralen Entscheidungskriterien stellen dabei das Skalenniveau des klinischen Endpunkts dar (kontinuierlich oder kategorial) sowie das Design der Studie (unverbunden, d. h. interindividueller Vergleich zweier Gruppen, oder verbunden, d. h. intraindividueller Vergleich zweier Messreihen an einer Gruppe z. B. vor und nach Medikation). Liegen keine normalverteilten Daten vor, wovon im Zweifelsfall ausgegangen werden sollte, so kann der unverbundene Wilcoxon-Test zum Vergleich zweier unverbundener und der Vorzeichentest zum Vergleich zweier verbundener Messreihen kontinuierlicher Daten eingesetzt werden. Für binäre Endpunkte sind der exakte Fisher-Test zum Vergleich zweier unverbundener und der McNemar-Test zum Vergleich zweier verbundener Messreihen anwendbar. Bei time to event-Daten bietet sich für beide Studiendesigns der Logrank-Test an. Soll eine Messreihe mit einem Referenzwert z. B. aus der Literatur verglichen werden, so können bei kontinuierlichen Daten der Vorzeichentest, bei binären der Binomial-Test herangezogen werden.

Abstract

Standard statistics software packages offer a variety of significance tests. The major problem, however, is the correct choice of an appropriate significance test for the underlying data and design setting. In general, the choice of significance tests should decide between two sample versus one sample (i.e. interindividual versus intraindividual) analyses; a further determinant is the clinical endpoint's scale level (mainly continuous or categorial). Two sample comparisons can be performed using the Wilcoxon test for continuous endpoints and the exact Fisher test for binary endpoints. Intraindividual comparisons become feasible using the sign test for continuous and the McNemar test for binary endpoints. Time to event data can be analysed using the log rank test. If one measurement series has to be compared to a single reference value, the sign test can be applied for continuous data, the binomial test for binary data.

PD Dr. Frank Krummenauer

Institut für Medizinische Biometrie, Epidemiologie und Informatik der Universität Mainz

Obere Zahlbacher Straße 69

55131 Mainz

Phone: ++49/6131/173107

Fax: ++49/6131/172968

Email: krummi@imsd.uni-mainz.de