Rehabilitation (Stuttg) 2005; 44(1): 44-49
DOI: 10.1055/s-2004-834624
Methoden in der Rehabilitationsforschung
© Georg Thieme Verlag KG Stuttgart · New York

Sensitivität, Spezifität, positiver und negativer Vorhersagewert

Sensitivity, Specificity, Positive and Negative Predictive ValueH.  Faller1
  • 1Stiftungsprofessur Rehabilitationswissenschaften, Institut für Psychotherapie und Medizinische Psychologie, Universität Würzburg
Weitere Informationen

Publikationsverlauf

Publikationsdatum:
25. Januar 2005 (online)

Zusammenfassung

Was bedeutete es, wenn ein Screeningtest eine Sensitivität von 80 % und eine Spezifität von 80 % aufweist? Welche Schlussfolgerungen kann ich daraus auf die Wahrscheinlichkeit ziehen, mit der ein positiv getesteter Patient die gesuchte Störung auch tatsächlich aufweist? Ist diese Wahrscheinlichkeit abhängig von der Prävalenz der gesuchten Störung? Derartige Fragen werden im folgenden Beitrag behandelt. Die klassischen Begriffe Sensitivität und Spezifität werden ebenso erläutert wie die moderneren und alltagsrelevanteren Konzepte des positiven und negativen Vorhersagewerts. Dabei benutzt der Autor unterschiedliche didaktische Präsentationen wie 4-Felder-Tafeln, grafische Darstellungen und natürliche Häufigkeiten, um diese immer wieder verwechselten Begriffe möglichst einfach und nachvollziehbar darzustellen.

Abstract

What does it mean that a screening test has a sensitivity of 80 % and a specificity of 80 %? What conclusion can be drawn as to the probability of a patient tested positive having the target disorder? Is this probability dependent on the prevalence of the target disorder? These are the questions addressed in the present paper. The classical concepts of sensitivity and specificity are presented as well as the more modern and clinically relevant concepts of the predictive values of a positive and a negative test. The author employs different didactic methods such as 2 × 2 tables, graphical illustrations and natural frequencies for elaborating on these often intermixed concepts in a clear and easily understandable way.

Literatur

  • 1 Härter M, Reuter K, Schretzmann B, Hasenburg A, Aschenbrenner A, Weis J. Komorbide psychische Störungen bei Krebspatienten in der stationären Akutbehandlung und medizinischen Rehabilitation.  Rehabilitation. 2000;  39 317-323
  • 2 Härter M, Baumeister H, Reuter K, Wunsch A, Bengel J. Epidemiologie komorbider psychischer Störungen bei Rehabilitanden mit muskuloskeletalen und kardiovaskulären Erkrankungen.  Rehabilitation. 2002;  41 367-374
  • 3 US Preventive Services Task Force . Screening for depression: recommendations and rationale.  Ann Intern Med. 2002;  136 760-764
  • 4 Sackett D L, Straus S E, Richardson W S, Rosenberg W, Haynes R B. Evidence-based medicine. 2. Aufl. Edinburgh; Churchill Livingstone 2000
  • 5 Löwe B, Spitzer R L, Grafe K, Kroenke K, Quenter A, Zipfel S, Buchholz C, Witte S, Herzog W. Comparative validity of three screening questionnaires for DSM-IV depressive disorders and physicians' diagnoses.  Journal of Affective Disorders. 2004;  78 131-140
  • 6 Kroenke K, Spitzer R L, Williams J BW. The PHQ-9. Validity of a brief depression severity measure.  J Gen Intern Med. 2001;  16 606-613
  • 7 Pignone M P, Gaynes B N, Rushton J L, Burchell C M, Orleans C T, Mulrow C D, Lohr K N. Screening for depression in adults: A summary of the evidence for the U. S. Preventive Services Task Force.  Annals of Internal Medicine. 2002;  136 765-776
  • 8 Spitzer R L, Williams J BW, Kroenke K, Linzer M, deGruy III F V, Hahn S R, Brody D, Johnson J G. Utility of a new procedure for diagnosing mental disorders in primary care. The PRIME-MD 1000 study.  JAMA. 1994;  272 1749-1756
  • 9 Whooley M A, Simon G E. Managing depression in medical outpatients.  N Engl J Med. 2000;  343 1942-1950
  • 10 Gigerenzer G. Das Einmaleins der Skepsis. Berlin; Berlin Taschenbuch Verlag 2004
  • 11 Loong T-W. Understanding sensitivity and specificity with the right side of the brain.  BMJ. 2003;  327 16-19
  • 12 Kraemer H C. Evaluating medical tests. Newbury Park; Sage 1992
  • 13 Sackett D L, Haynes R B, Guyatt G H, Tugwell P. Clinical epidemiology. 2. Aufl. Boston; Little, Brown and Company 1991
  • 14 Löwe B, Spitzer R L, Zipfel S, Herzog W. Gesundheitsfragebogen für Patienten (PHQ-D). 2. Aufl. Karlsruhe; Pfizer 2002
  • 15 Herrmann C, Buss U, Snaith R. Hospital Anxiety and Depression Scale - Deutsche Version. Bern; Huber 1995
  • 16 World Health Organization (WHO) .Wellbeing measures in primary health care: The DepCare Project. Kopenhagen; WHO Regional Office for Europe 1998
  • 17 Wittchen H, Zaudig M, Fydrich T. Strukturiertes Klinisches Interview für DSM-IV (SKID), Achse 1. Göttingen; Hogrefe 1997
  • 18 Lienert G A, Raatz U. Testaufbau und Testanalyse. Weinheim; Beltz PVU 1998

1 Wir sprechen an dieser Stelle vereinfachend vom tatsächlichen Vorhandensein der Krankheit, obwohl es sich in den meisten Fällen lediglich um die Diagnose einer Krankheit handelt. Die Diagnose steht aber mit dem tatsächlichen Vorhandensein wiederum nur in einer mehr oder weniger engen Beziehung. „A disorder is what a patient has; a diagnosis is what a physician believes a patient has” [12].

2 Auf das Problem der Wahl eines geeigneten Referenzstandards kann im Rahmen dieser Arbeit nicht eingegangen werden. Dies ist ein inhaltliches Problem, welches die vorgestellten Wahrscheinlichkeitskonzepte zunächst nicht berührt. Auch die Frage, ob es sich bei Depression um eine Krankheit oder, zurückhaltender formuliert, nur um eine Störung handelt, ist für die folgenden Überlegungen nicht relevant.

3 Obwohl allgemein angenommen wird, dass Sensitivität und Spezifität in unterschiedlichen Populationen konstant sind, ist dies nicht notwendigerweise der Fall [12].

4 Oft strebt man bei einem Screening eine möglichst hohe Sensitivität an, um keine Kranken zu verpassen. Damit nimmt man aber u. U. einen hohen Anteil falsch positiver Testresultate in Kauf. Diesem Nachteil (für die Betroffenen wie auch das Team) kann man in einem zweistufigen Screening dadurch begegnen, dass man für die erste Teststufe mehr Wert auf die Sensitivität legt, während der zweite Test möglichst spezifisch sein sollte, um die falsch positiv getesteten Probanden wieder auszuschließen.

Prof. Dr. med. Dr. phil. Dipl.-Psych. Hermann Faller

Stiftungsprofessur Rehabilitationswissenschaften · Institut für Psychotherapie und Medizinische Psychologie · Universität Würzburg

Klinikstraße 3

97070 Würzburg

eMail: h.faller@mail.uni-wuerzburg.de