Das Arznei-Telegramm - zu den Herausgebern gehört auch der Direktor des Institutes für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) - hat in Ausgabe 5/2005 das Thema des Sommers 2004 „Suizidalität unter selektiven Serotonin-Wiederaufnahmehemmern (SSRI)” wiederentdeckt und - unter Berufung auf die Meta-Analyse von Kirsch et al. [22] - angereichert mit der subtilen Suggestion, Antidepressiva grenzten sich in der Wirksamkeit nicht in klinisch relevantem Maße von Plazebo ab. Daraus ergab sich der eingängige Titel: „Antidepressiva: Lebensgefährliche Plazebos?”. Fragt sich, ob bereits im Vorfeld der am 18.01.2005 vom Gemeinsamen Bundesausschuss beim IQWiG in Auftrag gegebenen Analyse zur vergleichenden Wirksamkeit der Antidepressiva auf Ebene „patientenrelevanter Endpunkte” das Terrain vorbereitet werden soll. Jedenfalls kann diese Suggestivbotschaft den überwiegend hausärztlichen Verordner nur verunsichern, erst recht angesichts des ökonomischen Drucks, unter dem er insbesondere bei der Verordnung von Arzneimitteln steht. Will also das Arznei-Telegramm suggerieren, das Geld sei in antidepressive Therapie schlecht investiert?
Wirksamkeit der Antidepressiva
Der Meta-Analyse von Kirsch et al. [22], die der Food and Drug Administration (FDA) eingereichte Zulassungsstudien einbezog, gingen ähnliche Analysen u.a. derselben Autoren [23] voraus. Letztere wurde vermutlich mit gutem Grund im Internet-Journal der American Psychological Association „Prevention & Treatment” publiziert, denn die Botschaft sollte auch sein, Psychotherapie sei effizienter. Die Analyse gab Anlass zu lebhafter Debatte im englischen Sprachraum - und wurde nun nach Jahren endlich auch vom Arznei-Telegramm entdeckt, allerdings ohne die Kritik an diesen Meta-Analysen zu würdigen. Einige dieser Kritikpunkte sollen hier in Erinnerung gerufen und ergänzt werden.
Klein [24] und andere hatten die erste Meta-Analyse [23] in vielfältiger Hinsicht kritisiert, u.a. bezüglich der Studienselektion. Diese Kritik hat wahrscheinlich die neue Meta-Analyse [22], nun basierend auf allen - publizierten und unpublizierten - Zulassungsstudien induziert. Damit bleiben aber die grundsätzlichen Bedenken, die Klein [24] an der meta-analytischen Methodik geäußert hatte, unberührt. Diese lassen sich dahingehend zusammenfassen, dass eine Meta-Analyse nicht zwingend die „Wahrheit” ans Licht bringen kann - auch wenn dies die Hierarchiesysteme der evidenzbasierten Medizin auf den ersten Blick glauben machen könnten. Meta-Analysen können für sich alleine keine zwingende Evidenz beanspruchen [25]. So liegt z.B. ein entscheidender Mangel der meta-analytischen Technik darin, dass die spezifischen methodischen Qualitäten bzw. Mängel der einzelnen, einbezogenen Studien im Ergebnis unberücksichtigt bleiben. Daher sind jedenfalls Sensitivitätsanalysen notwendig. Eine solche Sensitivitätsanalyse fehlt bei Kirsch et al. [22].
Die Meta-Analyse von Kirsch et al. [22] berücksichtigte nicht etwa - wie die Interpretation durch das Arznei-Telegramm suggerieren will - alle Antidepressiva, sondern letztlich nur Fluoxetin, Venlafaxin und Nefadozon (letzteres wegen Sicherheitsproblemen vom Markt genommen). Dabei wurden die Daten gescheiterter Studien mit denen positiver Studien zusammengefasst. Das mag auf den ersten Blick plausibel sein. Auf den zweiten Blick aber fragt sich, ob es legitim ist, Daten von Studien, in denen in erheblichem Maße die diagnostischen Kriterien nicht erfüllt waren, unbesehen einzubeziehen. Man kann im Gegenteil argumentieren, zur Beurteilung der Wirksamkeit dürften nur Studien mit drei- (oder mehr-) armigem Design (also Plazebo, Verum und aktive Referenz) herangezogen werden, denn nur so steht ein echter Ankerpunkt zur Verfügung [10].
Die Geschwindigkeit und das Ausmaß der Wirkung von Antidepressiva über die verschiedenen Substanzen hinweg und unabhängig vom Typ der Depression der eingeschlossenen Kranken sind weitgehend stabil, der Plazeboeffekt aber variiert erheblich [4]
[21]. Der Plazeboeffekt bestimmt also die Effektstärke des Antidepressivums. So liegt der Plazeboeffekt bei schwerkranken, hospitalisationsbedürftigen Patienten nur bei rund 20 %, bei leichter Kranken aber bei bis zu ca. 50 %, der Effekt des Antidepressivums aber unverändert bei 60-70 %. Je chronifizierter die Depression ist, desto geringer wird der Plazeboeffekt, nicht aber der Effekt des Antidepressivums [4]. Non-Suppressoren von Kortisol im Dexamethason Suppressionstest (DST) haben einen Plazeboeffekt von nur ca. 10 %, Suppressoren aber einen überdurchschnittlichen. Wären Antidepressiva - wie vom Arznei-Telegramm unter Berufung auf Kirsch et al. [22] suggeriert - tatsächlich kaum wirksam, dann müsste der Plazeboeffekt und damit die Effektstärke u.a. unabhängig vom Schweregrad gleich bleiben. Das trifft offensichtlich nicht zu.
Typische Nebenwirkungen erleichtern die Entblindung doppelblinder Studien. Es ist gut etabliert, dass diese Entblindung die Überlegenheit des Antidepressivums gegenüber Plazebo scheinbar vergrößert [15]. Wären aber Antidepressiva weitgehend unwirksam - also Plazebos - so müssten Antidepressiva mit besonders typischen Nebenwirkungen, also z.B. mit sedierenden und/oder anticholinergen Nebenwirkungen, scheinbar besonders „wirksam” sein. Das trifft aber nicht zu [1]. Allenfalls bei hospitalisationsbedürftigen Schwerkranken sind trizyklische Antidepressiva (Amitriptylin) wirksamer als andere Antidepressiva [1].
Das Arznei-Telegramm hebt wie Kirsch et al. [22] auf den mit durchschnittlich zwei Punkten tatsächlich nur geringen Plazebo-Verum-Unterschied auf der Hamilton-Depression-Scale (HAM-D) ab. Den einzelnen Patienten wie auch den Arzt oder die Kostenträger kann aber nicht interessieren, wie ein Patient sich durchschnittlich bessert, sondern wie die Chancen eines Therapieerfolges (Response (> 50 % Besserung) oder besser noch einer Remission (HAM-D < 8) sind. Zweifellos ergeben sich hier alle der Festlegung von Cut-offs inhärenten Probleme. Immerhin aber ergibt sich für die Responderrate unter trizyklischen Antidepressiva ein durchschnittlicher Plazebo-Verum-Unterschied von 15 % (31 % versus 46 %), unter Plazebo erheblich variierend zwischen 6 % und 52 %, unter Verum aber nur zwischen 40 % und 69 % [33]. Daraus ergibt sich eine „number needed to treat” (NNT) von sieben, d.h. sieben Patienten müssen behandelt werden, um bei einem Patienten eine dem Antidepressivum ursächlich zuzuschreibende Response zu erzielen.
Walsh et al. [38] fanden - unabhängig vom Typ des Antidepressivums - eine mittlere Responserate von 50,1 % gegenüber 29,7 % unter Plazebo, also eine um ca. 20 % überlegene Wirksamkeit (NNT = 5). Diese NNT von fünf bis sieben kann sich im Vergleich zu anderen Indikationsgebieten sehr gut sehen lassen. Antidepressiva stehen also in der Wirksamkeit vielen anderen, unangefochtenen Arzneimitteln in nichts nach. Die Responseraten korrelieren [38] insbesondere in den Plazebogruppen mit dem Publikationsjahr der Studie, d.h. die Plazeboresponse hat in den letzten Dekaden (7 % pro Dekade) zugenommen. Das bedeutet u.a., dass vermehrt leichter Kranke in die Studien aufgenommen wurden. Das kann die Validität der den Studien zugrunde gelegten diagnostischen Klassifikationssysteme in Frage stellen.
Klinisch noch relevanter als die Responderrate ist die Remissionsrate, d.h. der Anteil Kranker, die gesund (HAM-D < 8) werden. Dieser Parameter wurde in der Vergangenheit leider nur in der Minderzahl der Studien angegeben. Deshalb können hier nur die Ergebnisse beispielhafter Meta-Analysen genannt werden. Bei Venlafaxin retard liegt die NNT im Vergleich zu Plazebo bei 4 bis 5 ([6]
[32]
[34], Übersicht bei 12). Thase [35] wies zurecht darauf hin, dass ein Plazebo-Verum-Unterschied selbst von nur 10 %, also eine NNT von 10, aus Sicht des Gesundheitswesens angesichts der hohen Prävalenz der Depression sehr wohl klinisch relevant ist, „viel größer als der Effekt einer Gewichtsreduktion oder der Cholesterinsenkung auf das Myokardinfarktrisiko oder des Einstellens des Rauchens auf das Lungenkrebsrisiko”. Die Relevanz für das Gesundheitswesen wird noch deutlicher, wenn man die hohe Prävalenz weiterer Krankheiten, bei denen Antidepressiva wirksam sind, also Panikkrankheit, Zwangskrankheit, chronische Schmerzen und viele andere mehr, einbezieht. Diese weiteren Indikationen wurden von Kirsch et al. [22] nicht berücksichtigt und vom Arznei-Telegramm ignoriert.
Kirsch et al. [22] berücksichtigten nur Kurzzeitstudien (bis zu 8 Wochen). Thase [35] wies in seiner Erwiderung u.a. darauf hin, dass die Plazebo-Verum-Unterschiede in plazebokontrollierten Absetzstudien typischerweise dem Doppelten des Plazeboeffektes entsprechen. In der Tat fanden Geddes et al. [14] in ihrer Meta-Analyse von 31 randomisierten, doppelblinden plazebokontrollierten Studien eine hoch-signifikante (p < 0,00001) Wirksamkeit der Erhaltungstherapie mit Relapseraten von 41 % unter Plazebo versus 18 % unter Verum. Dieser Befund ist kaum mit der behaupteten Unwirksamkeit von Antidepressiva vereinbar.
Das Arznei-Telegramm führt als weiteren Beleg für die fragwürdige Wirksamkeit von Antidepressiva die Arbeiten von Moncrieff et al. [28]
[29] an, wonach sie nicht in klinisch relevantem Maße einem aktiven Plazebo überlegen seien. Diesem Argument liegen nur neun Studien (trizyklische Antidepressiva versus Atropin) mit insgesamt nur 751 Patienten zugrunde, von denen nur zwei eine Überlegenheit des Antidepressivums zeigten. Dieses Argument postuliert, Atropin wäre tatsächlich nicht antidepressiv wirksam. Dafür fehlt der Beleg. Im Gegenteil gibt es eine Reihe experimenteller Hinweise für antidepressive Wirkungen von Anticholinergika (wie Atropin) und umgekehrt antimanische Wirkungen von Cholinomimetika [8]
[9]. Andererseits weisen Quitkin et al. [31] zurecht darauf hin, dass sich die Responderraten zwischen Plazebo und „aktivem Plazebo” nicht unterscheiden; das ist nicht vereinbar mit dem vom Arznei-Telegramm übernommenen Argument, Antidepressiva wären „aktive Plazebos”. Schließlich waren die Studien, die trizyklische Antidepressiva gegen Atropin als „aktives Plazebo” prüften, methodisch ungeeignet: ein Plazebo-Arm fehlte, die Fallzahl (Power) war zu gering und unzureichend geplant, die Dosis des Antidepressivums war inadäquat, die Behandlungsdauer (nur 3-4 Wochen) war inadäquat, die Diagnosen waren heterogen [31].
Das Arznei-Telegramm reklamiert das Fehlen von Dosis-Wirkungs-Beziehungen. Tatsächlich fanden die wenigsten Antidepressiva-Studien solche Beziehungen. Diese Kritik aber ignoriert die sog. Wirklatenz, dass sich also die antidepressive Wirkung nur allmählich im Verlauf von Tagen bis Wochen entwickelt. Diese Latenz bedeutet, dass nicht das Antidepressivum selbst für die antidepressive Wirkung verantwortlich ist, sondern dass das Antidepressivum adaptative Prozesse anstößt und erst die neue Homöostase (die bisher unzureichend identifiziert ist) die Stimmungsaufhellung bedingt [11]. Deshalb kann ein linearer Zusammenhang zwischen Dosis und Wirkung nicht erwartet werden. Um diese Adaptationen zu triggern, bedarf es einer Mindestkonzentration an den Rezeptoren, also einer Mindestkonzentration im Serum. Tatsächlich wurde zumindest für einige unselektive, insbesondere trizyklische Antidepressiva der Zusammenhang zwischen einer Mindestkonzentration im Serum und Therapieresponse bewiesen (Übersicht z.B. [30]). Wegen der erheblichen interindividuellen Variabilität der Bioverfügbarkeit kann die Identifikation einer minimal wirksamen Dosis nicht gelingen. Das Argument fehlender Dosis-Wirkungs-Beziehung geht also ins Leere.
Anderson & Haddad [2] wiesen darauf hin, dass die Zulassungsstudien wegen ihrer experimentellen Bedingungen (u.a. strikte Ein- und Ausschlusskriterien) die wirkliche Effektstärke nicht abbilden, keine Aussage über die Wirksamkeit im Behandlungsalltag (effectiveness statt efficacy) erlauben. Die „wahre” Wirksamkeit unter Alltagsbedingungen sei schlicht unbekannt. Hier bestehe erheblicher Forschungsbedarf. Die echte Effektstärke von Antidepressiva ist also im schlimmsten Fall nicht bekannt, jedenfalls aber klinisch relevant.
Suizidalität unter Antidepressiva
Wie steht es nun um die vom Arznei-Telegramm suggerierte Lebensgefährlichkeit der Antidepressiva? Das Arznei-Telegramm tut die inzwischen umfangreichen epidemiologischen Daten, wonach es mit zunehmender Verordnung von Antidepressiva und hier insbesondere SSRI zu einem Rückgang der Suizidraten gekommen ist (Übersicht bei [13]), als nicht aussagefähig ab. Es trifft selbstverständlich zu, dass diese Daten wegen vielfältiger anderer Einflussfaktoren keine suizidpräventiven Wirkungen der Antidepressiva beweisen. Sie sind aber nicht irrelevant, denn sie zeigen zumindest, dass es mit zunehmender Verordnung von SSRI nicht zu einer Zunahme an Suiziden gekommen ist.
Die Zunahme suizidaler Gedanken und suizidaler Handlungen - nicht etwa Suiziden [37] - bei Kindern und Jugendlichen in plazebokontrollierten Studien zu Paroxetin, die dessen Wirksamkeit nicht bestätigten, löste im Jahr 2004 eine lebhafte Debatte aus. Diese mündete in internationale Warnhinweise bezüglich der Verordnung von SSRI sowie selektiven Serotonin-Noradrenalin-Wiederaufnahmehemmern an Kinder und Jugendliche, die in Deutschland ohnehin für die Indikation Depression nicht zugelassen sind. In dieser Altersgruppe ist der Plazeboeffekt besonders ausgeprägt, weshalb ein konsistenter Wirksamkeitsnachweis bisher scheiterte [20]. Diese Debatte hat die Diskussion, die es schon einmal vor 15 Jahren gab, auch für Erwachsene reaktiviert. Das Arznei-Telegramm suggeriert nun, eine unzureichende Datenlage belege ein auch bei Erwachsenen erhöhtes Risiko suizidaler/autoaggressiver Phänomene unter SSRI, und beruft sich dabei auf die Studien von Fergusson et al. [7], Gunnel et al. [16] und Martinez et al. (26). Tatsächlich können SSRI zumindest Akathisie-ähnliche Unruhe provozieren oder verstärken [18], was im Einzelfall suizidale Phänomene verstärken könnte.
Fergusson et al. (2005) führten einen systematischen Review doppelblinder, randomisierter Studien (n = 345, 87650 Patienten) durch und fanden unter SSRI (0,0026 %) ein gegenüber Plazebo (0,0011 %) signifikant verdoppeltes Risiko von Suizidversuchen, allerdings keinen Unterschied zwischen SSRI und trizyklischen Antidepressiva und keine Unterschiede für Suizide (0,0004 %). Die Autoren diskutieren methodische Probleme, insbesondere fehlende Angaben über suizidale Handlungen, weshalb sie nicht ausschließen, dass der wahre Effekt höher sein könnte als beobachtet; das Gegenteil könnte aber auch zutreffen.
Gunnel et al. [16] analysierten alle der britischen „Medicines and Healthcare products Regulatory Agency (MHRA)” vorliegenden, plazebokontrollierten Studien (n = 477, 40826 Patienten). Sie fanden keine Evidenz für ein erhöhtes Suizidrisiko unter SSRI, allerdings schwache Evidenz für ein erhöhtes Risiko von Selbstschädigungen.
Martinez et al. [26] analysierten Erstverordnungen von SSRI und trizyklischen Antidepressiva (n = 146095) anhand der britischen „General Practice Research Database”, also Daten aus der Routineanwendung, und fanden für Suizidversuche und Suizide keine Unterschiede zwischen beiden Typen von Antidepressiva, allerdings ein erhöhtes Risiko für selbstschädigende Handlungen bei unter 18-Jährigen. Die Autoren schließen die Möglichkeit nicht aus, dass letzterer Befund aus einer präferentiellen Verordnung der weniger toxischen SSRI an suizidgefährdete Patienten resultierte; das muss aber nicht zutreffen.
Cipriani et al. [5] ziehen in ihrem Editorial aus diesen drei Untersuchungen Schlussfolgerungen, die in krassem Gegensatz zu denen des Arznei-Telegramms stehen: „Die aktuell verfügbare Evidenz, die keinen klaren Zusammenhang zwischen SSRI und Suizid zeigt, und die robuste Evidenz für die Wirksamkeit von Antidepressiva bei mäßiger bis schwerer unipolarer Depression sollte die Ärzte ermutigen, diese Arzneimittel in wirksamer Dosis zu verordnen. Dabei sollten die Ärzte sich bewusst sein, dass SSRI ähnlich wie Trizyklika suizidale Gedanken oder Suizidversuche in der Frühphase der Behandlung induzieren oder verschlimmern können, möglicherweise weil sie zu diesem Zeitpunkt Agitiertheit und Aktivierung hervorrufen können”. Bei Kindern und Jugendlichen sei die Nutzen-Risiko-Bilanz aber negativ, da es hier wenig Evidenz für Wirksamkeit gebe.
Die vom Arznei-Telegramm erhobene Forderung nach Langzeitstudien, um das Risiko durch Antidepressiva induzierter suizidaler Phänomene weiter zu klären, wirkt plausibel. Bei näherem Hinsehen aber erweist sie sich als widersinnig und illusorisch. Während Suizidgedanken alltäglich sind, in einer finnischen Erhebung [19] gaben 15 % an, im letzten Jahr solche Gedanken erlebt zu haben, sind suizidale Handlungen selten und Suizide extrem seltene Ereignisse. Das darf nicht darüber hinwegtäuschen, dass ca. 60 % der Suizide einer Depression zuzuschreiben sind und die suizidpräventiven Anstrengungen verstärkt werden müssen. Suizidale Phänomene gehören zum Wesen der Depression. Die möglicherweise durch SSRI induzierten suizidalen Phänomene ereignen sich aber wenn überhaupt nicht erst im Langzeitverlauf der Therapie, sondern zu Beginn. Also machen Langzeitstudien keinen Sinn. Dies erst recht deshalb nicht, weil die vorliegenden, plazebokontrollierten Studien zur Frage der Wirksamkeit von SSRI in der Erhaltungstherapie und Rezidivprophylaxe keine Hinweise auf ein erhöhtes Risiko suizidaler Phänomene ergeben haben [14]. Also müsste es sich um Akutstudien handeln, die zwangsläufig, um eine ursächliche Verantwortung der SSRI nachzuweisen, plazebokontrolliert sein müssten. Nachdem die vorliegenden Daten zeigen, dass, falls SSRI überhaupt suizidale Phänomene induzieren, dieser Effekt sehr klein ist, bedürfte es riesiger Fallzahlen, um signifikante Auswirkungen der Therapie auf diese Phänomene zu erfassen. Das würde also bedeuten, dass sehr viele Patienten - und darunter zumindest auch suizidgefährdete - Plazebo exponiert werden müssten, um ein ggf. minimales Risiko aufzudecken. Das wäre ethisch kaum vertretbar. Die Forderung des Arznei-Telegramms ist also illusorisch. Richtig durchdacht erweist sie sich als verantwortungslos. Aber sie ist geschickt suggestiv formuliert.
Suizidale Phänomene, insbesondere Suizidversuche und Suizide, sind zweifellos patientenrelevante Endpunkte, für die der Gemeinsame Bundesausschuss und das Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) Wirksamkeitsnachweise fordern könnten. Bisher ist für kein Antidepressivum bezüglich solcher Endpunkte Wirksamkeit positiv belegt worden. Wie das Arznei-Telegramm weitgehend korrekt wiedergibt, sind bisher nur für Lithium suizidpräventive Wirkungen belegt worden [3]
[36]; aber auch hier ist die Diskussion nicht abgeschlossen [17]. Lithium aber ist nicht als Antidepressivum zugelassen, sondern als Rezidivprophylaktikum in der Langzeittherapie. Von Antidepressiva könnte man allenfalls in der Langzeittherapie einen Wirksamkeitsnachweis auch bezüglich der Suizidprävention verlangen. Bisher darf aber ohnehin nur ein einziges Antidepressivum (Venlafaxin) die Wirksamkeit als Rezidivprophylaktikum beanspruchen.
Die Möglichkeit der Induktion suizidaler Phänomene durch SSRI kann nicht Gegenstand von Wirksamkeitsstudien sein, sondern ist Thema der Pharmakovigilanz. Selbstverständlich bedürfen die SSRI diesbezüglich besonderer Aufmerksamkeit. Die entscheidende therapeutische Maßnahme, diesem möglichen Risiko gerecht zu werden und zu begegnen, ist die engmaschige und gezielte Begleitung des Patienten insbesondere in der Frühphase der antidepressiven Therapie. Im Einzelfall kann ein Antidepressivum suizidale Phänomene induzieren oder verstärken [27]. Auch wenn unklar ist, ob bestimmte Typen von Antidepressiva geringere Risiken bergen, so hat die deutsche Psychiatrie doch die langjährige Tradition, sedierende Antidepressiva zu bevorzugen oder ein tranquilisierendes Psychopharmakon adjuvant zu verordnen.
Sind also „Antidepressiva lebensgefährliche Plazebos”? Nein. Wie die Leser des Arznei-Telegramms dessen suggestives Handeln bewerten, muss ihnen überlassen bleiben.