RSS-Feed abonnieren
DOI: 10.1055/s-0035-1551801
Von der Evidenz zur Empfehlung – Mit „Grade“ die wirksamste Behandlung finden
Verantwortlicher Herausgeber dieser Rubrik:
Publikationsverlauf
Publikationsdatum:
27. April 2015 (online)
Wer wissen will, welche Behandlungsmethode bei einem Beschwerdebild wirksamer ist als eine andere, muss sich durch eine Vielzahl von Studien kämpfen. Die Software GRADE hilft, Studien zu einem Thema zu vergleichen, und ermöglicht es, eine Handlungsempfehlung für die Praxis zu treffen.
#
Physiotherapeut Simon und seine Kollegen haben in unserem fiktiven Beispiel zurzeit viele Patienten mit Nackenbeschwerden. Aktuell stellt sich Simon die Frage, ob sie nicht mit einer Manipulation einen besseren Erfolg hätten als mit Mobilisation. Durch sein Studium verfügt er über das nötige wissenschaftliche Vorwissen, und er sucht in den Datenbanken PEDro, Cochrane Library und MEDLINE nach geeigneten Studien. Mit den Stichworten („manipulation“ OR „mobilisation“) AND „neck pain“ schließt er am Ende seiner Recherche in unserem Beispiel fünf Arbeiten zu seinem Thema ein. Deren Evidenz muss er nun im nächsten Schritt kritisch beurteilen. Dabei kann ihm die sogenannte GRADE-Analyse (Crading of Recommendations Assessment, Development and Evaluation) helfen. Die Software hilft, Studien mit unterschiedlichen Ansätzen zu ein und demselben Beschwerdebild zu vergleichen, um herauszufinden, ob eine der Behandlungsmethoden besonders empfehlenswert ist. Zudem hilft das Programm einzuschätzen, wie hoch die Qualität der Studienlage ist.
Die Software
Das Programm GRADE kann kostenlos im Internet heruntergeladen werden (Zusatzinfo). Vor der Nutzung ist es jedoch notwendig, einen Grundkurs zur Anwendung der Software zu absolvieren [1]. Das Ziel des Programms ist es, den Entwicklungsprozess einer klinischen Empfehlung so transparent wie möglich darzustellen [1]. Dabei unterscheidet das System explizit zwischen der Qualität der Evidenz und der Stärke der Empfehlung [2]. Mithilfe von GRADE erstellt Simon eine Übersicht über die Qualität aller gesammelten Studien zum jeweiligen Outcome, das ihn für seine Frage interessiert. Zudem trägt er die Ergebnisse der Interventions- und Kontrollgruppe ein, um einen Überblick zu haben und eine bestmögliche Empfehlung auszusprechen. Zur Vorbereitung einer Analyse mittels GRADE identifiziert Simon zunächst die externe Evidenz für alle wichtigen Outcomes, beurteilt sie kritisch und hält sie in sogenannten Evidenz-Tabellen fest. In seinem Fall entscheidet er sich für das Outcome Schmerz, da ihn besonders dieser Parameter für seine Überlegungen interessiert. Zuvor hat er eine Liste über alle möglichen Outcomes erstellt, die er für sinnvoll hielt, wie Funktion, Partizipation oder Lebensqualität. Das Outcome Schmerz stuft er als wichtig ein (Importance) (Tab.) und trägt es in die Software ein.
#
Die Qualitätsfaktoren
Im nächsten Schritt möchte sich der Therapeut vorerst eine Übersicht über die Qualität der Studien verschaffen. Dazu beurteilt er in jeder Studie vorgegebene Faktoren. Die Ergebnisse trägt er dann in Form von Zahlenwerten zwischen 0 und -2 in GRADE ein. 0 bedeutet dabei, dass der entsprechende Faktor in der Studie einwandfrei ist. -2 dagegen ist der schlechteste Wert – bezogen auf den jeweiligen Faktor wertet Simon diese Studie damit also ab. Da jeder Studientyp von Natur aus eine andere Gewichtung hat (eine RCT ist prinzipiell höherwertig als eine Expertenmeinung), kann Simon so dieses normale Gefälle ausgleichen und beispielsweise qualitativ schlechte RCTs abwerten, sodass ihre Aussage an Gewicht verliert.
Als Erstes beurteilt Simon mit seinen Kollegen anhand des sogenannten Risk of Bias, ob es möglicherweise eine Verzerrung der Ergebnisse durch systematische Fehler im Studienaufbau gegeben hat. Dies ist zum Beispiel der Fall, wenn die Teilnehmer einer Studie nicht zufällig, sondern vom Studienleiter willkürlich in zwei Gruppen verteilt wurden (fehlende Randomisierung). Simon bewertet seine fünf Studien und entscheidet darüber, ob er eine Studie qualitativ ab- oder aufwertet (in GRADE: up-bzw. downgraden). Alle Arbeiten geben kaum Hinweise darauf, ob qualitative Mängel im Studiendesign berücksichtigt wurden. Daher kann Simon nicht ausschließen, dass die Autoren keine systematischen Fehler gemacht haben. Aus diesem Grund entscheidet er sich insgesamt für eine Risk-of-Bias-Bewertung von -1.
Zudem trägt er in GRADE auch die Inkonsistenz (Inconsistency) ein, also inwieweit sich die Ergebnisse der Studien ähneln bzw. wie heterogen die Ergebnisse sind. Verantwortlich dafür könnte sein, dass die Studienteilnehmer beispielsweise in Bezug auf ihr Alter nicht vergleichbar sind und somit unterschiedliche Populationen untersucht wurden. Aufgrund der hohen Heterogenität seiner Studien vermutet Simon, dass die Untersuchungen an nicht vergleichbaren Patientengruppen durchgeführt wurden. Aus diesem Grund wählt er auch hier einen Durchschnittswert von -1.
Besser mit Therapie A oder B behandeln? – GRADE hilft.
Im nächsten Schritt bewertet er die Indirektheit (Indirectness), die aussagt, ob das Outcome direkt, anhand einer konkreten Messung oder Frage, oder indirekt gemessen wurde. Bei einem indirekt gemessenen Outcome versuchen die Forscher beispielsweise über den Blutdruck Rückschlüsse auf die Gemütslage des Probanden zu ziehen. Diese Bestimmung wäre jedoch sehr ungenau, da der Blutdruck auch noch von vielen anderen Faktoren abhängt. Im Fall von Simon wurde in allen Studien die Schmerzintensität direkt gemessen, daher kam es zu keiner Abweichung bezogen auf das gewählte Outcome. Er bewertet diesen Faktor daher mit einer 0.
Zudem ermittelt Simon, wie unpräzise (Imprecision) die Ergebnisse sind, gemessen daran, wieviele Studienteilnehmer es gab bzw. wie groß die Effekte waren. Hier bewertet er die Studien durchschnittlich mit einem Wert von-2, weil sie relativ kleine Effekte hatten.
Der letzte Faktor bezieht sich auf den sogenannten Publikationsbias. Dieser beschreibt, ob negative Ergebnisse bezogen auf die Interventionen nicht veröffentlicht wurden. Ob dies der Fall war, ermittelt Simon anhand der Software RevMan. Er kann in seinen Studien keine Verzerrung durch nicht publizierte Daten feststellen und trägt deshalb den Wert 0 in die Spalte „Other considerations“ ein.
Um sich einen besseren Überblick zu verschaffen, schreibt das Programm vor, zuletzt noch den Effekt der Studien einzutragen. Dazu führt Simon eine Metaanalyse aller Daten durch. Es zeigt sich, dass Patienten, die manipuliert wurden, ein um 0,2 Punkte besseres Ergebnis aufwiesen, als die Patienten, die mobilisiert wurden – ein sehr geringer Effekt.
#
Das Evidenzprofil
Sind alle Werte in das Programm eingegeben, liefert GRADE eine Auswertung, das sogenannte Evidenzprofil zur Fragestellung „Should Manipulation or Mobilisation be used for Neck Pain?“. Dieses Profil zeigt das Resultat der Studienbewertung und fasst die Ergebnisse zusammen. Aus diesen Zahlen errechnet die Software dann die Stärke einer Empfehlung (Quality). In Bezug auf die Nackenbeschwerden gibt das Programm keine Empfehlung hinsichtlich der Behandlungsmethode, auch wenn einige Studien dies einzeln betrachtet belegt hätten. Anhand der Bewertung durch GRADE stellt der junge Therapeut fest, dass die aktuelle Evidenz sehr schwach ist (VERY LOW). Somit entschließt er sich mit seinen Kollegen, Patienten mit Nackenschmerzen weiterhin zu mobilisieren. Trotzdem lohnt es sich für ihn, weiterhin die GRADE-Methode anzuwenden, wenn er einmal wieder zwischen zwei Behandlungsmethoden entscheiden muss.
Die Software zum Download
Die Software selbst und viele hilfreiche Infos rund um GRADE und seine Anwendung, auch in deutscher Sprache, finden Sie unter: www.gradeworkinggroup.org.
#
#