Internationale Erfahrungen bei der Kosten-Nutzen-Bewertung: Eine Übersicht

R. Busse

doi:10.1055/s-0029-1216386

Subscribe to RSS

Please copy the URL and add it into your RSS Feed Reader.

https://www.thieme-connect.de/rss/thieme/en/10.1055-s-00000022.xml

Share / Bookmark

Facebook X Linkedin Weibo

Download PDF

Gesundheitswesen 2009; 71: S26-S29
DOI: 10.1055/s-0029-1216386

Ethik der Kosten-Nutzen-Bewertung

Internationale Erfahrungen bei der Kosten-Nutzen-Bewertung: Eine Übersicht

International Experiences in Cost-Benefit Analysis – A ReviewR. Busse¹

¹Fachgebiet Management im Gesundheitswesen, Technische Universität Berlin, und European Observatory on Health Systems and Policies

Further Information

Publication History

Publication Date:
14 July 2009 (online)

Also available at

Abstract
Full Text
References

Permissions and Reprints

Einleitung

Aufgrund der internationalen Orientierung meines Fachgebietes Management im Gesundheitswesen und seiner Verbundenheit mit Health Technology Assessment gibt es einen konkreten Anlass, die im Ausland gesammelten Erfahrungen bei der Kosten-Nutzen-Bewertung zu schildern: Vor einigen Jahren, als die Kosten-Nutzen-Bewertung noch nicht ins Gesetz aufgenommen war, sondern es um die Bewertung von Arzneimitteln durch das damals neu zu gründende IQWiG ging, wurden wir gebeten, die Erfahrungen anderer OECD-Länder mit der Bewertung pharmazeutischer Produkte zu sammeln und zu inventarisieren, damit so Empfehlungen für Deutschland abgeleitet werden könnten (Zentner et al. 2005; kürzer: Zentner & Busse 2006). Der Auftrag damals stammte vom DIMDI. Die Erarbeitung dieser Thematik basierte in erster Linie auf den verfügbaren methodologischen Guidelines und in zweiter Linie auf Publikationen und mündlichen Interviews mit den Akteuren, um einen Eindruck von der Praxis zu gewinnen.

Da die Methodenhandbücher aber häufig erstens nur in der jeweiligen Landessprache vorliegen und zweitens nicht unbedingt den Prozess schildern, sind sie nicht unbedingt für die internationale Audienz geschaffen. (So ist auch für Ausländer, die nur das IQWiG-Methodenmanual gelesen haben, der Bewertungsablauf in Deutschland nicht hundertprozentig nachvollziehbar.) Daher werden neben den methodischen Guidelines Hintergrundinformationen über die praktische Ausgestaltung der Bewertung benötigt. Die Verarbeitung von Informationen über die Bewertung aus anderen europäischen Ländern wie Schweden oder der Schweiz als auch aus außer-europäischen Ländern wie Australien, Kanada, Neuseeland ist aber außerordentlich wichtig.

Auch die Frage, wer Arzneimittel unter diesem gesundheitsökonomischen Aspekt – oder allgemeiner: im Bereich des Health Technology Assessments – evaluiert, ist von Bedeutung.

Dabei ist insbesondere auf den Hintergrund der Organisation zu achten. Denn gerade die „klassischen” etablierten HTA-Institutionen in Europa (wie etwa ANAES in Frankreich) haben sich lange nicht mit Arzneimitteln beschäftigt. Als Health Technology Assessment in Europa aufkam, waren praktisch alle Institutionen mehr oder weniger in dem Nicht-Arzneimittelbereich tätig, so auch in Deutschland. Die erste bekannte Institution, die sich dann beiden Bereichen widmete, war ab 1999 das NICE (das dementsprechend zum Vorreiter eines neuen Typus von HTA-Institutionen wurde), während das ein Jahr später gegründete HTA-Programm beim DIMDI noch der alten Philosophie entsprang. In einigen Ländern gab es bereits vorher schon Institutionen, die sich nur mit der Arzneimittelbewertung beschäftigten, sich aber nicht zum Kreis der HTA-Institutionen gehörig fühlten. Dazu gehören beispielsweise Australien und Kanada, deren gesundheitsökonomische Guidelines, die oft an Arzneimitteln entwickelt wurden, als Vorbild dienen.

Das NICE war so die erste wahrnehmbare Institution, die beide Stränge innerhalb Europas zusammenbrachte. Das bedeutet, dass Technologien unabhängig davon, ob es sich um Arzneimittel oder nicht handelt, beurteilt werden. Das IQWiG wurde 2004 auch mit dieser Philosophie gegründet. Das NICE hat sich inzwischen weiter entwickelt zum „National Institute for Health and Clinical Excellence” und bearbeitet nunmehr auch Public Health-Interventionen. Die zukünftige Entwicklung im Bereich der Gründung neuer „HTA”-Institutionen in anderen Ländern bleibt abzuwarten, aber es ist anzunehmen, dass sich die Länder überwiegend am Beispiel Frankreichs orientieren, das mit der obersten Gesundheitsbehörde HAS einen neuen Typus geschaffen hat, der Qualitätssicherung sowie die Akkreditierung von Krankenhäusern integriert. Deutschland hält auch nach der 2007er Reform die Bereiche (noch) getrennt und schafft bekanntlich erst einmal ein neues „Institut für Qualität” (nach §137a), was m. E. – zumindest international – einigermaßen für Verwirrung sorgen wird.

Bei der Beobachtung anderer Länder und Ihrer Evaluationssysteme stellt sich zunächst die Frage, zu welchem Zweck Arzneimittel nach ihrer Marktzulassung (erneut) evaluiert werden. Vielfach geht es dabei um die Erstattungsfähigkeit an sich, d. h. die Aufnahme in den Leistungskatalog. Ein zweiter Grund ist die Preisregulierung, d. h. ob ein bestimmter Preis für das Arzneimittel gefunden werden muss oder es in eine Festbetragsgruppe eingeordnet werden kann, worin in Deutschland bislang der Schwerpunkt lag. Aber auch die Erstattungsfähigkeit an sich wird zukünftig eine Rolle spielen.

Eine zweite Frage, der vergleichend nachgegangen wurde, ist die nach der Belohnung von „echten” Innovationen, d. h. der positiv evaluierten neuen Arzneimittel. Die Aufnahme in die Positivliste ist sicherlich ein wesentlicher Punkt. Die Möglichkeit, freie oder höhere Preise zu bekommen, ein anderer Punkt. Eine Abwandlung dieser Frage lautet: Fällt das Arzneimittel in den preisregulierten Bereich oder in einen Bereich, wo Preisverhandlungen mit dem Ministerium hinfällig sind? In Frankreich ist es beispielsweise so, dass in den am besten bewerteten Gruppen Preisregulierungsmechanismen umgangen werden dürfen. Außerdem ergeben sich keine oder geringere Zuzahlungen auch auf Seiten der Patienten.

Weiter stellt sich die Frage, welche Kriterien, unabhängig davon, ob es um die Aufnahme in den Leistungskatalog oder die Verhandlungen über die Preise geht, von den Ländern zugrunde gelegt werden. Die Kriterien im Einzelnen sind der therapeutische Nutzen aus der medizinischen Sicht und der Patientennutzen aus Sicht der Patienten. Diese ersten beiden Kriterien sind überlappend zu betrachten, insbesondere da sich die Beurteilungskriterien zunehmend angleichen und Überlebenszeit und Lebensqualität umfassen. Ein weiteres Kriterium ist die Kosteneffektivität oder der Kosten-Nutzen des Medikamentes. Auch dieses wird in den meisten Ländern zugrunde gelegt. Es gibt allerdings Länder, die dieses nicht explizit in die erste Reihe stellen. So spielt in Frankreich die Kosteneffektivität bei der Frage, ob das Medikament überhaupt erstattungsfähig ist, erstmal keine Rolle. Indirekt wird es bei der Frage, welchen Preis das Medikament dann kosten soll, berücksichtigt. Und auch in der Schweiz hat die Kosteneffektivität noch nicht den Rang wie andere Kriterien. Das vierte Kriterium ist das der Kosten. Auswirkungen auf das Budget sind in sehr vielen Ländern ein relevanter Punkt. Hier spielt die Prävalenz oder die Anzahl der Patienten eine Rolle. Ein Medikament, das nur für wenige Patienten in Frage kommt, muss vom Budget-Impact anders betrachtet werden als ein Medikament, das sehr breit angewendet werden kann. In Deutschland steht diese Überlegung jedoch nicht im Vordergrund. Das nächste Kriterium umfasst pharmakologische und sonstige Merkmale. Dabei werden Faktoren wie die Bequemlichkeit für den Patienten berücksichtigt. Eine einmalige Anwendung am Tag stellt beispielsweise eine Erleichterung zur mehrmaligen Anwendung dar. Zudem ist eine orale Applikation einfacher als eine intravenöse. Bei diesem Kriterium sind die Länder gespalten. Etwa die Hälfte würde diesem Punkt nur Relevanz beimessen, wenn diese Verbesserungen sich nicht nur auf dem Papier, sondern auch in messbaren Verbesserungen der patientenrelevanten Outcomes niederschlagen, etwa dadurch, dass die angenehmere Applikation zu einer erhöhten Compliance führt. Die andere Hälfte ist grundsätzlich bereit diesen Punkt zu berücksichtigen. Die Verfügbarkeit von Behandlungsalternativen ist ein weiteres Kriterium. Strittig ist dabei, ob auch ohne Vorhandensein von Behandlungsalternativen der Fall des „Nichtstuns” berechnet werden muss. Ebenso wie es gemacht wird, wenn bereits Behandlungsalternativen bestehen. Soziale und ethische Erwägungen sind ebenfalls in etwa der Hälfte der Länder ein Kriterium. Unter dem weiteren Kriterium der Priorität der Regierung wird die Förderung und abweichende Beurteilung von Medikamenten oder Therapien, die bestimmten Minoritäten zugute kommen, verstanden. So zum Beispiel bei den Maori in Neuseeland.

Die typische Evaluationsfolge, die die untersuchten Länder befolgen, sieht eigentlich gleich aus: Zunächst befassen sie sich mit der Efficacy, wobei gegebenenfalls auch schon die Wirksamkeit unter Alltagswirkungen berücksichtigt wird. Dies ist aber bei neuen Medikamenten so gut wie nie möglich, da bei der Arzneimittelzulassung zumeist nur die Wirksamkeit des Medikaments unter Studienbedingungen zugrunde gelegt wird, wozu u. a. der Vergleich zu Placebos gehört. Anschließend wird der Nutzen betrachtet. Hierbei stellt sich die Frage, ob die Begriffe Mehrnutzen, Zusatznutzen und Nutzen inhaltlich gleich interpretiert werden oder ob hier differenziert werden muss. Ob der Begriff Nutzen auch die Messung gegenüber einem Placebo beinhaltet und der Mehrnutzen dann nur die Messung von einem Medikament zum anderen darstellt, ist auch bei einer Übersetzung ins Englische unklar. Hier bietet sich eine Verbindung zu den Behandlungsalternativen an. Wenn sich dann ein Zusatznutzen ergibt, ist die Frage, in welchem Verhältnis der Nutzen oder der Zusatznutzen zu den Kosten oder richtigerweise Zusatzkosten steht. Der deutsche Gesetzgeber verwendet den Begriff der Zusatzkosten aber grundsätzlich nicht. Hier gibt es in allen Ländern terminologische – und methodische – Unterschiede.

In Österreich wird beispielsweise der Begriff des Mehrnutzens verwendet. Abhängig vom Bestehen eines Mehrnutzens gestaltet sich die Preisregulierung dann unterschiedlich. Die Präparate werden nach der ersten Nutzenbewertung kategorisiert. Dabei werden die englischen Begriffe wie Red-Box, Yellow-Box usw. verwendet. In der Red Box sind die Präparate, die neu zugelassen sind und bei denen die Evaluation des Nutzens noch einige Zeit dauern wird. Bis zur abgeschlossenen Evaluation ist das Präparat dann erstattungsfähig, wenn auch unter eingeschränkten Bedingungen (etwa bzgl. der Anzahl an behandelten Patienten). Dies unterscheidet Österreich – und auch Deutschland – von den meisten anderen Ländern, in denen das Präparat zunächst gar nicht erstattungsfähig ist. In Österreich wird das Präparat nach der Evaluation in eine der weiteren Boxen einsortiert. In die schwarze Box kommen die ausgeschlossenen Präparate, in die grüne Box die verschreibungsfähigen. Die Zuteilung hängt vom Mehrnutzen ab. In die gelbe Box kommen die Medikamente, die ausschließlich mit Zweitmeinung verschrieben werden. Bei diesen Medikamenten muss das Rezept von dem sogenannten Chefarzt der Krankenkasse gegengezeichnet werden. Dies ist insbesondere bei teuren oder mit Nebenwirkungen behafteten Medikamenten der Fall. Je mehr der Mehrnutzen in Richtung „effective” gehen soll, also in Richtung der Wirksamkeit unter Alltagsbedingungen, desto mehr Zeit nimmt die Evaluation in Anspruch. Deswegen wird das Medikament in der Phase der Red-Box zunächst kontrolliert freigegeben und nebenbei werden die Daten, die zur Zulassung geführt haben, durch Daten zur Anwendung unter Alltagsbedingungen ergänzt bzw. ersetzt. Schwierig ist es, wenn Länder die Frage der Kosten-Effektivität und die des Nutzens vermischen. In diesem Fall werden die Ebenen dann durcheinander geworfen. Um dies strikt zu trennen, muss zunächst der medizinische Nutzen und anschließend der Kostenteil betrachtet werden. Ein ganz wesentlicher Faktor ist, gegenüber was ein Vergleich hergestellt wird – also wie der Komparator gewählt wird. Hier könnte die übliche Praxis herangezogen werden. Diese unterscheidet sich jedoch von den genauen Definitionen. Häufig wird das am häufigsten verschriebene Medikament verwendet, wobei die Frage ist, welcher Zeitpunkt herangezogen wird. Daneben existieren noch andere Alternativen, etwa der Vergleich mit der bisher effektivsten Therapie unabhängig von ihrem Preis. Diese Methode wenden die Länder Finnland, Norwegen, Neuseeland und Großbritannien an. Andere Länder ziehen die günstigste, wenn auch nicht gleichzeitig effektivste Alternative zum Vergleich heran. In Neuseeland wird sowohl gegenüber der besten Therapie als auch gegenüber der günstigsten Therapie verglichen. Weiter muss entschieden werden hinsichtlich welcher Indikationen überprüft wird. Gerade wenn Medikamente mehrere zugelassene Indikationen haben, ist die Frage, ob sich die Untersuchung auf alle zugelassenen Indikationen – wie es beispielsweise in Australien oder Frankreich gemacht wird – oder nur auf die Hauptindikation beziehen soll. Kanada evaluiert auch in wahrscheinlichen Off-Label-Use-Bereichen.

Bei den Studien des Designs werden von der Mehrheit der Länder bzw. Evaluationsinstitutionen Head-to-Head-RCTs und finale Ergebnisparameter wie die Änderung der Mortalität, der Morbidität oder der Lebensqualität zugrunde gelegt. Zudem präferiert die Mehrheit, dass die Studien von der Mehrheit in natürlichem und landesspezifischem Setting durchgeführt werden. Wie gesagt, diese „Wünsche” wurden den Guidelines entnommen, was keinesfalls heißt, dass in der Realität so vorgegangen wird bzw. werden kann.

Das bringt uns zum Thema der möglichen Ergebnisparameter: Australien gehört zu den wenigen Ländern, die sich auf die QALYs als Ergebnisparameter festgelegt haben. Vereinfacht gesehen, können Ergebnisgrößen in vier Stufen hierarchisiert werden, wobei QALYs die höchstwertigste Stellung einnehmen – und reine klinische Parameter (etwa die Anzahl koronarer Reperfusionen) die niedrigste Stellung (vgl. Zentner & Busse 2006: Tab. 3). In der zweithöchsten Spalte finden sich Parameter wie die Anzahl Überlebender bei Koronarverschluss, die Anzahl mit akzeptabler Lebensqualität bei instabiler Angina Pectoris, die Anzahl vermiedener Suizide sowie die Anzahl vermiedener Schlaganfälle. Der Dissens in Deutschland ist, ob die erste Spalte (QALYs) oder die zweite Spalte verwendet wird. Die Meinung dazu geht auch in den einzelnen Ländern auseinander. Da es keine RCTs gibt, die die Lebensqualität akzeptabel messen und eine entsprechend lange Laufzeit haben, werden oft die Parameter der zweiten Spalte herangezogen. Es kommt dann zu einem einem Trade-off, weil die Länder sich entscheiden müssen, ob sie harte Ergebnisse aus Studien, die sich zum Teil pro Indikation unterscheiden, heranziehen oder die Studie so modellieren, dass sich ein gemeinsames Outcome ergibt.

Die meisten Länder verknüpfen den erzielten Nutzen (bzw. Wirksamkeit) mit dem „Schaden” (etwa durch Nebenwirkungen) zum Nutzen-Schaden-Verhältnis. Dabei werden Nutzen- und Schadendimension ins Verhältnis gesetzt. Auf der Abszisse wird die Wirksamkeit und auf der Ordinate die Nebenwirkungen abgetragen. Die Wirksamkeit kann danach höher, gleich oder geringer als beim Comparator sein. Ebenso verhält es sich bei den Nebenwirkungen. Wenn das Medikament eine höhere Wirkung bei geringeren oder gleichen Nebenwirkungen hat, kommt das Medikament in die nächste Stufe der Evaluation. Bei bedeutenden Nebenwirkungen kann das Medikament auch bei gleicher Wirksamkeit und verringerten Nebenwirkungen in die nächste Stufe kommen. Eine exakt gleiche Wirkung wird in der Praxis selten vorkommen. Die formale gesundheitsökonomische Evaluation wird also nur bei bestimmten Ergebniskonstellationen durchgeführt. Im nächsten Schritt muss es dann nicht zwingend auf eine Kosteneffektivitäts- oder Kosten-Nutzwert-Analyse hinauslaufen. In einigen Fällen reicht auch eine Kostenminimierungsanalyse, die in den Guidelines häufiger vorkommt als in den gesundheitsökonomischen Lehrbüchern.

In Frankreich gibt es eine Zweiteilung bei der Beurteilung von Nutzen und Wirksamkeit. Der (Zusatz- bzw. Mehr-)Nutzen wird in sechs Stufen unterteilt: (i) wesentlicher therapeutischer Fortschritt, (ii) deutliche Verbesserung i. S. von Wirksamkeit (efficacy) und/oder reduzierten Nebenwirkungen, (iii) mäßige Verbesserung, (iv) geringfügige Verbesserung, (v) keine Verbesserung, aber geringere Behandlungskosten und (vi) keine Verbesserung. Diese Einstufung des Nutzens wird dann für die Preisverhandlungen zugrunde gelegt. Wird ein Medikament in die ersten beiden Stufen des Nutzens eingeordnet, unterliegt es keiner Preisregulierung. In den anderen Stufen unterliegt das Medikament einer starken Preisregulierung. Bei 108 Evaluationen, die im Jahr 2005 vorgenommen wurden, sind 75 in die Kategorien v und vi eingeordnet worden (d. h. 69%!), 24 wurden dem mittleren Bereich zugeordnet und nur 9 Medikamente (8%) sind in die höchsten zwei Stufen einsortiert worden. Nur diese bringen einen deutlichen Fortschritt. In Deutschland würde das Ergebnis vermutlich ähnlich ausfallen. Daneben existiert eine weitere Zusammenstellung der im Jahre 2005 durchgeführten Evaluationen der Wirksamkeit. Diese wurden für die Zulassung und für die Einstufung in die Zuzahlungs- oder in die Kostenerstattungsgruppe durchgeführt. Es handelt sich nicht um exakt identische Evaluationen, weil zum Teil ein bisschen Zeit verstrichen ist, aber es gibt eine sehr große Schnittmenge zwischen den beiden. Hier wurden auch ein paar mehr Medikamente betrachtet. Die Wirksamkeit wurde dabei in 108 Fällen als wesentlich oder erheblich eingestuft (aber eben nicht unbedingt „besser” als die von anderen Medikamenten), während sie bei 9 „mäßig”, bei 5 „gering” und bei 6 so „insuffizient” war, sodass sie gar nicht erstattungsfähig geworden sind.

Insgesamt gibt es einen gravierenden Unterschied, ob lediglich untersucht wird, wie ein Medikament für seine Indikation gegenüber einem Placebo wirkt oder auch Alternativen einbezogen werden. Im Bereich der gesundheitsökonomischen Evaluation wird als Analysetyp am häufigsten die Kosten-Nutzwert-Analyse gefordert. Verpflichtend ist sie allerdings nur in relativ wenigen Ländern zum Beispiel in Australien, Neuseeland und Großbritannien. In anderen Ländern wird die Kostenminimierungsanalyse mit bestimmten Einschränkungen, die Kosteneffektivitätsanalyse oder die Kosten-Nutzen-Analyse durchgeführt. Die Perspektive ist meistens gesellschaftlich, zum Teil aber auch begrenzt auf die Kostenträger. Auch in Deutschland stellt sich die Frage, wie die Nicht-Gesundheitssystem- und die Nicht-GKV-Kosten berücksichtigt werden. Die Messung des Nutzens, also eigentlich des Nutzwertes in Form der QALYs ist nur in wenigen Ländern verpflichtend, aber es wird in vielen Ländern als eine von mehreren Möglichkeiten aufgezählt. Das Instrument für die Evaluation ist normalerweise nicht vorgegeben. Es gibt ganz wenige Länder, in denen der EQ-5D verpflichtend ist. Auf der Kostenseite werden die häufig als Nettokosten bezeichneten landesspezifischen Kosten einbezogen. Diese ergeben sich aus den Investitionen oder den Kosten minus der Ersparnisse. Umstritten ist die Einbeziehung indirekter Kosten. Die Kanadier beziehen diese nicht mit ein, während die Australier und Holländer den Friktionskostenansatz wählen. Die Schweden verwenden den Humankostenansatz. Einige Länder messen dieser Entscheidung keine Bedeutung bei. Ebenso ist es bei der Einbeziehung der Zeit der Patienten und der Angehörigen. Die Australier gehen von der Annahme aus, dass die Zeit bei der Lebensqualität inbegriffen ist und diese dementsprechend nicht auf der Kostenseite berücksichtigt werden muss. Die Kanadier und Norweger sehen die Zeit als monetarisierbar an und gehen davon aus, dass diese in der Lebensqualität nicht ausreichend abgedeckt wird und deswegen auf der Kostenseite berücksichtigt werden muss. Wird diskontiert, muss das sowohl bei den Kosten als auch beim Nutzen gleichermaßen gemacht werden. Die Diskontierungsraten schwanken dabei zwischen 0 und 15%. Einige haben auch mehrere Stufen. Gibt es keine Primärstudien wird die Modellierung nachrangig eingeschoben. Da die Primärstudien aber in den meisten Fällen keine QALYs berücksichtigen, führt das praktisch immer zur Modellierung, wenn QALYs als Ergebnisparameter gefordert sind. In einer Zusammenstellung der Ergebnisse wird deutlich, wie das Vorgehen in den einzelnen Ländern variiert (Zentner & Busse 2006: Tab. 2). Aufgrund dieser gefunden Variabilität zwischen den untersuchten Ländern ist es durchaus fraglich, auf welchem länderspezifischen Vorgehen der „internationale Standard” (sofern man denn einen solchen haben möchte) aufbauen soll.

Zudem stellt sich die Frage, wer die Evaluation durchführen soll. Sind die Hersteller oder ist die bewertende Institution dafür zuständig? Auch da gibt es sehr unterschiedliche Herangehensweisen in den Ländern. In einigen stellen die Hersteller das Material zusammen und die Evaluationseinrichtungen prüfen dieses. In anderen Ländern müssen die Hersteller das eigenständig machen.

Literatur

1 Zentner A, Busse R. Internationale Standards der Kosten-Nutzen-Bewertung. Gesundheitsökonomie & Qualitätsmanagement. 2006; 11 368-373

Thieme Connect PubMed Search in Google Scholar
2 Zentner A, Velasco-Garrido M, Busse R. Methoden zur vergleichenden Bewertung pharmazeutischer Produkte – eine internationale Bestandsaufnahme zur Arzneimittelevaluation. Schriftenreihe Health Technology Assessment, Bd. 13. 2005;

PubMed

Korrespondenzadresse

Prof. Dr. R. Busse

Technische Universität Berlin

Fakultät VII (Wirtschaft und Management)

Straße des 17. Juni 135

10623 Berlin

Email: rbusse@tu-berlin.de