Schlüsselwörter
Endpunktstudien - Typ-2-Diabetes - Retinopathie - Nephropathie - mikrovaskuläre Endpunkte - Surrogatparameter
Keywords
Outcome studies - type-2-diabetes - retinopthy - nephropathy - microvascular endpoints - surrogate parameters
Einleitung
Im Arzneimittelneuordnungsgesetz (AMNOG) ist seit 2011 die frühe Nutzenbewertung neuer Medikamente durch das Institut für Wirtschaftlichkeit und Qualität im Gesundheitswesen (IQWiG) geregelt. Das IQWiG erhält vom gemeinsamen Bundesausschuss (G-BA) den Auftrag einer Nutzenbewertung nach festgelegten und konsentierten Methoden [1]. Auf die Nutzenbewertung durch das IQWiG folgt eine Stellungnahmemöglichkeit und Anhörung beim G-BA, bevor dieser abschließend entscheidet. Kriterien für die Nutzenbewertung sind laut Sozialgesetzbuch (SGB) V patientenrelevante Endpunkte, d.h. Daten zur Mortalität, Morbidität, zu Symptomen sowie Nebenwirkungen und zur Krankheitslast bzw. Lebensqualität im Vergleich zu einer vom G-BA festgelegten zweckmäßigen Vergleichstherapie (zVT). Problem bei häufigen und chronischen Krankheiten, wie z.B. Typ-2-Diabetes, ist die optimale Studiengestaltung zur frühen und systematischen Erfassung der vom SGB V festgelegten Kriterien und eines Vergleichs mit der zweckmäßigen Vergleichstherapie (zVT) [1]
[2].
Große, global durchgeführte kardiovaskuläre Sicherheits- und Endpunktstudien in der Diabetologie machen in aller Regel aufgrund ihres Studiendesigns und ihrer komplexen Durchführung einen direkten Ergebnisvergleich verschiedener Studien und Studienendpunkte nicht einfach. Die einzelnen Studien unterscheiden sich oft im Detail bei den Definitionen, Kriterien und standardisierten Erhebungsweisen (Studienprotokolle und Methoden) bei den makrovaskulären und mikrovaskulären Endpunkten.
Die Autoren und die Arbeitsgruppe der Artikelserie nehmen in diesem Manuskript eine Positionierung zu den mikrovaskulären Endpunkten mit Fokus auf die Nephropathie und Retinopathie vor, um die Kriterien für die Nutzenbewertung weiterzuentwickeln und möglicherweise zu schärfen und damit eine Hilfestellung für die Weiterentwicklung von Studiendesigns und deren Homogenisierung zu geben. Es ist die einvernehmliche Vorstellung der Arbeitsgruppe, dass die Endpunkte für klinische Studien möglichst transparent, homogen und damit vergleichbar festgelegt werden sollen. Diese Transparenz und Festlegung für klinische Endpunkte würde gegenüber den in die Studien investierenden pharmazeutischen Unternehmern eine klare und belastbare Grundlage nationaler Interessen am Design globaler Studien durchsetzen und dem methodischen Verfahren der frühen Nutzenbewertung eine aus unserer Sicht höhere Legitimität und Plausibilität verleihen. Eine einheitliche Definition der Endpunkte, sowohl für Surrogatendpunkte als auch für patientenrelevante Endpunkte, stellt zudem die Voraussetzung für etwaige zukünftige Surrogatvalidierungsstudien dar.
Allgemein gilt, dass die Kriterien bzw. die Definitionen der Endpunkte die Sensitivität und Spezifität ihrer Ereignisraten in bestimmten Patientenpopulationen bestimmen. Daher könnte eine Festlegung der spezifischen Endpunkte und ihrer methodischen Qualität zur Erhebung beitragen, sodass in großen Outcome-Studien bereits entsprechende weitere Endpunkte, z.B. mikrovaskuläre Komplikationen, standardisiert und operationalisiert erhoben werden könnten. Für die Bewertung eines eventuellen Zusatznutzens ist die strikte Unterscheidung zwischen primären und sekundären Endpunkten weniger relevant. Dort steht die Hypothese der Nutzenbewertung im Vordergrund, nicht die Einzelstudie. Eine homogenere Vergleichbarkeit von Endpunkten würde weitere Analysen in präspezifizierten Subgruppen oder auch Substudien stärken. Gegebenenfalls könnte auch festgelegt werden, dass bei eventuell höherem methodischem technischem Aufwand, oder Relevanz bestimmter Patientenpopulationen, spezifische Fragen in dezidierten Substudien, oder frühzeitig im Studienprogramm, berücksichtigt werden.
Es besteht weiter Konsens, dass patientenbezogene Outcomes und auch Patienten-berichtete Veränderungen von großer klinischer Relevanz sind und eine große Bedeutung für die frühe Nutzenbewertung haben sollten. Dies gilt insbesondere für chronische Erkrankungen, deren medizinischer Verlauf und seine Veränderungen durch neue Therapiestrategien meist viele Jahre benötigen.
Im Folgenden wird konkret auf die Retinopathie und danach auf die Nephropathie eigegangen.
Retinopathie
Um Endpunkte zur diabetischen Retinopathie möglichst optimal zu operationalisieren, sollte unbedingt und strikt zwischen strukturellen Veränderungen und Funktion der Netzhaut unterschieden werden. Alltagsrelevante Kenngrößen der „Sehfunktion“ und die visuelle Lebensqualität der Betroffenen sind die bedeutsamen Parameter [3].
Die hohe Ortsauflösung des Detailsehens, das Erkennen von Bewegungen, die Anpassungsfähigkeit an unterschiedliche Beleuchtungsbedingungen und die Abstände, das Erkennen von Mustern und Farben, das räumliche Sehen zur Unterstützung des Gleichgewichtssinns, z.B. im Rahmen von Bewegungsabläufen, sowie das frühe Erkennen von sich nähernden Objekten im peripheren Gesichtsfeld sind Funktionen, die sich in völliger Gesundheit ergänzen und komplex zusammenspielen. Kommt es zu Funktionseinbußen unterschiedlichen Ausmaßes, sind Lebensqualität und Lebensalltag in unterschiedlicher Weise eingeschränkt. Die Einschränkungen hängen wiederum von den patientenspezifischen Mobilitäts- und Lebenszielen ab. Individuelle patientenspezifische Therapieziele sollten ggf. zu Beginn einer Studie definiert bzw. im Studien-Design berücksichtigt werden [3]. [Tab. 1] fasst die Messmethoden, Kenngrößen und Endpunkte für mikrovaskuläre Veränderungen am Auge zusammen.
Tab. 1 Zusammenfassende Tabelle für Erhebungsmethode, Kenngröße, möglichen patientenrelevanten Endpunkt und Surrogatvalidierung.
Parameter
|
Definition/Merkmale
|
Beurteilung
|
|
1Die Bedeutung der Sehkraft eines Auges und die Auswirkungen auf die Lebensqualität hängt von der Konstellation (Sehen beider Augen) ab. Das Sehen des funktionell schlechteren Auges ist von Bedeutung für das Stereosehen und die Orientierungsfähigkeit; wegen der Auswirkungen für die langfristige Perspektive (Grad der Behinderung) erfolgt meist für Erkrankungen mit potenziell beidseitiger Sehverschlechterung auch eine Berücksichtigung (und Therapie) des schlechteren Auges.
|
Sinnesphysiologische Untersuchungsmethoden
|
Surrogat-Validierung
|
Best-corrected visual acuity (BCVA, distance vision)
|
Best-korrigierter Fernvisus (Hochkontrast): monokular1 und binokular
|
Logarithmische Skalierung
Betrachtung des Letter Score [77]
Caveat: Protokoll der Erhebung
DIN EN ISO 8596 [4]: Landolt C [9], ETDRS [57,11,44]
DIN 58220 [4]: Snellen
Validierung Lebensqualität: Beispiele [16]
[25]
[79]
|
+
|
Low luminance visual acuity
|
Kontrastsehen, Kontrastempfindlichkeit, Kontrastdefizit
|
Bestandteil der Fahrtauglichkeitsprüfung und Begutachtung [32]
Caveat: Ceiling, Zusammenhang mit Alter, Linsentrübung oder Retinopathie [35]
[36]
Cave: Protokoll der Erhebung [80]
-
Umgebungsleuchtdichte
-
Teststrategie
-
Definition des Kontrasts
Standard: Pellie-Robson [81]
[82]
|
|
Maximum Reading Speed (MRS)
|
Lesefähigkeit, Lesegeschwindigkeit
|
Zusatzinformation zu Fernvisus [83]
[84]
Lesevisus, kritische Schriftgröße [85]
Betrachtung der Lesegeschwindigkeit aussagekräftig [86]
[87]
Caveat: Zeitaufwand und Kooperation
|
|
Fixation stability / Macular sensitivity
|
Fixationsverhalten in der Mikroperimetrie
|
Zusatzinformation durch Ortsauflösung [88]
[89]
[90]
[91], Übereinstimmung mit Lesefähigkeit [92]
Caveat: Mindest-Visus als Anforderung, Kooperation
|
|
Colour Vision
|
Farbensehen
|
Einschränkungen des Farbensehens und Farbverwechslungen
Verwendung eines Error-Score [93]
[94], Anomalquotient [95]
Caveat: geringe Alltagsrelevanz (Adaptation)
keine Eignung als PRO
|
|
Fragebogen
|
|
National Eye Institute Visual Function Questionnaire (VFQ-51 oder meist NEI VFQ-25)
|
Schwierigkeiten bei Aufgaben, Symptome emotionales Wohlbefinden, soziale Funktion
|
Validiertes Instrument mit Eignung für alle häufigen chronischen Augener-krankungen [16], auch diabetische Retinopathie [27]
-
deutsche Referenzdaten [19]
-
Relevanz Subskalen, Vergleich EQ-5D [16]
[22]
[23]
[96]
[97]
[98]
[99]
[100]
-
Auswirkungen beider Augen [26]
|
+
|
Retinopathy-Dependent Quality of Life Questionnaire (RetDQoL)
|
Sehbehinderung, Sorgen und Bewegungseinschrän-kungen
|
Instrument für Menschen mit diabetischer Retinopathie [101]
Caveat: bisher keine Verwendung in Studien oder größeren Kohorten
|
|
Visual Function (VF-14)
|
Funktionelle Auswirkungen einer Linsentrübung (Katarakt)
|
Instrument für Menschen mit einer Katarakt [102] oder Retinopathie [103]
Validierung in deutscher Kohorte [104]
Beschränkung auf Funktionen [105]
|
|
Impact of Vision Impairment (IVI)
|
Funktionelle Auswirkungen auf Lesen, Mobilität, Arbeit und Freizeit
|
Instrument zur Erfassung der Alltagsrelevanten Funktionen [106]
|
|
Activity Daily Vision Scale (ADVS)
|
Funktionelle Auswirkungen auf Alltagstätigkeiten
|
Instrument zur Erfassung der alltagsrelevanten Funktionen [107]
|
|
Short-Form health survey (SF-12, SF-20, SF-36)
|
Allgemeinere Erfassung von Funktionsfähigkeit, Symptomen, emotionalen Wohlbefinden, sozialen Beziehungen, Sorgen
|
Caveat: begrenzte Bedeutung für Augen-spezifische Auswirkungen [108]
[109]
Verwendung in Stichproben [29]
[109]
|
|
European Quality of Life 5 Dimensions 3 Level Version (EQ-5D)
|
Erfassung allgemeine Lebensqualität
|
Caveat: Ceiling, begrenzte Bedeutung für augenspezifische Auswirkungen
Verwendung in einzelnen Stichproben [110]
[111]
[112]
|
|
Time trated off / standard gamble
|
Nutzwertanalysen
|
Übersicht in [113]
|
|
Visual Activities Questionnaire (VAQ)
|
Blendungsbehinderung, Sehschärfe, Tiefenwahrnehmung, peripheres Sehen, Farbempfindlichkeit, visuelle Verarbeitung, Suche.
|
Validierung in Glaukomkohorte [97]
|
|
Nicht-invasive bildgebende Untersuchungen
|
|
Diabetic Retinopathy Severity Scale (DRSS)
|
Fundusbefund (Foto)
|
Standardisierte Bewertung über Reading-Center oder Algorithmus [114]
Caveat: Einordnung abhängig von Bildqualität und Field of view [115]
Validierung Lebensqualität: Nachweis eines Makulaödems [24]
[79], Nachweis einer Retinopathie [116], Stadien [117]
|
(+)
|
Central retinal thickness (CRT, central subfield)
|
Netzhautdicke (optische Kohärenztomographie / OCT)
|
Identifikation foveale Beteiligung bzw. Vorliegen eines Makulaödems [118]]
Caveat: geringe Korrelation von Dicke und Visus [119]
|
|
Foveal avascular zone area (FAZ-A), contour irregularity (FAZ-CI), average vessel caliber (AVC), vessel tortuosity (VT), vessel density (VD)
|
Mikrovaskuläre Parameter (OCT-Angiographie)
|
Mögliche Detektion früher mikrovaskulärer Veränderungen als potenzielle Biomarker [120]
[121]
[122]
Caveat Reproduzierbarkeit der OCT-Angiographie unklar, Relevanz noch unklar (Stadien, Funktion, Lebensqualität) [123]
[124]
[125]
[126]
[127]
|
|
Zur Erfassung einer Veränderung der Sehfunktion bzw. einer Visus-Minderung von Menschen mit Diabetes Mellitus, z.B. infolge des diabetischen Makulaödems, ist der hochauflösende, best-korrigierte Hochkontrast-Visus (BCVA) als Test anzuwenden. Nach der DIN EN ISO 8596 für die gutachterliche Untersuchung sollen möglichst das Landolt C verwendet werden. Der allgemeine Sehtest gemäß DIN 58220, Teil 5 liegt den Arbeitsplatzbezogenen Untersuchungen (G25, G37) in Deutschland zugrunde [4]
[5].
Unter anderem ermöglichen die ETDRS (Early Treatment Diabetic Retinopathy Study)-Charts eine gute Möglichkeit, die zentrale Sehfunktion zu vergleichen. Das Testverfahren liefert den Endpunkt, der in klinischen Studien am häufigsten verwendet wird [6]. Es ist methodisch sinnvoll, den Anteil bestimmter Schwellenwerte in Responder-Analysen zu betrachten, z.B. einen Verlust von 15 Buchstaben oder den Erhalt von Lesefähigkeit und Fahrtauglichkeit. Der Schwellenwert für Relevanz ist für die jeweilige Kohorte festzulegen. Wenn die Veränderung im zeitlichen Verlauf betrachtet wird, kann je nach Verteilung und Größe der Stichprobe eine Adjustierung nach den Ausgangswerten erforderlich sein. In der letzten Revision der DIN EN ISO 8596:2018 wurden jetzt auch die Verwendung von ETDRS-Charts aufgenommen, die im Rahmen der Early Treatment Diabetic Retinopathy Study (ETDRS) erstmals eingesetzt wurden [5]
[7]. Durch die Anordnung wird der Reihenoptotypen-Visus bestimmt, es ergeben sich somit vereinzelt Unterschiede für Menschen mit einer Amblyopie. Außerdem gibt es geringfügige Unterschiede in Bezug auf die verwendeten Abbruchkriterien [8].
Sowohl die Verwendung der ETDRS-Charts als auch des Landolt C zeigen eine hohe Re-Test Reliability [9]. Unabhängig von Unterschieden in Abstand und Buchstabengröße ist vor allem die Hintergrundbeleuchtung ein wichtiger Unterschied der ETDRS-Charts zu den Optotypen nach Snellen, die allerdings auch eine Leuchtdichte des Testfeldes im Bereich von 80–320cd/m2 (200cd/m2 empfohlen) aufweisen müssen. Die Charakteristika können eine unterschiedliche Trennschärfe in den unteren Visusstufen bedingen [10]
[11]
[12].
Unabhängig von den verwendeten Sehzeichen ist die bestmögliche Refraktion von großer Bedeutung. Häufig ist die aktuelle Brillenkorrektur nicht aktuell. Außerdem lässt sich aus dem objektiv gemessenen Brechungsfehler nicht unmittelbar die Stärke der Refraktionskorrektur ableiten [13]. Deshalb ist eine genaue Operationalisierung des subjektiven Abgleichs wichtig. Patient und Untersucher sollten gegenüber der Therapiemodalität maskiert sein. In der Augenheilkunde können beide oder ein Auge eines Patienten in einer klinischen Prüfung betrachtet werden. Neben Auswirkungen auf den Stichprobenumfang müssen die statistische Abhängigkeit einerseits gegenüber der vollständigen Erfassung andererseits abgewogen werden. Ohne Frage können eine systemische Behandlung oder orale Medikamente sich auf beide Augen auswirken, während Augentropfen oder intravitrealen Injektionen unterschiedliche Reaktionen bewirken können.
Eine weitere Verankerung des MCID (minimal clinically important difference) in einer deutschen Studienkohorte bleibt anzustreben [14]. Allerdings sind Interventionen mit einer meist starken Auswirkung auf die Lebensqualität dazu kaum geeignet [15].
Als Fragebogeninstrument für die Sehfunktion wird der VFQ-25 vom National Eye Institute (NEI) empfohlen, der die Seh-bedingte Lebensqualität aussagekräftig erfassen kann. Die Auswirkungen einer Intervention kann auch mit Hilfe der Subskalen genauer beschrieben werden. Die Subskalen des VFQ-25 unterscheiden sich nur geringfügig (allgemeines Sehen, Nah- und Fernsehtätigkeiten, Augenschmerzen, sehspezifische soziale Funktion, sehspezifische Rollenfunktion, sehspezifische psychische Gesundheit, Abhängigkeit von der Sehfunktion, Fahrschwierigkeiten, Farbabweichungen und peripheres Sehen) von den längeren Versionen [16]. Nach einem Standardalgorithmus werden Skalenwerte berechnet. Die deutsche Übersetzung des VFQ-25 wurde in diversen Studien validiert [17]
[18]
[19]. Obwohl es sich um keinen Krankheits-spezifischen Fragebogen handelt, konnte bestätigt werden, dass der VFQ-25 spezifisch die Sehfunktion erfasst, unabhängig vom Stadium der Retinopathie [20]
[21]. Eine Verschlechterung der Subskalen zeigte einen unmittelbaren Zusammenhang mit der fortschreitenden Sehverschlechterung und war auch mit konkreten Lebensumständen wie Verlust der Arbeitsfähigkeit und der schlechteren Betreuung von Langzeitkomplikationen assoziiert [22]. Niedrige Scores bildeten verlässlich eine Reduktion der zentralen Sehfunktion (Gesichtsfeld, Kontrastsehen) ab [23]. Die Beeinträchtigung, die sich unter einem diabetischen Makulaödem in den Items darstellt, ähnelt anderen Makulopathien und ist so (noch) nicht bei einer milden Retinopathie ohne Makulaödem anzutreffen [24]. Der VFQ-25 spiegelte die Besserung des Makulaödems durch medikamentöse Therapie verlässlich ab, indem sich vor allem die Subskalen Near Vision und Distance Vision entsprechende Anstiege zeigten [25]
[26]. Aber auch die Subskalen Dependency und Social interaction zeigen Krankheits-abhängige Beeinträchtigungen [27].
Für die Operationalisierung muss beachtet werden, ob eine selbstverwaltete oder Interviewer-basierte Version gewählt wird. In der statistischen Analyse sollte berücksichtigt werden, ob das schlechtere und/oder bessere Auge (unter systemischer Therapie beide Augen) beeinflusst wurden [28]. Ein deutlicher Seitenunterschied des Hochkontrast-Visus beider Augen bedeutet meist niedrigere Scores [19]
[29]. Eine gute Übersicht über die bisher für die diabetische Retinopathie untersuchten Zielgrößen (Krankheits-bezogene QoL, Seh-bezogene QoL, Seh-bezogene Funktionen, Generische QoL, Nutzwert) bieten Fenwick et al [30]. Nicht alle psychometrischen Testverfahren sind als PRO geeignet.
Objektive Messverfahren können darüber hinaus Veränderungen des intraindividuellen Verlaufs mittels entsprechend definierter struktureller Parameter erfassen, wie z.B. Läsionen der zentralen und peripheren-Netzhaut. Daher kann eine Fotodokumentation relevante Informationen liefern, falls die Aufnahme und Bildanalyse mit einer validierten und reproduzierbaren Operationalisierung erfolgt. Studien müssen die Validierung solcher Surrogat-Endpunkte aber zuerst belegen, also die Verbindung zwischen Änderungen zeigen, die mit solch morphometrischen Verfahren erhoben werden. Ein entsprechender Endpunkt muss letzten Endes stark mit dem Verlust der Sehfunktion korrelieren, bevor die klinische Relevanz gesichert ist.
Die optische Kohärenztomographie (OCT) wird insbesondere als Methode verwendet, die Informationen zur Dicke der Netzhaut und ihrer einzelnen Schichten liefert. Allerdings korreliert die alleinige Dickenmessung schlecht mit der Funktion. Obwohl das Potenzial besteht, neurodegenerative Veränderungen und eine Abnahme der tiefen perifovealen Kapillardichte mittels OCT und OCT-Angiographie zu erfassen, ist die Relevanz der Untersuchungsmethoden als Endpunkt nicht gegeben bzw. belegt. Daher sind Veränderungen mit solchen Messverfahren derzeit keine Grundlage für eine Zusatznutzenbewertung von patientenrelevanten Endpunkten.
Die best-korrigierte Sehschärfe mit niedrigem Kontrast (LCVA) und die Kontrastempfindlichkeit (CS) weisen eine geringfügig größere Variabilität auf als der Hochkontrastvisus; sie bilden aber die Sehqualität unter Dämmerungsbedingungen oder in Umgebungen mit geringen Kontrastunterschieden realistisch ab. Neben der Tiefenwahrnehmung ist eine reduzierte Kontrastempfindlichkeit der wichtigste Seh-bezogene Risikofaktor für Stürze [31]. Die Bestimmung der Kontrastempfindlichkeit ist fester Bestandteil der Fahrtauglichkeitsprüfung und Begutachtung [32]. In einigen Kohorten wurde ein Unterschied von über zwei Zeilen zwischen dem Hochkontrast- und dem Niedrigkontrast-Visus beschrieben [33]
[34]. Abgesehen von einer Abnahme mit dem Alter, für die eine zunehmende Streuung der Linse und die neuronale Degeneration verantwortlich sein dürften, gibt es auch Hinweise auf eine Minderung der Kontrastempfindlichkeit in frühen Ausprägungen der diabetischen Retinopathie [35]. Weil einzelne Studien eine höhere Assoziation der Kontrastempfindlichkeit mit der Netzhautdicke im Vergleich zum Hochkontrastvisus gefunden hatten, gibt es Stimmen für die Verwendung im Rahmen von Therapiestudien [36]
[37]. Die Messmethoden im Bereich des niedrigen Kontrasts sind standardisiert und weisen bei Gesunden eine hohe Reproduzierbarkeit auf [38]
[39]
[40]. Während mit proliferativer diabetischer Retinopathie nach Stabilisierung durch die Laserkoagulation in über der Hälfte keine Verminderung des Hochkontrastvisus gefunden wurde, entsprach den Beschwerden eine häufige Minderung des Low Luminance Visus (>80%) [41]. Kritisch muss angemerkt werden, dass die bestimmten Kontrastschwellen stark vom verwendeten Test aber auch von den Testbedingungen (Umgebungsleuchtdichte, Teststrategie, Definition des Kontrasts) abhängen. Im Gegensatz zum Hochkontrastvisus unterliegen die Messwerte somit einer höheren Variabilität und werden z.B. von einer begleitenden Linsentrübung beeinflusst. Eine weitere Einschränkung ist der Ceiling Effekt einiger Tests, sodass nicht über den gesamten Bereich von einer gleichmäßigen Trennschärfe ausgegangen werden darf.
Zurzeit entwickeln mehrere Hersteller verschiedene neue künstliche Intelligenz (KI)-basierte Verfahren zur Auswertung von zentraler und peripherer Netzhaut. Der Stellenwert dieser KI-basierten Auswertesysteme für den Ausschluss oder die frühe Erfassung von klinisch relevanten Netzhautveränderungen und ihre Beziehungen zu Patienten-bezogenen Ereignissen müssen evaluiert werden. Eine Perspektive dieser neuen KI-Methoden kann nicht nur darin bestehen, engmaschiger den intraindividuellen Verlauf systematisch in Studien erfassen zu können. Validierte Algorithmen können auch genutzt werden, um die Effekte und die Sicherheit neuer Therapiemodalitäten in sehr großen Kohorten bzw. Endpunktstudien zu evaluieren und Surrogatvalidierungsstudien für patientenrelevante Endpunkte durchzuführen.
Nephropathie
Bis im Jahr 2020 gab es noch keinen harmonisierten internationalen Konsens zur Definition des Nierenversagens und von Surrogaten für die Progression der Nierenerkrankung, die spezifisch und homogen für klinische Studien verwendet wurden. Nachdem 2020 eine internationale Arbeitsgruppe der International Society of Nephrology (83 Teilnehmer aus 18 Ländern) die Datenbasis von 64 Studien analysiert und ihre 163 Definitionen, die eine Relevanz für das Nierenversagen haben, in einem iterativen Prozess analysierten, wurde eine internationale Konsensusempfehlung zur Harmonisierung von renalen Endpunkten und Surrogatendpunkten für die Progression einer Nierenerkrankung veröffentlicht [42]
[43]
[44]
[45]
[46]. Grundsätzlich werden hier beim Nierenversagen („kidney failure“) zum einen klinische Outcomes mit den Komponenten Nierentransplantation, Beginn dauerhafter Dialyse und Tod durch Nierenversagen einerseits und GFR-basierte Outcomes (GFR = glomerular filtration rate) mit den Komponenten dauerhaft erniedrigter GFR, sowie anhaltende prozentuale Abnahme der GFR andererseits berücksichtigt. Die Konsensempfehlung empfiehlt für die Studienplanung und -homogenisierung zusammengefasst wie folgt:
Der Klinische Endpunkt für Nierenversagen („kidney failure“) sollte zusammengesetzt sein, d.h.:
und
Surrogat-Endpunkte, die mit hoher klinisch prognostischer Wertigkeit sich auf eine Verschlechterung der Nierenfunktion beziehen, sind:
oder
-
eine prozentuale Abnahme der glomerulären Filtrationsrate, berechnet als eGFR, vom Ausgangspunkt, die für mindestens vier Wochen weiterbesteht (= anhaltend). Als prozentuale Abnahme der eGFR werden Schwellen von ≥30%, ≥40%, ≥50% oder eGFR ≥57% aufgeführt. Diese prozentuale Abnahme ist individualisiert und nicht immer kontinuierlich. Eine 57%ige Abnahme der geschätzten glomerulären Filtrationsrate entspricht ungefähr einer Verdopplung des Serum-Kreatinins und ist der am besten etablierte Surrogat-Parameter, wohingegen eine mehr als 30%ige Abnahme der eGFR die geringste Belastbarkeit besitzt [42].
Für die einzelnen Endpunkte oder deren Komponenten konstatiert die Konsensusempfehlung:
Nierentransplantation wird als Erhalt einer Nierentransplantation definiert, unabhängig von der Quelle (post-mortem vs. lebender Spender), oder als erfolgreiche Implantation oder Transplantatfunktion. Das Datum der Transplantation ist das Datum des Outcomes. Für niedrigere oder höhere Ressourcen sind keine Adjustierungen erforderlich [42].
Dauerhafte Dialyse ist definiert als Dialyse (Peritoneal- oder Hämodialyse), die mindestens 4 Wochen lang durchgeführt wird. In verschiedenen Studien wurden verschiedene Definitionszeiträume verwendet (z.B. 4 Wochen; 30, 60 oder 90 Tage); die Konsensgruppe hat sich nach eingehender Diskussion zwecks Harmonisierung auf 4 Wochen geeinigt. Die Konsensgruppe definiert Situationen, in denen die Dauer von mindestens 4 Wochen Dialyse potenziell nicht eingehalten werden kann, z.B. aufgrund von Todesfällen oder wenn keine weiteren Daten verfügbar sind, aber auf ein dialysepflichtiges Nierenversagen geschlossen werden kann. Zu diesen Situationen gehören der Beginn der Dialyse nach einem Verlauf einer fortschreitenden CKD, der Abbruch der Dialysebehandlung innerhalb weniger Tage aufgrund von Therapieversagen (Dialyseabbruch) oder Ressourcenengpässen oder eine Nierentransplantation kurz nach Beginn der Dialyse. Alle diese Situationen stellen das Erreichen des Studienendpunktes der dauerhaften Dialyse dar. Die Konsensgruppe war sich einig, dass eine längere Dialysedauer als 4 Wochen den meisten „Register“-Definitionen der Dauerdialyse entspricht. Ebenso berücksichtigt die Konsensgruppe, dass die Dialysedauer je nach untersuchter spezifischer Patientenpopulation unterschiedlich sein kann (z.B. Patienten mit Vaskulitis oder Glomerulonephritis). Die Konsensgruppe war sich einig, dass 4 Wochen Dialysedauer in den meisten Fällen eine geeignete Definition ist und die meisten heilbaren dialysepflichtigen akuten Nierenschäden (AKI) angemessen von einem Ergebnis der Dauerdialyse ausschließen würde. Bei Patienten, die eine dialyseunabhängige Nierenfunktion wiedererlangen, könnte dieses Ergebnis revidiert und in eine Sensitivitätsanalyse aufgenommen werden, um die Auswirkungen dieser Änderung zu bestimmen [47]. Aus Patientensicht ist jegliche Dialyse unabhängig von der Dauer ein schwerwiegendes Ereignis mit „Nierenversagen“. Daher sollten Studien, die Nierenversagen als Ergebnis melden, Informationen zu dialysepflichtigen akuten Nierenversagen berichten oder erwägen, ein patientenorientiertes Ergebnis „jeder Dialyse“ zu berichten. In der ressourcenarmen medizinischen Versorgung sind keine Änderungen an der Definition erforderlich. Möglicherweise wird bei knappen Ressourcen seltener dialysiert. Die Dialysehäufigkeit wird somit nicht in die Definition des Endpunkts einbezogen [42].
Tod durch Nierenversagen betrifft einen kleinen Teil des übergeordneten Endpunkts „Nierenversagen“. Seine Einbeziehung ermöglicht den Einschluss der Teilnehmer mit einer GFR von <15 ml/min/1,73 m2, die infolge der Nichtverfügbarkeit einer Nierenersatztherapie oder einer persönlichen Entscheidung gegen eine Dialyse gestorben sind. Dies entspricht der KDIGO-Nomenklatur (KDIGO = Kidney Disease: Improving Global Outcomes) des Todes durch „Nierenversagen ohne Ersatztherapie“. In diesen Fällen ist die zugrunde liegende Todesursache eine fortgeschrittene CKD [100). Im Rahmen von Studien ist die Unterscheidung zwischen Tod mit Nierenversagen und Tod durch Nierenversagen wichtig. Beim Tod durch Nierenversagen ist die Todesursache die eingeschränkte Nierenfunktion. Die Konsensgruppe ist sich bewusst, dass dieser Endpunkt bei eingeschränkten Ressourcen häufiger auftreten kann. Es wird darauf hingewiesen, dass diejenigen, die eine AKI ohne vorbestehende CKD entwickeln und denen dann entweder keine Dialyse angeboten oder Dialyse verweigert wird, im Todesfall mit oder durch Nierenversagen je nach Umständen klassifiziert werden können. Bei der Durchführung der Studie sollte dies vorab festgelegt werden. Tod mit Nierenversagen sollte im Gegensatz zu Tod durch Nierenversagen kein geplanter primärer Studienendpunkt nach Auffassung der Konsensgruppe sein [42].
GFR-basierte Endpunkte und Progression des Nierenversagens: Diese laborbasierten Endpunkte sind akzeptierte und validierte Parameter für das Fortschreiten des Nierenversagens und haben einen hohen prädiktiven Wert (v.a. die prozentuale Abnahme der geschätzten GFR [eGFR]). Sie können auch andere schwerwiegende Komplikationen (z.B. andere kardiovaskulären Erkrankungen) vorhersagen.
Anhaltend niedrige GFR, unabhängig von der Notwendigkeit einer Dialyse, ist ein wichtiger Endpunkt. Eine anhaltende prozentuale Abnahme der GFR wird als ein weiterer „akzeptabler“ GFR-basierter Ersatz für das klinische Studienergebnis Nierenversagen von der Konsensgruppe angesehen [42]. Der Endpunkt einer anhaltend niedrigen GFR ist erreicht, wenn Studienteilnehmende eine niedrige GFR (z.B. bis <15 ml/min/1,73 m2) aufweisen, die über mindestens 4 Wochen anhält und durch zwei aufeinanderfolgende Messungen nachgewiesen wird. Eine GFR <15 ml/min/1,73 m2 gilt in den meisten Fällen als akzeptiert, da dies einen erheblichen Verlust der Nierenfunktion darstellt und mit den aktuellen Leitliniendefinitionen übereinstimmt [42]
[44]
[48]
[49].
Mittlerweile ist durch weitere Metaanalysen und Publikationen die anhaltende prozentuale Abnahme der GFR noch besser validiert und anerkannt. Hierbei wurden zum einen Slope-Techniken (Abfall der eGFR über die Zeit anhand multipler Nierenfunktionsmessungen) für akute, chronische oder Gesamtslopes definiert [49]
[50]
[51]
[52]
[53]. Diese Komponenten sind wichtig angesichts der relativ hohen Korrelation zwischen der prozentualen Abnahme der GFR und dem Risiko des Fortschreitens zum Nierenversagen. Als akzeptierte Surrogatparameter gelten die relativen Abnahmen der GFR gegenüber dem Ausgangswert von ≥40% bzw. den Schwellenwerten ≥30%, 50%, 57%, je nach Studiendesigns und Studienpopulationen. Der Ausgangswert für die Bestimmung der Abnahme der GFR kann von Studienpopulationen und Wirkungsmechanismen der Arzneimitteltherapie abhängen. Eine anhaltende prozentuale Abnahme der GFR sollte im Allgemeinen auf Folgemessungen nach einer Ausgangsbeurteilung vor der Randomisierung basieren und über mindestens 4 Wochen anhalten (Bestätigung durch zwei kurz aufeinanderfolgende Messungen). Die Konsensgruppe weist auf den Wert der Erhebung der Abnahme der GFR als Surrogatparameter auch vor dem Hintergrund hin, dass so kleinere Stichprobengrößen und Studiendauern bei prospektiven Studien zum Nierenversagen möglich sind [42]
[49]
[50]
[51]
[52]
[53]
[54]. Umfangreiche Analysen, die von Workshops der National Kidney Foundation, der US-amerikanischen Food and Drug Administration und der Europäischen Arzneimittelagentur unterstützt wurden, haben die Gültigkeit der eGFR als Surrogatendpunkt bestätigt [42]
[55]. Zu diesen Ergebnissen gehören:
-
Der starke Zusammenhang zwischen einem Rückgang der eGFR und dem Risiko einer Nierenerkrankung im Endstadium in Beobachtungsstudien. Im Vergleich zu Patienten mit einer stabilen eGFR ist ein Rückgang der eGFR um 40 % über 2 Jahre mit einem 10-fach erhöhten Risiko für Nierenversagen bei Patienten mit einer eGFR von <60 ml/min/1,73 m2 verbunden [42]
[56].
-
Ein Abfall der eGFR um ≥40% ermöglicht eine konsistente Bewertung der Behandlungseffekte im Vergleich zu einer Verdopplung des Kreatinins in erneut analysierten Studien unter Verwendung einer Reihe unterschiedlicher Interventionen [42]
[57].
-
Simulationsstudien zur Auswahl der Grenzen, welcher prozentuale Rückgang der eGFR für eine Intervention in verschiedenen Szenarien ausgewählt werden sollte, wurden an Populationen mit unterschiedlichen Raten der CKD-Progression, Wahl des Startpunkts der eGFR und Verwendung von Interventionen mit unterschiedlichen akuten Auswirkungen auf die eGFR durchgeführt [42]
[54]. Die Auswahl von ≥30%, ≥40%, ≥50% oder ≥57% eGFR-Abnahme ist von oben genannten Faktoren abhängig. Studien mit Personen ohne Diabetes oder ohne Albuminurie müssen beispielsweise möglicherweise eine Abnahme von ≥40% verwenden, da die Zeit bis zu einer Abnahme von ≥57% zu lang sein kann. Akute Auswirkungen der Studienintervention auf die eGFR müssen unbedingt berücksichtigt werden [54]
[56]. In einigen Situationen (z.B. wenn die Testintervention die eGFR nicht akut beeinflusst) kann eine Abnahme der GFR um 30% ein akzeptables Surrogat für das Fortschreiten des Nierenversagens sein, obwohl es kein so zuverlässiger oder starker Indikator ist wie eine größere GFR Abnahme [42].
Auch in den Langzeitstudien zu mikrovaskulären Endpunkten mit der Substanzklasse der SGLT-2 Inhibitoren (SGLT-2 = sodium glucose transporter) wurde die anhaltende prozentuale Abnahme der GFR als ein Endpunkt betrachtet [58]
[59]
[60]
[61]
[62]
[63]
[64]
[65]
[66]
[67]
[68]
[69]
[70]
[71].
Eine Verdopplung des Serum-Kreatinins ist ein besonders starker Prädiktor für eine Nierenerkrankung im Endstadium. Ein Rückgang der eGFR um 57% über 2 Jahre (d.h. etwa eine Verdopplung des Kreatinins) ist mit einem 32-fach erhöhten Risiko für Nierenversagen bei Patienten mit einer eGFR <60 ml/min/1,73 m2 verbunden. Dieses Surrogat eignet sich möglicherweise besonders für Studien, bei denen routinemäßige Gesundheitsdaten für die Nachsorge verwendet werden und es nicht immer möglich ist, zusätzliche Messungen zu erheben [42]
[56].
Analysen der gesamten oder chronischen eGFR-Slope-Entwicklung und zusätzlich die Erfassung von Änderungen der Albuminurie sind möglicherweise noch bessere Kriterien für eine Surrogat-Endpunktentwicklung für das Fortschreiten einer chronischen Nierenerkrankung [51]
[55]. Solche GFR-Slope-Analysen sind besonders nützlich bei frühen Nierenerkrankungen und Interventionen mit akuten Auswirkungen auf die GFR. In einer großen Metaanalyse wurden hierzu Behandlungseffekte auf den GFR-Slope-Verlauf über einen Zeitraum von 3 Jahren gemessen und analysiert [51]. Dabei wurden die Auswirkungen der Behandlung auf den Gesamt-GFR-Slope, berechnet vom Ausgangswert bis zu 3 Jahren, und der fortgesetzte Abfall des Slopes über den Zeitraum, beginnend 3 Monate nach der Randomisierung, eingeschätzt. Des Weiteren wurden Effekte der Behandlung auf den klinischen Endpunkt (Verdoppelung des Serumkreatinins, GFR <15 ml/min pro 1,73 m2 oder Nierenversagen mit Nierenersatztherapie) für jeden von 66 Behandlungsvergleichen in einer individuellen Analyse (insgesamt n=187.323) untersucht. Dabei wurde ein Bayesianisches Mixed-Effects-Meta-Regressionsmodell verwendet, um die Behandlungseffekte auf den GFR-Slope mit denen auf den klinischen Endpunkt in allen Studien und nach Krankheitsgruppen (Diabetes mellitus, glomeruläre Erkrankungen, CKD oder Herz-Kreislauf-Erkrankungen) in Beziehung zu setzen. Die Auswirkungen der Behandlung auf den klinischen Endpunkt waren stark mit den Behandlungseffekten auf den Gesamtverlauf des GFR-Slopes verbunden (medianes R2 = 0,98 [95 % Bayesian Credible Interval [BCI] 0,85 bis 1,00]) und mäßig mit denen auf den chronischen Abfall verbunden (R2 = 0,56 [95 %]. BCI 0,25 bis 0,79]). Es gab keine Hinweise auf eine Heterogenität zwischen den einzelnen Krankheiten. Die Ergebnisse dieser Metaanalyse unterstützen die Verwendung der Gesamtsteigung als primären Endpunkt für klinische Studien zur CKD-Progression [51]. Aufgrund einer anderen großen Metaanalyse wurde als ein wichtiger Surrogatparameter der prozentuale Abfall der Albuminurie, gemessen als Urinalbumin/Kreatinin Ratio (ACR oder UACR), z.B. ≥30% vorgeschlagen und validiert [72].
Die Zulassungsbehörden FDA und EMA erkennen einen Abfall der GFR um 30%-40% als Surrogatendpunkt für Nierenversagen in klinische Studien an. Diese Entscheidung erfolgte nach Analyse der Evidenz aus Beobachtungsstudien, klinischen Studien und Studienmodellierungen. In Kohortenstudien waren die Beziehungen zwischen der Veränderung des Albumin-Kreatinin-Verhältnisses (UACR) im Urin oder des geschätzten GFR-Slopes (eGFR) und dem klinischen Outcome des Fortschreitens der Nierenerkrankung stark und konsistent. Eine UACR-Reduktion um 30 % oder eine eGFR-Slopereduktion um 0,5 bis 1,0 ml/min/1,73 m2 pro Jahr waren mit einer HR von ~0,7 für das klinische Outcome in Kohorten und Studien assoziiert. In Simulationen reduzierte die Verwendung des GFR-Slopes als Endpunkt die erforderliche Probengröße und die Dauer der Nachbeobachtung erheblich im Vergleich zum klinischen Endpunkt, vor allem wenn die Ausgangs-eGFR hoch war, die Behandlungseffekte gleichmäßig waren und keine akute Wirkung der Behandlung auftrat [73].
Patientenbezogene Outcomes bei chronischen Nierenerkrankungen: Symptome von Nierenversagen können sich bei unterschiedlichen GFR-Werten zeigen, mit Unterschieden zwischen den Patienten und Populationen. Symptome von Nierenversagen (z.B. Müdigkeit, kognitive Probleme [126.) wurden als wichtige potenzielle Studienergebnisse für Menschen mit CKD identifiziert, einschließlich Dialysepatienten [74]. Für patientenbezogene bzw. –berichtete Outcomes bei Nierenerkrankungen wurde im Jahr 2014 die SONG (Standardized Outcomes in Nephrology)-Initiative ins Leben gerufen. Bisher sind Standardisierungen für chronische Nierenerkrankungen bei glomerulären Erkrankungen (SONG-GD) und SONG-PKD, SONG-Kids, SONG-HD/PD und SONG-TX entstanden. SONG identifiziert Outcomes, die für Patienten von Bedeutung sind und priorisiert werden, wie Fatigue, Schmerz, Gewichtszu- oder -abnahme, finanzielle Nöte/Einfluss und Angstzustände. Diese Endpunkte wurden bisher in Endpunktstudien bei Nierenkranken nicht berücksichtigt. Die Endpunkte beziehen Therapeuten und Health Care Professionals mit ein, legen Perspektiven in Bezug auf Endpunkte fest und sollten zukünftig regelhaft erhoben werden [74]
[75].
Methodik zu Surrogatvalidierungsstudien
Methodik zu Surrogatvalidierungsstudien
Ein Abfall der GFR ist ursächlich für Nierenversagen und liefert damit eine starke biologische Plausibilität als Surrogatendpunkt für die CKD-Progression in RCTs. Darüber hinaus gibt es auch ausgeprägte epidemiologische Zusammenhänge zwischen GFR-Niveaus und GFR-Abfall mit nachfolgendem Nierenversagen [51]. Die Zulassungsbehörden FDA und EMA erkennen nach einem gemeinsamen Workshop mit der KDIGO einen Abfall der GFR um 30%-40% als Surrogatendpunkt für Nierenversagen in klinische Studien an [49]
[51]. Die Frage betreffend, wie und ob der Schweregrad einer vorbestehenden CKD in einer Population einer klinischen Studie den Verlauf und das Ausmaß des GFR-Slopes verändert, wurde kürzlich in einer großen Metaanalyse untersucht [53]. Diese Bayesian metaanalytische Regressionsanalyse von 66 RCTs ergab eine konsistente und valide Datenlage, die die Verwendung des GFR-Slopes als verlässlichen Surrogatparameter in unterschiedlichen CKD-Populationen stützt [53].
Als weiterer Surrogatendpunkt für die CKD-Progression ist die UACR etabliert und anerkannt [52]
[72]. Es gibt nun einen weiteren Hinweis, dass eine Kombination der Surrogatendpunkte GFR-Slopeverlauf und UACR-Verlauf eine zusätzliche Vorhersagesicherheit für renale Endpunkte liefern kann. In einer Bayesian metaanalytischen Regressionsanalyse von 41 RCTs zeigte sich, dass in Phase-2-Studien der Klinischen Zulassungsprüfung bei Studienarmgrößen von 100–200 Teilnehmern pro Therapiearm und einer Beobachtungsdauer von 1–2 Jahren die kombinierte Auswertung der Surrogatendpunkte UACR und GFR-Slope die Vorhersage für harte klinische renale Endpunkte sicherer vorhersagen lässt [52]. Die kombinierte sequenzielle Bestimmung von GFR und UACR in der Versorgung von Menschen mit Typ-2-Diabetes wird jetzt auch dezidiert in dem neuen gemeinsamen Konsensus-Report der ADA und der KDIGO empfohlen [76]. Aus Gründen der vorliegenden Evidenz und der daraus resultierenden zunehmenden Einheitlichkeit der Empfehlungen für die Verwendung von renalen Surrogatendpunkten schließt sich die DDG den Empfehlungen des Konsensus Reports der ADA und KDIGO an.
Zusammenfassung
Für die Retinopathie und die Nephropathie als mikrovaskuläre Folgekomplikationen wurden die einzelnen Merkmale und Parameter dieser Folgekomplikationen, deren Quantifizierbarkeit und deren Eignung als Endpunkt oder Surrogatparameter beurteilt.
Bei der Retinopathie sollte klar zwischen strukturellen Veränderungen und Funktion der Netzhaut unterschieden werden. Als patientenrelevanter Endpunkt sind Sehfunktion und Lebensqualität wichtige Parameter. Bei den sinnesphysiologischen Untersuchungen ist nach derzeitigem Stand der „Best-korrigierter Fernvisus“ mittels des Standardenpunkt-charakterisierten „Best-corrected visual acuity (BCVA, distance vision)“ ein auch für die Surrogatvalidierung geeignetes Verfahren. Als standardisierte und validierte Fragebögen zur Erhebung patientenrelevanter Endpunkte ist das „National Eye Institute Visual Function Questionnaire (VFQ-51 oder meist NEI VFQ-25)“ ein geeignetes Instrument. Als nichtinvasives bildgebendes Untersuchungsverfahren zur Netzhaut und Fundusbeurteilung ist die „Diabetic Retinopathy Severity Scale (DRSS)“ geeignet und kann auch zur Surrogatvalidierung herangezogen werden [128].
Bei der Nephropathie sollte für den Endpunkt „Nierenversagen“ ein zusammengesetzter Endpunkt aus dauerhafter Dialyse, eine dauerhaft auf <15 ml/min/1,73m2 reduzierte GFR oder Transplantation in Kombination mit Tod infolge von Nierenversagen festgelegt sein. Surrogatendpunkte sind eine prozentuale kontinuierliche Abnahme der GFR vom Ausgangspunkt („Slope“) oder eine Zunahme der Albuminausscheidung. In letzter Zeit werden für beide Surrogatendpunkte vermehrt und erfolgreich die Kombination von eGFR-Abnahme und Albuminausscheidung verwendet. Patientenrelevante Endpunkte sind teilweise von der SONG (Standardized Outcomes in Nephrology)-Initiative validiert, hier besteht jedoch noch Entwicklungpotenzial [129].
Die Autoren sehen folgenden weiteren Entwicklungsbedarf für die Operationalisierung mikrovaskulärer Endpunkte und Surrogatparameter:
-
Eine Homogenisierung der Definition und Erhebungsmethoden bei mikrovaskulären Endpunkten sollten – soweit es geht – festgelegt und transparent auch in der Methodik der frühen Nutzenbewertung dargelegt werden.
-
Die Homogenisierung von Endpunkten ermöglicht einen Vergleich verschiedener Studien und Analysen unter Verwendung größerer Datensätze, die versorgungsnah, z.B. in E-Health Records oder in Indikationsregistern, erhoben werden.
-
Diese Festlegungen möglicher Response-Kriterien zur Beurteilung klinisch relevanter Effekte ermöglichen eventuell auch die Erfassung von mikrovaskulären Endpunkten bereits im Rahmen von kardiovaskulären Endpunktstudien in einer belastbaren Weise, die mögliche Änderungen der Zulassung von Medikamenten zeitnaher erlaubt und die Translation in die Versorgung erheblich beschleunigen könnte.
-
Stellenwert von bestimmten PROs bei Patientengruppen, die in Endpunktstudien eingeschlossen werden sollen, sollten methodisch evaluiert und problemorientiert priorisiert sein, um in großen Studien oder Zulassungsprogrammen frühzeitig eingesetzt zu werden.