Ein häufiges Problem in der biomedizinischen
Forschung ist die Analyse von Verlaufskurven. Eine Verlaufskurve
ist eine zeitlich angeordnete Datenreihe, gemessen an einem Probanden,
zum Beispiel die glomeruläre Filtrationsrate (GFR) über
2 Jahre im Abstand von 3 Monaten oder eine Blutzuckerkurve über
2 Stunden mit 5minütlichen Blutzuckermessungen. Kennzeichnend
für solche Situationen ist also, dass es zu einer Vielzahl
von Messwertwiederholungen kommt. Da zur Beurteilung und zum Testen
auf Unterschiede von Verlaufskurven keine einfachen statistischen
Standardverfahren zur Verfügung stehen, werden Verlaufskurven
häufig inadäquat ausgewertet, zum Beispiel durch
den Vergleich zu jedem einzelnen Messzeitpunkt.
Solche multiplen Vergleiche können zu inhaltlichen Problemen
bei der Interpretation führen, wenn beispielsweise nur bei
einem von 10 Messzeitpunkten ein Unterschied auffällt, oder
wenn sich die Kurven überkreuzen. Bei den multiplen Vergleichen
entstehen auch Probleme, wenn multiple Signifikanztests eingesetzt
werden (zum Beispiel 10 verschiedene t-Tests), da bei einer solchen
Vorgabe das Signifikanzniveau [2] nicht
mehr eingehalten werden kann. Das heißt, die Irrtumswahrscheinlichkeit
als Grundpfeiler der statistischen »Sicherheit« ist
nicht mehr quantifizierbar. Auf diese besondere Problematik des
multiplen Testens und geeignete Lösungsmöglichkeiten
werden wir in einem weiteren Beitrag dieser Reihe näher
eingehen. Zunächst sei auf die Literatur verwiesen [1].
Je nach Fragestellung und Design kann eine angemessene Analyse
von Verlaufskurven sehr komplex werden. Eine vollständige Übersicht über
die vorhandenen statistischen Methoden zur Auswertung von Messwertwiederholungen
kann hier nicht gegeben werden. Eine sehr gute Übersicht
findet man zum Beispiel bei Cowder und Hand [3]
Neben komplizierten Verfahren, wie zum Beispiel Varianz-analyse
für Messwertwiederholungen oder Regressionsanalyse mit
zufälligen Effekten, kann man oft auf einfachere Methoden
zurückgreifen, um Verlaufskurven adäquat auszuwerten.
Vor allem bei langen Verlaufskurven interessiert häufig nicht
jeder einzelne Datenpunkt, sondern nur gewisse Charakteristiken
der gesamten Kurve. Lässt sich der Informationsgehalt einer
Kurve sinnvoll durch eine oder wenige Kenngrößen
wiedergeben, so kann die Auswertung dadurch vereinfacht werden,
dass nicht sämtliche Einzelpunkte, sondern lediglich diese
Kenngrößen der Verlaufskurven analysiert werden [7]. Häufig verwendete Kenngrößen
sind die Fläche unter der Kurve (AUC), bei monotonen Kurven
die Steigung aus der einfachen linearen Regression [5] und bei eingipfligen Kurven das Kurvenmaximum
und der Zeitpunkt des Kurvenmaximums.
Abb. 1 Serum-Insulin-Kurven
eines Probanden nach, subkutaner Injektion von Human-Insulin und
eines Insulin-Analogons.
Tab. 1 C max.
-Werte (in pmol/l) von Serum-Insulin-Kurven
gemessen an n = 14 Probanden nach subkutaner
Verabreichung eines Insulin-Analogons bzw. eines Human-Insulins [4].
Proband
|
Insulin-Analogon
|
Human-Insulin
|
Differenz
|
1
|
510
|
345
|
156
|
2
|
428
|
212
|
216
|
3
|
595
|
329
|
266
|
4
|
456
|
300
|
156
|
5
|
444
|
258
|
186
|
6
|
538
|
344
|
194
|
7
|
472
|
281
|
191
|
8
|
516
|
293
|
223
|
9
|
476
|
201
|
275
|
10
|
785
|
286
|
499
|
11
|
585
|
321
|
264
|
12
|
490
|
294
|
196
|
13
|
442
|
261
|
181
|
14
|
515
|
355
|
160
|
Mittelwert (SD)
Median
|
518.0 (92.0)
500
|
291.4 (47.0)
293.5
|
226.6 (87.6)
195
|
Welcher Test zur weiteren Analyse der Kenngrößen
geeignet ist, hängt von der Fragestellung und vom Studiendesign
ab. Grundsätzlich kommen zur Analyse von Kurvenkenngrößen die üblichen
parametrischen und nichtparametrischen Tests in Frage [6]. Man muss lediglich beachten, ob
die zu vergleichenden Verlaufskurven in unabhängigen Gruppen
(Verfahren für unabhängige Stichproben, zum Beispiel
ungepaarter t-Test) oder ob mehrere Verlaufskurven beim gleichen
Probanden (Verfahren für abhängige Stichproben,
zum Beispiel gepaarter t-Test) gemessen wurden.
Als Beispiel betrachten wir die Serum-Insulin-Kurven von n = 14
Probanden, die in einer Studie zum Vergleich zweier Insulin-Präparate
(Insulin-Analogon und Human-Insulin) gemessen wurden [4]. Nach 1 Stunde Vorlaufphase wurde
zum Zeitpunkt 0 subkutan je ein Insulin-Präparat verabreicht
und über 6 Stunden das Serum-Insulin gemessen. Insgesamt
liegen pro Kurve 20 Messwerte vor. Jeder Proband erhielt an 2 verschiedenen
Tagen beide Insulin-Präparate. In [Abb. 1] findet man beispielhaft die beiden
Serum-Insulin-Kurven eines Probanden (Nr. 7).
Eine sinnvolle Kenngröße zur Beschreibung der
maximalen Wirkung der Insulin-Präparate ist das Kurvenmaximum (C max.
). In [Tab. 1] findet man die Cmax.-Werte
aller 28 Kurven. Es zeigt sich ein deutlicher Unterschied zwischen
den beiden Präparaten bezüglich des Kurvenmaximums.
Da es sich um abhängige Stichproben handelt und eine Normalverteilung der
Cmax.-Werte nicht angenommen werden kann, ist ein adäquater
Test auf Unterschied zwischen den Kurven bezüglich Cmax. der
Vorzeichen-Rang-Test von Wilcoxon. Die Anwendung dieses Tests liefert
einen signifikanten Unterschied zwischen den beiden Insulin-Präparaten
bezüglich der maximalen Wirkung (p<0,001).
kurzgefasst: Verlaufskurven sind zeitlich
angeordnete Datenreihen gemessen an einem Probanden. Die richtige
Interpretation kann anhand von komplexen Auswertungsverfahren, zum Beispiel
Varianzanalyse für Messwertwiederholungen oder Regressionsanalyse
mit zufälligen Effekten aber auch anhand einfacherer Kenngrößen,
zum Beispiel Fläche unter der Kurve, bei monotonen Kurven
die Steigung aus der einfachen linearen Regression oder bei eingipfligen
Kurven durch die Bestimmung des Kurvenmaximums bzw. den Zeitpunkt
der Kurvenmaximums erfolgen.