Content uploaded by Heiner C. Bucher
Author content
All content in this area was uploaded by Heiner C. Bucher on Mar 16, 2016
Content may be subject to copyright.
Schwerpunktherausgeber
M. Battegay, Basel
J.F. Riemann, Ludwigshafen
Internist 2008 · 49:681–687
DOI 10.1007/s00108-008-2126-8
Online publiziert: 10. April 2008
© Springer Medizin Verlag 2008
H.C. Bucher
Basel Institute for Clinical Epidemiology & Biostatistics, Universitätsspital Basel
Studien mit
Surrogatendpunkten
Nutzen und Grenzen in der klinischen
Entscheidungsfindung
Schwerpunkt: Evidenzbasierte Medizin
Behandlungsentscheidungen sollten
sich möglichst auf die Ergebnisse von
randomisierten kontrollierten Studi-
en abstützen, welche auf patienten-
relevanten Endpunkten wie z. B. ver-
hinderte Krankheitsereignisse oder
Tod basieren. Die Durchführung sol-
cher Studien ist jedoch aufwändig
und teuer, weshalb oft Studien mit
Surrogatendpunkten durchgeführt
werden. Diese Arbeit entwickelt De-
finitionen und Kriterien, anhand de-
rer Kliniker die Ergebnisse von Surro-
gatendpunktstudien im Rahmen der
klinischen Entscheidungsfindung kri-
tisch gewichten lernen.
Das klinische Problem
Ein Pharmareferent stellt Ihnen Sitaglip-
tin, ein Präparat einer neuen Substanz-
klasse von Dipeptidylpeptidase-IV-Inhibi-
toren zur Behandlung von Typ-2-Diabeti-
kern vor, welche unter Metformin unzu-
reichend eingestellt sind. Er unterstreicht,
dass in einer randomisierten Multicenter-
studie nach 30 Wochen bei 22,1% der Pa-
tienten unter Sitagliptin gegenüber 3,3%
in der Placebogruppe das HbA1c unter 7%
lag (Differenz von HbA1c zwischen den
Gruppen −1,0% zugunsten von Sitagliptin;
[22]).Er betont das niedrigere Hypoglyk-
ämierisiko von Sitagliptin in der Kombi-
nationstherapie im Vergleich mit anderen
Substanzen. Das Präparat sei eine echte
Alternative gegenüber den „Problemme-
dikamenten aus der Klasse der Thiazoli-
dinedionen“.
Wie glaubhaft sind die Ergebnisse dieser
Studie? Ist Sitaglaptin – ein Präparat, für
welches Daten zur Verbesserung von be-
kannten klinischen Komplikation bei Typ-
2-Diabetes fehlen, – eine echte Option für
Ihre unzureichend eingestellten Typ-2-Di-
abetiker?
Was ist ein Surrogatendpunkt?
Behandlungsentscheidungen in der Kli-
nik sollten sich im Idealfall auf die Ergeb-
nisse von randomisierten kontrollierten
Studien abstützen, welche den Nutzen ei-
ner Intervention anhand von Endpunk-
ten untersuchen, die für Patienten rele-
vant sind. Patientenrelevante Endpunkte
sind zum Beispiel Lebensqualität, Herz-
infarkt oder Tod. Da oft große Patienten-
zahlen und eine lange Beobachtungszeit
benötigt werden, ist die Durchführung
solcher Studien jedoch aufwändig. Aus
diesem Grund werden von Forschern und
der pharmazeutischen Industrie oft Studi-
en durchgeführt, bei welchen patienten-
relevante Endpunkte durch sog. Surroga-
tendpunkte ersetzt werden. Dies erlaubt,
die Patientenzahl und Studiendauer zu
reduzieren, und erscheint als eine Lösung
für das Dilemma [1].
Surrogatendpunkte sind Ersatzmes-
sparameter für die Lebensqualität, den
organischen Funktionszustand oder die
Überlebenswahrscheinlichkeit eines Pati-
enten. Sie umfassen physiologische Vari-
ablen wie Albuminausscheidung im Urin
als Surrogatendpunkt für dialysepflich-
tige Niereninsuffizienz, Knochendichte
als Surrogatendpunkt für osteoporosebe-
dingte Frakturen, Blutdruck als Surroga-
tendpunkt für Hirnschlag und CD4-Zell-
zahl als Surrogatendpunkt für AIDS oder
AIDS-assoziierte Mortalität [31]. Surroga-
tendpunkte werden manchmal auch als
Biomarker bezeichnet.
Die Substitution eines patientenrele-
vanten Endpunkts mit einem Surroga-
tendpunkt ist v. a. dann sinnvoll, wenn
der Surrogatmarker einfach, genügend
früh im Krankheitsverlauf, mit hoher Prä-
zision und ohne Beeinträchtigung durch
Störfaktoren (z. B. beim Vorliegen von
kompetitiven Risiken) gemessen werden
kann. Ein nützlicher Surrogatmarker soll-
te nicht nur mit dem patientenrelevanten
Endpunkt korreliert sein, sondern muss
auch im höchst möglichen Ausmaß den
therapeutischen Effekt auf den patienten-
relevanten Endpunkt widerspiegeln.
Nützlich oder irreführend?
Surrogatendpunkte sind unerlässlich in
der Evaluation und Nutzenbemessung
von neuen Medikamenten in Phase-II-
und frühen Phase-III-Studien. In vielen
Ländern erhält die pharmazeutische In-
dustrie die Zulassung eines neuen Medi-
kaments basierend auf Daten von Surro-
gatendpunktstudien. Diese Zulassungs-
politik spiegelt das Entscheidungsdilem-
ma wider, in dem Zulassungsbehörden im
Spannungsfeld von öffentlichem Interesse
nach neuen, besseren und sichereren Me-
dikamenten und dem Druck der phar-
mazeutischen Industrie stehen, ihre Pro-
681Der Internist 6 · 2008
|
dukte möglichst rasch auf den Markt zu
bringen.
Sich auf Evidenz von Surrogatmarker-
studien zu verlassen, kann sinnvoll oder
auch schädlich sein. Die Entscheidung
der amerikanischen Zulassungsbehörde
(Food and Drug Administration), neue
antiretrovirale Medikamente aufgrund ih-
res Wirkungseffekts auf die Surrogatend-
punkte CD4-Zellzahl und HI-Viruszell-
last zuzulassen, war richtungweisend und
rettete Tausende von Patienten vor AIDS
oder Tod. Nachfolgende patientenrele-
vante Endpunktstudien zeigten, dass eine
antiretrovirale Therapie, z. B. mit einem
Protease-Inhibitor, die HIV-assoziierte
Morbidität und Mortalität senkt [11].
Andererseits kann das Vertrauen auf
Surrogatendpunktstudien irreführend
sein. Flosequinan, Milrinon, und Ibopa-
min sind alles Substanzen, welche wich-
tige hämodynamische Parameter bei Pa-
tienten mit Herzinsuffizienz verbessern.
Nachfolgende randomisierte kontrollier-
te Studien zeigten jedoch, dass jede dieser
Substanzen im Vergleich zu Placebo zu ei-
ner Exzessmortalität führte.
Wie können Kliniker zwischen einem
glaubwürdigen und einem ungültigen
Surrogatmarker unterscheiden? Anhand
von klinischen Beispielen soll gezeigt wer-
den, aufgrund welcher Kriterien die Gül-
tigkeit von Surrogatmarkerstudien beur-
teilen werden kann ([2]; Infobox 1). Hier-
bei zeigt sich, dass die Beurteilung kom-
plex ist und eine systematische Evaluati-
on der Beziehung von Surrogat- und pa-
tientenrelevantem Endpunkt notwendig
macht und die Aufarbeitung der Evidenz
von allen randomisierten kontrollierten
Studien einer Substanz mit patientenre-
levanten Endpunkten beinhaltet. Klini-
ker haben nicht die Zeit, sich dieses Wis-
sen zu erarbeiten. Anhand von Beispielen
sollen Kriterien zur Beurteilung der Gül-
tigkeit von Surrogatmarkerstudien vorge-
stellt werden, welche Klinikern ermögli-
chen, die Argumente von Experten – oder
der pharmazeutischen Industrie – zur
Verschreibung von Medikamenten basie-
rend auf Evidenz von Surrogatmarkerstu-
dien kritisch zu evaluieren.
Beurteilung von
Surrogatendpunktstudien
Sind die Ergebnisse von Surro-
gatmarkerstudien glaubhaft?
Assoziation zwischen Surrogat- und
patientenrelevantem Endpunkt
Damit ein Surrogatendpunkt ein glaub-
würdiger Ersatz für einen patientenrele-
vanten Endpunkt ist, muss eine hohe As-
soziation zwischen dem Surrogatend-
punkt und dem patientenrelevanten End-
punkt bestehen. Je höher das Assoziati-
onsmaß, desto wahrscheinlicher ist der
kausale Zusammenhang zwischen Sur-
rogat- und patientenrelevantem End-
punkt. D. h. der Surrogatmarker muss im
kausalen pathophyiologischen Prozess
bedeutsam sein [1]. Zum Beispiel muss
LDL-Cholesterin eine Ursache von isch-
ämischen kardiovaskulären Ereignissen
sein, um ein glaubhafter Surrogatmarker
zu sein. Zudem muss eine Änderung des
Surrogatmarkers (z. B. des LDL-Choles-
terins) einen relevanten Einfluss auf pati-
entenrelevante Endpunkte haben. Wenn
eine Intervention unabhängig vom Sur-
rogatendpunkt Morbidität oder Mortali-
tät positiv oder negativ (wie beispielswei-
se Fibrate zur Prävention von Myokard-
infarkten; [29]) beeinflusst, ist die Glaub-
würdigkeit des Surrogatendpunkts in Fra-
ge gestellt.
Die Glaubwürdigkeit eines Surrogat-
markers hängt zudem davon ab, dass in
verschiedenen Studien ein konsistenter
und unabhängiger Zusammenhang zwi-
schen dem Surrogatmarker und patien-
tenrelevanten Endpunkten besteht. Bei-
spielsweise bestätigen große Kohorten-
studien unabhängig von anderen Risiko-
faktoren wie Alter, Geschlecht, Blutdruck
und Rauchen den Zusammenhang der
Höhe des Cholesterinspiegels und dem
Myokardinfarktrisiko [35].
Zurück zu unserem Beispiel: Evidenz
aus randomisierten kontrollierten Studi-
en bei Typ-1- und -2-Diabetes zeigt, dass
eine bessere Kontrolle des Blutzuckers mi-
krovaskuläre Komplikationen reduziert
[4, 32]. Große Kohortenstudien zeigen ei-
nen Zusammenhang zwischen dem Aus-
maß der Blutzuckerkontrolle und dem Ri-
siko von makrovaskulären Komplikationen
[13, 14]. In einer Metaanalyse von 13 Ko-
hortenstudien (unter Einschluss der UK-
PD-Studie) nahm pro Prozent Zunahme
des HbA1c das relative Risiko eines kardio-
vaskulären Ereignisse zu (RR 1,18; 95% CI
1,10–1,26; [26]).Damit ist das erste Kriteri-
um für einen glaubwürdigen Surrogatend-
punkt erfüllt.
Übereinstimmung
mit randomisierten
Studien verschiedener
Medikamentenklassen
Pathophysiologische Studien sowie nicht-
experimentelle Beobachtungsstudien sind
unzureichend, um den kausalen Zusam-
menhang zwischen Surrogatendpunkt
und patientenrelevanten Endpunkten
zu dokumentieren. Antiarrhythmika der
Klasse I zeigten in elektrophysiologischen
Untersuchungen ausgezeichnete Eigen-
schaften, komplexe ventrikuläre Rhyth-
musstörungen zu unterdrücken und wur-
den deshalb häufig bei Hochrisikopati-
enten eingesetzt. Als – mit beträchtlicher
Verzögerung – Encainid und Flecainid im
Rahmen einer randomisierten kontrol-
lierten Studie überprüft wurden, musste
die Studie aufgrund einer massiven Ex-
zessmortalität beider Substanzen gegen-
682
|
Der Internist 6 · 2008
Schwerpunkt: Evidenzbasierte Medizin
Infobox 1
Kriterien zur Beurteilung von Surrogatendpunktstudien
Sind die Ergebnisse von Surrogatmarkerstudien glaubhaft?
F Besteht eine starke, unabhängige und konsistente Assoziation zwischen dem Surrogatend-
punkt und dem patientenrelevanten Endpunkt?
F Zeigen randomisierte Studien verschiedener Medikamentenklassen, dass die Veränderung des
Surrogatendpunkts konsistent patientenrelevante Endpunkte verbessert?
F Zeigen randomisierte Studien der gleichen Medikamentenklassen, dass die Veränderung des
Surrogatendpunkts konsistent patientenrelevante Endpunkte verbessert?
Wie lauten die Ergebnisse?
F Wie groß, präzise und anhaltend ist der Behandlungseffekt?
Wie können die Ergebnisse in die Patientenversorgung einfließen?
F Stehen die wahrscheinlichen Behandlungsvorteile im Verhältnis zu möglichen Risiken und den
Kosten?
über Placebo vorzeitig abgebrochen wer-
den [7].
Die Behandlung der Herzinsuffizienz
bietet ein weiteres instruktives Beispiel.
Kontrollierte Studien bei Patienten mit
Herzinsuffizienz zeigen, dass ACE-Hem-
mer sowohl die Belastungskapazität ver-
bessern [6, 23] als auch zu einer Mortali-
tätsreduktion führen [8] und damit die Be-
lastungskapazität einen für Kliniker nütz-
lichen Surrogatendpunkt darstellt. Milri-
non [5] und Epoprostenol [30] zeigten in
der Behandlung der Herzinsuffizienz eine
deutliche Verbesserung der Belastungska-
pazität, waren jedoch in randomisierten
kontrollierten Studien mit einer erhöh-
ten Mortalität assoziiert [3, 20]. Ipopamin
zeigte eine Verbesserung von gleich 3 Sur-
rogatendpunkten (Auswurffraktion, Vari-
abilität der Herzrate und Markern auto-
nomer Funktion; [33]), doch in der Über-
prüfung im Rahmen einer randomisier-
ten Studie resultierte insbesondere bei Pa-
tienten mit Herzinsuffizienz wiederum ei-
ne Exzessmortalität [12].
Über Jahre wurde Natriumfluorid auf-
grund des günstigen Einflusses auf die
Knochendichte in der Behandlung der
Osteoporose eingesetzt. Im Rahmen ei-
ner randomisierten kontrollierten Stu-
die zeigten jedoch mit Natriumfluorid
behandelte Frauen trotz Zunahme der
Knochendichte aufgrund einer erhöhten
Knochensprödigkeit vermehrte Frakturen
[24]. Der ungünstige Einfluss von Natri-
umfluorid auf die Frakturrate wurde spä-
ter in einer Metaanalyse von randomisier-
ten kontrollierten Studien bestätigt [10].
Es gibt jedoch auch Beispiele von gül-
tigen Surrogatmarkern. Erste randomi-
sierte kontrollierte Studien mit Protease-
Inhibitoren bei HIV-Infizierten zeigten,
dass mit vollständiger Unterdrückung
der HI-Viruslast und dem Anstieg der
CD4-Zellzahl AIDS und die HIV-assozi-
ierte Mortalität relevant gesenkt werden
können [11]. Nachfolgende große Kohor-
tenstudien zeigten, dass neuere antiretro-
virale Substanzen zu einer weiteren be-
deutsamen Mortalitätsreduktion führen
[28]. Diese Ergebnisse ermutigen uns in
der Schlussfolgerung, dass neue Substan-
zen wie z. B. Darunavir, ein neuer Protea-
se-Inhibitor [16], oder Raltegravir, ein In-
tegraseblocker [9], welche bei Patienten
mit fortgeschrittener HIV-Infektion und
multiplen Resistenzen zu einer eindrück-
lichen Verbesserung der Surrogatend-
punkte führten, auch zu einer relevanten
Verbesserung der klinischen Prognose bei
diesen Patientengruppen führen werden.
Zurück zum Beispiel: Neben Insulin
stehen heute 6 Medikamentenklassen
zur oralen Behandlung des Typ-2-Diabe-
tes zur Verfügung [19]. Studien mit Er-
gebnissen zu patientenrelevanten End-
punkten liegen jedoch nur für Metfor-
min und die Thiozolidnedione Rosiglita-
zon und Pioglitazon vor. In einer Metaa-
nalyse reduzierte eine intensivierte Blut-
zuckerkontrolle unter Monotherapie mit
Metformin das Risiko der diabetesassozi-
ierten Mortalität, von letalen Myokard-
infarkten sowie die Gesamtmortalität
[25]. Die Kombination von Metformin
und Sulfonylharnstoffen führte jedoch
in der UKPD-Studie zu einer 96%igen
Exzessmortalität [32]. In Metaanalysen
von randomisierten kontrollierten Studi-
en zeigte Rosiglitazon im Vergleich zu an-
deren Substanzen keine bessere Senkung
des HbA1c, war jedoch in einer Metaana-
lyse mit einem erhöhten Risiko von My-
okardinfarkten und Herzinsuffizienz as-
soziiert [27]. Eine weitere Metaanaly-
se fand für Rosiglitazon und Pioglitazon
ebenfalls ein erhöhtes Risiko von Herz-
insuffizienz und legt einen Klasseneffekt
nahe, konnte jedoch aufgrund anderer
Einschlusskriterien von Studien eine er-
höhte kardiovaskuläre Mortalität dieser
Substanzen nicht erhärten [15]. Der Nut-
zen oraler Antidiabetika für patienten-
relevante Endpunkte ist mit Ausnahme
von Metformin unklar. Kriterium 2 für
die Validität von HbA1c als Surrogatend-
punkt ist somit nicht erfüllt.
Übereinstimmung mit
randomisierten Studien der
gleichen Medikamentenklasse
Surrogatendpunktstudien können für Kli-
niker glaubwürdiger sein, wenn für Sub-
stanzen der gleichen Klasse randomisierte
kontrollierte Studien vorliegen, welche ei-
ne Verbesserung von Surrogat- und pati-
entenrelevanten Endpunkten zeigen. Bei-
spielsweise zeigen mehrere große rando-
misierte kontrollierte Studien, dass Stati-
ne in der Primär- und Sekundärpräven-
tion kardiovaskuläre Ereignisse reduzie-
ren [29]. Deshalb ist nahe liegend anzu-
nehmen, dass Rosuvastatin, ein noch po-
tenteres Präparat zur Senkung des LDL-
Cholesterins, einen ebensolchen Effekt
auf patientenrelevante Endpunkte hat.
Hierbei gilt es jedoch zu bedenken, dass
Cerivastatin – ein Präparat, welches nur
aufgrund von Daten aus Surrogatmar-
kerstudien die Zulassung erhielt – wegen
eines 10-fach erhöhten Risikos von Rhab-
domyolysen gegenüber herkömmlichen
Statinen vom Markt genommen werden
musste.
E Das Vertrauen auf Surrogatend-
punktstudien ist immer mit offenen
Fragen zu Langzeitverträglichkeit
und Toxizität verbunden.
Unsere Annahmen für dieses Kriterium
können durch 2 Mechanismen außer
Kraft gesetzt werden. So kann ein Prä-
parat einen nützlichen Effekt außerhalb
des über den Surrogatmarker vermit-
telten Effekts haben. Beispielsweise kön-
nen Statine sich in ihren antiinflamm-
torischen Effekten, welche für die Endo-
thelfunktion wichtig sind, unterscheiden.
Zweitens können Substanzen schädliche
Effekte haben, welche nicht über den
Surrogatmarkermechanismus vermittelt
sind. Beispielsweise ist die Zunahme der
nicht kardiovaskulären Mortalität unter
Fibraten einem anderen Mechanismus
zuzuschreiben und nicht durch die Re-
duktion des LDL-Cholesterins und die
damit assoziierte Reduktion von letalen
und nicht-letalen Myokardinfarkten von
Fibraten bedingt.
Unsere Kriterien werden durch die
Definition des Klassenbegriffs einer
Substanz tangiert. Es ist nahe liegend,
dass ein Produzent geneigt ist, den Klas-
senbegriff für seine Substanz weit zu fas-
Tab. 1 Beispiele von Surrogatendpunkten und Kriterien zur Beurteilung der Glaubwürdigkeit von Studienergebnissen mit Surrogatend-
punkten
Art der Inter-
vention
Surrogatend-
punkt
Patienten-
relevanter
Endpunkt
Kriterium 1 Kriterium 2 Kriterium 3
Besteht eine starke, unabhän-
gige und konsistente Assoziation
zwischen dem Surrogatend-
punkt und dem patientenrele-
vanten Endpunkt?
Zeigen randomisierte Studien
verschiedener Medikamenten-
klassen, dass die Veränderung
des Surrogatendpunkts
konsistent patientenrelevante
Endpunkte verbessert?
Zeigen randomisierte Studien
der gleichen Medikamenten-
klassen, dass die Veränderung
des Surrogatendpunkts konsis-
tent patientenrelevante End-
punkte verbessert?
DPP-IV-Hem-
mera
Sitagliptin
HbA1c
Kardiovasku-
läre Ereignisse
Ja [13, 26]
Nein [15, 25, 27]
Nein [22]
Integraseblo-
cker
Raltegravirb
HI-Viruslast
CD4-Zellzahl
AIDS oder Tod
AIDS oder Tod
Ja [17]
Ja [34]
Ja [11, 18]
Ja [11]
Nein [9]
Nein [9]
Proteinase-
Inhibitor
Darunavirb
HI-Viruslast
CD4-Zellzahl
AIDS oder Tod
AIDS oder Tod
Ja [17]
Ja [34]
Ja [18]
Ja [18]
Ja [18]
Ja [18]
Lipidsenker
Rosuvastatin
LDL-Choleste-
rinsenkung
Myokardin-
farkt, Tod
Ja [35] Nein [29] Ja [29]
a Dipeptidylpeptidase -IV-Hemmer, b In Kombinationstherapie mit 2 Reverse-Transkriptase-Hemmern.
684
|
Der Internist 6 · 2008
Schwerpunkt: Evidenzbasierte Medizin
sen, wenn mehrere Präparate der glei-
chen Klasse eine positive und konsistente
Assoziation zwischen Surrogatendpunkt
und patientenrelevantem Endpunkt ge-
zeigt haben (Beispiel β-Blocker für Pa-
tienten nach Myokardinfarkt). Bei Sub-
stanzen mit bekanntem Toxizitätspoten-
zial werden Produzenten eher dazu nei-
gen, die pharmakologischen Unter-
schiede ihrer Substanz gegenüber Subs-
tanzen der gleichen Klasse zu unterstrei-
chen (Beispiel Clofibrat gegenüber einem
anderen Fibrat).
Anhand kontroverser Beispiele von
Surrogatendpunktstudien illustriert
. Tab. 1 unsere Kriterien zur Beurtei-
lung der Glaubwürdigkeit.
In unserem klinischen Beispiel ist Sitag-
liptin die erste Substanz der DPP-IV-Inhibi-
torenklasse und erhielt die Zulassung in der
EU im April 2007 aufgrund von Ergebnis-
sen von Surrogatendpunktstudien. Ergeb-
nisse zu klinischen Endpunktstudien fehlen
für diese Medikamentenklasse gänzlich.
Wie lauten die Ergebnisse?
Wie groß, präzise und anhaltend
ist der Behandlungseffekt?
Unser Vertrauen in die Ergebnisse von
Surrogatmarkerstudien kann erhöht
werden, wenn der Surrogatmarker in
hohem, zeitlich ausreichend langem und
klinisch relevantem Ausmaß sowie mit
genügender Präzision (enge 95%-Ver-
trauensintervalle um das Effektmaß der
Surrogatmarkerveränderung) durch ei-
ne neue Substanz beeinflusst wird. Klei-
ne, klinisch wenig relevante Verände-
rungen des Surrogatmarkers von unge-
wisser Dauer würden unser Vertrauen in
einen Surrogatendpunkt schmälern.
Zurück zum Beispiel: In der Studie
von Raz et al. [22] ergab sich bei Pati-
enten, die mit Metformin behandelt wa-
ren, unter zusätzlichen Behandlung von
Sitagliptin gegenüber Placebo nach 30 Wo-
chen eine Differenz des HbA1c von –1,0% (–
1,4% bis –0,6%). Das Vertrauensintervall
ist weit und schließt einen klinisch wenig
relevanten Effekt ein. Es wurden 190 Pa-
tienten randomisiert und der Verlust an
Patienten im Studienverlauf lag bei rund
10%. Insgesamt wurden unter Sitagliptin
15,6% Laborabnormalitäten – die nicht im
Detail aufgeführt sind – aufgeführt, gegen-
Zusammenfassung · Abstract
Internist 2008 · 49:681–687 DOI 10.1007/s00108-008-2126-8
© Springer Medizin Verlag 2008
H.C. Bucher
Studien mit Surrogatendpunkten. Nutzen und Grenzen
in der klinischen Entscheidungsfindung
Zusammenfassung
Therapieentscheidungen sollten im Idealfall
auf die Ergebnisse von randomisierten kont-
rollierten Studien mit patientenrelevanten
Endpunkten gestützt sein. Patientenrele-
vante Endpunkte sind zum Beispiel Lebens-
qualität, Herzinfarkt oder Tod. Die Durchfüh-
rung solcher Studien ist jedoch aufwändig,
da oft große Patientenzahlen und eine lange
Beobachtungszeit benötigt werden. Deshalb
werden oft Studien durchgeführt, bei wel-
chen patientenrelevante Endpunkte durch
Surrogatendpunkte ersetzt werden, um Pa-
tientenzahl und Beobachtungszeit zu ver-
ringern. Surrogatendpunkte sind Ersatzmes-
sparameter für die Lebensqualität, den orga-
nischen Funktionszustand oder die Überle-
benswahrscheinlichkeit eines Patienten. Die
Zulassung von neuen Substanzen beruht oft
auf den Ergebnissen von Surrogatendpunkt-
studien. Unerwartete Nebenwirkungen und
der Rückzug von Substanzen, welche auf-
grund solcher Studien zugelassen wurden,
haben in jüngster Zeit eine Kontorverse über
die Bedeutung von Surrogatendpunktstu-
dien entfacht. Wir erläutern anhand von Bei-
spielen Kriterien, mit deren Hilfe Kliniker die
Ergebnisse von Surrogatendpunktstudien
kritisch gewichten können.
Schlüsselwörter
Surrogatendpunkt · Patientenrelevanter End-
punkt · Randomisierte kontrollierte Studie ·
Evidenzbasierte Medizin
Surrogate endpoint trials: Benefit and
pitfalls for clinical decision making
Abstract
Ideally clinicians should base their treatment
decisions on results from randomised con-
trolled trials which include patient-important
outcomes, such as quality of life, prevent-
ed disease events or death. Conducting such
trials often involves large sample sizes and
extended follow-up periods. Therefore, re-
searchers have aimed to conduct trials with
surrogate endpoints by substituting patient-
important outcomes in order to reduce sam-
ple size and observation time. Surrogate end-
points are outcomes that substitute for di-
rect measures of how a patient feels, func-
tions, or survives. In many countries drugs are
approved based on data from surrogate end-
point trials. Recently, a controversy evolved
on the reliability of results generated from
these trials driven by unanticipated side ef-
fects or severe toxicity leading to the with-
drawal of drugs that were solely approved
based on evidence from surrogate endpoint
trials. We present some recent examples and
criteria how clinicians can critically evaluate
the validity of claims by experts or the phar-
maceutical industry in regard to the expect-
ed patients’ benefit from drugs approved by
results from surrogate endpoint trials.
Keywords
Surrogate endpoints · Clinical endpoint · Ran-
domised controlled trial · Evidence-based
medicine
685
Der Internist 6 · 2008
|
über 4,3% in der Placebogruppe. In beiden
Gruppen trat jeweils eine Hypoglykämie
auf.
Wie können die Ergebnisse in die
Patientenversorgung einfließen?
Verhältnis von Behandlungsvor-
teilen zu Risiken und Kosten
Die nachfolgenden Fragen muss sich
ein Kliniker bei jeder Intervention stel-
len:
F Sind die Ergebnisse einer Studie auf
einen gegebenen Patienten übertrag-
bar?
F Wurden alle patientenrelevanten
Endpunkte berücksichtigt?
F Überwiegt der erwartete Nutzen die
möglichen Risiken?
F Ist die Maßnahme kosteneffektiv?
Die Abschätzung des zu erwartenden
Nutzens für den Patienten ist bei Sur-
rogatendpunktstudien eine besonde-
re Herausforderung und verlangt die
Übertragung eines zu erwartenden
Nutzens der Modifikation des Surro-
gatmarkers auf den klinisch relevanten
Endpunkt durch Extrapolation von an-
deren Studien.
In unserem Beispiel folgern wir, dass
die Dokumentation des Nutzens von Si-
tagliptin auf relativ kleinen randomi-
sierten Studien von mit Metformin vor-
behandelten und ungenügend eingestell-
ten Typ-2-Diabetikern beruht. Daten
zur Langzeitsicherheit und dem Effekt
von Sitagliptin auf patientenrelevante
Endpunkte fehlen. Durch Herleitung
von anderen Studien ist eine Differenz
des HbA1c von 1% mit einer 18%igen Ri-
sikoerhöhung von diabetesassoziierten
patientenrelevanten Endpunkten ver-
bunden. Die Verbesserung des HbA1c
durch Sitagliptin ist jedoch in der Stu-
die von Raz et al. [22] mit großer Unsicher-
heit behaftet: HbA1c erfüllt bloß 1 von 3 Kri-
terien für die Glaubwürdigkeit eines Surro-
gatendpunkts.
Aus diesem Grund entscheiden Sie sich
aufgrund der großen Unsicherheit in der Evi-
denzlage, Sitagliptin bei Ihren ungenügend
kontrollierten Patienten äußerst zurückhal-
tend einzusetzen und aggressiven Maßnah-
men zur Verbesserung des Lebensstils zu-
nächst den Vorzug zu geben [21].
Fazit für die Praxis
Therapieentscheidungen, welche sich auf
Ergebnisse von Surrogatendpunktstudien
stützen, implizieren gewichtige Annah-
men bezüglich eines Nutzens für einen für
den Patienten relevanten Endpunkt. Unse-
re Kriterien können Klinikern helfen, sich
dieser Annahmen explizit bewusst zu wer-
den. Auch wenn ein Surrogatmarker al-
le diese Kriterien erfüllt, können Kliniker
und Patienten dennoch in die Irre geführt
werden. Aus diesem Grund ist es entschei-
dend, dass sich Kliniker über die gewich-
tigen Probleme von Surrogatmarkerstu-
dien bewusst sind.
Leider besteht eine nicht unerheblich lan-
ge Liste von Beispielen – einige wurden
hier aufgeführt – bei denen Tausende von
Patienten durch Verlass auf Studienergeb-
nisse von Surrogatendpunktstudien zu
Schaden gekommen sind. Kliniker mit ei-
ner eher konservativen Einstellung, wel-
che die Ergebnisse von randomisierten
kontrollierten Studien mit patientenrele-
vanten Endpunkten abwarten, bevor sie
ein neues Präparat verordnen, sind oft gut
beraten, insbesondere wenn es Behand-
lungsalternativen gibt. Ergebnisse von
Surrogatmarkerstudien sollten möglichst
nur dann Eingang in ein Behandlungskon-
zept finden, wenn die Krankheit lebensbe-
drohlich ist, ein sehr hoher Leidensdruck
des Patienten besteht, die Effektgröße der
Intervention auf den Surrogatendpunkt
groß, präzise und klinisch relevant ist und
keine gute andere Behandlungsalterna-
tive vorliegt.
Korrespondenzadresse
Prof. Dr. H.C. Bucher
Basel Institute for Clinical Epidemiology & Bio-
statistics, Universitätsspital Basel
4031 Basel
Schweiz
bucherh@uhbs.ch
Interessenkonflikt. Der korrespondierende Autor
gibt an, dass kein Interessenkonflikt besteht.
Literatur
1. Biomarkers Definitions Working Group (2001) Bio-
markers and surrogate endpoints: preferred defi-
nitions and conceptual framework. Clin Pharmacol
Ther 69: 89–95
2. Bucher HC, Guyatt GH, Cook DJ et al. (1999) Users‘
guides to the medical literature: XIX. Applying cli-
nical trial results. A. How to use an article measu-
ring the effect of an intervention on surrogate end
points. Evidence-Based Medicine Working Group.
JAMA 282: 771–778
3. Califf RM, Adams KF, McKenna WJ et al. (1997) A
randomized controlled trial of epoprostenol thera-
py for severe congestive heart failure: The Flolan
International Randomized Survival Trial (FIRST).
Am Heart J 134: 44–54
4. Diabetes Control and Complications Trial Research
Group (1993) The effect of intensive treatment of
diabetes on the development and progression of
long-term complications in insulin-dependent di-
abetes mellitus. N Engl J Med 329: 977–986
5. DiBianco R, Shabetai R, Kostuk W et al. (1989) A
comparison of oral milrinone, digoxin, and their
combination in the treatment of patients with ch-
ronic heart failure. N Engl J Med 320: 677–683
6. Drexler H, Banhardt U, Meinertz T et al. (1989) Con-
trasting peripheral short-term and long-term ef-
fects of converting enzyme inhibition in patients
with congestive heart failure. A double-blind, pla-
cebo-controlled trial. Circulation 79: 491–502
7. Echt DS, Liebson PR, Mitchell LB et al. (1991) Mor-
tality and morbidity in patients receiving encaini-
de, flecainide, or placebo. The Cardiac Arrhythmia
Suppression Trial. N Engl J Med 324: 781–788
8. Garg R, Yusuf S (1995) Overview of randomized tri-
als of angiotensin-converting enzyme inhibitors
on mortality and morbidity in patients with heart
failure. Collaborative Group on ACE Inhibitor Trials.
JAMA 273: 1450–1456
9. Grinsztejn B, Nguyen BY, Katlama C et al. (2007) Sa-
fety and efficacy of the HIV-1 integrase inhibitor
raltegravir (MK-0518) in treatment-experienced
patients with multidrug-resistant virus: a phase
II randomised controlled trial. Lancet 369: 1261–
1269
10. Haguenauer D, Welch V, Shea B et al. (2000) Fluo-
ride for the treatment of postmenopausal osteo-
porotic fractures: a meta-analysis. Osteoporos Int
11: 727–738
11. Hammer SM, Squires KE, Hughes MD et al. (1997)
A controlled trial of two nucleoside analogues
plus indinavir in persons with human immuno-
deficiency virus infection and CD4 cell counts of
200 per cubic millimeter or less. Aids Clinical Tri-
als Group 320 Study Team. N Engl J Med 337: 725–
733
12. Hampton JR, Van Veldhuisen DJ, Kleber FX et al.
(1997) Randomised study of effect of ibopamine
on survival in patients with advanced severe heart
failure. Second Prospective Randomised Study of
Ibopamine on Mortality and Efficacy (PRIME II) In-
vestigators. Lancet 349: 971–977
13. Khaw KT, Wareham N, Bingham S et al. (2004) As-
sociation of hemoglobin A1c with cardiovascular
disease and mortality in adults: the European pro-
spective investigation into cancer in Norfolk. Ann
Intern Med 141: 413–420
14. Kuusisto J, Mykkanen L, Pyorala K, Laakso M (1994)
NIDDM and its metabolic control predict coronary
heart disease in elderly subjects. Diabetes 43: 960–
967
15. Lago RM, Singh PP, Nesto RW (2007) Congestive
heart failure and cardiovascular death in patients
with prediabetes and type 2 diabetes given thia-
zolidinediones: a meta-analysis of randomised cli-
nical trials. Lancet 370: 1129–1136
686
|
Der Internist 6 · 2008
Schwerpunkt: Evidenzbasierte Medizin
16. Madruga JV, Berger D, McMurchie M et al. (2007)
Efficacy and safety of darunavir-ritonavir com-
pared with that of lopinavir-ritonavir at 48 weeks
in treatment-experienced, HIV-infected patients in
TITAN: a randomised controlled phase III trial. Lan-
cet 370: 49–58
17. Mellors JW, Kingsley LA, Rinaldo CR et al. (1995)
Quantitation of HIV-1 RNA in plasma predicts out-
come after seroconversion. Ann Intern Med 122:
573–579
18. Montaner JS, Reiss P, Cooper D et al. (1998) A ran-
domized, double-blind trial comparing combina-
tions of nevirapine, didanosine, and zidovudine for
HIV-infec ted patients: the INCAS Trial. I taly, the Ne-
therlands, Canada and Australia Study. JAMA 279:
930–937
19. Nathan DM (2007) Finding new treatments for dia-
betes – how many, how fast... how good? N Engl J
Med 356: 437–440
20. Packer M, Carver JR, Rodeheffer RJ et al. (1991) Ef-
fect of oral milrinone on mortality in severe ch-
ronic heart failure. The Promise Study Research
Group. N Engl J Med 325: 1468–1475
21. Pi-Sunyer X, Blackburn G, Brancati FL et al. (2007)
Reduction in weight and cardiovascular disease
risk factors in individuals with type 2 diabetes:
one-year results of the look AHEAD trial. Diabetes
Care 30: 1374–1383
22. Raz I, Chen Y, Wu M et al. (2008) Efficacy and safety
of sitagliptin added to ongoing metformin thera-
py in patients with type 2 diabetes. Curr Med Res
Opin 24: 537–550
23. Riegger GA (1991) Effects of quinapril on exercise
tolerance in patients with mild to moderate heart
failure. Eur Heart J 12: 705–711
24. Riggs BL, Hodgson SF, O’Fallon WM et al. (1990)
Effect of fluoride treatment on the fracture rate
in postmenopausal women with osteoporosis. N
Engl J Med 322: 802–809
25. Saenz A, Fernandez-Esteban I, Mataix A et al.
(2005) Metformin monotherapy for type 2 di-
abetes mellitus. Cochrane Database Syst Rev:
CD002966
26. Selvin E, Marinopoulos S, Berkenblit G et al. (2004)
Meta-analysis: glycosylated hemoglobin and car-
diovascular disease in diabetes mellitus. Ann In-
tern Med 141: 421–431
27. Singh S, Loke YK, Furberg CD (2007) Long-term
risk of cardiovascular events with rosiglitazone: a
meta-analysis. JAMA 298: 1189–1195
28. Sterne JA, Hernan MA, Ledergerber B et al. (2005)
Long-term effectiveness of potent antiretroviral
therapy in preventing AIDS and death: a prospec-
tive cohor t study. Lancet 366: 378–384
29. Studer M, Briel M, Leimenstoll B et al. (2005) Effect
of different antilipidemic agents and diets on mor-
tality: a systematic review. Arch Intern Med 165:
725–730
30. Sueta CA, Gheorghiade M, Adams KF et al. (1995)
Safety and efficacy of epoprostenol in patients
with severe congestive heart failure. Epoprostenol
Multicenter Research Group. Am J Cardiol 75: 34A–
43A
31. Temple RJ (1995) A regulatory authority’s opinion
about surrogate endpoints. In: Nimmo WS, Tucker
GT (eds) Clinical measurement in drug evaluation.
John Wiley, New York, pp 3–22
32. UK Prospective Diabetes Study Group (UPDS)
(1998) Intensive blood-glucose control with sul-
phonylureas or insulin compared with conventio-
nal treatment and risk of complications in patients
with type 2 diabetes (UKPDS 33). Lancet 352: 837–
853
33. Yee KM, Struthers AD (1997) Can drug effects on
mortality in heart failure be predicted by any sur-
rogate measure? Eur Heart J 18: 1860–1864
34. Yerly S, Perneger TV, Hirschel B et al. (1998) A cri-
tical assessment of the prognostic value of HIV-1
RNA levels and CD4+ cell counts in HIV-infected
patients. The Swiss HIV Cohort Study. Arch Intern
Med 158: 247–252
35. Yusuf S, Hawken S, Ounpuu S et al. (2004) Effect of
potentially modifiable risk factors associated with
myocardial infarction in 52 countries (the INTER-
HEART study): case-control study. Lancet 364: 937–
952