Full-text

Available from: Markus Wirtz, May 06, 2014
Name der Zeitschrift 0/2001 30.7.2005 blackcyanmagentayellow
Regression zur Mitte
C. Zwingmann
1
M. Wirtz
2
Regression to the Mean
Koordinatoren der Reihe ¹Methoden in der Rehabilitationsforschung“:
Prof. Dr. Dr. Hermann Faller, Würzburg; Prof. Dr. Thomas Kohlmann, Greifswald;
Dr. Christian
Zwingmann, Berlin
Interessenten, die einen Beitrag zur Reihe beisteuern möchten, werden gebeten,
vorab Kontakt aufzunehmen, E−mail: christian.zwingmann@vdr.de
Institutsangaben
1
Verband Deutscher Rentenversicherungsträger, Rehabilitationswissenschaftliche Abteilung, Berlin
2
Methodenzentrum des Rehabilitationswissenschaftlichen Forschungsverbundes Freiburg/Bad Säckingen,
Abteilung für Rehabilitationspsychologie, Institut für Psychologie, Universität Freiburg
Korrespondenzadresse
Dr. Christian Zwingmann ´ Verband Deutscher Rentenversicherungsträger ´ Rehabilitationswissenschaftliche
Abteilung ´ Hallesche Straße 1 ´ 10963 Berlin ´ E−mail: christian.zwingmann@vdr.de
Bibliografie
Rehabilitation 2005; 44: 244±251  Georg Thieme Verlag KG Stuttgart ´ New York
DOI 10.1055/s−2005−866924
ISSN 0034−3536
Zusammenfassung
Bei der Evaluation der Effektivität von Rehabilitationsmaßnah−
men kann Regression zur Mitte auftreten. Damit ist gemeint,
dass die Messwerte in einer Gruppe von Patienten mit extremen
Merkmalsausprägungen allein aufgrund von Zufall, also auch
ohne ¹wirkliche“ Veränderung, bei wiederholter Merkmalsmes−
sung im Durchschnitt weniger extrem ausgeprägt sind. Wird die−
se Veränderungskomponente bei der
Evaluation von Behand−
lungseffekten in Extremgruppen nicht berücksichtigt, kommt es
zu Fehleinschätzungen der Wirksamkeit. Die Arbeit erläutert die
Regression zur Mitte in einfacher Weise und klärt einige häufig
anzutreffende Missverständnisse. Es wird gezeigt, welche Bedin−
gungen für das Zustandekommen und die Stärke des Regres−
sionseffekts von Bedeutung sind und wie ihm bei Messwieder
holungen Rechnung getragen werden sollte.
Schlüsselwörter
Regression zur Mitte ´ epidemiologischer AU−Trend ´ Analyse von
Veränderungen ´ Extremgruppen
Abstract
The evaluation of rehabilitation programmes may be distorted
by regression to the mean: In a group of patients with extreme
measurement values, these values tend to be less extreme on a
following point in time due to merely random components and
regardless of a ¹true“ treatment effect. If this effect is not taken
into account the effectiveness of rehabilitation programmes
may
be estimated wrongly. In this paper regression to the mean
is explained comprehensively, and common misunderstandings
are clarified. It is shown which conditions are crucial for occur
rence of regression to the mean and which factors determine its
strength. Furthermore it is shown how regression to the mean
should be controlled in repeated measurement designs.
Key words
Regression to the mean ´ analysis of change ´ extreme groups
Methoden in der Rehabilitationsforschung
244
Page 1
Name der Zeitschrift 0/2001 30.7.2005 blackcyanmagentayellow
Einführendes Beispiel für die Regression zur Mitte:
Der ¹epidemiologische Arbeitsunfähigkeitstrend“
Wenn es um die Erfolgsbewertung von medizinischen Rehabili−
tationsmaßnahmen anhand von Arbeitsunfähigkeitszeiten (AU−
Zeiten) geht, wird in der deutschsprachigen rehabilitationswis−
senschaftlichen Literatur regelmäßig darauf hingewiesen, dass
bei der Interpretation der ¹epidemiologische Arbeitsunfähig−
keitstrend (AU−Trend)“ berücksichtigt werden muss. Damit ist ±
im Anschluss an die Arbeiten von Wagner [25] aus der ehemali−
gen DDR und die westdeutschen Replikationen von Gerdes [11] ±
folgende empirische Beobachtung gemeint: Auch bei konstant
bleibendem Kr
ankenstand z.B. zwischen aufeinander folgenden
Jahreszeiträumen, ergeben sich systematische zeitliche Verände−
rungen der AU−Zeiten unabhängig von potenziellen Behand−
lungseffekten. Diese folgen dem Trend: ¹Tiefe Werte nehmen
zu, hohe Werte nehmen ab“ ([25], S. 323). Personen mit sehr
niedrigen bzw. sehr hohen Werten bei der Arbeitsunfähigkeit
weisen also im Folgejahr durchschnittlich starke Veränderungen
nach oben bzw. nach unten auf, während sich Personen mit mitt−
leren Ausgangswerten im Durchschnitt nur wenig verändern. Bei
konstant bleibendem Krankenstand handelt es sich bei den Ver
änderungen lediglich um ¹Umschichtungen“, die Summe aller
Abweichungen beträgt Null.
Personen, die eine Rehabilitationsmaßnahme in Anspruch neh−
men, weisen vor der Maßnahme zumeist sehr hohe AU−Zeiten
auf; dies ist ja häufig auch
einer der Gründe für die Inanspruch−
nahme. Werden nun im Rahmen von Prä−Post−Vergleichen die
AU−Zeiten zur Erfolgsbewertung herangezogen, so muss ± dem
epidemiologischen AU−Trend zufolge ± davon ausgegangen wer
den, dass es bei den Rehabilitanden ohnehin zu starken Rück
gängen der AU−Zeiten kommt. Die empirisch beobachtbare deut−
liche Abnahme der durchschnittlichen AU−Zeiten nach einer Re−
habilitationsmaßnahme kann deshalb nicht einfach ursächlich
auf die Wirkung der Behandlung zurückgeführt werden, sondern
zum Großteil einfach damit zusammenhängen, dass Rehabilitan−
den vor der
Rehabilitationsmaßnahme erhöhte AU−Zeiten auf−
weisen. Tatsächlich fanden Wagner [25] und Gerdes [11], dass
die Abnahme der AU−Zeiten nach Rehabilitation nicht höher aus−
fällt als in Kontrollgruppen ohne Rehabilitation, die hinsichtlich
der ursprünglichen Höhe der AU−Zeiten bzw. sogar weiterer po−
tenziell relevanter Merkmale vergleichbar waren.
Der in der rehabilitationswissenschaftlichen Literatur als ¹epide−
miologischer AU−Trend“ bezeichnete Sachverhalt ist somit ± wie
Stallmann [22] dargelegt hat ± kein spezifisches Phänomen für
Arbeitsunfähigkeitsdaten, sondern ein konkretes Beispiel für die
¹Regression zur Mitte“, die erstmals
von Sir Francis Galton [10]
beschrieben wurde. Die Regression zur Mitte bezeichnet in erster
Linie artifizielle zufallsbedingte Veränderungen, die in Untersu−
chungsgruppen mit zunächst extremen Merkmalsausprägungen
auftreten. Der vorliegende Beitrag soll klären, wie dieser ¹sto−
chastische“ Regressionseffekt charakterisiert werden kann, wie
er zu Stande kommt, unter welchen Umständen mit ihm (beson−
ders) zu rechnen ist und wie er kontrolliert werden kann. Die Er
läuterungen erfolgen schrittweise und werden durch ein Daten−
beispiel veranschaulicht.
1
Charakterisierung der Regression zur Mitte anhand eines
Datenbeispiels
Wir nehmen an, dass 21 Patienten zu Beginn (t1), am Ende einer
medizinischen Rehabilitationsmaßnahme (t2) und zu einem Ka−
tamnesezeitpunkt (t3, z. B. 6 Monate nach Entlassung) einen Fra−
gebogen zur gesundheitsbezogenen Lebensqualität ausgefüllt
haben. Tab.1 zeigt die resultierenden Messwerte.
Die Daten in Tab.1 wurden zufällig generiert ± unter der Modell−
voraussetzung, dass die Messwerte von t1 und t2 bzw. t2 und t3
linear zusammenhängen und zu ca. 0,75 korrelieren.
2
Für alle
drei Messzeitpunkte kommt jeder Messwert im Bereich 1 bis 21
genau einmal vor. Die Messwerte sind somit lediglich unter
schiedlich angeordnet, sodass die Verteilungseigenschaften der
betrachteten Variablen ¹gesundheitsbezogene Lebensqualität“
über die drei Messzeitpunkte per Definition gleich bleiben:
± Zum einen findet in der Stichprobe der 21 Rehabilitanden kei−
ne Veränderung des Mittelwertsüber dieZeit statt (M
gesamt−t1
=
M
gesamt−t2
= M
gesamt−t3
= M
gesamt
= 11). Es liegen also in der Ge−
samtstichprobe keine systematischen Merkmalsveränderun−
gen z. B. infolge einer Behandlung vor, die normalerweise die
Regression zur Mitte überlagern können. Als ¹Erklärung“ für
die im Folgenden zu diskutierenden Effekte kommen in unse−
rem Datenbeispiel also nur unsystematische, zufällige Verän−
derungen infrage.
± Zum anderen bleibt in der
Stichprobe der 21 Patienten auch
die Merkmalsstreuung über die Zeit konstant (SD
gesamt−t1
=
SD
gesamt−t2
= SD
gesamt−t3
= SD
gesamt
= 6,06). Da zudem jeder Mess−
wert im Bereich 1 bis 21 zu jedem Messzeitpunkt genau ein−
mal vorkommt, können die Daten in diesem Beispiel auch als
messzeitpunktspezifische Rangreihenwerte interpretiert wer
den. Der Rehabilitand mit der Patientennummer 1 beispiels−
weise hat also zu t1 die geringste Lebensqualität, zu t2 die
drittniedrigste und zu t3 die viertniedrigste Lebensqualität.
Der Regressionseffekt wird im Datenbeispiel erkennbar, wenn
die Rehabilitandenstichprobe auf der Basis der Ausprägung der
1
Häufig werden darüber hinaus die Effekte kompensatorischer Gegen−
prozesse, die durch extreme Merkmalsausprägungen aktiviert werden,
ebenfalls zur Regression zur Mitte gezählt [20]. Beispielsweise ist es
denkbar, dass hohe AU−Zeiten ± auch ohne rehabilitative Behandlung ±
systematische Verhaltensänderungen auslösen, die zu einer überpro−
portionalen Abnahme der AU−Zeiten führen. Solche
¹Spontanremissio−
nen“ werden mit der Begründung unter die Regression zur Mitte subsu−
miert, dass es allein auf der Grundlage eines zu zwei Messzeitpunkten
gemessenen Merkmals empirisch nicht möglich ist,
zwischen zufallsbe−
dingten Veränderungen einerseits und inhaltlich bedeutsamen kom−
pensatorischen Effekten andererseits zu unterscheiden [20]. Hierfür
wären zusätzliche empirische Folgeuntersuchungen mit theoretisch ab−
geleiteten Vorhersagevariablen erforderlich.
2
Die zufällige Erzeugung der Datenreihen erfolgte in mehreren Schritten
unter Zuhilfenahme der Zufallswerteprozedur rv.normal in SPSS: Zu−
nächst wurde eine kontinuierliche, standardnormalverteilte Zufallsva−
riable X1 generiert. Anschließend wurde zu X1 eine normalverteilte Va−
riable mit Varianz 1 hinzuaddiert. Nach Standardisierung dieser neuen
Variablen X2 wurde in identischer Weise ± ausgehend von den X2−Wer
ten ± eine Zufallsvariable X3 erzeugt. Die ¹Messwerte“ in Tab.1 zu t1, t2
bzw. t3 entsprechen den aufsteigenden
Rangreihen der kontinuierli−
chen Werte in X1, X2 bzw. X3.
Zwingmann C, Wirtz M. Regression zur Mitte. Rehabilitation 2005; 44: 244 ±251
Methoden in der Rehabilitationsforschung
245
Page 2
Name der Zeitschrift 0/2001 30.7.2005 blackcyanmagentayellow
gesundheitsbezogenen Lebensqualität zu t1 in drei gleich große
Gruppen unterteilt wird (s. Spalte 2 in Tab.1). Gruppe 1 wird von
den Patienten mit der niedrigsten Lebensqualität, Gruppe 3 von
den Patienten mit der höchsten Lebensqualität gebildet. Betrach−
tet man die Mittelwerte dieser Subgruppen (vgl. letzte Spalte in
Tab. 1), so fällt auf, dass diese über die Zeit in Gruppe 1 zuneh−
men (4,00, 5,00, 7,43) und in Gruppe 3 abnehmen (18,00, 16,86,
1
4,29). Die Mittelwerte in diesen beiden Extremgruppen ver
ändern sich also jeweils in Richtung des Gesamtmittelwerts
M
gesamt
= 11 (¹Regression zur Mitte“), während sich in der mittle−
ren Gruppe 2 nur eine geringfügige, unsystematische Verände−
rung des Mittelwerts zeigt (11,00, 11,14, 11,29). Entscheidend für
diese Systematik der subgruppenspezifischen Mittelwertverän−
derungen ist die Bildung der Subgruppen auf der Grundlage der
t1−Werte. Würde man in Tab.1 die drei Gruppen zufällig generie−
ren, so träte kaum Regression zur Mitte auf, weil dann zu t1 in
allen drei Subgruppen nur unsystematische Abweichungen vom
Gesamtmittelwert vorlägen.
Wodurch kommt die Systematik der Mittelwertveränderungen
in den Extremgruppen zu Stande, wenn doch lediglich zufällige
Veränderungen als ¹Erklärung“ infrage kommen? Die Ursache
für
diese Systematik wird nachvollziehbar, wenn man berück
sichtigt, dass die drei Messwertreihen der gesundheitsbezoge−
nen Lebensqualität nicht in perfektem Zusammenhang stehen
(Korrelation < 1)
3
, sodass sich von Messzeitpunkt zu Messzeit−
punkt Veränderungen in den Messwerten der Patienten ergeben.
Da in den Extremgruppen bereits maximal mögliche Abwei−
chungen der Lebensqualität vom mittleren Wert der Gesamt−
stichprobe (M
gesamt
= 11) vorliegen, erfolgen Veränderungen ±
von Einzelfällen abgesehen ± insgesamt in Richtung tendenziell
weniger extremer Werte. Dementsprechend müssen die Mittel−
werte in den Extremgruppen zu t2 näher am Gesamtmittelwert
M
gesamt
liegen. Eine Veränderung in den Extremgruppen ist also
mit einer ¹Normalisierung“ ± hier im Sinne einer weniger extre−
men Lebensqualität ± verbunden.
In den Daten wird
dieser Effekt auch dadurch erkennbar, dass in−
nerhalb der drei Patientengruppen die Variabilität der Messwer
te zunimmt; z.B. steigt die Streuung der Lebensqualität in Grup−
pe 1 von 2 auf 3,21 bzw. 5,12 (s. letzte Spalte in Tab. 1). Diese
Streuungserhöhung kann in der extremen Gruppe 1 nur durch
tendenziell höhere bzw. in der extremen Gruppe 3 nur durch
tendenziell niedrigere Messwerte erreicht werden, sodass es in
diesen beiden Gruppen zu einer ¹gerichteten Bewegung“ weg
von den Extremen, hin zum Gesamtmittelwert M
gesamt
kommt.
Bei der in diesem Beispiel dargestellten Gruppenaufteilung wird
auch deutlich, dass die A−posteriori−Auswahl der Extremgruppen
1 und 3 gemäß der Ausprägung zu t1
zu einer minimal mögli−
chen Merkmalsstreuung zu t1 führt: Keine andere Gruppe von
sieben Patienten hätte eine niedrigere Merkmalsstreuung als
SD = 2. Diese systematische Einschränkung der Merkmalsstreu−
ung aufgrund der Selektion einer homogenen Patientengruppe
± zusammen mit der Tatsache, dass bereits maximal extreme
Werte vorliegen ± lässt den Regressionseffekt in den Extrem−
gruppen notwendigerweise auftreten, wenn die Messwerte für
die Personen nicht unverändert bleiben. Da die Messwertreihen
zu t2 bzw. t3 nicht perfekt mit den Werten zu t1 korrelieren, er
höht sich notwendigerweise die Streuung und entsprechend tritt
Regression zur Mitte auf.
In Gruppen mit maximal extremen Werten (wie die Gruppen 1
und 3 im Dat
enbeispiel) lässt sich der Regressionseffekt am an−
schaulichsten nachvollziehen. Die Regression zur Mitte zeigt
sich allerdings grundsätzlich in beliebigen Subgruppen, deren
Mittelwert von demjenigen der Gesamtstichprobe abweicht: Je
größer die Differenz zwischen dem Mittelwert der betreffenden
Subgruppe und dem Gesamtmittelwert ist, desto größer ist der
Regressionseffekt. Dies wird verständlich, wenn man bedenkt,
dass auch die Bildung weniger extremer Gruppen zu einer Ver
ringerung der subgruppenspezifischen Merkmalsstreuung zu t1
führt.
Entscheidend für die Evaluation von Behandlungseffekten ist
nun, dass es aufgrund
des Regressionseffekts problematisch ist,
wenn die Daten von Extremgruppen ausgewertet werden: Wür
den nur die Patienten 1 ± 7 oder aber 15±22 über die drei Mess−
zeitpunkte hinweg untersucht, wäre eine systematische Verän−
derung der gesundheitsbezogenen Lebensqualität zu verzeich−
nen, die ausschließlich durch den Regressionseffekt bedingt ist
und nicht der Wirkung z.B. von rehabilitativen Behandlungen
zugeschrieben werden dürfte. Als Interventionseffekt dürfte viel−
mehr nur der Betrag bezeichnet werden, der über die zufallsbe−
Tab. 1 Messwertreihen für 21 Patienten für drei Messzeitpunkte,
sortiert nach der Ausprägung in t1 (Erläuterung weiterer
Angaben s. Text)
Pat.−Nr. Gruppe t1 t2 t3 Kennwerte innerhalb
der Gruppen
1
2
3
4
5
6
7
1
1
1
1
1
1
1
1
2
3
4
5
6
7
3
1
2
6
9
4
10
4
3
9
2
10
6
18
Gruppe 1
M(t1) = 4,00 SD(t1) = 2,00
M(t2) = 5,00 SD(t2) = 3,21
M(t3) = 7,43
SD(t3) = 5,12
8
9
10
11
12
13
14
2
2
2
2
2
2
2
8
9
10
11
12
13
14
18
11
15
5
7
8
14
20
14
8
11
1
12
13
Gruppe 2
M(t1) = 11,00 SD(t1) = 2,00
M(t2) = 11,14 SD(t2) = 4,39
M(t3) = 11,29 SD(t3) = 5,40
15
16
17
18
19
20
21
3
3
3
3
3
3
3
15
16
17
18
19
20
21
17
12
21
16
13
19
20
15
5
21
17
7
16
19
Gruppe 3
M(t1) =
18,00 SD(t1) = 2,00
M(t2) = 16,86 SD(t2) = 3,18
M(t3) = 14,29 SD(t3) = 5,57
M 11 11 11
SD 6,06 6,06 6,06
Anmerkung: Bei den Standardabweichungen SD
handelt es sich um Stichpro−
benstreuungen (jeweils Summe der quadrierten Abweichungen vom Mittel−
wert, geteilt durch n)
3
Hier und im Folgenden verwenden wir die Begriffe ¹Korrelation“ und
¹Zusammenhang“ im Sinne einer positiven Korrelation bzw. eines posi−
tiven Zusammenhangs, obwohl alle Eigenschaften des Regressionsef−
fekts für den Betrag der Korrelation und damit in gleicher Weise für
negative Beziehungen gelten.
Zwingmann C, Wirtz M. Regression zur Mitte. Rehabilitation 2005; 44: 244 ± 251
Methoden in der Rehabilitationsforschung
246
Page 3
Name der Zeitschrift 0/2001 30.7.2005 blackcyanmagentayellow
dingte, jedoch systematische Veränderung aufgrund der Regres−
sion zur Mitte hinausgeht. In unserem Datenbeispiel liegt aber
kein Behandlungseffekt vor, wie an dem unveränderten Mittel−
wert der Gesamtstichprobe über die drei Messzeitpunkte deut−
lich wird. Die Auswertung von Extremgruppen kann allerdings
nicht nur zur fälschlichen Interpretation eines Regressions−
effekts als Interventionseffekt führen, sondern u. U. auch zum
Übersehen eines Behandlungseffekts. Dies kann vorkommen,
wenn die Regression zur Mitte in erfolgreich behandelten
Extremgruppen mit bereits sehr günstigen Prä−Werten einer
weiteren Verbesserung entgegenwirkt.
Wir können bis jetzt folgendermaßen zusammenfassen: Regres−
sion zur Mitte tritt auf, wenn bei zeitlich aufeinander folgenden
Messwertreihen, die in linearem Zusammenhang stehen und
nicht perfekt korrelieren,
eine zu mehr oder weniger extremen
Ausgangswerten führende Selektion stattgefunden hat. Regres−
sion zur Mitte kann damit als Folge einer Auswahlverzerrung
aufgefasst werden: ¹Regression to the mean is a form of selection
bias“ ([7], S. 707). Der Regressionseffekt äußert sich darin, dass in
den mehr oder weniger extremen Subgruppen die durchschnitt−
lichen Rangplätze von Messzeitpunkt zu Messzeitpunkt näher
am mittleren Rangplatz der Gesamtstichprobe liegen. Die Re−
gression zur Mitte bezieht sich auf Rangplätze und damit auf
die relative Lage der Extremgruppenmittelwert
e, zeigt sich aber
meistens ± wie in unserem Datenbeispiel ± auch in den absolu−
ten Durchschnittswerten. Ausnahmen von dieser Regel werden
weiter unten spezifiziert.
Ausgehend von unserem Datenbeispiel sowie dem einführenden
Beispiel zum epidemiologischen AU−Trend sollen nun zentrale
Eigenschaften des Regressionseffekts näher erläutert werden.
Regression zur Mitte ist umso stärker, je geringer zwei
Messwertreihen korrelieren
Die Höhe der Korrelation der betrachteten Messwertreihen ist
mitentscheidend für die Stärke des Regressionseffekts. Eine
hohe Korrelation ±
beispielsweise eines Merkmals mit sich selbst
über die Zeit hinweg ± impliziert, dass sich die relative Position
einer Person in einer Stichprobe vergleichsweise wenig verän−
dert. Somit verändert sich der Mittelwert einer Extremgruppe
umso weniger zum Gesamtmittelwert hin, je stabiler das Merk
mal über die Zeit ist. Da die Messwerte von t1 und t2 mit 0,75
hoch korreliert sind, verlagert sich der Mittelwert in der Gruppe
der Patienten mit geringer Lebensqualität vergleichsweise
schwach (von 4 auf 5; s. Tab.1). Die Werte von t1 und t3 sind je−
doch nur noch zu 0,48 korreliert, und folglich ist eine deutlich
stärkere Mittelwertveränderung von 4 auf 7,43 zu verzeichnen.
Insgesamt gilt: Je mehr die Korrelation gegen Null geht, desto
stärker fällt die Regression zur Mitte aus. Der stärkstmögliche
Regressionseffekt wäre bei einer Nullkorrelation festzustellen.
Für das einleitende Beispiel zum epidemiologischen AU−Trend
folgt hieraus, dass die ¹Normalisierung“ der Arbeitsunfähigkeit
von Rehabilitanden umso stärker ausfällt, je weniger stabil die
Arbeitsunfähigkeit über die Zeit ist. Zudem muss bei Messwie−
derholungsdesigns beachtet werden, dass eine wachsende Dis−
tanz des Intervalls zwischen zwei Messzeitpunkten im Allgemei−
nen eine Abnahme der Korrelation zur Folge hat. Würden dann
beispielsweise in zw
ei Studien, in denen die AU−Zeiten die ab−
hängige Variable darstellen, unterschiedliche Katamneseinter
valle gewählt (z. B. 3 vs. 12 Monate nach Reha−Ende), hätte die
Regression zur Mitte beim Vergleich der Behandlungseffektivitä−
ten zwischen den Studien einen verfälschenden Einfluss: Da die
Messwerte nach 12 Monaten geringer mit denjenigen bei Entlas−
sung korreliert sind, würde der Regressionseffekt zu einer stär
keren Überschätzung der Behandlungseffektivität in dieser Stu−
die führen.
Da sich das Ausmaß der Regression zur Mitte umgekehrt propor
tional
zum Ausmaß des Zusammenhangs zwischen zwei Mess−
wertreihen verhält (vgl. später Formel 1), kann der Regressions−
effekt auch als Reformulierung einer nicht perfekten Korrelation
aufgefasst werden [3]. Im Anschluss daran wird zuweilen erläu−
tert, dass für diese nicht perfekte Korrelation die mangelnde Re−
liabilität, also die situations− und messzeitpunktspezifische
Messfehlerbehaftetheit des Erhebungsinstruments verantwort−
lich ist. Diese Aussage ist aber nur teilweise richtig. Sicherlich
ist die Messfehlerbehaftetheit ein wichtiger Faktor, der sich kor
relationsmindernd auswirkt. Aber es ist nicht der einzige, denn
die Korrelation verringert sich auch ± und zumeist in viel stärke−
rem Maße ± durch differenzielle wahre Veränderungen. Dem−
nach tritt der Regressionseffekt auch bei perfekt reliablen Mes−
sungen auf, we
nn der Merkmalszusammenhang nicht gleich 1
ist. Für die Regression zur Mitte sind also nicht nur Messfehler
verantwortlich, sondern alle Faktoren, die eine perfekte Korrela−
tion zwischen den Messwertreihen verhindern.
Regression zur Mitte führt nicht zu einer Reduktion
der Variabilität
Manchmal wird mit dem Regressionseffekt die falsche Vorstel−
lung verbunden, dass sich in einer Stichprobe, in der Regression
zur Mitte auftritt, die Personen über mehrere Messzeitpunkte
einander angleichen, weil sie alle ¹mittlerer“ werden. Aus den
bisherigen Ausführungen geht hervor, dass dies nicht zutrifft.
Bei der Erläut
erung des Datenbeispiels wurde bereits darauf hin−
gewiesen, dass nicht nur in der mittleren Gruppe 2, sondern auch
in den Extremgruppen 1 und 3, in denen Regression zur Mitte
beobachtet wird, die Streuung der Messwerte um ihren jeweili−
gen subgruppenspezifischen Mittelwert über die drei Messzeit−
punkte hinweg zunimmt (s. letzte Spalte in Tab.1). Gerade die Er−
höhung der ursprünglich minimalen Streuung ist es ja, die in den
Extremgruppen zu einer relativen Annäherung der subgruppen−
spezifischen Mittelwerte an den Gesamtmittelwert M
gesamt
und
damit zum Regressionseffekt führt. Diese Normalisierung in den
Extremgruppen wird dadurch kompensiert, dass insbesondere in
der Gruppe 2 zu t2 und t3 tendenziell extremere Werte auftreten
±
die Erhöhung der Variabilität hier jedoch nicht mit einer Ver
änderung in eine spezifische Richtung verbunden ist. Die Homo−
genisierung der Gruppenmittelwerte (Regression zur Mitte) und
die Heterogenisierung der Messwerte innerhalb der drei Grup−
pen müssen also gemeinsam berücksichtigt werden, um die un−
veränderte Merkmalsstreuung über die drei Messzeitpunkte in
der Gesamtstichprobe (SD
gesamt
= 6,06) erklären zu können.
Zwingmann C, Wirtz M. Regression zur Mitte. Rehabilitation 2005; 44: 244 ±251
Methoden in der Rehabilitationsforschung
247
Page 4
Name der Zeitschrift 0/2001 30.7.2005 blackcyanmagentayellow
Entsprechendes gilt für das einleitende Beispiel zum epidemio−
logischen AU−Trend: Bei konstant bleibendem Krankenstand
weisen im Folgejahr Personen mit niedrigen Ausgangswerten
der Arbeitsunfähigkeit eine durchschnittliche Veränderung
nach oben auf (¹hin zur Mitte“), Personen mit hohen Ausgangs−
werten eine durchschnittliche Veränderung nach unten (¹hin zur
Mitte“) und Personen mit mittleren Ausgangswerten unsystema−
tische Veränderungen nach oben oder nach unten (¹weg von der
Mitte“). Weil bei diesen ¹Umschichtungen“ die Unterschiedlich−
keit der AU−Zeiten innerhalb der drei Gruppen zunimmt, bleibt
die Streuung der AU−Zeiten insgesamt bestehen.
Regression zur Mitte ist kein zeitlich gerichteter Effekt
In unserem Datenbeispiel in Tab.1 wurden die Rehabilitanden in
drei gleich große
Gruppen unterteilt, und zwar auf der Basis der
Ausprägung ihrer gesundheitsbezogenen Lebensqualität zum
Zeitpunkt t1; anschließend wurden die subgruppenspezifischen
Veränderungen für die Zeitpunkte t2 und t3 betrachtet. Diese Be−
trachtungsrichtung entspricht dem üblichen zeitlichen Blick
winkel in prospektiven Studien.
Es muss jedoch betont werden, dass für die Regression zur Mitte
die zeitliche Richtung nicht
von Bedeutung ist: Ordnet man die
Patienten in Tab.1 auf der Basis der Ausprägung ihrer Lebensqua−
lität zu t3, zeigt sich ± wie in Tab. 2 veranschaulicht ± in den dann
entstehenden Extremgruppen ebenfalls Regression zur Mitte mit
grundsätzlich identischem Muster, nur eben in zeitlich entge−
gengesetzter Richtung. Durch diesen zeitlich umgekehrten Blick
winkel verändern sich die Korrelationen der Messwertreihen na−
türlich nicht und die Streuungen in den Subgruppen nehmen
entsprechend ¹rückwärts“ gerichtet zu, sodass in den auf der Ba−
sis der t3−Werte gebildeten Extremgruppen die t2− und t1−Mit−
telwerte sukzessive näher am Gesamtmittelwert M
gesamt
liegen.
Der Regressionseffekt tritt in Längsschnittstudien also in beiden
zeitlichen Richtungen auf: Patienten mit extremer Merkmals−
ausprägung in der Eingangsdiagnostik werden zu späteren
Messzeitpunkten aufgrund der Regression
zur Mitte im Durch−
schnitt relativ weniger extreme Werte aufweisen. Und Patienten,
bei denen zu einem späteren Messzeitpunkt z.B. die besten Wer
te der gesundheitsbezogenen Lebensqualität festgestellt werden,
besaßen bei Reha−Beginn aufgrund der Regression zur Mitte im
Durchschnitt vergleichsweise weniger extreme Ausgangswerte.
Entsprechendes gilt für das einleitende Beispiel zum epidemio−
logischen AU−Trend: Personen mit ursprünglich extremen AU−
Zeiten werden im Folgejahr aufgrund der Regression zur Mitte
im Durchschnitt relativ weniger extreme AU−Zeiten aufweisen.
Und Personen, bei denen im Folgejahr z.B. die höchsten AU−Zei−
ten festgestellt werden, hatten im Jahr davor aufgrund der
Regression zur Mitte im Durchschnitt vergleichsweise weniger
extreme AU−Zeiten.
Regression zur Mitte bezieht sich auf verbundene Messungen
Wir haben gesehen, dass die Regression
zur Mitte kein zeitlich
gerichteter Effekt ist. Noch allgemeiner gilt, dass für die Regres−
sion zur Mitte überhaupt keine zeitliche Komponente oder Be−
trachtung notwendig ist: Denn der Effekt tritt für alle nicht per
fekt korrelierenden Messwertreihen auch dann auf, wenn die
Einzelwerte der Messwertreihen nicht zeitlich, sondern hin−
sichtlich anderer inhaltlicher Aspekte einander zugeordnet sind.
Solche nichtzeitlich ¹verbundenen“ Messungen liegen vor, wenn
Personen aus verschiedenen Stichproben einander zugeordnet
sind (meist paarweise, z. B. ¹Mutter und Kind“ oder ¹Patient und
pflegender Angehöriger“) oder wenn an denselben Personen
mehrere Merkmale zum selben Messzeitpunkt erhoben werden
(z.B. ¹somatische und psychische Belastungen“). Das mehrmali−
ge Messen des gleichen Merkmals
an denselben Personen ± wie
in unserem Datenbeispiel in Tab.1 und im einleitenden Beispiel
zum epidemiologischen AU−Trend ± ist somit lediglich ein spe−
zieller, für rehabilitationswissenschaftliche Evaluationsstudien
allerdings besonders relevanter Fall verbundener Messungen.
Regression zur Mitte ließe sich somit auch an folgenden Beispie−
len demonstrieren: Frauen in Mutter−Kind−Einrichtungen, die im
Vergleich zur Gesamtgruppe der untersuchten Mütter extreme
Eingangsbelastungen aufweisen, haben Kinder, die im Vergleich
zu den anderen untersuchten Kindern im Durchschnitt nicht so
extrem belastet sind ± und umgekehrt. Die pflegenden Angehöri−
gen von Patienten mit extremen Belastungen sind relativ zur un−
tersuchten Gesamtgruppe der pflegenden Angehörigen im
Durchschnitt wenig
er belastet als die von ihnen gepflegten Pa−
tienten relativ zur Gesamtgruppe der untersuchten Patienten ±
und umgekehrt. Rehabilitanden, die im somatischen Bereich
extreme Belastungen haben, sind im psychischen Bereich ver
gleichsweise unauffälliger ausgeprägt ± und umgekehrt.
Die beste Vorhersage für individuelle Werte bei Regression
zur Mitte
Bisher haben wir den Regressionseffekt immer auf
den Mittel−
wert einer Gruppe bezogen charakterisiert. Der Effekt lässt sich
aber auch auf Ebene individueller Messwerte definieren, wenn
man die vorhergesagten Werte betrachtet, die im Rahmen einer
linearen Regressionsanalyse bestimmt werden können [26].
Würde man in der Regressionsanalyse beispielsweise die Werte
für t2 aufgrund der Werte zu t1 vorhersagen, so entsprächen die
regressionsanalytisch vorhergesagten Werte für den Zeitpunkt
t2 dem zu erwartenden Mittelwert in einer Gruppe von Patien−
ten, die alle exakt denselben t1−Wert besitzen. Es lässt sich zei−
gen, dass die relative Position der für t2 für einen Patienten vor
Tab. 2 Mittelwerte für die drei Messzeitpunkte der Patientengrup−
pen, die zu t3 geringe (1 bis 7; Gruppe 1), mittlere (8 bis 15;
Gruppe 2) bzw. hohe (16 bis 21; Gruppe 3) Messwerte auf−
weisen
Gruppe (t3) t3 t2 t1
1 4 6,57 8,57
2 11 9,14 9,29
3 18 17,29 15,14
Zwingmann C, Wirtz M. Regression zur Mitte. Rehabilitation 2005; 44: 244 ± 251
Methoden in der Rehabilitationsforschung
248
Page 5
Name der Zeitschrift 0/2001 30.7.2005 blackcyanmagentayellow
hergesagten Werte direkt durch die Korrelation festgelegt ist.
Wegen der gleichen Streuung des Merkmals zu t1 und t2 gilt
nämlich die Beziehung:
x
Ã
t2
± M
t2
= r (x
t1
± M
t1
) (Formel 1)
wobei x
Ã
t2
den durch die Regressionsgleichung vorhergesagten
Messwert zu t2 und r die Korrelation bezeichnet.
In unserem Datenbeispiel in Tab. 1 weicht Patient 1 mit einem
Messwert von 1 zu t1 genau 10 Einheiten vom Mittelwert 11
nach unten ab (|x
t1
± M
t1
| = ± 10). Man würde nach Formel 1 er
warten, dass dieser Patient zu t2 nur noch |x
Ã
t2
± M
t2
| = 0,78 10 =
7,8 Einheiten unterhalb des Mittelwertes liegt. Und zu t3 beträgt
die erwartete Abweichung wegen der Korrelation von 0,48 nur
noch 4,8. In einer großen Gruppe von Patienten mit dem Mess−
wert von 1 zu t1 entsprächen die Werte 7,8 und 4,8 den zu erwar
tenden Gruppenmittelwerten.
An dieser Stelle muss betont werden, dass sich Regression zur
Mitte zwar auf der Ebene individueller Messwerte definieren
lässt, aber diese Definition immer eine bestimmte Stichprobe
von Messwerten voraussetzt [3,13]. Das bedeutet, dass sich die
auf der individuellen Ebene regressionsanalytisch vorhergesag−
ten Messwerte
ändern, wenn sich ± etwa durch den Ausschluss
bestimmter Personen oder durch die Neuzuordnung einer indivi−
duellen Person zu einer anderen Erhebungsgruppe ± die Refe−
renzstichprobe ändert. Für einen Patienten mit mittlerer Ausprä−
gung der gesundheitsbezogenen Lebensqualität z. B. würde man
erwarten, dass sich seine Lebensqualität erhöht, wenn er Mit−
glied einer Stichprobe von Rehabilitanden mit hoher Lebensqua−
lität ist. Hingegen würde eine Verringerung erwartet, wenn die
Referenzstichprobe von Patienten mit niedriger Lebensqualität
gebildet wird. Dies verdeutlicht, dass die Regression zur Mitte
nicht eine einem individuellen Prä−Wert innewohnende Kraft
darstellt, die festlegt, zu welchem Post−Wert er zu regredieren
hat. Vielmehr bestimmen die jeweiligen Stichprobenverhältnis−
se, welche relativen Veränderungen bei der Interpretation von
individuellen Veränderungen beachtet werden müssen.
Regression zur Mitte auch in den Messwerten?
Bisher haben wir festgestellt,
dass der Regressionseffekt ± bei
Messwertreihen, die in linearem Zusammenhang stehen und
nicht perfekt korrelieren ± immer auftritt, wenn man sich auf
die relative Lage der Extremgruppenmittelwerte zum Gesamt−
mittelwert bezieht. Die relative Lage der Extremgruppenmittel−
werte wird deutlich, wenn Merkmalsstreuungen und Mittelwer
te der verschiedenen Messwertreihen konstant sind. In unserem
Datenbeispiel in Tab.1 haben wir deshalb bewusst Streuungs−
und Mittelwertsgleichheit zwischen den drei Messwertreihen
hergestellt, und zwar in diesem Fall durch die besondere Restrik
tion, dass jeder Messwert (im Bereich 1±21) in jeder Messwert−
reihe genau einmal vorkommt. Diese spezielle Restriktion trifft
normalerweise natürlich nicht zu. Im Allgemeinen erreicht man
Streuungs− und Mittelwertgleichheit dadurch, dass man die
Messwertreihen standardisiert, d.h. linear so transformiert,
dass sie jeweils einen Mittelwert von 0 und eine Standardabwei−
chung von 1 aufweisen [26]. Die Feststellung, dass ± bei linearem
Zusammenhang und nicht perfekter Korrelation ± Regression zur
Mitte immer auftritt, wenn man sich auf die relative Lage
der
Extremgruppenmittelwerte bezieht, impliziert, dass sich der Re−
gressionseffekt bei standardisierten Merkmalen immer zeigt.
Bei nichtzeitlich verbundenen Messungen ± z. B. wenn an den−
selben Personen unterschiedlich skalierte Merkmale zum glei−
chen Messzeitpunkt erhoben werden ± ist eine Standardisierung
zumeist unumgänglich, da nur bei einer Vereinheitlichung der
unterschiedlichen Metriken sinnvolle Vergleiche durchgeführt
werden können. Dies ist vermutlich der Grund dafür, dass Re−
gression zur Mitte klassischerweise für standardisierte Werte
definiert wird [3, 5,17]. Bei zeitlich verbundenen Messungen ±
wenn also an denselben Personen
das gleiche Merkmal mehr
mals gemessen wird ± wird hingegen zu den verschiedenen
Messzeitpunkten in der Regel dasselbe Erhebungsinstrument
eingesetzt, sodass die Metrik nicht vereinheitlicht werden muss.
Im Gegenteil: Im Rahmen von Evaluationsstudien wäre eine im−
plizite Gleichsetzung der Mittelwerte durch messzeitpunktspe−
zifische Standardisierung sogar unangebracht, weil es ja gerade
darum geht, eine Mittelwertveränderung im Studienverlauf
nachzuweisen.
Bei Messwiederholungsdesigns werden die Zusammenhänge
zwischen den Messwertreihen also gewöhnlich auf der Grundla−
ge der ursprünglichen Messwerte analysiert.
Meistens zeigt sich
dann auch bei Betrachtung der absoluten Messwerte Regression
zur Mitte. Aufgrund von Mittelwertveränderungen oder Streu−
ungsunterschieden zwischen den Messwertreihen gibt es aber
Sonderfälle, in denen in den absoluten Messwerten keine Re−
gression zur Mitte zu beobachten ist [19]. Erst wenn man die re−
lative Lage der Messwerte betrachtet, wird die Regression zur
Mitte wieder unmittelbar erkennbar.
So kann u.U. auch bei Patienten mit hoher Ausprägung zum Prä−
Messzeitpunkt eine Verbesserung der absoluten Werte beobach−
tet werden, wenn insgesamt eine deutliche Verbesserung der ge−
sundheitsbezogenen Lebensqualität eintritt. Regression zur Mit−
te drückt sich dann darin aus, dass die Verbesserung der Patien−
ten mit sehr gut
en Ausgangswerten geringer ausfällt als bei den
übrigen Patienten: Die relative Verbesserung fällt also schwä−
cher aus, auch wenn sich die absoluten Werte in positiver Rich−
tung verändern.
Auch bei einer deutlichen Streuungserhöhung in der Gesamt−
stichprobe kann es sein, dass sich bei Betrachtung der absoluten
Messwerte keine Regression zur Mitte zeigt. Hierfür muss
gleichzeitig gelten, dass die relativen Positionen vom Prä− zum
Post−Messzeitpunkt eine hohe Stabilität aufweisen. Ein promi−
nentes Beispiel für diesen Sonderfall ist die Beobachtung: ¹Arme
werden ärmer,
Reiche werden reicher.“ Auch hier offenbart erst
die relative Betrachtung den Regressionseffekt: Die extrem Ar
men zum Prä−Messzeitpunkt sind zum Post−Messzeitpunkt im
Durchschnitt relativ weniger arm, und die extrem Reichen zum
Prä−Messzeitpunkt sind zum Post−Messzeitpunkt im Durch−
schnitt relativ weniger reich.
Abschließend sei noch auf Folgendes hingewiesen: Wir haben
mehrfach betont, dass sowohl bei standardisierten als auch bei
absoluten Werten ein linearer Zusammenhang zwischen den
Zwingmann C, Wirtz M. Regression zur Mitte. Rehabilitation 2005; 44: 244 ±251
Methoden in der Rehabilitationsforschung
249
Page 6
Name der Zeitschrift 0/2001 30.7.2005 blackcyanmagentayellow
Messwertreihen vorliegen muss, damit Regression zur Mitte wie
beschrieben auftritt. Ein Zusammenhang zwischen zwei Mess−
wertreihen ist linear, wenn er grafisch adäquat durch eine Gera−
de wiedergegeben wird. Ist der Zusammenhang zwischen zwei
Messwertreihen hingegen nicht linear, wird er also grafisch bes−
ser durch eine Kurve beschrieben, können ± sowohl bei standar−
disierten als auch bei absoluten Werten ± Situationen auftreten,
in denen es in den Extremgruppen zu durchschnittlichen Bewe−
gungen ¹weg vom Mittelwert“ kommt [13,16]. Zuweilen findet
sich in der Literatur zusätzlich der irreführende Hinweis, dass
Regression zur Mitte normalverteilte Werte voraussetzt. Zwar
hängen biv
ariat normalverteilte Variablen stets linear zusam−
men. Der Regressionseffekt tritt aber auch auf, wenn die Mess−
werte nicht normalverteilt sind. Die Daten in Tab.1, für die der
Regressionseffekt auftritt, sind beispielsweise nicht normal−,
sondern gleichverteilt. Zu beachten ist allerdings, dass im Falle
nicht symmetrischer Verteilungen die Werte nicht zum arithme−
tischen Mittelwert regredieren müssen, sondern beispielsweise
im Fall unimodaler Verteilungen eine Regression zum Modal−
wert auftreten kann [6,7].
Kontrolle der Regression zur Mitte bei Messwiederholungen
Regression zur Mitte stellt
bei jedem Eingruppen−Prä−Post−De−
sign eine bedenkenswerte Alternativerklärung dar und ist einer
der Gründe für die unzureichende interne Validität dieses Unter
suchungsplans [4]. Die im Eingruppen−Prä−Post−Design nach ei−
ner Intervention beobachteten Veränderungen können nicht
kausal interpretiert, d.h. nicht allein auf die Intervention zurück
geführt werden, sondern auch durch konfundierende Ursachen
zu Stande kommen; zu nennen sind der natürliche Krankheits−
verlauf, Testeffekte und reaktive Effekte, andere zwischenzeitli−
che Einflüsse und eben die Regression zur Mitte. Dabei sind hin−
sichtlich des Regressionseffekts zwei Betrachtungsebenen zu
unterscheiden:
Ein verfälschender Einfluss der Regression zur Mitte ergibt sich
stets, wenn man nicht die gesamte Stichprobe analysiert, son−
dern ± wie in unserem Datenbeispiel in Tab.1 ± auf der Basis der
Prä−Werte (oder damit hoch korrelierender Variablen) extreme
Substichproben bildet und separat auswertet (für ein Beispiel
aus der rehabilitationswissenschaftlichen Forschung s. [27]). Ein
solches Vorgehen ist auf jeden Fall zu vermeiden.
Aber auch wenn man eine solche Extremgruppenauswertung
unterlässt, spielt der Regressionseffekt im Eingruppen−Prä−Post−
Design eine Rolle: Häufig stellt die vorliegende Stichprobe be−
reits als Ganzes ± im Vergleich zur zugrunde liegenden Popula−
tion ± eine mehr oder weniger extreme Gruppe dar.
Das ist im−
mer dann der Fall, wenn die Stichprobe nicht zufällig aus der
Population gezogen wurde. Eine nicht zufällige Stichprobenzie−
hung bedeutet nämlich zwangsläufig, dass bei der Zusammen−
stellung der Stichprobe eine explizite oder implizite Selektion
stattgefunden hat. Dies führt immer zu einem mehr oder weni−
ger großen Abstand zwischen Stichproben− und Populationsmit−
telwert und damit ± in Relation zur Population ± zu extremen
Prä−Werten sowie einem Regressionseffekt in der Gesamtstich−
probe. Um den Regressionseffekt gering zu halten, muss die Un−
tersuchungsstichprobe also zufällig aus einer zuvor sorgfältig
definierten Population gezogen werden. Nur dann ist die Wahr
scheinlichkeit hoch, dass Stichproben− und Populationsmittel−
wert nahe beieinander liegen.
In den meisten untersuchungs−
praktischen Fällen liegt allerdings keine Zufallsstichprobe vor.
Ein Beispiel: Wenn es darum geht, im Rahmen eines Eingruppen−
Prä−Post−Designs die Wirksamkeit eines neuartigen, für definier
te Rehabilitanden eines bestimmten Indikationsbereichs (¹Popu−
lation“) konzipierten Patientenschulungsprogramms zu unter
suchen, kann durch eine nicht zufällige Stichprobenziehung
eine hinsichtlich der gesundheitsbezogenen Lebensqualität be−
sonders belastete Untersuchungsstichprobe entstehen. Bewusst
oder unbewusst werden möglicherweise gerade belastete und
deshalb mutmaßlich besonders ¹geeignete“ Patienten für diese
neue Interv
ention vorgesehen oder schon im Vorhinein der Un−
tersuchungsklinik zugewiesen. Möglicherweise tragen auch
Selbstselektionsmechanismen zu einer belasteten Untersu−
chungsstichprobe bei, weil Rehabilitanden mit einer vergleichs−
weise hohen Lebensqualität seltener zu einer Teilnahme zu mo−
tivieren sind. Als Konsequenz stellt die Untersuchungsstichprobe
kein zufälliges Abbild der zugrunde liegenden Population dar,
und wir würden erwarten, dass sich die Untersuchungsstichpro−
be bereits wegen der Regression zur Mitte im Durchschnitt ver
bessert.
Lässt sich bei einer
nicht zufälligen Stichprobenziehung die Re−
gression zur Mitte im Eingruppen−Prä−Post−Design durch statis−
tische Korrekturen abschätzen und damit kontrollieren? Tat−
sächlich werden in der Literatur eine Vielzahl von Korrekturfor
meln für diesen Fall vorgeschlagen. Einige beruhen auf der Mo−
mentenmethode (z.B. [15]), andere auf anspruchsvolleren Maxi−
mum− Likelihood−Schätzungen (z.B. [21]). Einige Autoren versu−
chen, den Regressionseffekt auf latenter Ebene zu modellieren
(z.B. [18]). Um diese Korrekturvorschläge valide anwenden zu
können, müssen allerdings spezifische Kenntnisse über die Ver
teilungsparameter in der Population sowie über die Charakteris−
tika der Stichprobenziehung und des Behandlungseffekts vor
handen sein. Dies ist in der F
orschungspraxis jedoch nur selten
der Fall.
Der beste Weg zur Kontrolle der Regression zur Mitte ist deshalb
die randomisierte Zuweisung der Rehabilitanden zu einer Fall−
gruppe (z.B. Rehabilitanden mit Patientenschulung) und einer
Kontrollgruppe (z. B. Rehabilitanden ohne Patientenschulung,
aber gleicher Therapiedichte). Ziel der Randomisierung ist es, in
den zu vergleichenden Gruppen eine möglichst hohe Struktur
gleichheit hinsichtlich bekannter und unbekannter Einflussgrö−
ßen herzustellen, um einen etwaigen Post−Unterschied zwischen
den Gruppen kausal auf die untersuchte Intervention (z.B. die
Patientenschulung) zurückführen zu können. Wenn sich
Fall−
und Kontrollgruppe nur in der durchgeführten Maßnahme un−
terscheiden, kann der Unterschied zwischen den Post−Mittelwer
ten der beiden Gruppen also komplett der Intervention zuge−
schrieben werden [24]. Das Prinzip der Randomisierung ist somit
auch der beste Weg, um einen verfälschenden Einfluss der Re−
gression zur Mitte zu vermeiden. Der Regressionseffekt wird
kontrolliert, weil er sich in Fall− und Kontrollgruppe in der glei−
chen Weise auswirkt.
Zwingmann C, Wirtz M. Regression zur Mitte. Rehabilitation 2005; 44: 244 ± 251
Methoden in der Rehabilitationsforschung
250
Page 7
Name der Zeitschrift 0/2001 30.7.2005 blackcyanmagentayellow
Ist eine Randomisierung nicht möglich, kann ersatzweise ver
sucht werden, eine hinsichtlich der Ausgangswerte parallelisier
te Kontrollgruppe zu bilden (¹Matching“). Wenn aus derselben
zugrunde liegenden Population für jeden Teilnehmer der Fall−
gruppe ein hinsichtlich des Prä−Wertes identischer Partner für
die parallelisierte Kontrollgruppe gefunden wird, stellt das
Matching eine geeignete Strategie dar, um die Regression zur
Mitte als Alternativerklärung für die aufgetretenen Veränderun−
gen auszuschließen. Allerdings gelingt die Parallelisierung in der
Forschungspraxis häufig nur unvollständig. Eine valide Kontrolle
des Regressionseffekts ist dann infrage gestellt [3,9].
Liegt lediglich eine ¹natürliche“ (nicht vom Forscher gebildete)
Vergleichsgruppe vor, wird die Regression zur Mitte häufig
kova−
rianzanalytisch zu kontrollieren versucht, indem die unter
schiedlichen Ausgangswerte nachträglich statistisch herausge−
rechnet werden. Dieses Vorgehen vernachlässigt allerdings die
Frage, auf welche Weise die beiden Gruppen zu Stande gekom−
men sind. Fall− und natürliche Vergleichsgruppe entstammen
häufig unterschiedlichen Populationen, sodass die gruppenspe−
zifischen Ausgangswerte zu unterschiedlichen Mittelwerten re−
gredieren. Die Kovarianzanalyse ermöglicht deshalb bei einer
natürlichen Vergleichsgruppe nur in Ausnahmefällen eine adä−
quate Kontrolle; vielmehr wird der Regressionseffekt gewöhn−
lich unterschätzt [3].
Fazit
Die Regr
ession zur Mitte ist ein wichtiger zu berücksichtigender
Effekt, wenn es um Versuchsplanung und Ergebnisinterpretation
insbesondere im Rahmen von Längsschnittuntersuchungen geht.
Wenn die Untersuchungsstichprobe in einem unkontrollierten
Design eine durch explizite oder implizite Selektion entstandene
Extremgruppe darstellt, können die nachfolgenden Veränderun−
gen in der Stichprobe auch durch diese Selektion zu Stande ge−
kommen sein. Es besteht somit die Gefahr, dass der Regressions−
effekt mögliche Behandlungseffekte verfälscht. Die ¹Regres−
sionsfalle“ ist für viele Fehlinterpretationen in der medizini−
schen und sozialwissenschaftlichen Forschung verantwortlich
[1,2,14] und spiegelt sich auch in Fehlbeurteilungen im Alltags−
leben wider [8,12,23]. Angesichts dieser Häufigkeit warnen
Campbell u. Kenny ([3], S. ix) eindringlich davor, den Regres−
sionseffekt zu negieren, indem sie ± vielleicht etwas zu stark,
aber prägnant ± konstatieren: ¹Regression toward the mean is
as inevitable as death and taxes.“
Literatur
1
Andersen B. Methodological errors in medical research. Oxford: Black
well, 1990
2
Bland JM, Altman DG. Statistics notes: Some examples of regression
towards the mean. British Medical Journal 1994;
309: 780 ±782
3
Campbell DT, Kenny DA. A primer on regression artifacts. New York:
Guilford, 1999
4
Cook TD, Campbell DT. Quasi−experimentation ± design and analysis
issues for field settings. Chicago, IL: Rand McNally, 1979
5
Cronbach LJ, Furby L. How we should measure ¹change“ ± or should
we? Psychological Bulletin 1970; 74: 68± 80
6
Das P, Mulder PGH. Regression to the mode. Statistica Neerlandica
1983; 37: 15± 20
7
Davis CE. Regression to the mean. In: Johnson NL, Kotz S (eds): Ency−
clopedia of statistical sciences, Vol. 8. New York: Wiley, 1
986: 706 ±
708
8
Fiedler K. Die Regressionsfalle. Ursache vieler Denkfehler und Fehl−
beurteilungen. Ruperto Carola, Forschungsmagazin der Universität
Heidelberg 2000; (2): 16 ±22 ± verfügbar im Internet unter: www.uni−
heidelberg.de/presse/ruca/ruca2_2000/falle.html (aufgerufen 5.4.
2005)
9
Furby L. Interpreting regression toward the mean in developmental
research. Developmental Psychology 1973; 8: 172±179
10
Galton F. Regression toward mediocrity in hereditary stature. Journal
of the Anthropological Institute 1886; 15: 246 ±263
11
Gerdes N. Bewirken Rehamaßnahmen eine Abnahme der Arbeitsunfä−
higkeit? Eine Fall−Kontroll−Studie. Stuttgart: Thieme, 1993
12
Gibbons RD, Hedeker D, Davis JM. Regression toward the mean: More
on the price of beer and the salaries of priests. Psychoneuroendocri−
nology 1987; 12: 185± 192
13
Healy MJR, Goldstein H. Regression to the mean. Annals of Human
Biology 1978; 5: 277± 280
14
Ingelfinger JA, Mosteller F, Thibodeau L, Ware JH. Biostatistics in clini−
cal medicine. 3. Aufl. New York: McGraw−Hill, 1994
15
James KE. Regression toward the mean in uncontrolled clinical stu−
dies. Biometrics 1973; 29: 121± 130
16
Nachtigall C, Suhl U. Der Regressionseffekt. Mythos und Wirklichkeit
(methodenreport 4[2]). Jena: Friedrich−Schiller−Universität, Institut
für Psychologie, 20
02 ± verfügbar im Internet unter: www2.uni−jena.
de/svw/metheval/materialien/reports/report_2002_02.pdf (aufgeru−
fen 5.4.2005)
17
Nesselroade J, Stigler S, Baltes P. Regression toward the mean and the
study of change. Psychological Bulletin 1980; 88: 622 ±637
18
Raykov T. Studying true change patterns via structural equation
modeling. In: Steyer R, Wender KF, Widaman KF (eds): Psychometric
methodology. Proceedings of the 7
th
European Meeting of the Psycho−
metric Society in Trier. Stuttgart: Fischer, 1993: 430 ±434
19
Rogosa D. Myths about longitudinal research. In: Schaie KW, Campbell
RT, Rawlings SC (eds): Methodological issues in aging research. New
York: Springer, 1988: 171± 209
20
Rothermund K. Analyse längsschnittlicher Veränderungen in Struk
turgleichungsmodellen. Trierer Psychologische Berichte 2003; 30 (1)
± verfügbar im
Internet unter: www.psychologie.uni−trier.de/tripsybe
richte/2003/2003_30_1.pdf (aufgerufen 5.4.2005)
21
Senn SJ, Brown RA. Maximum likelihood estimation of treatment ef−
fects for samples subject to regression to the mean. Communications
in Statis
tics, Theory and Methods 1989; 18: 3389 ±3406
22
Stallmann M. Statistisch−methodische Anmerkungen zum epidemio−
logischen Arbeitsunfähigkeitstrend. Gesundheitswesen 1996; 58:
303± 313
23
Taylor J, Cuave KL. The sophomore slump among professional baseball
players: Real or imagined? International Journal of Sport Psychology
1994; 25:
230± 239
24
Vickers AJ, Altman DG. Analysing controlled trials with baseline and
follow up measurement. British Medical Journal 2001; 323: 1123±
1
124
25
Wagner H. Fehlerquellen bei Kurerfolgsbeurteilungen mittels Arbeits−
ausfallzeiten wegen Krankheit. Zeitschrift für Physiotherapie 1977;
29: 313± 338
26
Wirtz M, Nachtigall C. Deskriptive Statistik. Statistische Methoden für
Psychologen, Teil 1. 3. Aufl. Weinheim: Juventa, 2004
27
Zwingmann C. Zielorientierte Ergebnismessung (ZOE) mit dem IRES−
Patientenfragebogen: Eine kritische Zwischenbilanz. Rehabilitation
2003; 42: 226± 235
Zwingmann C, Wirtz M. Regression zur Mitte. Rehabilitation 2005; 44: 244 ±251
Methoden in der Rehabilitationsforschung
251
Page 8
  • Source
    • "Medical rehabilitation programmes for example, often are evaluated for their ability to restore the patient's ability to work. Unaware of RTM effects a patient's recovery typically is interpreted as a treatment effect [2]. Other examples include the evaluation of asthma disease management programmes [3] or cholesterol screening [4]. "
    [Show abstract] [Hide abstract] ABSTRACT: Regression to the mean (RTM) occurs in situations of repeated measurements when extreme values are followed by measurements in the same subjects that are closer to the mean of the basic population. In uncontrolled studies such changes are likely to be interpreted as a real treatment effect. Several statistical approaches have been developed to analyse such situations, including the algorithm of Mee and Chua which assumes a known population mean mu. We extend this approach to a situation where mu is unknown and suggest to vary it systematically over a range of reasonable values. Using differential calculus we provide formulas to estimate the range of mu where treatment effects are likely to occur when RTM is present. We successfully applied our method to three real world examples denoting situations when (a) no treatment effect can be confirmed regardless which mu is true, (b) when a treatment effect must be assumed independent from the true mu and (c) in the appraisal of results of uncontrolled studies. Our method can be used to separate the wheat from the chaff in situations, when one has to interpret the results of uncontrolled studies. In meta-analysis, health-technology reports or systematic reviews this approach may be helpful to clarify the evidence given from uncontrolled observational studies.
    Full-text · Article · Feb 2008 · BMC Medical Research Methodology
  • Source
    [Show abstract] [Hide abstract] ABSTRACT: NAND flash memory has become an indispensable component in mobile embedded systems because of its versatile features such as nonvolatility, solid-state reliability, low cost and high density. Even though NAND flash memory is gaining popularity as data storage, it can be also exploited as code memory for XIP (execute-in-place). In this paper, we present a new memory architecture in which incorporates NAND flash memory into an existing memory hierarchy for code execution. The usefulness of the proposed approach is demonstrated with real embedded workloads on a real prototyping board.
    Preview · Conference Paper · Nov 2003
  • Source
    [Show abstract] [Hide abstract] ABSTRACT: According to a recent review by Hüppe and Raspe effects of multidisciplinary treatment programs for patients with chronic low back pain in Germany seem to be rather weak and not to have persisting effects. Factors which could counteract possible benefits of treatment are, among others, psychic and job-related stresses and strains persisting after treatment. A multidisciplinary, in-patient treatment program for patients with chronic low back pain, therefore, was amended by multidisciplinary diagnosis and assignment and measures to support vocational solutions. To evaluate the effects of the multidisciplinary program in comparison to a control group with the usual care, a prospective longitudinal study was conducted. 307 patients were assigned to the multidisciplinary in-patient treatment program, whereas 176 patients with comparable complaints had the standard rehabilitation program. Besides the full sample, we analyzed a subgroup of patients with chronic low back pain. We found positive moderate and strong effects in the intervention group concerning function, pain, psychic strains as well as the number of sick days and return to work rates 10 months after discharge. Effects in the intervention group exceeded the effects achieved in the control group. Beside the full sample, we analyzed a subgroup of patients with chronic low back pain, who received an intense activating group treatment. Also in this subgroup we found moderate and strong effects of treatment superior to those in the control group for function, psychic strains and sick days. We attribute these persisting and superior effects in the treatment group to an efficient treatment of occupational and psychic problems as well as to more homogeneous treatment groups attained by a multidisciplinary diagnosis and team-based assignment. They also show the significance of in-patient-treatment which is effective, when -- based on multidisciplinary diagnosis -- differential treatment groups can be formed.
    Full-text · Article · May 2006 · Zeitschrift für Orthopädie
Show more