ArticlePDF Available

A questionnaire for the evaluation of psychotherapeutic change: Validation and manual [Der Fragebogen zur Evaluation von Psychotherapieverläufen (FEP-2): Validierung und Manual]

Authors:

Abstract and Figures

Zusammenfassung Qualitätssicherungsmaßnahmen und das kontinuierliche Monitoring von Verän-derungen bei psychotherapeutischen wie psychiatrischen Interventionen werden immer üblicher. Zur kontinuierlichen Messung des therapeutischen Fortschrittes sind Messinstrumente nötig, die verschiedene Vorbedingungen erfüllen. Da sie häufig erhoben werden, sollten sie kurz und kostengünstig sein. Trotzdem sollten sie aber auch ein breites Spektrum relevanter Aspekte erfassen und möglichst ver-änderungssensitiv sein. Der "Fragebogen zur Evaluation von Psychotherapiever-läufen" (FEP-2) ist ein solcher Bogen: er misst 4 Dimensionen therapeutischer Outcomes (Wohlbefinden, Symptombelastung, Inkongruenz und interpersonelle Probleme) mit 40 Items und ist außerdem unter einer "creative commons"-Lizenz verfügbar. In dieser Arbeit werden die Ergebnisse von Validierungsstudien vorge-stellt sowie eine Dokumentation zur Verfügung gestellt, die die Verwendung des Fragebogens ermöglicht.
No caption available
… 
Content may be subject to copyright.
Lutz, W. & Böhnke, J.R. (2008). Der „Fragebogen zur Evaluation von Psychotherapiever-
läufen“ (FEP-2): Validierungen und Manual. Trierer Psychologische Berichte, 35, Heft 3.
___________________________________________________________________________
Der „Fragebogen zur Evaluation von
Psychotherapieverläufen“ (FEP-2):
Validierungen und Manual
Wolfgang Lutz & Jan R. Böhnke
Zusammenfassung
Qualitätssicherungsmaßnahmen und das kontinuierliche Monitoring von Verän-
derungen bei psychotherapeutischen wie psychiatrischen Interventionen werden
immer üblicher. Zur kontinuierlichen Messung des therapeutischen Fortschrittes
sind Messinstrumente nötig, die verschiedene Vorbedingungen erfüllen. Da sie
häufig erhoben werden, sollten sie kurz und kostengünstig sein. Trotzdem sollten
sie aber auch ein breites Spektrum relevanter Aspekte erfassen und möglichst ver-
änderungssensitiv sein. Der „Fragebogen zur Evaluation von Psychotherapiever-
läufen“ (FEP-2) ist ein solcher Bogen: er misst 4 Dimensionen therapeutischer
Outcomes (Wohlbefinden, Symptombelastung, Inkongruenz und interpersonelle
Probleme) mit 40 Items und ist außerdem unter einer „creative commons“-Lizenz
verfügbar. In dieser Arbeit werden die Ergebnisse von Validierungsstudien vorge-
stellt sowie eine Dokumentation zur Verfügung gestellt, die die Verwendung des
Fragebogens ermöglicht.
Schlüsselwörter: Veränderungsmessung, Qualitätssicherung, Fragebogenentwick-
lung, Therapieverlaufsforschung
The „Questionnaire for the Evaluation of Treatment Progress” (FEP-2):
Validation and user guide
Abstract
Quality assurance and the continuous monitoring of change and progress in
psychotherapeutic and psychiatric interventions are becoming common practice.
To be able to assess change in practice, special instruments are needed. Because
of their frequent use, they should be short and affordable. However, they should
cover a broad scope of relevant aspects and also be sensitive to change. The
“Questionnaire for the Evaluation of Treatment Progress” (FEP-2) is such an in-
strument: it measures 4 dimensions of therapeutic outcome (well-being, symptom-
distress, incongruence and interpersonal problems) with 40 items and is distri-
buted under a “creative commons” licence. This article presents results from vali-
dation studies as well as a user guide for the questionnaire.
Keywords: assessment of change, quality assurance, questionnaire development,
progress and outcome in psychotherapy
2
Möglichkeiten zur Etablierung funktionierender Wissenschaftler-Praktiker-Netzwerke und
damit einem gelingenden beidseitigen Austausch stellen die laufende Evaluation psychothera-
peutischer und psychiatrischer Maßnahmen sowie Qualitätssicherungsmaß-nahmen dar. Die
so erhobenen Daten stellen auf der einen Seite die Grundlage für eine am individuellen Fort-
schritt orientierten Forschung dar und liefern auf der anderen Seite konkrete Informationen
über den Einzelfall, die eine weitere Auskunftsquelle für den Therapeuten im Therapieprozess
sind (Lambert, 2007; Lutz, 2002; Lutz, Lambert, et al., 2006; Lutz, 2007; Stulz & Lutz, 2007;
Stulz, Lutz, Leach, Lucock & Barkham, 2007). Messinstrumente, die eine theoriegeleitete,
ökonomische und veränderungssensitive Erhebung des Verlaufs wie der Ergebnisse der
Therapie ermöglichen, sind somit eine wichtige Voraussetzung für solche Zusammenarbeiten
(Barkham, et al., 2001; Borkovec, Echemendia, Ragusea & Ruiz, 2001; Howard, Moras, Brill,
Martinovich & Lutz, 1996).
Eine Reihe von Übersetzungen entsprechender Instrumente aus dem englischsprachigen
Raum sind mittlerweile auf Deutsch erhältlich. Lutz und Kollegen (Lutz, Tholen, Schürch &
Berking, 2006) zeigen beispielsweise basierend auf bestehenden Instrumenten, wie eine Ent-
wicklung von Kurzformen aus längeren Originalinstrumenten möglich ist. Diese könnten
dann für die nötigen wiederholten Messungen im Therapieverlauf verwendet werden Aller-
dings fehlen Instrumente, welche „public domain“ und damit für die klinisch-diagnostischen
Anwender einfach zugänglich sind und günstig eingesetzt werden können (Lutz, et al., 2009).
Ziel war es, eine multidimensionale, theoretisch fundierte und veränderungssensitive Erhe-
bung des Therapieverlaufs zu erreichen, die gleichzeitig ökonomisch eingesetzt werden kann
(Hill & Lambert, 2004). Mit dem „Fragebogen zur Evaluation von Psychotherapie-verläufen“
(FEP) werden drei zentrale klinisch-therapeutische Konzeptualisierungen therapeutischer Ver-
änderungen erhoben: das Phasenmodell therapeutischer Veränderung (Howard, Lueger,
Maling & Martinovich, 1993), das interpersonale Kreismodell (Horowitz, Rosenberg, Baer,
Ureno & Villasenor, 1988; Kiesler, 1996) und das Inkongruenzkonzept (Grawe, 1998). Durch
die so realisierte theoretische Breite hebt der FEP-2 sich von den bisher bestehenden Instru-
menten zur Verlaufs- und Ergebnismessung ab: die Konzeptualisierungen sind in verschiede-
nen Therapieschulen anschlussfähig, weshalb sich der Fragebogen für viele Therapeuten eig-
net.
Das Phasenmodell
Das Phasenmodell therapeutischer Veränderungen (Grissom, Lyons & Lutz, 2002; Howard, et
al., 1993; Howard, Lueger, Martinovich & Lutz, 1999; Stulz & Lutz, 2007) hat in Bezug auf
3
die Entwicklung von schulenübergreifenden Messinstrumenten im Bereich der Psycho-thera-
pie an Bedeutung gewonnen. Dieses Modell beschreibt eine Abfolge unterschiedlicher Ver-
änderungsphasen im Verlauf des psychotherapeutischen Genesungsprozesses. Dabei werden
drei aufeinanderfolgende Phasen unterschieden: Remoralisierungsphase (Wohlbefinden), Re-
mediationsphase (Symptomatik) und Rehabilitationsphase (Funktionsfähigkeit / interpersonale
Probleme). In der ersten Phase der Behandlung, der Remoralisierungsphase, verbessert sich
das subjektive Wohlbefinden des Patienten. Positive Erwartungen und Hoffnungen ermög-
lichen es dem Patienten, sich frühzeitig in der Therapie besser zu fühlen und die Demoralisie-
rung, welche ihn in die Therapie geführt hat, zu überwinden. Für manche Patienten kann dies
bereits ausreichen, um eigene Bewältigungsmöglichkeiten zu aktivieren. Sie sind dann in der
Lage, die Probleme, die sie in die Therapie brachten, zu lösen. Andere Patienten wechseln
danach in eine zweite Phase der Therapie oder beginnen die Therapie gleich in dieser Phase,
der Remediationsphase. In dieser Phase sind die Verbesserung der Symptomatik und/oder
eine Lösung der Lebensprobleme, wegen derer die Patientin oder der Patient die Therapie
ursprünglich aufgesucht hat, Ziel der Therapie. Ein Teil der Patienten wird danach noch in die
sogenannte Rehabilitationsphase übergehen. Als Ziel dieser Phase kann die Wiederherstellung
und/oder Verbesserung des allgemeinen Funktionsniveaus, das Verlernen dysfunktionaler
Muster, kognitiver Schemata und Verhaltensweisen, sowie das Erlernen neuer Rollen bzw.
eine Verbesserung interpersonaler Probleme gesehen werden (Grawe, 1998; 2004; Howard, et
al., 1996; Howard, et al., 1999).
Neben diesem Modell gibt es weitere klinisch-therapeutische Konzeptualisierungen, die im
Rahmen einer multidimensionalen Erhebung des Therapiefortschrittes einen wichtigen Bei-
trag liefern können. Dazu gehören Maße der interpersonalen Problemlage (Horowitz, et al.,
1988; Kiesler, 1996) sowie Maße zur Erhebung der Inkongruenz bzw. zur Realisierung der
wichtigsten motivationalen Ziele der Patienten (Grawe, 1998; 2004; Grosse Holtforth, Grawe
& Tamcan, 2004).
Interpersonale Probleme
Interpersonalen Verhaltensweisen stellen eine wichtige Ergebnisdimension von Psycho-
therapie dar und werden in zahlreichen Studien berücksichtigt (Lutz & Grawe, 2006). Hierbei
wird insbesondere das auf Leary (1957) zurückgehende „Circumplex-Modell interpersonalen
Verhaltens“ diskutiert. Dieses Kreismodell ordnet interpersonale Verhaltensweisen und Prob-
leme in einem zweidimensionalen semantischen Raum an, der durch zwei orthogonal zuein-
ander stehende Achsen definiert wird: eine horizontale Achse mit der Dimension „Affiliation
4
und den beiden Polen „Liebe / Zuneigung“ und „Hass / Ablehnung“ und eine ver-tikale Achse
mit der Dimension „Kontrolle“ und den beiden Polen „Dominanz / Autonomie“ und „Submis-
sion / Abhängigkeit“ (Fiedler, 2001). Interpersonale Probleme werden im Phasenmodell kon-
zeptionell auf der Veränderungsstufe „Rehabilitation“ gesehen (Howard, et al., 1996; Lutz &
Grawe, 2006).
Inkongruenz
Inkongruenz wird von Grawe (1998; 2004) als Ausmaß der Nichtbefriedigung motivationaler
Ziele beschrieben. Um eigene Grundbedürfnisse zu befriedigen bzw. sich vor Frustrationen zu
schützen, entwickeln Menschen unter dem Einfluss konkreter Lebensbedingungen spezifische
motivationale Ziele, die einen zentralen Einfluss auf ihr konkretes Verhalten ausüben. Eine
hohe Inkongruenz wird dabei als eine wesentliche Ursache für die Entstehung und Aufrecht-
erhaltung psychischer Störungen angesehen und umgekehrt können psychische Störungen
auch Ursachen einer wahrgenommenen Inkongruenz sein. Entsprechend kann die Verände-
rung der Inkongruenz ebenfalls als ein wichtiges therapeutisches Ziel und untersuchbare Er-
gebnisdimension von Psychotherapie betrachtet werden. Da sich das Konzept auf verschiede-
ne Bereiche bezieht, wird eine gewisse Überlappung mit den übrigen Dimensionen erwartet.
So kann Inkongruenz im Bezug auf das Wohlbefinden oder die Beschwerden, jedoch auch im
Zusammenhang mit interpersonalem Erleben und Verhalten auftreten.
Der Fragebogen zur Erhebung von Psychotherapieverläufen (FEP-2)
Ziel bei der Entwicklung war es, multidimensional, aber ökonomisch den Verlauf von Psy-
chotherapie abzubilden. Daher wurde angestrebt, die Anzahl der Items niedrig zu halten, ver-
gleichbar zu anderen Instrumenten (Barkham, et al., 2001; Grissom, et al., 2002; Lambert, et
al., 2004; Lutz, Tholen, et al., 2006). Die Basis der Itemgenerierung waren Vorstudien, in de-
nen Items aus veränderungsrelevanten Bereichen aus der Literatur abgeleitet wurden (Lutz,
Tholen, et al., 2006). Hauptkriterien waren die Veränderungssensitivität sowie die inhaltliche
Zuordnung zu relevanten Störungsbildern im ambulanten Setting.
Skalenkonstruktion
Die drei Phasen des Phasenmodells werden im FEP-2 durch 40 Fragen repräsentiert, die sich
wiederum zu vier theoretischen Skalen zusammenfassen lassen: Die Skala Wohlbefinden
(sieben Items) bildet die Veränderungen in der „Remoralisierungsphase“ ab. Gemäß Phasen-
5
modell handelt es sich hier um Fragen des subjektiven Wohlbefindens, bei denen Verbesse-
rungen relativ frühzeitig im Therapieverlauf erwartet werden.
Veränderungen in der „Remediationsphase“ werden von der Skala Beschwerden erfasst, wel-
che elf Items zu typischen Symptomen insbesondere der Angst- und affektiven Störungen ent-
hält. Diese beiden Störungsgruppen haben die höchste Prävalenz in der Bevölkerung und ent-
sprechend auch in den Behandlungseinrichtungen, für welche der Fragebogen gedacht ist
(Wittchen, Nelson & Lachner, 1998; Wittchen, Lieb, Wunderlich & Schuster, 1999). Aus die-
sem Grund wurden die Fragen auf die entsprechenden Symptome beschränkt, um diese häufi-
gen Beschwerden gut abbilden zu können. Für die beiden Symptomgruppen können optional
zwei Subskalen (Ängstlichkeit und Depressivität) berechnet werden.
Für Patienten, welche die „Rehabilitationsphase“ erreichen, werden zu einem späteren Zeit-
punkt im Therapieverlauf Veränderungen auf der Skala Interpersonale Beziehung (zwölf
Items) erwartet. Ziel dieser Skala ist es, interpersonale Schwierigkeiten gemäß dem Kreis-
bzw. Circumplexmodell zu erfassen (Horowitz, et al., 1988; Kiesler, 1996). Die Items können
zu den Dimensionen „introvertiert / scheu“, „ausnutzbar / nachgiebig“, „konkurrierend / unter-
stützend“ und „selbstunsicher / zurückhaltend“ zusammengefasst werden, welche sich entspre-
chend auf dem interpersonalen Kreismodell abbilden lassen (Lutz, 2002).
Durch die Skala Kongruenz (zehn Items) wird das Inkongruenzkonzept (Grawe, 1998) opera-
tionalisiert. Es wird erhoben, inwiefern wichtige motivationale Ziele vom Patienten umgesetzt
werden können. Dabei wird zwischen Annäherungs- und Vermeidungszielen (motivationale
Schemata) unterschieden, die angestrebt werden oder deren Eintreten verhindert werden soll.
Neben dem Skalenwert Kongruenz lassen sich deshalb auch die Dimensionen Annäherung
und Vermeidung separat berechnen. Die Items zur Kongruenz können nicht eindeutig einer
der drei Phasen im Phasenmodell zugeordnet werden. Vielmehr wird angenommen, dass sich
einzelne Aspekte der (In-)Kongruenz früh verändern (z.B Inkongruenz bezüglich Lebens-
qualität), andere erst im späteren Verlauf (z.B. Inkongruenz bezüglich interpersonaler Fakto-
ren).
Skalenauswertung
Die Skalen des FEP-2 werden durch die Addition der einzelnen Itemwerte und anschließende
Division durch die Anzahl bearbeiteter Items gebildet. Dabei empfehlen wir, dass ein Skalen-
wert nur dann gebildet werden sollte, wenn mindestens 80 % der Items beantwortet sind. Bei
den aus wenigen Items zusammengesetzten Skalen wird dadurch eine Mittelwertsbildung aus
einer Auswahl von Items verhindert, die nicht repräsentativ für das Belastungsbild des Patien-
6
ten ist. Vergleichbare Instrumente verwenden ähnliche Kriterien (Lutz & Howard, 1997). Ne-
ben den vier Subskalen kann nach den gleichen Regeln auch ein Gesamtwert psychischer
Beeinträchtigung gebildet werden. Für differenziertere Auswer-tungen können die Subskalen
Beschwerden, interpersonale Probleme und Kongruenz in die jeweiligen inhaltlichen Bereiche
aufgeteilt werden. Die Beantwortung der Items erfolgt auf einer fünfstufigen Likertskala (von
1 = nie bis 5 = sehr oft). Von den vierzig Items sind 13 Items positiv formuliert (1, 2, 5, 9, 14,
15, 19, 21, 22, 27, 29, 30 und 39) und müssen vor der Skalenberechnung umgepolt werden
(Umkodierung folgendermassen: 1 = 5; 2 = 4 ; 3 = 3; 4 = 2; 5 = 1). Höhere Werte bedeuten
dann jeweils eine stärkere Belastung.
Die psychische Gesamtbelastung wird als Summe der Antworten aller 40 Items geteilt durch
die Anzahl der ausgefüllten Items berechnet. Sofern weniger als 32 Items ausgefüllt wurden,
kann der Wert nicht mehr als verlässlich angesehen werden (80 %-Regel; s.o.).
Der Gesamtwert „Wohlbefinden“ berechnet sich aus der Summe aller Items der „Wohlbefin-
den“-Subskala (1, 5, 9, 14, 22, 30, 39) geteilt durch die Anzahl der ausgefüllten Items. Sofern
weniger als sechs Items ausgefüllt wurden, sollte der Wert nicht mehr berechnet werden.
Der Gesamtwert für „Beschwerden / Allgemeine Symptombelastung“ ergibt sich als Summe
der zu dieser Subskala gehörenden Items (4, 6, 7, 8, 10, 12, 23, 24, 31, 34, 38) geteilt durch
die Anzahl der ausgefüllten Items. Sofern weniger als neun Items ausgefüllt wurden, ist dieser
Wert als fehlend zu betrachten. Hier können auch die Subskalen Ängstlichkeit (Items 4, 8, 12
und 23; alle Items müssen ausgefüllt sein) und Depressivität (Items 7, 10, 24, 31, 34, 38; fünf
Items müssen ausgefüllt sein) berechnet werden
Bei der Skala „Beziehung“ lässt sich zunächst auch ein Gesamtwert „Interpersonale
Probleme“ bestimmen als Summe aller zugeordneten Items (11, 13, 16, 18, 20, 25, 26, 28, 32,
33, 36, 40) geteilt durch die Anzahl der ausgefüllten Items. Sofern weniger als zehn Items
ausgefüllt wurden, ist der Gesamtwert als fehlend zu betrachten. Gemäß des Kreismodells
lassen sich noch vier Subskalen bilden, bei denen jeweils alle Items ausgefüllt sein müssen,
sonst gilt dieser Subskalenwert als fehlend (80 %-Regel, s.o.). Die Skalenwerte werden je-
weils als Summe geteilt durch die Anzahl der beantworteten Items berechnet. Die erste Skala
ist „introvertiert / scheu“ (Items 28, 36, 40), die zweite Skala „ausnutzbar / nachgiebig“ (Items
13, 20, 26), die dritte Skala „konkurrierend / unterstützend“ (Items 11, 16, 33) und die vierte
Skala „selbstunsicher / zurückhaltend“ aus den Items 18, 25 und 32.
Als letzte Dimension bleibt die Skala „Kongruenz“. Bei ihr kann zunächst ein Gesamtwert als
Summe der Antworten auf alle zugeordneten Items (2, 3, 15, 17, 19, 21, 27, 29, 35, 37) geteilt
durch die Anzahl der ausgefüllten Items berechnet werden. Sofern weniger als acht Items
7
ausgefüllt wurden, ist der Gesamtwert als fehlend zu betrachten. Für die Dimension Kongru-
enz gibt es zwei Subskalen. Die erste fasst die „Annäherungsziele“ (Items 2, 15, 19, 21, 27,
29; alle müssen ausgefüllt sein) und die zweite die „Vermeidungsziele“ (Items 3, 17, 35, 37;
alle müssen ausgefüllt sein). Für beide Subskalen wird der Wert als Summe geteilt durch die
Zahl der Items berechnet.
Im Folgenden werden die Ergebnisse mehrerer Untersuchungen berichtet, die die Güte und
Struktur des Fragebogens untersuchten.
Psychometrische Kennwerte des „Fragebogens zur Evaluation von Psychotherapiever-
läufen“
Studie I (Lutz et al., 2009)
Diese Studie sollte die Umsetzung der dargelegten grundlegenden Prinzipien des Fragebogens
untersuchen. Neben der Validierung der einzelnen Konstrukte sollten cut offs für ambulante
vs. nicht-belastete Patienten und der reliable Veränderungsindex (reliable change index,
Jacobson & Truax, 1991)) berechnet werden. Dazu wurden die Daten einer nicht-klinischen,
einer studentischen und einer ambulanten Therapiepatienten-Stichprobe verwertet. Die Ergeb-
nisse sind im Detail bei (Lutz, et al., 2009) nachzulesen.
Nicht-klinische Stichprobe
Für die nicht-klinische Stichprobe lagen Daten von 274 Personen vor, davon 53.3 % Frauen.
Diese Stichprobe wurde im Rahmen von mehreren Diplomarbeiten am Institut für Psycholo-
gie der Universität Bern erhoben (Boixet, 2005; Jermann, 2006). Das Durchschnitts-alter der
geschichteten Stichprobe betrug 35.3 Jahre (SD = 12.9) bei einem Range von 15 bis 74 Jah-
ren. 54.4 % gaben an ledig zu sein, 40.1 % waren verheiratet. 40.9 % hatten einen Gymnasial-
abschluss, 38 % einen Sekundarschulabschluss, die restlichen hatten einen niedrigeren oder
einen anderen Abschluss. Bei den Berufsabschlüssen hatten je ein Drittel einen Universitäts-
abschluss (34.3 %) oder eine Lehre (30.3 %). 64.4 % hatten zum Zeitpunkt der Befragung
eine Vollzeitanstellung, 32.2 % arbeiteten Teilzeit.
Studentische Stichprobe
Die studentische Stichprobe bestand aus Psychologiestudierenden und wurde im Rahmen
einer obligatorischen Veranstaltung erhoben. Der Fragebogen wurde an alle Anwesenden ver-
teilt, ca. 1 % der Studierenden lehnte eine Teilnahme ab. 96 Personen haben einen ausge-
8
füllten Bogen abgegeben, davon 81.5 % Frauen. Das Durchschnittsalter betrug 25.3 Jahre (SD
= 5.3) bei einer Bandbreite von 20 bis 62 Jahren. Die meisten waren noch ledig (92.7 %) und
gaben als Beruf Student / Studentin an (91.7 %).
Ambulante Stichprobe
Die Daten der ambulanten Stichprobe (N = 184) wurden in der Poliklinischen Psychotherapie-
ambulanz der Universität Osnabrück erhoben. Der Fragebogen wird dort von allen Patienten
einmal pro Quartal ausgefüllt. Der Frauenanteil betrug 61.6 %. Das Durchschnittsalter lag in
dieser Stichprobe bei 37.4 Jahren (SD = 12.3, 17 bis 72 Jahre). 53.4 % hatten die Behandlung
aufgrund einer affektiven Störung aufgesucht, bei 23.3 % lag eine Angststörung vor (nach
ICD-10). Bei 10 % lag eine Diagnose für eine komorbide Störung vor.
Untersuchungsinstrumente zur Prüfung der externen Validität
Zur Prüfung der konvergenten Validität wurden vier Fragebogen hinzugezogen, die als valide
Messinstrumente für die intendierten Dimensionen gelten und bereits in zahlreichen Studien
zum Einsatz kamen. Das Beck Depressions-Inventar (BDI, Hautzinger, Bailer, Worall &
Keller, 1994) ist ein Selbstbeurteilungsinstrument zur Erfassung der Schwere depressiver
Symptomatik mit 21 Items. Es ist vielfältig in Psychotherapieergebnisstudien eingesetzt wor-
den. Die psychometrischen Kennwerte wurden anhand unterschiedlicher klinischer Stichpro-
ben ermittelt und zeigen hohe Werte bezüglich Reliabilität und Validität.
Der OQ-45 (Lambert, et al., 2004) misst den Therapiefortschritt der Patienten und kann zur
Verlaufs- und Ergebnismessung eingesetzt werden. Der Fragebogen hat insgesamt 45 Items
und deckt die Bereiche Symptombelastung (25 Items), Interpersonale Beziehungen (elf Items)
und soziale Rolle (neun Items) ab. Nebst den drei Skalen kann auch ein Gesamtwert der
allgemeinen psychischen Beeinträchtigung gebildet werden. Der OQ-45 ist veränderungs-
sensitiv und hat in der englischen Originalversion eine hohe Reliabilität (Cronbachs Alpha für
den Gesamtwert: .93) und Validität (Korrelationen mit Angst- und Depressionsskalen von .64
bis .88) (Lambert, et al., 2004). Verwendet wurde die deutsche Version (Lambert, Hannöver,
Nisslmüller, Richard & Kordy, 2002), die ähnliche Werte aufweist.
Das Treatment Evaluation and Management System TEaM (Grissom, et al., 2002) wird vor
allem im US-amerikanischen Raum neben dem OQ-45 (Lambert, et al., 2004) als Instrument
zur Evaluation von Psychotherapie herangezogen. Der TEaM-Fragebogen beinhaltet insge-
samt 58 Items und erfasst dabei die drei Dimensionen des Phasenmodells therapeu-tischer
Veränderungen (Howard, et al., 1993): subjektives Wohlbefinden (drei Items), Symptomatik
9
(29 Items) und Funktionsbeeinträchtigung (13 Items). Die einzelnen Skalen weisen in der
englischen Originalversion interne Konsistenzen (Cronbachs Alpha) von .82 (Wohlbefinden)
bis .90 (Symptome) und für den Gesamtwert von .88 auf (Grissom, et al., 2002). Diese kon-
nten auch in der deutschen Übersetzung erhoben an einer 197 Personen umfassenden studen-
tischen Stichprobe approximativ erhalten werden (zwischen .75 in der Skala Wohlbefinden
und .90 in der Skala Symptome, Gesamtwert = .91).
Für die Abgrenzung von somatischen Beschwerden (diskriminante Validität) wurde der Fra-
gebogen zum Gesundheitszustand SF12 (Bullinger & Kirchberger, 1998) erhoben. Er ist ein
Instrument zur subjektiven Selbsteinschätzung der Gesundheit. Es handelt sich dabei um eine
Kurzform des SF-36 mit den beiden Bereichen körperliche und psychische Gesundheit. Dabei
misst der SF-12 gemäß amerikanischen Studien (Bullinger & Kirchberger, 1998) dasselbe
Spektrum körperlicher und psychischer Gesundheit wie sie mit dem SF-36 erfasst wird. Die
deutsche Version wurde an verschiedenen Stichproben mit insgesamt über 4000 Fällen nor-
miert. Aufgrund der verhaltensnahen Formulierung der Items ist das Instrument eher als Maß
der subjektiven Gesundheit aus Patientensicht zu verstehen.
Ergebnisse
Der varianzanalytische Vergleich der Werte der drei Stichproben zeigte, dass sich die kli-
nische Stichprobe auf allen Skalen sowie dem Gesamtwert des FEP-2 signifikant von den bei-
den nicht-klinischen Stichproben unterscheidet und höhere Belastungswerte aufweist (kon-
trolliert für Alter und Geschlecht). Auf der Skala Wohlbefinden sowie beim Gesamtwert un-
terscheiden sich zusätzlich die Studierenden signifikant von der nicht-klinischen Stichprobe
aus der allgemeinen Bevölkerung. Die Reliabilität wurde durch die interne Konsistenz (Cron-
bachs Alpha) und die Test-Retest-Korrelation geprüft. Die internen Konsistenzen sind mit
Werten zwischen .74 und .94 durchwegs hoch (Lutz, et al., 2009).
Die Retest-Korrelation des FEP-2 wurde nur für die beiden nicht-klinischen Stichproben er-
mittelt. Für die zusammengefügte Stichprobe (N = 269) ergab sich über einen Zeitraum von
bis zu acht Wochen (mittlerer Abstand zwischen den Messungen = 3.1 Wochen, SD = 1.4) ein
Wert von rtt = .69 für den Gesamtwert psychische Beeinträchtigung. Für die Studierenden-
stichprobe allein wurde ein engeres Retest-Zeitintervall definiert. Für diese Teilstichprobe (N
= 59) ergibt sich für ein Intervall von einer Woche ein Wert von rtt = .77 für den Gesamtwert.
Um die Validität des „Fragebogens zur Evaluation von Psychotherapieverläufen“ (FEP-2) zu
prüfen, wurden die Subskalen sowie der Gesamtwert der nicht-klinischen Bevölkerungs-stich-
probe mit den Instrumenten (BDI, SF12, TEaM, OQ-45) korreliert. Die Korrelationen des
10
Gesamtwertes des FEP-2 liegen mit den Gesamtwerten für TEaM, SF12 Psyche und OQ-45
allesamt in einem akzeptablen Rahmen (zwischen r = .71 bei SF12 Psyche und r = 0.81 bei
OQ-45). Auch die FEP-2-Subskalen Wohlbefinden und Beschwerden korrelieren jeweils am
deutlichsten mit den korrespondierenden Prüfinstrumenten (r = .74 mit Symptome TEaM und
r = .77 Symptome OQ-45). Die durchweg niedrige Korrelation des FEP-2 und seiner Subska-
len mit dem SF12-Körper (r = .13 mit FEP-2-Beschwerden und Beziehung bis r = .22 mit
FEP-2-Wohlbefinden) zeigen, dass der FEP-2 nicht primär auf die körperliche, sondern ledig-
lich die psychische Symptomatik abzielt. Zusätzlich fällt auf, dass die FEP-2-Subskala Bezie-
hung die niedrigsten Korrelationen mit den Prüfskalen hat (.39 bis .61, ohne SF12 Körper)
und ihre höchsten Korrelate sind nicht TEaM Funktion, OQ-45 Interpersonal und Soziale
Rolle (Lutz, et al., 2009).
Dies zeigt, dass mit dem FEP-2 Informationen in verschiedenen Bereichen erhoben werden
können, wie dies mit den verschiedenen Dimensionen intendiert wurde. Der Gesamtwert, ge-
bildet aus den verschiedenen Bereichen, erlaubt zudem die Abbildung des allgemeinen psy-
chischen Wohlbefindens.
Veränderungssensitivität
Ein Instrument zur Verlaufsmessung muss sich als veränderungssensitiv erweisen. Dies wur-
de anhand von Effektstärken zwischen Vorher- und Zwischenerhebungsmessungen sowie
Vorher- und Abschlussmessungen geprüft (Mittelwertsdifferenzen geteilt durch die Streuung
zu Therapiebeginn). Zur Effektstärkenberechnung wurden Teilstichproben der klinischen
Stichprobe verwendet, für die bereits Zwischenerhebungen bzw. Abschlussmessungen vorla-
gen (Personen mit 10-20 Sitzungen bei der Zwischenmessung, N = 144; Personen mit 10-76
Sitzungen bei der Abschlussmessung, N = 45). Dabei zeigt sich, dass bei den Patienten zur
Zwischenerhebung in der Wohlbefindens-Skala (Effektstärke / ES = .47) und der Kongruenz-
Skala (ES = .44) bereits eine deutliche Verbesserung stattfindet und die Beschwerden sich
leicht verbessern (ES = .27), während die Skala Beziehung bezüglich dieser frühen Zwischen-
messung weitgehend unverändert bleibt (ES = .07). Dieses Muster ist mit den erwarteten Ver-
änderungen nach dem Phasenmodell therapeutischer Veränderung konsistent, wonach sich zu
Therapiebeginn zunächst das Wohlbefinden verbessert (Remoralisierung), die Symptomre-
duktion (Remediation) und die Verbesserung des Funktionsniveaus in relevanten Lebensbe-
reichen (Rehabilitation) sich dagegen erst in einer späteren Therapiephase abspielt (Howard,
et al., 1999). Die bereits früh gebesserten Bereiche haben auch bei den beendeten Therapien
die stärksten Veränderungen. Die Effektstärken nehmen insgesamt stark zu (Wohlbefinden,
11
ES = 1.66; Beschwerden, ES = 0.90; Kongruenz ES = 1.80) und der Bereich interpersonale
Beziehung kommt für beendete Therapien auf eine Effektstärke von 0.5. Dies erklärt sich da-
durch, dass ein Teil der Patienten mit abgeschlossener Therapie die Rehabilitationsphase im
Phasenmodell erreicht hat und sich entsprechend in relevanten Lebensbereichen verbessern
konnte. Werden die Effektstärken für die nicht-klinische Stich-probe berechnet, ergeben sich
für die einzelnen Skalen Werte zwischen .13 und .27. Diese Werte sind deutlich niedriger als
für die abgeschlossenen Therapien.
Faktorenstruktur
Vier theoretische Faktoren (Wohlbefinden, Beschwerden, Interpersonale Beziehung und In-
kongruenz) sind im Fragebogen angelegt. Zur Überprüfung der Faktorenstruktur wurde eine
Hauptkomponentenanalyse mit der zusammengefügten Gesamtstichprobe (N = 554) durchge-
führt. In der unrotierten Lösung ergab sich eine Hauptkomponente mit 42 % Varianzaufklä-
rung, was die Berechnung eines Gesamtwerts rechtfertigt. Da eine starke Komponente „allge-
meine Psychopathologie“ in der Regel die differenziertere theoretische Konzeption überlagert
(Halstead, Leach & Rust, 2007; Lutz, et al., 2009), kann nicht von einer vollständigen Unab-
hängigkeit der vier Bereiche des Fragebogens ausgegangen werden. In einer konfirmato-
rischen Faktorenanalyse wurde getestet, ob sich vier korrelierte Faktoren rechtfertigen lassen.
Dazu wurden die vier Konstrukte Wohlbefinden, Beschwerden, Interpersonale Probleme und
Inkongruenz als latente Variablen modelliert, die alle mit einander korreliert waren und je-
weils nur ihre Skalenitems als Indikatoren hatten (konfirmatorische Faktorenanalyse; z.B.
Loehlin, 2004). Die Ergebnisse der mit Mplus (Muthén & Muthén, 1998-2004) durchgeführ-
ten Analyse sind in Tabelle 1 zusammengefasst. Beide Modelle passen nach dem reinen Mo-
delltest nicht (1 Faktor: χ²(df = 702; N = 480) = 2639.41, p < 0.001; vier Faktoren: χ²(df = 696; N = 480) =
2083.41, p < 0.001), doch die in Tabelle 1 aufgeführten vergleichenden Fit-Indizes zeigen
eine deutliche Verbesserung der Modellpassung durch die Annahme der vier postulierten Fak-
toren.
Abbildung 1 verdeutlicht durch die Angabe der Korrelationen zwischen den vier latenten
Konstrukten, dass sie nur bedingt als einzelne Entitäten gesehen werden können. Insbesonde-
re die Inkongruenz korreliert stark mit den anderen drei Konstrukten.
Aus diesen Ergebnissen (und der in Lutz et al., 2009 berichteten explorativen Faktorenanaly-
se) schließen wir, dass die verlässlichste Aussage über den Zustand des Patienten durch den
Gesamtwert getroffen wird und die vier Subdimensionen brauchbare Zusatzinformationen
liefern können.
12
Tabelle 1
Fit-Indizes der Ein- und Vier-Faktoren-Lösung für den FEP-2
ein Faktor vier Faktoren
χ²/df 3.76 2.99
CFI 0.83 0.88
AIC // BIC 46776.90 // 47102.78 46232.90 // 46583.85
RMSEA [90 % Konfidenzintervall] 0.08 [0.07; 0.08] 0.06 [0.06; 0.07]
SRMR 0.06 0.05
Anmerkungen. Item 35 wurde ausgelassen, da es zu hohe Korrelationen mit verschiedenen
Faktoren aufwies. N = 480.
Abbildung 1. Korrelationen zwischen den latenten Faktoren in der konfirmatorischen Fakto-
renanalyse des FEP-2 (ohne Item 35; s. Anm. Tabelle 1).
Reliable und klinisch bedeutsame Veränderung
Für den Einsatz bei der Messung von Veränderungen ist es notwendig, dass das Instrument
ermitteln kann, ob und inwieweit sich der Patient zwischen Therapiebeginn und Sitzung t ver-
bessert, nicht verändert oder verschlechtert hat. Dazu kann entweder der absolute Therapie-
fortschritt in Relation zum Messfehler bzw. der Reliabilität des Instrumentes betrachtet wer-
den, oder aber die Verbesserung im Vergleich zur nicht-klinischen Stichprobe. Für ersteres
13
hat sich die Berechnung der klinisch bedeutsamen Veränderung in der Literatur durchgesetzt
(RC, reliable change oder reliable Veränderung, z.B. Jacobson & Truax, 1991; Wise, 2004).
Eine Veränderung gilt dann als reliabel, wenn die absolute Veränderung in Rohwerten größer
ist als der RC. Eine Beschwerdenzunahme wird als reliabel verschlechtert beurteilt, während
eine Beschwerdenabnahme im gleichen Umfang als reliable Verbesserung gilt. Die RCs rei-
chen von 0.72 (Gesamtwert) bis 1.20 (Wohlbefinden; vgl. auch Tabelle 2).
Für die klinisch relevante Veränderung sollte zusätzlich der Patientenrohwert wahrschein-
licher aus der nicht-klinischen Population stammen. Den cut-off Wert bildet dabei die Grenze
zwischen klinischer und Normpopulation. Werte unterhalb des cut-off gehören mit größerer
Wahrscheinlichkeit zur nicht-klinischen als zur klinischen Stichprobe (Jacobson & Truax,
1991). Hat der Rohwert eines Patienten den cut-off unterschritten, gilt er als nicht mehr kli-
nisch bedeutsam beeinträchtigt. Vorläufige Ergebnisse ohne die Erhebung einer repräsenta-
tiven Normstichprobe zeigen, dass bei der Gesamtskala ein Mittelwert von 2.45 als cut-off
zwischen auffälligen Werten (oberhalb dieses Wertes) und nicht-auffälligen herangezogen
werden kann (vgl. auch Tabelle 2).
Studie II (Schürch et al., in press)
Ein salientes Thema, das aus dieser ersten Untersuchung hervorgeht, ist die Frage der Dimen-
sionalität. In einer Nachfolgearbeit (Schürch, Lutz & Böhnke, in press) wurde an derselben
Stichprobe wie in der ersten Studie (Lutz, et al., 2009) untersucht, ob und wie sich problema-
tische Antwortmuster mit der Hilfe des Rasch-Modells identifizieren lassen.
Das dazu verwendete Rasch-Modell ist ein Item Response Modell, das annimmt, dass alle
Items eines Tests auf einer Dimension (hier oftmals als „Fähigkeit“ bezeichnet) messen und
sich lediglich in ihrer Schwierigkeit unterscheiden, nicht aber in ihrer Trennschärfe (Rost,
2004). In der Arbeit wird gezeigt, dass sich nahezu alle vierzig Items auf einer Dimension
anordnen lassen, die einen allgemeinen Belastungsfaktor misst. Lediglich fünf der Items
scheinen (auch) andere Merkmale der Patienten zu messen. Diese Items sind „hatte ich
Schlafprobleme“ (Item 6), „war ich selbstbeherrscht“ (Item 19), „gingen mir die Probleme an-
derer Menschen schnell zu nahe“ (Item 26), „war ich Teil einer erfüllten und intimen Bezie-
hung“ (Item 27) und „mischte ich mich zu sehr in die Angelegenheiten anderer ein“ (Item 33).
Dass sich diese fünf Items nicht auf der Dimension anordnen lassen, kann unterschiedliche
Gründe haben. Plausibel für vier dieser Items ist, dass sie nicht (nur) die Dimension „Allge-
meine Psychopathologie“ ansprechen. Schlafstörungen können auch andere Gründe als psy-
chopsychosoziale Belastung haben und die drei anderen Items könnten deutlicher durch die
Person-Umwelt-Interaktion geprägt sein als das für die anderen Items des Tests der Fall ist.
14
Tabelle 2
Psychometrische Kennwerte des FEP-2 aus der neuen Stichprobe und zum Vergleich
der Ergebnisse von Lutz et al. (2009).
Datengrundlage
Kennzahl Lutz et al. (2009) neues Datenset
α Wohlbefinden 0.92 0.87
α Beschwerden 0.92 0.92
α Beziehung 0.86 0.86
α Inkongruenz 0.86 0.83
α Gesamtwert 0.96 0.96
cut-off Wohlbefinden 2.90 2.93
cut-off Beschwerden 2.39 2.69
cut-off Beziehung 2.15 2.24
cut-off Inkongruenz 2.58 2.60
cut-off Gesamt 2.45 2.49
RC Wohlbefinden 1.20 1.15
RC Beschwerden 0.89 0.97
RC Beziehung 0.75 0.87
RCI Inkongruenz 0.92 0.94
RCI Gesamt 0.72 0.75
Anmerkungen. cut-off = (s1*M2+s2*M1)/(s1+s2); RC = 1.96*Sdiff; Sdiff=2
*2 SE ;
SE= )1(*1 tt
rs , SE = Standarderror, rtt = test-retest Korrelation, aus Lutz et al. (2009)
übernommen; s1 ist Standardabweichung der Bevölkerungsstichprobe, α = Cronbachs Alpha.
Studie III
Validierung des cut-offs für die Gesamtskala
Zur Validierung der oben dargestellten Kennwerte des FEP werden in verschiedenen Projek-
ten derzeit neue Daten erhoben. Durch die Zusammenarbeit mit der Poliklinischen Psycho-
therapieambulanz Osnabrück wurde eine neue ambulante Patientenstichprobe erhoben und in
einer Diplomarbeit (Jung, 2008) eine neue nicht-klinische Stichprobe erhoben.
Ambulante Stichprobe
Die verwendeten Daten von 129 Patient stammen alle von der Standardmessung des Status im
ersten Quartal der Therapie. Der Frauenanteil betrug 64.3 %. Das Durchschnittsalter lag bei
15
41.7 Jahren (SD = 12.2, 19 bis 76 Jahre). Von den Patienten suchten 37.2 % die Behandlung
aufgrund einer affektiven Störung auf, 17.8 % aufgrund einer Angststörung, 14.7 % aufgrund
einer schweren Belastung oder Anpassungsstörung. Die restlichen Patienten litten nach
ICD-10 an diversen anderen Störungen. 60.4 % wiesen mindestens eine weitere Diagnose auf.
Nicht-klinische Stichprobe
Die nicht-klinische Stichprobe (N = 120) ist eine Quota-Stichprobe, die im Westen der Bun-
desrepublik Deutschland erhoben wurde. Die zu erhebenden Quoten wurden aufgrund des
scientific-use Files des Mikrozensus1 bestimmt. Neben Geschlecht wurde nach Alter in drei
Gruppen (18 bis 30 Jahre, 31 bis 50 Jahre und 51 bis 65 Jahre) und höchster allgemeiner
Schulabschluß (Haupt-/ Volksschule, Realschule/ Polytechnische Oberschule, Fachhochschul-
reife und Abitur) erhoben. Diese Stichprobe hatte einen Frauenanteil von 50 % und 95 % der
Befragten waren Deutsche. Das mittlere Alter betrug 43.9 Jahre (SD = 13.6, 19 bis 87 Jahre).
Der Familienstand der meisten war entweder ledig (37.5 %) oder verheiratet (38.3 %; 14.2 %
waren geschieden). 71.6 % der Befragten lebten mit einem festen Partner zusammen (verhei-
ratet wie unverheiratet; 16.7 % gaben an, längerfristig keinen Partner zu haben). Von den Be-
fragten gaben 40 % an, einen Hauptschulabschluß zu haben, 31.7 % die mittlere Reife und
28.3 % das Abitur. Derzeit arbeiten 53.3 % der Befragten Vollzeit, 33.3 % Teilzeit und 9.2 %
gaben an, arbeitslos zu sein.
Ergebnisse
Die Skala erweist sich weiterhin als sehr reliabel (Cronbachs Alpha von 0.96 bei N = 220).
Als cut-off zwischen dem Spektrum der nicht-belasteten und dem Spektrum der belasteten
Personen ergibt sich ein Wert von 2.49 für die Gesamtskala, was sehr nahe an dem Ergebnis
der ersten Studie liegt (2.45). Der cut-off für die Abgrenzung zwischen nicht-belasteten und
ambulanten PatientInnen ließ sich also replizieren. Auch die anderen psychometrischen Kenn-
werte lassen sich zumindest in der Größenordnung replizieren (s. Tabelle 2). Da die Kenn-
werte stichproben- und verteilungsabhängig sind, sind kleine Schwankungen zu erwarten,
doch sind diese gering genug, um die Werte als verlässlich zu betrachten.
1 Statistisches Bundesamt; „Campus-File“ über das Forschungsdatenzentrum der Statistischen Ämter des Bundes
und der Länder (http://www.forschungsdatenzentrum.de/)
16
Diskussion
Die bisherigen Untersuchungen zeigen, dass der FEP-2 durch seine breite theoretische Fun-
dierung mehrere zentrale Dimensionen psychotherapeutischer Veränderungen erfassen kann.
Diese unterschiedlichen Komponenten psychischer Gesundheit bzw. psychischer Belastungen
sind empirisch von einander abgrenzbar und die gleichzeitig angestrebte geringere Itemzahl
als die Summe der verschiedenen Instrumente für die einzelnen Konzepte ermöglicht eine
zeitsparende Erhebung des Status zu verschiedenen Zeitpunkten im Therapieverlauf. Sowohl
eine Erfassung der einzelnen Symptombereiche, wie auch die Messung eines allgemeinen
Faktors der psychischen Befindlichkeit (begründet durch die hohen mittleren Korrelationen
der einzelnen Dimensionen) sind möglich. Der „public domain“-Status macht den Fragebogen
darüber hinaus zu einem ökonomischen und dadurch breit einsetzbaren Instrument.
In den statistischen Analysen zeigte sich, dass der Fragebogen als Gesamtskala wie auch in
den vier zentralen Subdimensionen reliabel ist. Die psychometrischen Eigenschaften des Ge-
samtwertes sind mit denen ähnlicher Instrumente im englischsprachigen Raum vergleichbar
(Barkham, et al., 2001; Grissom, et al., 2002; Lambert, et al., 2004). Aufgrund der Ergebnisse
aus den Faktorenanalysen erscheint es sinnvoll, auch die Subskalen zu den Beschwerden
separat zu berechnen. Der Vergleich zwischen der ambulanten klinischen Stichprobe sowie
der an der Bevölkerung erhobenen Stichprobe und der Studierendenstichprobe zeigt, dass alle
Dimensionen in der Lage sind, klinische Beschwerden zu identifizieren bzw. das Instrument
deutlich erhöhte Werte bei Personen mit psychischen Beschwerden aufweist als bei nicht be-
lasteten Personen. In der Validierung dieser Befunde an zwei neuen Stichproben ließen sich
diese Eigenschaften replizieren.
Besonderer Wert wurde bei der Entwicklung auf die Veränderungssensitivität gelegt. Die ent-
sprechenden Prüfwerte (Effektstärken) zeigen vergleichbare Werte wie weitaus umfang-
reichere und bereits länger eingeführte Instrumente, welche aber nicht eine entsprechende
Ökonomie besitzen. Zum Beispiel wurden zu den Zwischenmesszeitpunkten nach zehn
Sitzungen an der psychotherapeutischen Praxisstelle an der Universität Bern für ein vergleich-
bares Wohlbefindensmaß (Emotionalitätsinventar, EMI-B; Ullrich de Muynck & Ullrich,
1977) eine Vorher- Zwischenerhebungs-Effektstärke von .57 und nach 20 Sitzungen für ein
vergleichbares Beschwerdemaß (Brief Symptom Inventory, Franke, 2000) eine Vorher-
Zwischenerhebungs-Effektstärken von .47 festgestellt. Dies lässt sich durchaus mit dem hier
untersuchten Instrument, für das die Zwischenerhebungen zwischen der zehnten und der
zwanzigsten Sitzung lagen, vergleichen. Die Vorher-Nachher-Effektstärken liegen mit Werten
17
von deutlich über Eins beim Wohlbefinden, der Inkongruenz und dem Gesamtwert im hohen
Bereich und lassen auf eine sehr gute Veränderungssensitivität bei abgeschlossenen Therapien
schließen.
Literatur
Barkham, M., Margison, F., Leach, C., Lucock, M., Mellor-Clark, J., Evans, C., Benson, L., Connell,
J., Audin, K. & McGrath, G. (2001). Service profiling and outcomes benchmarking using the
CORE-OM: Toward practice-based evidence in the psychological therapies. Journal of Consulting
and Clinical Psychology, 69, 184-196.
Boixet, S., (2005). Die Skalen Wohlbefinden und Beziehung im Fragebogen zur Evaluation von
Psychotherapieverläufen FEP-2. Konstruktion und erste Überprüfung psychometrischer Kennwer-
te. Unveröffentlichte Lizentiatsarbeit, Universität Bern, Bern.
Borkovec, T. D., Echemendia, R. J., Ragusea, S. A. & Ruiz, M. (2001). The Pennsylvania Practice
Research Network and future possibilities for clinically meaningful and scientifically rigorous
psychotherapy effectiveness research. Clinical Psychology: Science and Practice, 8, 155-167.
Bullinger, M. & Kirchberger, I., (1998). SF-36. Fragebogen zum Gesundheitszustand. Göttingen:
Hogrefe.
Fiedler, P., (2001). Dissoziative Störungen und Konversion. Weinheim: Beltz.
Franke, G., (2000). BSI. Brief Symptom Inventory — Deutsche Version. Manual. Göttingen: Beltz.
Grawe, K., (1998). Psychologische Therapie. Bern: Hogrefe.
Grawe, K., (2004). Neuropsychotherapie. Göttingen: Hogrefe.
Grissom, G. R., Lyons, J. S. & Lutz, W. (2002). Standing on the shoulders of a giant: Development of
an outcome management system based on the dose model and phase model of psychotherapy.
Psychotherapy Research, 12, 397-412.
Grosse Holtforth, M., Grawe, K. & Tamcan, Ö., (2004). Inkongruenzfragebogen. Manual. Göttingen:
Hogrefe.
Halstead, J. E., Leach, C. & Rust, J. (2007). The development of a brief distress measure for the
evaluation of psychotherapy and counseling (sPaCE). Psychotherapy Research, 17, 656-672.
Hautzinger, M., Bailer, M., Worall, H. & Keller, F., (1994). Beck-Depressions-Inventar (BDI). Bern:
Huber.
Hill, C. E. & Lambert, M. J., (2004). Methodological issues in studying psychotherapy processes and
outcomes. In M. J. Lambert (Ed.), Bergin and Garfield's handbook of psychotherapy and behavior
change (pp. 84-135). New York: Wiley.
Horowitz, L. M., Rosenberg, S. E., Baer, B. A., Ureno, G. & Villasenor, V. S. (1988). Inventory of
interpersonal problems: Psychometric properties and clinical applications. Journal of Consulting
and Clinical Psychology, 56, 885-892.
Howard, K. I., Lueger, R. J., Maling, M. S. & Martinovich, Z. (1993). A phase model of psycho-
therapy outcome: Causal mediation of change. Journal of Consulting and Clinical Psychology, 61,
678-685.
Howard, K. I., Lueger, R. J., Martinovich, Z. & Lutz, W., (1999). The cost-effectiveness of
psychotherapy: Dose-response and phase models. In N. E. Miller & K. M. Magruder (Eds.), Cost-
effectiveness of psychotherapy: A guide for practitioners, researchers, and policymakers (pp. 143-
152). New York: Oxford University Press.
Howard, K. I., Moras, K., Brill, P. L., Martinovich, Z. & Lutz, W. (1996). Evaluation of psycho-
therapy: Efficacy, effectiveness, and patient progress. American Psychologist, 51, 1059-1064.
Jacobson, N. S. & Truax, P. (1991). Clinical significance: A statistical approach to defining mean-
ingful change in psychotherapy research. Journal of Consulting and Clinical Psychology, 59, 12-
19.
Jermann, B., (2006). Die Skalen Beschwerden und Kongruenz im Fragebogen zur Evaluation von
Psychotherapieverläufen (FEP-2). Konstruktion und erste Überprüfung psychometrischer Kenn-
werte. Unveröffentlichte Lizentiatsarbeit, Universität Bern, Bern.
18
Jung, F., (2008). Allgemeine Selbstwirksamkeit: Zusammenhänge mit den Dimensionen des psychi-
schen Wohlbefindens im Fragebogen zur Evaluation von Psychotherapieverläufen (FEP). Eine Un-
tersuchung an einer annähernd bevölkerungsrepräsentativen Stichprobe. Unveröffentlichte Diplom-
arbeit, Universität Trier, Trier.
Kiesler, D. J. (1996). From communications to interpersonal theory: A personal odyssey. Journal of
Personality Assessment, 66, 267-282.
Lambert, M. (2007). Presidential address: What we have learned from a decade of research aimed at
improving psychotherapy outcome in routine care. Psychotherapy Research, 17, 1-14.
Lambert, M. J., Hannöver, W., Nisslmüller, K., Richard, M. & Kordy, H. (2002). Fragebogen zum
Ergebnis von Psychotherapie: Zur Reliabilität und Validität der deutschen Übersetzung des Out-
come Questionnaire 45.2 (OQ-45.2). Zeitschrift für Klinische Psychologie und Psychotherapie, 31,
40-47.
Lambert, M. J., Morton, J. J., Hatfield, D., Harmon, S. C., Reid, R. C. et al. (2004). Administration
and scoring manual for the OQ-45.2. Orem, UT: American Professional Credentialing Service.
Leary, T., (1957). Interpersonal diagnosis of personality. New York: Ronald Press.
Loehlin, J. C., (2004). Latent variable models. An introduction to factor, path, and structural equation
analysis. Mahwah, NJ: Lawrence Erlbaum.
Lutz, W. (2002). Patient-focused psychotherapy research and individual treatment progress as scienti-
fic groundwork for an empirical based clinical practice. Psychotherapy Research, 12, 251-272.
Lutz, W. (2007). Evidenzbasierung in der Psychotherapie: A bridge over troubeled water. Zeitschrift
für Neuropsychologie, 18, 9-21.
Lutz, W. & Grawe, K., (2006). Psychotherapieforschung: Grundlagen, Konzepte und neue Trends. In
B. Strauss, F. Caspar & F. Hohagen (Hrsg.), Lehrbuch der Psychotherapie (S. 727-768). Göttingen:
Hogrefe.
Lutz, W. & Howard, K. I., (1997). Compass questionnaire validity checks. Unpublished Working
Paper, Northwestern University, Evanston/Chicago.
Lutz, W., Tholen, S., Schürch, E. & Berking, M. (2006). Die Entwicklung, Validierung und Reliabili-
tät von Kurzformen gängiger psychometrischer Instrumente zur Evaluation des therapeutischen
Fortschritts in der Psychotherapie und Psychiatrie. Diagnostica, 52, 11-25.
Lutz, W., Lambert, M. J., Harmon, S. C., Tschitsaz, A., Schurch, E. & Stulz, N. (2006). The prob-
ability of treatment success, failure and duration- what can be learned from empirical data to
support decision making in clinical practice? Clinical Psychology & Psychotherapy, 13, 223-232.
Lutz, W., Schürch, E., Stulz, N., Böhnke, J. R., Schöttke, H., Rogner, J. & Wiedl, K. H. (2009). Ent-
wicklung und psychometrische Kennwerte des Fragebogens zur Evaluation von Psychotherapiever-
läufen (FEP). Diagnostica, 55,
Muthén, B. O. & Muthén, L. K., (1998-2004). Mplus user's guide (3). Los Angeles, CA: Muthen &
Muthen.
Rost, J., (2004). Lehrbuch Testtheorie — Testkonstruktion. Bern: Huber.
Schürch, E., Lutz, W. & Böhnke, J. R. (im Druck). Identifikation problematischer Antwortmuster im
Fragebogen zur Evaluation von Psychotherapieverläufen mit Hilfe der Rasch-Analyse. Zeitschrift
für Klinische Psychologie und Psychotherapie.
Stulz, N. & Lutz, W. (2007). Multidimensional patterns of change in outpatient psychotherapy: The
phase model revisited. Journal of Clinical Psychology, 63, 817-833.
Stulz, N., Lutz, W., Leach, C., Lucock, M. & Barkham, M. (2007). Shapes of early change in psycho-
therapy under routine outpatient conditions. Journal of Consulting and Clinical Psychology, 75,
864-874.
Ullrich de Muynck, R. & Ullrich, R., (1977). Das Emotionalitätsinventar als Befindlichkeitsmaß. Test-
manual EMI-B. München: Pfeiffer.
Wise, E. A. (2004). Methods for analyzing psychotherapy outcomes: A review of clinical significance,
reliable change, and recommendations for future directions. Journal of Personality Assessment, 82,
50-59.
Wittchen, H.-U., Nelson, C. B. & Lachner, G. (1998). Prevalence of mental disorders and psycho-
social impairments in adolescents and young adults. Psychological Medicine, 28, 109-126.
Wittchen, H.-U., Lieb, R., Wunderlich, U. & Schuster, P. (1999). Comorbidity in primary care: Pre-
sentation and consequences. Journal of Clinical Psychiatry, 60, 29-36.
19
Anschrift der Verfasser:
Prof. Dr. Wolfgang Lutz
Dipl.-Psych. Jan R. Böhnke
Fachbereich I - Psychologie
Universität Trier
D-54286 Trier
E-Mail: wolfgang.lutz@uni-trier.de
Fragebogen zur Evaluation von Psychotherapieverläufen (FEP-2)1
Mit diesem Fragebogen würden wir gerne von Ihnen erfahren, wie Sie sich in der letzten Woche
gefühlt und in bezug auf andere verhalten haben.
Bitte lesen Sie jede Frage aufmerksam durch und kreuzen Sie jeweils die für Sie zutreffendste
Antwort an. Bitte überlegen Sie dabei nicht, ob eine Antwort einen guten Eindruck machen
könnte, sondern antworten Sie so, wie es auf Ihre gegenwärtige Lebenssituation zutrifft.
Kreuzen Sie bitte pro Frage nur eine Antwort an. Alle Ihre Antworten werden selbstverständlich
vertraulich behandelt.
nie selten manchmal oft sehr oft
1 2 345
In der letzten Woche...
1. fühlte ich mich wohl
1
2
3
4
5
2. ging ich vielen Interessen nach
1
2
3
4
5
3. fühlte ich mich ohnmächtig
1
2
3
4
5
4. war ich nervös
1
2
3
4
5
5. fühlte ich mich unbelastet und zufrieden
1
2
3
4
5
6. hatte ich Schlafprobleme
1
2
3
4
5
7. belastete mich meine Zukunftsaussicht
1
2
3
4
5
8. war ich ängstlich
1
2
3
4
5
9. war ich den an mich gestellten
Anforderungen gewachsen
1
2
3
4
5
10. war ich sehr einsam und alleine
1
2
3
4
5
11. hatte ich Probleme, mich für andere zu freuen
1
2
3
4
5
12. war ich unter Anspannung und innerem Druck
1
2
3
4
5
13. war ich leicht von anderen zu überreden
1
2
3
4
5
14. war ich guter Dinge
1
2
3
4
5
15. war ich selbstsicher und selbstbewusst
1
2
3
4
5
16. hatte ich Probleme, andere zu unterstützen
1
2
3
4
5
17. fühlte ich mich von anderen nicht geschätzt
1
2
3
4
5
18. hatte ich Probleme, Aggressionen zu zeigen,
wenn nötig
1
2
3
4
5
1Licensed by Wolfgang Lutz, University of Berne
nie selten manchmal oft sehr oft
1 2 345
In der letzten Woche...
19. war ich selbstbeherrscht
1
2
3
4
5
20. war ich leicht von anderen auszunutzen
1
2
3
4
5
21. empfand ich einen Sinn in meinem Leben
1
2
3
4
5
22. war ich voller Kraft und Ausdauer
1
2
3
4
5
23. war ich panisch und voller Angst
1
2
3
4
5
24. fühlte ich mich ohne Wert
1
2
3
4
5
25. hatte ich Probleme, vertrauten Personen
gegenüber Ärger zu äussern, wenn nötig
1
2
3
4
5
26. gingen mir die Probleme anderer Menschen
schnell zu nahe
1
2
3
4
5
27. war ich Teil einer erfüllten und intimen Beziehung
1
2
3
4
5
28. hatte ich Probleme, auf andere Menschen
zuzugehen
1
2
3
4
5
29. war ich unabhängig und frei
1
2
3
4
5
30. war ich voll innerer Ruhe
1
2
3
4
5
31. konnte ich mich für nichts begeistern
1
2
3
4
5
32. hatte ich Probleme, anderen negative Gefühle
mitzuteilen
1
2
3
4
5
33. mischte ich mich zu sehr in die Angelegenheiten
anderer ein
1
2
3
4
5
34. dachte ich daran, mir das Leben zu nehmen
1
2
3
4
5
35. fühlte ich mich ungenügend und unzureichend
1
2
3
4
5
36. hatte ich Probleme, anderen gegenüber offen
zu sein und Gefühle zu zeigen
1
2
3
4
5
37. fühlte ich mich von anderen im Stich gelassen
1
2
3
4
5
38. war ich deprimiert und niedergeschlagen
1
2
3
4
5
39. war ich optimistisch
1
2
3
4
5
40. war ich schnell vor anderen verlegen
1
2
3
4
5
1Licensed by Wolfgang Lutz, University of Berne
... Höhere Werte indizieren schlechtere Befindlichkeit. Die psychische Belastung wurde mit dem ›Fragebogen zur Erhebung von Psychotherapieverläufen‹ (FEP) gemessen (Lutz & Böhnke, 2008 ...
Article
Full-text available
In the past, little empirical research has been devoted to systemic constellations. One conceivable reason for this is the emotional controversy about family constellations as a »systemic« method and the »phenomenological« light in which practitioners have traditionally seen themselves. But the diversification of constellations produced empirical studies that did much to take the sting out of this controversy. The Heidelberg study used a randomised, con- trolled approach (RCT) to examine the effectiveness of constellations in connection with psychical well-being. A non-clinical sample of 208 adult participants from the general public was randomly allotted to an experimental group (EG; intervention: 3-day constellation seminar) and a waiting-list con- trol group (WLCG) where intervention came later. Both arms of the study consisted of 64 active members addressing a concern of theirs in a constellation and 40 observer participants without a constellation of their own. Effectiveness was assessed two weeks and four months after the constellation seminar by means of established measuring instruments widely used in psychotherapy research. The article presents the outcome of the exploratory comparison between the active participants in both arms of the study.
... Usually, these questionnaires are designed as post-session reports, for example, the Therapy Session Report (Orlinsky & Howard, 1967), the Vanderbilt Psychotherapy Process Scales (Smith, Hilsenroth, Baity, & Knowles, 2003), the Session Evaluation Questionnaire (Stiles, 1980;Stiles et al., 1994), the Session Impact Scale ( Q7 Eliott & Wexler, 1994), or the Berne Post-Session Report (Flückiger, Regli, Zwahlen, Hostetteler, & Caspar, 2010 Q8 ) and its advanced development, the Scale for the Multiperspective Assessment of General Change Mechanisms in Psychotherapy (SACiP; Mander et al., 2013). The multidimensional Questionnaire for the Evaluation of Psychotherapeutic Processes (Lutz & Böhnke, 2008) is applied at some few time points during the process with the ratings referring to a period of 1 week. Other session-related scales focus uniquely on the therapeutic alliance, such as the Working Alliance Inventory (Horvath & Greenberg, 1986), the Helping Alliance Questionnaire (Alexander & Luborsky, 1986), the California Psychotherapy Alliance Scales (Gaston, 1991), or the Combined Alliance Scale (Hatcher & Shannon, 2005) and its short version, the Scale of the Therapeutic Alliance-Revised (STA-R; Brockmann et al., 2011). ...
Article
Full-text available
Many outcome measures and session‐related questionnaires in psychotherapy are designed for weekly or biweekly administration. Yet today, technical developments allow for higher frequency assessments to monitor human change dynamics more closely, by daily assessments. For this purpose, the Therapy Process Questionnaire (TPQ) was developed, with a specific focus on inpatient psychotherapy. In this article, we present an explorative and confirmative factor analysis of the TPQ based on the time series data of 150 patients collected during their hospital stay (mean time series length: 69.1 measurement points). A seven factor solution was identified which explains 68.7% of variance and associates 43 items onto the factors, which are “well‐being and positive emotions”, “relationship with fellow patients”, “therapeutic relationship and clinical setting”, “emotional and problem intensity”, “insight/confidence/therapeutic progress”, “motivation for change”, and “mindfulness/self‐care”. The internal consistency (Cronbach‘s α), the inter‐item correlations of the subscales, and the discriminative power of the items are excellent. The TPQ can be applied in practice and research for creating time series with equidistant measurement points and time series lengths which are appropriate for the application of nonlinear analysis methods. Especially in clinical practice it is important to identify precursors of phase transitions, changing synchronization patterns, and critical or instable periods of a process, which now is possible by internet‐ or app‐based applications of this multidimensional questionnaire.
... In previous studies, the instrument's scores showed good reliability and validity with the scores from concurrent instruments such as the OQ-45 (Lambert et al., 1996) and the TEaM (Grissom et al., 2002). The instrument has been validated in two independent studies (Lutz & Böhnke, 2008;Lutz et al., 2009) and it has also been shown that 35 of its 40 items are Rasch-scalable ). Because of its conceptual breadth, validation, and open-access status, it is now also used in clinical trials (e.g., Klein et al., 2013). ...
Article
Full-text available
The need for efficient clinical assessment instruments has been growing during the past years. In the current application, the item information (item response theory) is used to evaluate and build fixed short versions. The method was applied to a questionnaire measuring psychological distress and data were collected from two mixed outpatient and general population samples. After fitting the partial credit model, two short versions were built: one to increase efficiency in screening applications; the other for the monitoring of high distress patients. A cross-validation bootstrap procedure is proposed to check whether the short versions are more efficient than alternative item selections. Using the partial credit model, the results from short and full versions can be compared on score level, which improves the flexibility of the assessment. The discussion focuses on the model selection and on how many items are realistically needed in routine assessments of psychological distress.
Article
Full-text available
Hintergrund: Obwohl die Wirksamkeit ambulanter Psychotherapie bei psychischen Erkrankungen hinreichend belegt wurde, zeigen 5–10% der Patienten eine Verschlechterung im Therapieverlauf. Patienten und Methoden: In dieser randomisierten kontrollierten Studie wurde untersucht, welchen Effekt eine formalisierte therapiebegleitende Rückmeldung an den Therapeuten über Veränderungen der psychischen Belastung, Beeinträchtigung und Therapiemotivation des Patienten auf den Therapieverlauf hat. In einer poliklinischen Psychotherapieambulanz wurden 230 Patienten auf drei Studiengruppen randomisiert verteilt: Verlaufsmessung mit Feedback (EG), Verlaufsmessung ohne Feedback (KG1), keine Verlaufsmessung (KG2). Während der anschließenden verhaltenstherapeutischen Behandlung wurden die Verlaufsmessungen zur Erhebung des Therapie­fortschritts regelmäßig mithilfe des Fragebogens zur Evaluation von Psychotherapieverläufen (FEP-2), des Outcome Questionnaires (OQ-30) und des Assessment for Signal Cases (ASC) durchgeführt. In der EG wurden die Ergebnisse der Verlaufsmessungen den Therapeuten zurückgemeldet. Mittels Varianzanalysen mit Messwiederholungen wurde der Einfluss des Feedbacks auf die Wirksamkeit der Therapien überprüft. Ergebnisse: Die Patienten der drei Studiengruppen unterschieden sich nicht signifikant hinsichtlich sozio­demografischer und erkrankungsrelevanter Variablen. Die psychische Beeinträchtigung aller Gruppen ging im Therapieverlauf zurück. Zwischen den Gruppen zeigten sich keine signifikanten Unterschiede. Bei Therapien, die bis zur ersten Verlaufsmessung keine Verbesserung aufwiesen (n = 49), zeigte sich ebenfalls kein differentieller Effekt des Feedbacks. Diskussion und Schlussfolgerung: Feedback brachte in diesem Studienkollektiv einer Ausbildungsambulanz weder einen globalen noch einen differentiellen Vorteil auf den Therapieverlauf. Um einen potentiellen Feedbackeffekt besser nachweisen zu können, sollten zukünftige Studien eine höhere Frequenz des Feedbacks anstreben, die Einstellung der Therapeuten gegenüber derartigen Feedbacksystemen erheben sowie “Clinical Support Tools” einsetzen.
Article
Full-text available
Depressive disorders are among the leading causes of worldwide disability with mild to moderate forms of depression being particularly common. Low-intensity treatments such as online psychological treatments may be an effective way to treat mild to moderate depressive symptoms and prevent the emergence or relapse of major depression.Methods/design: This study is a currently recruiting multicentre parallel-groups pragmatic randomized-controlled single-blind trial. A total of 1000 participants with mild to moderate symptoms of depression from various settings including in- and outpatient services will be randomized to an online psychological treatment or care as usual (CAU). We hypothesize that the intervention will be superior to CAU in reducing depressive symptoms assessed with the Personal Health Questionnaire (PHQ-9, primary outcome measure) following the intervention (12 wks) and at follow-up (24 and 48 wks). Further outcome parameters include quality of life, use of health care resources and attitude towards online psychological treatments. The study will yield meaningful answers to the question of whether online psychological treatment can contribute to the effective and efficient prevention and treatment of mild to moderate depression on a population level with a low barrier to entry.Trial registration: Trial Registration Number: NCT01636752.
Article
Full-text available
The findings of a decade-long program of research aimed at tracking patient treatment response are summarized. Outcome measures were developed and applied on a weekly basis with patients undergoing therapy in routine practice. Treatment response was defined as reliable and clinically significant change, and longitudinal statistical models for identifying poor progress were applied. The author was able to estimate the amount of therapy necessary for recovery, study early dramatic improvers, and assess the consequences of providing practitioners with alarm signals when patients were off track for a positive outcome. Results indicate that integrating treatment response research into routine mental health care reliably improved positive outcomes and reduced negative outcomes. Future directions for this line of action research are suggested.
Article
Full-text available
Zusammenfassung. Im Rahmen der sich in den letzten Jahren immer starker etablierenden Wissenschaftler-Praktiker-Netzwerke und Qualitatssicherungsstudien in der Psychotherapie und Psychiatrie wird der Einsatz von okonomischen, aber multidimensionalen und veranderungssensitiven klinischen Messinstrumenten zur Verlaufs- und Ergebnismessung therapeutischer Behandlungen immer wichtiger. In der vorliegenden Arbeit wird die Entwicklung von Kurzfragebogen vier gangiger Messinstrumente (der Symptom-Checkliste, SCL-90-R; dem Emotionalitatsinventar, EMI; dem Inventar Interpersonaler Probleme, IIP und dem Inkongruenzfragebogen, INK) sowie die Validitat, Reliabilitat und Veranderungssensitivitat dieser Kurzfragebogen anhand einer Stichprobe der Allgemeinbevolkerung (N = 436), einer Stichprobe ambulanter Psychotherapiepatienten (N = 169) sowie einer Stichprobe von Patienten in stationarer Psychotherapie (N = 134) dargestellt. Die psychometrischen Eigenschaften dieser Kurzformen sowie ein daraus generierter auf 43 Items...
Article
Full-text available
An acceptable, standardized outcome measure to assess efficacy and effectiveness is needed across the professions offering psychological therapies. The goal of the current study is to present psychometric data on the reliability, validity, and sensitivity to change of the Shorter Psychotherapy and Counselling Evaluation (sPaCE) measure, a 19-item self-report instrument, with domains of Depression (general and self-harming), Anxiety (general and phobic), Apathy, and Functional Cognitive Problems. The author evaluated sPaCE's internal reliability, test–retest reliability, exploratory principal-component analysis, correlations with the Beck Depression Inventory (BDI), differences between clinical and nonclinical samples, and assessment of change within a clinical group. Internal and test–retest reliabilities were good, as was convergent validity with the BDI. A clear, replicable factor structure was demonstrated corresponding with the subscales. There were large differences between clinical and nonclinical samples and good sensitivity to change. The author concluded that the sPaCE measure is a reliable and valid instrument with good sensitivity to change and a clear factor structure and is acceptable in clinical practice.
Book
Jürgen Rost., The following values have no corresponding Zotero field: ID - 626
Article
This book introduces multiple-latent variable models by utilizing path diagrams to explain the underlying relationships in the models. This approach helps less mathematically inclined students grasp the underlying relationships between path analysis, factor analysis, and structural equation modeling more easily. A few sections of the book make use of elementary matrix algebra. An appendix on the topic is provided for those who need a review. The author maintains an informal style so as to increase the book's accessibility. Notes at the end of each chapter provide some of the more technical details. The book is not tied to a particular computer program, but special attention is paid to LISREL, EQS, AMOS, and Mx. New in the fourth edition of Latent Variable Models: * a data CD that features the correlation and covariance matrices used in the exercises; * new sections on missing data, non-normality, mediation, factorial invariance, and automating the construction of path diagrams; and * reorganization of chapters 3-7 to enhance the flow of the book and its flexibility for teaching. Intended for advanced students and researchers in the areas of social, educational, clinical, industrial, consumer, personality, and developmental psychology, sociology, political science, and marketing, some prior familiarity with correlation and regression is helpful. © 2004 by Lawrence Erlbaum Associates, Inc. All rights reserved.
Article
Zusammenfassung: Patientenorientierte Psychotherapieforschung (patient-focused psychotherapy research) oder auch Qualitätsmanagement in der Psychotherapie können als relativ neue Ansätze in der sich immer wieder entfachenden Debatte um eine praxisrelevante Evaluation psychotherapeutischer Tätigkeit sowie die Evidenzbasierung von Psychotherapie angesehen werden. In vielen psychotherapeutisch arbeitenden Institutionen wird routinemäßig eine psychometrische Evaluation der psychotherapeutischen Behandlung durchgeführt, um die klinische Fallkonzeption zu Therapiebeginn zu unterstützen sowie die Resultate bei Therapieabschluss zu evaluieren. Neuere Konzepte und Methoden der patientenorientierten Psychotherapieforschung erlauben eine weitergehende Verwendung der Patientenausgangs-, Verlaufs- und Abschlussdokumentationen zur empirischen Unterstützung der differenziellen wie adaptiven Indikation. Dieser Beitrag diskutiert sowohl wissenschaftliche als auch klinisch-praktische Aspekte einer patientenorientierten Psychotherapieforschung und damit einer verstärkten Evidenzbasierung von Psychotherapie anhand von Beispielstudien.
Article
Describes a new instrument, the Inventory of Interpersonal Problems (IIP), which measures distress arising from interpersonal sources. The IIP meets the need for an easily administered self-report inventory that describes the types of interpersonal problems that people experience and the level of distress associated with them before, during, and after psychotherapy. In Study 1, psychometric data are presented for 103 patients who were tested at the beginning and end of a waiting period before they began brief dynamic psychotherapy. On both occasions, a factor analysis yielded the same six subscales; these scales showed high internal consistency and high test–retest reliability. Study 2 demonstrated the instrument's sensitivity to clinical change. In this study, a subset of patients was tested before, during, and after 20 sessions of psychotherapy. Their improvement on the IIP agreed well with all other measures of their improvement, including those generated by the therapist and by an independent evaluator. (PsycINFO Database Record (c) 2012 APA, all rights reserved)