ChapterPDF Available

Kriz, Jürgen (2014): Wie evident ist Evidenzbasierung? Über ein gutes Konzept – und seine missbräuchliche Verwendung.

Authors:

Abstract

Resümee Resümierend lässt sich sagen, dass EbM im Ansatz und in der Intention zwar prinzipiell positiv zu sehen ist, in der Praxis hierzulande aber durch Gremien wie z.B. den G-BA zunehmend entstellt und zweckentfremdet eingesetzt wird. Aus dem guten Anliegen, für Praktiker einen informativen Überblick über von ihnen schwer zu bewältige Flut an Forschungsergebnissen bereit zu stellen, wurde missbräuchlich ein Instrument zur Selektion und Maßregelung entwickelt. Der Begriff „Evidenzbasierung“ ist so (wortwörtlich) zu einem Schlag-Wort verkommen, um inhaltliche Argumente und Diskurse zu unterbinden: Gut zwei Jahrzehnte nach Einführung von EbM durch die Gruppe um David Sackett, werden die eindringlichen Warnungen des Gründers (z.B. Sackett et al. 1996) ignoriert und oft eine entstellte Form, die lediglich RCT-Studien berücksichtigt, irreführend als „EbM“ ausgegeben. Diese starke Betonung von RCT-Studien macht dort Sinn, wo experimentelle Designs dem Untersuchungsgegenstand angemessen sind – dies gilt neben der Apparate- und Pharmaforschung in der Medizin vor allem dann, wenn klar definierbare und operationalisierbare Programme angewendet werden können. Für Teile der Verhaltenstherapie und recht bedingt auch für andere Psychotherapieansätze ist das noch hinreichend gewährleistet. Für viele andere psychotherapeutische Ansätze hingegen, die wesentlich auf der situationsspezifischen und passungsgerechten Entfaltung von Prinzipien beruhen, ist diese Methodik weitgehend inadäquat. Die Reduktion von EbM auf RCT-Designs schließt somit nicht nur Teile wissenschaftlicher Methodik von vornherein aus (wie z.B. das gesamte Spektrum qualitativer Forschung) sondern enthält zusätzlich einen starken Bias für nur eine der vier zentralen psychotherapeutischen Grundorientierungen – nämlich für die verhaltenstherapeutische auf Kosten der psychodynamischen, humanistischen und systemischen Grundorientierung. Auch aus Sicht des Allgemeinen Modell der Psychotherapie (AMP) von Orlinsky & Howard (1987), das international als Minimalkonsens über Wirkungskomplexität gilt, stellt eine auf RCT-Designs reduzierte EbM eine unzulässige Verkürzung auf einen winzigen Ausschnitt dessen dar, was als zu berücksichtigende Einflussgrößen unter dem Begriff der „Passung“ in die Diskurse Einzug gehalten hat. Ignoriert werden in RCT-Designs weiterhin die essentiellen Auswirkungen von nicht-linearen Entwicklungsverläufen, welche aber (auch) für psychotherapeutische Veränderungen typisch sind. Eingesetzt im Rahmen von „Evidenzbasierung“ werden weiterhin modellhafte Algorithmen der Metaanalyse. In diesen spielt das Konzept der „Effektstärke“ eine zentrale Rolle. Auf Grund dieser Begrifflichkeit nehmen viele Kliniker irrtümlich an, es handle sich dabei um ein Maß der klinischen Effektes von Interventionen – in Wirklichkeit aber geht es um die statistische Diskriminierung zweier Populationen, die nur unter bestimmten weiteren Bedingungen überhaupt so etwas wie klinische Effekte abbildet. Durch eine leider nicht untypische Mystifikation von numerischen Ergebnissen, die Computerprogramme geliefert haben, bleibt auch hier bisweilen der inhaltliche Sachverstand von Klinikern und Therapeuten auf der Strecke. Insgesamt gesehen ist das Ausmaß an methodischem Unverständnis und faktischem Missbrauch der guten Idee von „Evidenzbasierung“ gerade auch von einflussreichen Gremien wie dem G-BA derart gravierend, dass EbM daher für die Bewertung von Psychotherapie sehr kritisch gesehen werden muss. Sie dient inzwischen wohl auch eher einer interessengeleiteten Selektion bestimmter psychotherapeutischer Ansätze als der Information über den Stand wissenschaftlicher Forschung oder gar dem Wohl von Patienten.
MS-Version. Artikel erschien als:
Kriz, Jürgen (2014): Wie evident ist Evidenzbasierung? Über ein gutes Konzept und seine missbräuchliche
Verwendung. In: Sulz, Serge (Hrsg): Psychotherapie ist mehr als Wissenschaft. Ist hervorragendes Expertentum
durch die Reform gefährdet? München: CIP-Medien, S. 154 185
Wie evident ist Evidenzbasierung?
Über eine gutes Konzept - und seine missbräuchliche Verwendung
Jürgen Kriz
Das eigentlich gute Anliegen der Evidenzbasierung
Gut gemeint so sagt bereits der Volksmund erweist sich oft als Gegenteil von gut gemacht. Gut
gemeint ist sicherlich die Idee, in Zeiten zunehmenden Gerangels um Anteile am Topf
krankenkassenfinanzierter Gesundheitsleistungen auch die Psychotherapie auf eine festere Diskurs-
Rationalität zu stellen. Wohl nur so lässt sich der vergleichsweise winzigen Anteil für Psychotherapie
gegenüber Ansprüchen sichern, die von einer kostenmäßig ausufernden Apparatemedizin und
pharmazeutischen Vollversorgung mit ihren Milliarden für Werbung und Lobbyarbeit vorgetragen
werden. Es ist dabei auch verständlich, dass in diesem Markt die „Spielregeln“ für die Diskurse
Bewertungen von diesen „global playern“ der Apparate- und Pharma-Konzerne vorgegeben werden
nicht einmal aus bösem Willen, sondern weil dies schlicht der Logik solcher Produkte entspricht.
Bereits vor diesem Hintergrund ist es allerding eine Frage an das Selbstverständnis der
Psychotherapie, ob sie auf ihre Besonderheit und Andersartigkeit in ihrem Umgang mit leidenden
Menschen verweisen will, und auf diesem Hintergrund eine Verbesserung ihrer Argumente
hinsichtlich der seit einem Jahrhundert belegten Wirksamkeit und Nützlichkeit vorantreiben will. Oder
aber, ob sie ihre Besonderheit negierend oder leugnend meint, alle Bedingungen für den
Wettbewerb nach den Spielregeln der Bewertungslogik für Apparate und Pharmaprodukte erfüllen zu
sollen und damit ihren Wert zunehmend bereits für sich selbst aus einer solch Perspektive definieren
will.
Diese Frage und die damit zusammenhängenden Detailprobleme wären eigentlich Gegenstand
umfassender Diskurse. Es scheint aber so zu sein, dass stattdessen wie auch bei vielen anderen
gesellschaftlichen, politischen und inhaltlichen Diskursen eine Homogenisierung der Ansichten und
die Reduktion der Perspektivvielfalt über die Verlagerung von inhaltlichen Fragen auf methodische
Vorgehensweisen erreicht werden soll. Bereits vor Jahrzehnten hat der Soziologe Helmut Schelsky
(1977) Teile der Wissenschaftler-Community als „neues Priestertum“ kritisiert – eine Kaste, die sich
Fragen vorlegen lässt um darüber dann „end-gültig“ im Sinne von „wahr“ und „falsch“ zu entscheiden,
indem sie sich auf selbst scheinbar nicht mehr hinterfragbare Entscheidungsregeln beruft. Damit wird
dann die Vielfalt an Anliegen und Wertvorstellungen quasi methodisch entsorgt bzw. gleichgeschaltet
und die Verantwortung für die inhaltlichen Konsequenzen auf eine angeblich „objektive“ Methodik
abgeschoben. D.h. diese Kaste tut ziemlich genau das Gegenteil dessen, was eigentlich die Aufgabe
von Wissenschaft wäre, nämlich scheinbare Selbstverständlichkeiten immer wieder zu hinterfragen,
Einseitigkeiten zu kritisieren, die Vielfalt von Perspektiven möglichst zu vergrößern und über
vermeintliche Antworten und Lösungen immer wieder Diskurse zu eröffnen oder lebendig zu erhalten.
Schelsky konnte freilich noch nicht ahnen, dass zu Beginn des 21. Jahrhunderts ein solches
Wissenschaftsverständnis in unserer Kultur zunehmend in Vergessenheit geraten würde angesichts
von Ausbildungsstrukturen, bei denen vorgegebene Fakten in mit Wissenspartikel überfrachtete
Fächern vornehmlich nur noch abgefragt werden. Das heißt, erwünscht ist und belohnt wird deren
reproduktive Wiedergabe, und ist für die zentrale Frage, wie diese „Fakten“ zustande kommen, was sie
genauer bedeuten oder wo die Grenzen ihrer Aussagekraft sind, ist kaum noch Zeit vorgesehen.
Eine zentrale Idee, die zwar gut gemeint sein mag aber letztlich zu einer methodischen Entsorgung
essentieller inhaltlicher Diskurse in der Psychotherapie zu entarten droht, ist die Anwendung des
Konzeptes der sogenannten „Evidenzbasierung“ auf die Bewertung von psychotherapeutischen
Ansätzen. Das Grundanliegen, aus dem dieses Konzept zweckentfremdet wurde, geht auf die
„evidenzbasierten Medizin“, EbM, zurück, die fraglos positiv zu bewerten ist so wie auch die damit
verbundene Arbeit der Cochrane Collaboration (CC) und das Erstellen von Behandlungs-Leitlinien:
Es geht nämlich darum, Ärzten (bzw. Psychologischen Psychotherapeuten (PP), Kinder- und
Jugendlichen Psychotherapeuten (KJP)) wissenschaftliche Informationen zur Verfügung zu stellen,
damit diese mit integriert mit ihrer ärztlicher Erfahrung und der individuellen Patientenperspektive
dem jeweiligen Patienten die beste Behandlung anbieten können. Mit EbM soll somit die
zunehmenden Schwierigkeiten bewältigt werden, dass die einzelnen „Kliniker“ die Informationsfülle
über Behandlungsmethoden (und Medikamente etc.) allein nicht mehr bewältigen können und zwar
sowohl hinsichtlich der Menge an Behandlungsmethoden und Publikationen darüber, als auch
hinsichtlich der Gütebeurteilung der meist aufwändigen Studien.
Besonders von der internationalen „Cochrane Collaboration" werden unter Mitarbeit internationaler
Wissenschaftler für diesen Zweck Bewertungen und Zusammenfassungen (sog. „Reviews") von
wissenschaftlichen Studien im Bereich der Medizin vorgenommen.
Ob dieser nützliche Überblick über real durchgeführte Forschungen nach bestimmten Kriterien (s.u.)
nun aber auch ein nützliches Kriterium dafür sein kann, welche Methoden in der Praxis angewendet
bzw. unterlassen werden sollten, hängt von der Erfüllung bestimmter Voraussetzungen ab. Dazu zählt
zum einen insbesondere die Frage, wie weit das Spektrum realer Behandlungen tatsächlich und
hinreichend biasfrei im Spektrum dieser Forschung widergespiegelt wird. Zum anderen geht es um die
Frage, wie brauchbar sich das methodische Modell dieser Forschung nicht nur für die Beurteilung von
Pillen und Apparaten sondern auch für Psychotherapie eignet.
Schon hinsichtlich der ersten Frage werden oft erhebliche Zweifel geäußert, die mit
Interessenkonflikten zusammenhängen (vgl. z.B. Kienle et al. 2003). Denn Forschung orientiert sich
nicht einfach wertfrei an inhaltlich relevanten Fragen der Kliniker bzw. an zu klärenden Fragen für die
Patienten. Für Forschung zu Medikamenten, Apparate-Medizin etc., die weitgehend von Firmen
finanziert werden, zeigt sich vielmehr, dass überwiegend Therapien erforscht werden die patentierbar
und gewinnversprechend sind. Zudem werden pharmazeutische Unternehmen begünstigt, die mit
wenigen Medikamenten großen Umsatz machen. Diese sind die Gewinner im EbM-Biotop. Verlierer
sind dagegen Therapien ohne Aussicht auf breite Vermarktung oder ohne finanzstarke industrielle
Rückendeckung, wie z.B. nicht-pharmakologische Therapien.
Aber auch bei Forschung im Bereich von Psycho- und Sozialtherapie, Reha-Maßnahmen etc., die
primär über universitäre und öffentliche Mittel (incl. DFG, Stiftungen etc.) finanziert wird, steht die
Kritik oft mangelnder Neutralität im Raum, denn es werden bevorzugt Fragestellungen erforscht, die
im Rahmen von Diplom-, Doktor- und Habilitationsarbeiten angegangen werden und vergleichsweise
schnell und einfach publiziert werden können - d.h. Arbeiten, die gut in universitäre Karrierestrukturen
passen. So lässt sich beispielsweise eine spezielle Vorgehensweise (die dann dem Spektrum
„Verhaltenstherapie“ zugerechnet werden kann) an einer speziellen Patientengruppe sehr gut im
Rahmen einer Dissertation experimentell untersuchen. Die Wirkung einer langfristigen, kaum
manualisierbaren Vorgehensweise wie etwa der Humanistischen Psychotherapie oder der Langzeit-
Psychoanalyse lässt sich in diesem Rahmen praktisch so nicht untersuchen.
Der durchaus informative Überblick über die Forschungsliteratur durch EbM oder CC spiegelt somit
keineswegs nur die Nützlichkeit von Interventionsmethoden wider, sondern in erheblichem Ausmaß
die Nützlichkeit der Forschung unter kommerziellen oder Wissenschaftskarriere-Aspekten.
Zwei wichtige Bestandteile des EbM sind (a) eine bestimmte methodische Vorgehensweise, nämlich
die prospektive randomisierte, kontrollierte Doppelblindstudie (randomized controlled trail), RCT, und
die ihr zugrunde liegende epistemologische Sicht eines „wissenschaftlichen Beweises“, sowie (b) die
systematische Zusammenfassung solcher Studien im Rahmen von Metaanalysen, wobei die
Effektstärke (ES) eine besondere Rolle spielt.
Beide Bestandteile sollen daher zunächst im Folgenden einer näheren Analyse unterzogen werden
(wobei die Argumentation Aspekte aus Kriz 2000, 2003, 2007, 2008, 2011, 2012, 2014 mit aufgreift).
Zur Problematik von RCT-Studien in der Psychotherapie
Die Brauchbarkeit von Apparaten und die Wirksamkeit von Pharmaprodukten lassen sich jedenfalls
im Rahmen der typisch standardisierten Behandlungen sehr geht mit dem experimentellen Design
untersuchen: Bei diesem wird eben die Intervention unter Bedingungen erforscht, die für viele
naturwissenschaftliche Experimente üblich sind d.h. man erhebt den Ausgangszustand (in unserem
Falle die klinisch-symptomatischen Befunde des Patienten), führt die Intervention durch, und stellt die
Wirkung fest, indem man nun die erfolgte Veränderung erfasst.
Schematisiert sagt man, dass eine „Unabhängige Variable“ (UV) in Form der Intervention auf einen
Untersuchungsgegenstand (hier ein Mensch M) einwirkt und Wirkung von UV auf eine „Abhängige
Variable“ (AV) in Form der erhobenen Befunde, Testwerte, etc. festgestellt wird, also:
UV M AV
Dieser Ansatz reicht allerdings nicht aus, wenn der der Untersuchungsgegenstand (hier: der Mensch
mit seinen Befunden) sich ohnedies im Laufe der Zeit verändert und weiteren Einflüssen unterworfen
ist. Diese zeitliche Veränderung ohne die spezifische Intervention versucht man über eine
Kontrollgruppe abzuschätzen. Ferner ist wichtig, die lange ein Behandlungserfolg überhaupt anhält
man wird also nicht nur nach der Interventionen sondern auch in Zeiträumen danach Befunde erheben.
Das Standardmodell, dass aus solchen Überlegungen entwickelt wurde, wird als „Randomisiertes
Kontrolliertes Design“ bzw. RCT-Studie (von engl.: randomized controlled trial) bezeichnet. Wegen
seiner unbestrittenen Brauchbarkeit für die Beurteilung von Apparaten und Pharmaprodukten wurde
dieser Ansatz vor einigen Jahrzenten auf für die Untersuchung von psychotherapeutischen
Interventionen eingesetzt. Der international renommierte Psychotherapieforscher Martin P. Seligman,
führte dazu in einer Arbeit unmittelbar vor seiner Wahl zum Präsidenten der „American Psychological
Association“ (APA) aus, dass auch er diesen Ansatz lange Zeit als sogenannter „Goldstandard“ für
Psychotherapieforschung ansah. Er fasste dessen wesentlichen Aspekte wie folgt zusammen
(Seligman 1997, S. 267):
„Grundsätzlich wird dabei eine Behandlungsgruppe unter gut kontrollierten Bedingungen mit einer
Kontrollgruppe verglichen. Aber neben der Kontrollgruppe weisen Effizienzstudien, die mittlerweile
zu einem paradigmatischen Unterfangen geworden sind, noch eine hochkomplexe Methodologie auf.
Im Idealfall gehören die folgenden Raffinessen dazu:
1. Zuordnung der Patienten zu der Behandlungs- und Kontrollgruppe nach dem Zufallsprinzip.
2. Strenge Kontrollen: Neben Kontrollgruppen ohne Behandlung werden Kontrollgruppen gebildet,
bei denen eine Placebo-Behandlung mit potentiell therapeutischen Elementen eingesetzt wird, die
für Patienten wie Therapeuten glaubwürdig sind. Damit wird der Einfluss unspezifischer Faktoren
überprüft, zum Beispiel Rapport, Erfolgserwartung und teilnahmsvolle Aufmerksamkeit (sog.
Nonspezifika).
3. Die Behandlung ist standardisiert, mit hochgradig detaillierten expliziten Therapievorgaben. Die
Einhaltung der Standards wird anhand von Videoaufnahmen der Sitzungen überprüft,
Abweichungen werden korrigiert.
4. Die Behandlung erfolgt in einer festgelegten Zahl von Sitzungen.
5. Die Zielergebnisse werden sorgfältig operationalisiert (z.B. klinisch diagnostizierte DSM-IV-
Störungen, Zahl der berichteten Orgasmen, Selbstauskünfte über Panikattacken, prozentueller
Anteil flüssiger Äußerungen).
6. Auswerter und Diagnostiker wissen nicht, aus welcher Gruppe die Patienten kommen. (Anders als
bei Medikamentenstudien sind "doppel-blinde" Effizienzstudien in der Psychotherapie unmöglich,
da Patienten und Therapeuten die Behandlungsform kennen. Wann immer Sie jemanden eine
"Doppelblindstudie" in der Psychotherapie verlangen hören, halten Sie Ihren Geldbeutel zurück!)
7. Die Patienten erfüllen die Kriterien für eine einzige diagnostizierte Störung; Patienten mit
mehreren Störungen werden in der Regel nicht einbezogen.
8. Nach Behandlungsende werden die Patienten über einen festgelegten Zeitraum mit einer
umfassenden Testbatterie eingeschätzt.“
Die Notwendigkeit und Angemessenheit dieser „Raffininessen“ wird an der Prüfung der Wirkung
einer antibakteriellen Medizin „X“ leicht einsichtig: Wenn die Patienten selbst aussuchen dürften, in
welche Gruppe sie kommen, könnte X als wirksamer erscheinen, weil vielleicht nur die leichten Fälle
in diese Gruppe gehen, oder die mit mehr Motivation, oder es sind mehr zahlungskräftige dabei, die
sich aber gleichzeitig gesünder ernähren etc. und deswegen schneller geheilt werden (1). Man muss
sicherstellen, dass tatsächlich X wirkt und nicht der „Glaube an X“ oder die Flasche als Verpackung
oder die Bakterien sowieso von allein verschwinden (2); ebenso, dass tatsächlich X in der Flasche ist
und nicht irgendetwas anderes (3); und im Vergleich können natürlich völlig unterschiedliche Mengen
verwendet werden (4). Bekämpft werden sollten die Bakterien (5) daher sind z.B. Glücksgefühle bei
X irrelevant. Die Ergebnisse sollen auch nicht durch die Erwartungen der Auswerter verfälscht werden
(6). Da X gegen einen bestimmten Bakterienstamm wirken soll, sind eben auch nur Patienten mit
diesem Befall relevant bei Fußpilz würde die Wirkung von X eher unterschätzt werden, bei einer
allgemeinen Immunschwäche weiß man nicht wie diese (statt X) den Verlauf beeinflusst (7). Man
muss auch sicherstellen, dass die Bakterien zumindest eine gewisse Zeit beseitigt sind und nicht
nach wenigen Wochen z.B. die Krankheit wieder aufflammt (8). Insgesamt läßt sich somit sagen, dass
die angeführten Punkte in Bezug auf die Prüfung der Wirkung einer antibakteriellen Medizin durchaus
recht sinnvoll sind.
Gleichwohl stammt die obige Zusammenstellung der „Rafinessen“ der RCT-Forschung durch
Seligman (1997) bereits aus einem eher kritischen Beitrag, obwohl Seligman zunächst viele Jahre
selbst vehement den „Goldstandard“ in der Psychotherapie vertreten hatte. In diesem im Beitrag führt
er aber aus, wie ihn die Beteiligung an der „consumer report study“ von 1995 eines besseren belehrt
habe. Damit bezieht er sich auf eine große amerikanischen Verbraucher-Umfrage über die Wirkungen
von Behandlungen im realen psychotherapeutischen Feld Mitte der 1990er Jahre. Selbst bei
Einräumung vieler methodischer Probleme von denen allerdings auch die Laborforschung, wie alle
Forschung, nicht frei ist wichen deren Ergebnisse sehr deutlich von den Behauptungen über die
Wirksamkeit von Psychotherapien aus den Laborstudien ab., Angesichts dieser Unterschiede schwor
Seligman vehement seiner bisheriger Ansicht über den „Goldstandard“ öffentlich ab und schrieb:
„Durch diese Studie wurde mir klar, dass die Entscheidung, ob eine bestimmte Methode unter streng
kontrollierten Bedingungen einer anderen Methode oder der Kontrollgruppe überlegen ist, etwas
anderes ist als die Frage nach dem, was in der Praxis wirkt (...). Ich halte „Efficacy-Studien seitdem
nicht mehr für die einzige, ja nicht einmal für die beste Möglichkeit, um festzustellen, welche
Methoden in der Praxis tatsächlich wirksam sind. Ich bin zu der Überzeugung gekommen, dass
"Effektiveness“-Studien, mit denen die Erfahrungen der Patienten unter den realen Bedingungen in der
Praxis erhoben werden, eine brauchbare und glaubwürdige "empirische Validierung" von
Psychotherapie und Medikation ermöglichen“ (Seligman 1997, S. 271).
Es sei noch erwähnt, dass Seligman ein Jahr nach dieser (in etlichen Publikationen betonten)
Kehrtwendung seiner bisherigen Position zum Präsident der mächtigen APA (American Psychological
Association) gewählt. Dies zeigt, dass in den USA ein größeres Spektrum an heterogenen Positionen
durchaus an einflussreichen Stellen vertreten wird, als in den deutschen Gremien, die über
Psychotherapie befinden.
RCT-Forschung als Repräsentant des experimentellen Ansatzes
Trotz der Argumente von Seligman hat der Stellenwert, der RCT-Studien hierzulande eingeräumt
wird, in den letzten beiden Jahrzehnten fraglos zugenommen (s.u.). Gegen Seligman wird dabei ins
Feld geführt, dass Patienten oft gar nicht genau wissen, welche Art von Psychotherapie sie erhalten
haben und dass sie ferner über das Ausmaß des Erfolges aufgrund fehlender klinisch-diagnostischer
Kenntnisse nur Laienhafte Urteile abgeben könnten. Nur RCT-Studien würden den harten Kriterien
von „wissenschaftlicher Belastbarkeit“ gerecht.
Neben dem Modell der Apparatemedizin und Pharmaforschung stehen dabei auch die guten
Erfahrungen der Psychologie als einer weitgehend experimentellen Wissenschaft: Psychologen
können zu Recht stolz darauf sein, was in nur rund 130 Jahren als akademisches Fach an
Forschungsergebnissen aufgetürmt wurde und wenn man etwas genauer hinsieht, so lässt sich
feststellen, dass der ganz überwiegende Teil dieser Befunde auf experimentellen Ergebnissen beruht.
In der Tat sind zahlreiche Fragen, welche im Rahmen moderner Psychologie gestellt werden, optimal
durch eine experimentelle Herangehensweise nach dem obigen Schema UVMAV untersuchbar.
Dieser fraglos große Erfolg der Psychologie bei der Erforschung von Fragen, welche sich angemessen
mit dieser Herangehensweise untersuchen lassen, hat allerdings zur Gefahr der Übergeneralisierung
geführt: Denn in Experimenten und der entsprechenden Statistik werden Beobachtungsdaten als
empirische Realisation theoretischer, „wahrer“ Parameter (oder Naturgesetze) verstanden: Der Fall
einer Kugel ist z.B. eine Realisation des Fallgesetzes. Empirisch ergeben sich zwar immer kleine
Abweichungen der Messwerte von den theoretisch erwarteten Werten. Diese Abweichungen werden
jedoch „Störeinflüssen“ zugeschrieben, welche möglichst zu vermeiden sind.
Dieses Modell ist deshalb auch noch für die Behandlung von bakteriellen Ifektionen im obigen
Beispiel brauchbar, weil beim Befall eines Patienten mit z.B. Pneumokokken diese konkreten
Pneumokokken eben als „Realisation“ aus der wirklichen Population dieser Bakterien angesehen
werden können. Ein Antibiotikum gegen diesen Bakterien-Typ wird somit wirken, egal ob die
Beziehung des Patienten zum Arzt gut oder schlecht ist das wären zu eliminierende Störgrößen.
Schwieriger wird der Einsatz dieser Forschungslogik allerdings selbst bei bakteriellen Infekten schon
dann, wenn das Medikament nicht die Bakterien selbst bekämpfen, sondern die „Abwehrkräfte“
steigern soll: Von „was“ wären gemessene „Abwehr“-Daten (z.B. Immun-Parameter) Realisationen?
Und was sind hier Störgrößen?
Noch schwieriger allerdings wird es, wenn es um psychische Störungen geht: Ist das, was wir bei
einem depressiven Patienten seine Störung nennen, die konkrete Realisation einer theoretischen Größe
(Krankheit) namens „Depression“? Und – noch wichtiger kann die Behandlungsweise „b“ gegen
diese Störung als eine konkrete Realisation der Behandlungsmethode „B“ verstanden werden (die
dann, mit anderen Methoden für andere Störungen zusammen Verfahren „X“ ergibt)?
Doch trotz solcher Zweifel, führt eine (klassisch) experimentelle Perspektive in der obigen Form (UV
M AV) geradezu notwendig in die Logik der RCT-Studien. Denn wenn man entsprechend
schreibt:
so gilt notwendig (analog zu den zentralen Aspekten in der obigen Liste von Seligman):
Das „X“ muss zwangsläufig weitgehend manualisiert werden, denn man will ja nicht
irgendeine UV testen sondern X.
Es müssen vorgegebene Stunden-Anzahl mit X sein, sonst wäre nicht X die Wirkung, sondern
die Behandlungsdauer.
Es müssen Kontroll- bzw. Vergleichsgruppen gebildet werden, denn in der massen-
statistischen Analyse (für E) können sonst viele Einflüsse (z.B. „Spontanremission“) und
nicht X die Wirkung hervorrufen.
Ebenso muss randomisiert (bzw. bei kleinem N besser: parallelisiert) werden, denn sonst
wirken statt X ggf. die Unterschiede in den Gruppen.
Um die Wirkung von X im Sinne von Effektstärken (E) sinnvoll erfassen zu können, ist eine
weitere notwendige Voraussetzung, dass die Symptom- und auch die Heilungsdynamik
hinreichend linear zumindest ohne große Instabilitäten und Nichtlinearitäten verläuft:
Ansonsten würde bei der formal vorgenommenen Aggregierung der Daten im Rahmen der
statistischen Auswertung über unterschiedliche Verläufe aggregiert, wo ggf. dieselbe „Dosis“
von X einmal fast nichts, ein anders mal extrem viel verändert. Mittelwerte würden dann
weitgehend Artefakte der zufälligen Mischung unterschiedlichen Phasen abbilden und
weniger über X (im Verlgeich z.B. zur Kontrollgruppe oder zu einem anderen Ansatz Xa)
aussagen.
Eine letzte der hier (keineswegs erschöpfend vgl. Kriz 1996, 2006) aufzuführenden
impliziten Voraussetzungen ist, dass außer X keine weiteren bedeutsamen Wirkvariablen im
Experiment wirken. Wie ist es aber beispielsweise mit der „therapeutische Beziehung“ in der
VT? Inzwischen wird deren Bedeutsamkeit auch für die VT nicht bestritten. Doch wo findet
sich in der VT-Theorie eine genaue Herleitung dessen, was mit „therapeutische Beziehung“
in diesem Ansatz gemeint ist? Und da wohl kein Verhaltenstherapeut die Sicht für akzeptabel
hielte, dass VT lediglich ein „add-on“ zur Wirkvariable „therapeutische Beziehung“ ist, wie
sie beispielsweise in der Gesprächspsychotherapie fundiert theoretisch hergeleitet und
empirisch erforscht ist: Wo sind die Dismantling-Studien, welche den Einfluss dieser
Wirkvariablen von der „eigentlichen“ VT bestimmen können.
Um Missverständnisse zu vermeiden sei an dieser Stelle explizit betont, dass die Diskussion mit
Verweisen auf die VT nicht deshalb erfolgt, weil diese als besonders kritikwürdig angesehen wird,
sondern weil die VT von allen Ansätzen noch am ehesten mit dem klassisch-experimentellen
Paradigma übereinstimmt und sich in der Betonung von RCT-designs auch primär auf dieses beruft.
Daher ist es wichtig zu zeigen, dass auch die VT jenseits von idealisierter Grundlagenforschung mit
diesem Paradigma in Schwierigkeiten gerät, wenn es um Aussagen über die Wirkung realer Psycho-
therapie geht. Diese Vorbehalte gelten daher mindestens ebenso bei anderen Richtungen der
Psychotherapie allerdings haben diese auch gar nicht den Anspruch, in ihren wesentlichen Aspekten
durch das klassisch-experimentelle Paradigma abgebildet zu werden.
Es gibt somit viele implizite aber notwendige Voraussetzungen für die Angemessenheit der klassisch-
experimentellen Perspektive auf Fragen der Psychotherapie. Dass diese auch nur hinreichend erfüllt
sind, darf nach der obigen Diskussion besonders dann bezweifelt werden, wenn man nicht über die
Bedingungen im Labor, sondern über ein Verfahren in der realen Anwendung urteilen will. Für die
Psychotherapie ist daher zwar Grundlagen- und Laborforschung wichtig aber eben nicht nur: Denn
nur wenige PP und KJP werden Forscher im engeren Sinne. Die meisten gehen in die reale Praxis.
Daher gilt es, sich in einem Behandlungs- und Anforderungsalltag zu orientieren, in dem die Patienten
eben nicht (und auch nicht Modellhaft angemessen) als Realisation von reinen Störungen betrachtet
werden können, sondern wo die Komplexität ihrer in Störungen manifestierten Lebens- und
Leidensgeschichten mit dem Begriff „Komorbidität“ belegt wird.
Dabei ist selbst die Bezeichnung „Komorbidität“ irreführend. Denn Patienten „haben“ nicht zwei oder
mehrere reine Störungen so wie Fußpilz und Grippe sondern ihre komplexen Leiden sind diagnos-
tisch nur in mehreren Kategorien erfassbar. Das ist ein wesentlicher Unterschied. Deshalb ist die für
klassisch-experimentell Forschungsdesigns so notwendige Manualisierung selbst für die VT in der
Alltagspraxis auch recht fragwürdig, weil die weiteren Verläufe und Dynamiken der Behandlung nur
sehr bedingt Standardverläufen entsprechen ja, oft nicht einmal über längere Verläufe geplant
werden sondern ständig individuell neu adjustiert werden müssen. Nicht umsonst betont auch Zarbock
(2010, S.126): „Verhaltenstherapie stellt eben nicht die Behandlung von Diagnosen mit medika-
tionsähnlichen Standardinterventionen dar.“ Die – ohne Zweifel wichtigen und interessanten
Ergebnisse aus der Psychotherapieforschung im klassisch-experimentellen Paradigma haben somit nur
sehr artefizielle Aussagekraft für die reale Psychotherapiepraxis.
Konsens besteht ohnehin unter Wissenschaftstheoretikern dahingehend, dass Psychotherapie-Praxis
nicht als Anwendung von Psychotherapie-Theorie verstanden werden kann. Selbst für die klassische
Verhaltenstherapie bei welcher der Gedanke der Anwendung von Theorie vielleicht noch am ehesten
naheliegen könnte hat schon Westmeyer (1978, 1980) gezeigt, dass sie (bzw. Teile davon) nicht als
„angewandte Lerntheorien“ verstanden werden kann. Stattdessen plädiert er, wie auch Perrez (1982a,
b) dafür, Theorie im Rahmen von Psychotherapie bestenfalls als Bereitstellung von „technologischen
Regeln“ zu verstehen, nämlich als Aufforderungen, in bestimmten Situationen bestimmte Maßnahmen
zu ergreifen um bestimmte Ziele zu erreichen Diese problematische Theorie-Praxis-Realtion gilt aber
nicht nur für die Psychologie und Psychotherapie sondern ebenso für viele naturwissenschaftliche
Bereiche und die Verwendung der wissenschaftlichen Ergebnisse für die Praxis.
Der Bias des RCT-Ansatzes
Gleichwohl lässt sich die Frage auch anders herum stellen: Unter welchen Bedingungen passt das
Modell der experimentellen Forschung und das RCT-Design zumindest hinreichend brauchbar? Geht
man dieser Frageperspektive nach, so ist jenseits des Labors ein solches Modell für die Praxis dann
hinreichend brauchbar, wenn diese Praxis eben entsprechend den Bedingungen gestaltet werden kann
bzw. typischerweise so gestaltet wird. Dies nun wiederum ist besonders bei der Entwicklung und
Evaluation von Programmen der Fall, in denen die Aspekte in der Seligman Liste eben auch zu
standardisierte Vorgehensweisen in der Praxis umgesetzt sind also auch bei psychotherapeutischen
Programmen: Sind z.B. in einer Klinik für den 6-wöchigen Aufenthalt 10 Sitzungen für eine
bestimmte Störung vorgesehen, in denen jeweils ein sehr klar vorgegebenes Programm durchgeführt
wird, so sind die o.a. Bedingungen 3, 4, 5 und 7 per se erfüllt. Und 1, 2, 6 und 8 ließen sich leicht für
eine Untersuchung realisieren bzw. stehen für die reine Praxis in keinem Widerspruch zum
ehemaligen Forschungsdesign. Um die Wirksamkeit der Anwendung von Programmen zu prüfen,
sind RCT-Studien somit gut brauchbar.
Wie brauchbar ist dieser Ansatz aber zur Beurteilung der Wirksamkeit von Psychotherapie, bei
welcher die Behandlung typischerweise nicht nach einem vorgegebenen Programm erfolgt sondern auf
einer dynamischen Passung von eher allgemeinen Prinzipien an die gegenwärtiger Problem-Situation
beruht (wobei in die „Problem-Situation“ recht viele Aspekte einfließen können: von der genetischen
Disposition über biographische Strukturierungen, Lerngeschichten, aktuelle Belastungen,
Symptomstabilisierungen im sozialen Umfeld etc. etc.). Wird also entsprechend der spezifischen
aktuellen Situation das konkretes therapeutisches Vorgehen aus bestimmte Prinzipien erst entfaltet und
in passend umgesetzt, so sind die zentralen Bedingungen 3, 4 und 7 sind somit typischerweise nicht
anwendbar. Bedingung 7 wird sogar als Artefakt gesehen, wenn man „komorbide“ Patienten so
versteht, dass diese (meist) nicht „mehrere Störungen haben“, sondern eine „Störung“, deren
Symptome ggf. mehreren diagnostischen Kategorien zugeordnet werden kann. Über Bedingung 5
kann man sich einigen sie sollte nicht zu sehr an den essentiellen Aspekten der Störung vorbeigehen.
Ob also z.B. der Fokus auf der „Zahl der berichteten Orgasmen“ eher als ein Heilungskriterium
angesehen wird oder selbst Ausdruck als einer Störung (wie schon Wilhelm Reich) betonte, bedarf
einer inhaltliche Diskussion.
Fasst man diese Argumente zusammen, so lässt sich sagen: Um die Wirksamkeit von Therapieformen
zu prüfen, die in spezifischer Passung Kriterien entfalten sind RCT-Studien somit unangemessen.
Natürlich kann man auch diese Therapieformen auf programmartige Vorgehensweisen, unter den o.a.
Standardbedingungen reduzieren und damit die Forderung nach RCT-Studien für diese „Varianten“
erfüllen. Gezwungenermaßen wurden solche Studien auch für Vorgehensweisen durchgeführt, die
nicht zu dieser Forschungslogik passen - denn auch in den USA ist eine Gruppe sehr einflussreich, die
unter dem Begriff „Empirically Supported Treatment (EST)“ (empirisch gestützte Behandlungen) nur
RCT-studien als einzige Form der empirischen Forschung ansieht obwohl die Lehrbücher über
empirische Forschungsmethoden auch in den USA zahlreiche andere Ansätze enthalten. Es sollte aber
klar sein, dass ein solcher Forschungsansatz eben unangemessen ist und das Wesentliche verfehlt. Es
ist ein wenig so, als wenn die Autolobby lediglich den Nachweis gelten lässt, wie schnell man auf
Autobahnen vorankommt und dabei das Essentielle ignoriert, dass dies für die Beurteilung von PKW
LKW sinnvoll sein mag, aber nicht für Pferde auch wenn man diese zwingen kann, sich am
Wettrennen auf Autobahnen zu beteiligen. Doch dies ist nicht nur unangemessen, sondern entwertet
auch die Leistung der Pferde, z.B. über Hecken, Zäune und in unwegsamem Gelände voranzukommen
und somit auch solche Menschen zu erreichen, die nicht an den Hauptstraßen angesiedelt sind.
Ein weiterer Aspekt des Bias des RCT-Ansatzes liegt in der Nicht-Berücksichtigung der
Passungsproblematik nach dem allgemeinen Modell von Psychotherapie (AMP) nach Orlinsky &
Howard (1987): Eigentlich gehört es heute zum Minimalstandard einer angemessen komplexen
Diskussion, zumindest auf diese Passung einzugehen und diese in den Designs zu beachten. Wobei das
kategoriale AMP-Modell angesichts der Komplexität in der Praxis immer noch als recht vereinfachend
bezeichnet werden muss. Aber es berücksichtigt zumindest folgende Passungen (vgl. die Abbildung)
Die Passung Behandlungsmodell und Störungsmodell.
Die Passung Patient und Behandlungsmodell
Die Passung Therapeut und Patient
Die Passung Therapeut und Störung des Patienten
AMP Allgemeines Modell von Psychotherapie Orlinsky & Howard (1987)
Sieht man sich dazu die faktische an RCT- und EbM orientierte Forschung an, so ist diese nicht nur
ausschließlich auf den ersten Aspekt ausgerichtet (Relation zwischen Behandlungsmodell und
Störungsmodell). Vielmehr wird selbst diese Relation auf das reduziert, was mit den Linien umrandet
wurde nämlich Interventionstechniken, welche auf Patientensymptome wirken. Wiederum ist die
Fokussierung auf störungsspezifische Interventionstechniken als Untersuchungsmethodik für
Programme noch vertretbar, für andere Konzepte von Psychotherapie hingegen ist diese Sicht
unzulässig beschränkt.
Was misst die Effektstärke ?
In den Diskursen zur Bewertung von Psychotherapie spielt spätestens bei der Zusammenführung der
Studien zu Metaanalysen –eine Maßzahl eine zentrale Rolle, die „Effektstärke genannt wird. Diese
Effektstärke, ES, ist üblicherweise wie folgt definiert und operationalisiert (vgl. Reinecker 1996):
ES = (Me Mk)/ Sk
wobei:
Me = Mittelwert von T der Experimental( = Behandlung-)gruppe i.d. Post-Messung
Mk = Mittelwert von T der Kontrollgruppe i.d. Post-Messung
Sk = Standardabw. von T der Kontrollgruppe i.d. Post-Messung
T = Test-/Messvariable (z.B. ein klinischer Test)
Dieser ES wird deshalb eine so bedeutsame Stellung eingeräumt, weil die Ergebnisse
unterschiedlicher RCT-Studien auf sehr unterschiedlichen Vergleichsgruppen, Ausgangsbedingungen,
Zielgrößen etc. beruhen. Der Begriff „Effektstärke“ suggeriert, dass hier auch tatsächlich die Stärke
des Behandlungseffektes gemessen bzw. vergleichbar gemacht wird und so wird er in den Diskursen
auch verwendet.
In Wirklichkeit kann ES aber nur recht bedingt etwas über Effektivität aussagen. Der Grund liegt
darin, dass aus der obigen Formel hervorgeht, dass ES dann groß ist:
i) wenn auch Me - Mk groß ist - das ist weitgehend wohl auch das, was man sich unter “Effektivität”
vorstellt.
ii) wenn Sk klein ist - das aber hat fast nichts mit Effektivität zu tun, sondern hängt von
Besonderheiten der Gruppe ab
Insgesamt “misst” ES somit eher statistische Diskriminierung zwischen zwei Gruppen und nicht das,
was man sich inhaltlich klinisch unter “Effektivität” vorstellt. Es kann die therapeutisch relevanten
Beziehungen im Vergleich ggf. sogar ins Gegenteil verkehren. Hierzu ein Demonstrationsbeispiel, mit
einfachen, runden Zahlen.
Annahme: Man habe eine klinisch relevante Testgröße T, diese liege zwischen 0 (völlig störungsfrei)
und 100 (schwerst gestört). Der Mittelwert von T in der Normalbevölkerung sei 40, die
Standardabweichung 15
Fall A: homogene, störungsspezifische Gruppe:
M (der störungsspezifischen Grundgesamtheit) sei 60 (wo auch der Postwert Mk der Kontrollgruppe
bleibe), s sei 5 (und bleibe es für die Postwerte der Kontrollgruppe);
die Therapie erbringe eine mittlere Verbesserung um 10 Punkte, d.h Me = 50
Es gilt dann:
ES = (Me - Mk)/Sk = (50 - 60)/5 = 2,0 - man würde sagen: eine hohe Effektstärke !
Fall B: heterogene, “Mischgruppe”:
Wieder sei M = 60 (also im Mittel genau so gestört wie oben), s sei 15 (das spiegelt realistisch die
Heterogenität wieder)
die Therapie erbringe eine mittlere Verbesserung um 20 Punkte, d.h Me = 40
Es gilt dann:
ES = (Me - Mk)/Sk = (40 - 60)/15 = 1,3 - scheinbar eine deutlich geringere Effektstärke !
De facto aber liegt in diesem Beispiel bei Fall B das Me der Behandlungsgruppe nach der Therapie
genau auf dem der Normalbevölkerung (40). Die Behandlungsgruppe ist somit nach der Therapie als
“völlig normal” anzusehen;
In Fall A hingegen, trotz der um 50% höheren Effektstärke, liegt die Behandlungsgruppe 10 Punkte
über (=schlechter) der Normalbevölkerung; Daraus folgt (sofern s gleich geblieben ist): über 97,5%
der Behandlungsgruppe liegen hier über dem Mittel der Normalbevölkerung, sind also gestörter.
Fall A hat somit die deutlich höhere Effektstärke, Fall B aber die deutlich höhere Effektivität der
Therapie !
Die inhaltlichen Zusammenhänge, in denen in der Literatur über “Effektstärke” gesprochen wird,
lassen zweifeln, dass diese formalen Zusammenhänge bzw. Unterschiede hinreichend bei „Klinikern“
bekannt sind und dass bewusst ist, dass mit “Effektstärke” lediglich eine spezifische statistische
Diskriminationsfähigkeit zwischen Gruppen gemeint ist. Diese statistische Diskriminationsfähigkeit
ist im Fall A unbestritten höher - doch was haben die Therapeuten oder die Patienten davon ?
Vielmehr wird meist so getan, als messe die Effektstärke tatsächlich und unbesehen einen
therapeutischen Effekt. Es zeigt sich darüber hinaus, dass es falsch wäre, Effekte in heterogenen,
störungs-unspezifischen Gruppen als weniger bedeutsam oder aussagekräftig abzutun: zumindest in
formal-quantitativer Hinsicht ist eher das Gegenteil richtig (da störungs-unspezifische Gruppen
typischerweise eher eine größere als eine kleinere Varianz gegenüber homogenen Gruppen
aufweisen).
Evidenzbasierter Quark
Computer, mathematische Modelle und Rechenvorschriften sagen per se nichts über den Sinn oder
Unsinn ihrer Verwendung aus. Daher lassen sich Daten aus berechneten Effektstärken auch dann in
eines der üblichen Computerprogramme für Metaanalysen füttern, wenn die inhaltliche Fragestellung
als unsinnig zu erkennen wäre sofern man nicht einer Mystifikation von Zahlenwerten aus
Computerprogrammen unterliegt sondern seinen fachlichen Sachverstand bemüht. Ein Beispiel für
einen offenkundigen Missbrauch von Effektstärken zum Zwecke von Metaanalysen und scheinbar
evidenzbasierten Aussagen, stellt das von Norcross herausgegebene Werk dem Titel „Evidence-Based
Therapy Relationships“ dar.
1
Dieses enthält 13 Beiträge, die jeweils Metaanalysen zu „Elementen“
bzw. „Faktoren“ der therapeutischen Beziehung durchführen. Solche „Elemente“ sind u.a.
therapeutische Allianz, Zielübereinstimmung, Management von Gegenübertragung, positive
Wertschätzung, Kongruenz oder auch Empathie. Jedem „Element“ ist ein Kapitel mit einer
Metaanalyse gewidmet. Wohlgemerkt: jedem einzelnen. Dies führt dann u.a. zu Aussagen, dass
Empathie (57 Studien, 3599 Klienten) „nachweislich“, positive Wertschätzung (18 Studien) aber nur
„wahrscheinlich“ effektiv wirkt. Und für Kongruenz (16 Studien 863 Klienten) gebe es „noch keine
hinreichende Evidenz“ für Wirksamkeit. Das sind beachtliche Unterschiede in der Bewertung – die
aber mehr für statistische Akribie denn für substantielle Erkenntnis sprechen: Die mittlere Korrelation
zwischen „Element“ und „Behandlungserfolg“ beträgt als Effektstärke für Empathie .31 für positive
Wertschätzung .27 und für Kongruenz .24.
Zu kritisieren ist nicht nur, wie artefaktanfällig solche Unterschiede sind. Wichtiger ist die Frage, ob
z.B. in allen 57 Studien mit Daten zur „Empathie“ überhaupt hinreichend das Gleiche darunter
verstanden wurde. Oder wie weit dies für „Behandlungserfolg“ gilt. Und hatte nicht Rogers, auf den
diese Konzepte zurückgehen, einst betont, dass es sich um drei untrennbare, wechselwirkende Aspekte
einer Haltung handelt?
Das Vorgehen von Norcross und seinen Autoren zur Analyse der „Evidenz“ und „Effektstärke“
entspricht daher einer Studie, welche den Einfluss unterschiedlicher Zutaten wie Salz, Pfeffer, Milch,
Quark, etc. auf das Ergebnis eine schmackhafte Mahlzeit wie folgt untersuchen wollte: Man stellt
einige hundert Speisen mit genauen gemessenen (aber variablen) Mengen an diesen Zutaten her und
lässt die Endprodukte dann von größeren Gruppen randomisiert zugewiesenen Essern auf einer Skala
hinsichtlich bestimmter Gütekriterien beurteilen. Zusätzlich könnte man ggf. noch objektive Daten wie
Magensäure, Verdauungsaktivität und viele medizinische Parameter erheben. Im nächsten Schritt
würde man aus diesen Daten mit Hilfe metaanalytischer Algorithmen berechnen, wie groß der Einfluss
von Salz, der von Pfeffer, der von Milch, der von Quark etc. auf diese Ergebnisse ist.
Auch ohne große Methodenkenntnisse läßt sich der Unsinn einer solchen Untersuchung in der schon
intuitiv erfassbaren Tatsache erkennen, dass in den unterschiedlichen Gerichten der Einfluss der
1
Zu finden unter www.nrepp.samhsa.gov/pdfs/norcross_evidence-based_therapy_relationships.pdf, allerdings
auch etwas erweitert als Buch (Norcross 2011) und, mit Wampold zusammen, auch Heft 1/2011 von
Psychotherapy.
Zutaten, ihre Wechselwirkung, Reihenfolge etc. bereits so komplex sind, dass Fragen wie: „Ist der
Einsatz von Quark beim Essen überhaupt evidenzbasiert?“ oder: „Zu wieviel Prozent (oder mit
welcher Effektstärke) trägt Salz zu einer guten Mahlzeit bei?“ obsolet sind. Sie sind viel zu allgemein
gestellt und müssten daher zumindest für die unterschiedlichen Mahlzeiten, aber auch für spezifische
Umsetzungen (z.B. Reihenfolge) der Zutaten, differenziert werden.
Dies wird sofort deutlich, wenn man sich vorstellt, dass Pfeffersteak mit anschließendem
Schokopudding ggf. sehr schmackhaft sein kann (wobei es auch dort auf etliche weitere Details
ankommt: Es ist z.B. wenig ratsam, das Steak so lange in der Pfanne zu braten wie man derweil den
Schokopudding rührt). Pfeffersteak und Schokopudding beides auf einem Teller verrührt oder gar in
nur einem Gefäß gleichzeitig zubereitet, dürfte dagegen nur wenige begeistern. Und wenn man bei
denselben Zutatenmengen als Gänge erst die Milch mit Pfeffer, dann das Steak mit Schokopulver
und zum Nachtisch eine Prise Salz anbieten würde, würde dieses Menü kaum besser ankommen.
Die Zutaten sind somit beim Kochen zwar nicht irrelevant, sagen aber letztlich wenig darüber aus, wie
schmackhaft die ganze Mahlzeit wird. Hinzu kommt, dass es erhebliche Vorlieben und Gewohnheiten
gibt, was besonders in Multi-Kulti-Gesellschaften verhindern dürfte, dass es jemals nur zwei
„Richtlinien-Kochbücher“ geben wird.
Freilich ist die exzessive Zerlegung therapeutischer Prozesse in metaanalytisch isolierbare „Elemente“
keineswegs neu: In zahlreichen Lehrbüchern (übrigens auch bei Norcross) geistert ein
Tortendiagramm herum, das auf Asay &Lambert (1999/ 2001) zurückgeht, wonach 30% der
Verbesserung in Therapien auf die therapeutische Beziehung zurückgehen soll (40% auf
extratherapeutische Variablen, 15% auf Erwartungseffekte und nur 15% auf die gewählte Technik).
Diese Zahlen sind für viele, welche die Bedeutsamkeit der therapeutischen Beziehung nicht
vernachlässigt wissen möchten, natürlich erfreulich. Sie sind dennoch numerischer Unsinn. Und die
Aussagen sind nichts weiter als pseudo-quantitative Datenbelletristik. Was würden wir z. B. mit einer
Aussage anfangen: „Im Mittel sind die Gewässer in Deutschland 162,7 cm tief“? Zu Recht würden wir
doch fragen: Welche Gewässer? Sind es die großen Flüsse, wie Rhein, Elbe etc., oder auch die
kleinen, wie Hase, Düte usw.? Und wie steht es mit Gartentümpeln oder Baggerseen? Und falls nur
Flüsse gemeint sein sollen: Wo wird denn gemessen: näher an der Quelle oder an der Mündung?
Genauso klar ist, dass die Wirk-Anteile im Therapieprozess nicht konstant und unabhängig sind und
z.B. von der Art der Störung oder dem jeweiligen Ansatz abhängen: Sie sind (hoffentlich) im
humanistischen Ansatz eher höher als bei verhaltenstherapeutischen Vorgehensweisen, wo
andersherum die dort zentralen Techniken vermutlich mehr als 15 % des Erfolgs ausmachen. Jede
quantitative Aussage hängt somit von der Mischung an unterschiedlichen therapeutischen
Vorgehensweisen ab.
Die Aussage von Asay & Lambert ist daher nicht falsch denn sie bezieht sich auf das Ergebnis einer
Reanalyse mit einer ganz bestimmten Mischung an unterschiedlichen therapeutischen
Vorgehensweisen. Aber für eine ganz bestimmte Mischung an „Gewässern“ wäre eben die obige
Aussage von 167,2 cm für die „mittlere Tiefe deutscher Gewässer“ ebenfalls nicht falsch. Allerdings
würden wir für einen anderen Mix auch andere Anteile der Faktoren erwarten bzw. eine andere
mittlere Gewässertiefe. Und genau wie bei den Gewässern gibt es auch für „Psychotherapie“ per se
keinen „richtigen“ oder zumindest „angemessenen“ Mix hinsichtlich globaler Gesamtaussagen. Denn
woran sollte man auch die Richtigkeit eines solchen Mixes messen? Die Quantifizierung ist daher
nicht falsch oder richtig, sie ist schlicht sinnlos.
Dieser alte aber übermäßig oft zitierte Unsinn von Asay & Lambert ist also in Norcross’
Sammlung nur nochmals potenziert. Dass bei dieser missbräuchlichen Anwendung maßanalytischer
Vorgehensweisen renommierte Forscher wie Wampold, Elliott, Greenberg oder Lambert mitgewirkt
haben, macht die Sache keineswegs besser, sondern eher noch bedenklicher. Denn die nichtlinearen
Wechselwirkungen und damit die Unangemessenheit des Ansatzes sind eigentlich auch ohne große
Methodenkenntnis offensichtlich. Recht anschaulich hat Plaum (1999) in einer kurzen fiktiven aber
nicht untypischen Fallgeschichte die zugrundeliegende Problematik dargestellt. Daran wird deutlich,
wie fragwürdig es ist, in komplexen Prozessräumen, wie dies für Psychotherapie typisch ist, nach
isolierbaren Wirkfaktoren zu suchen:
„...Aufgrund der Distanz von zuhause war Frau X. in der Lage, ein anregendes Klima, eine
reizvolle Landschaft, positiv auf sich wirken zu lassen, was durch die entspannende Wirkung
der Bäder verstärkt worden ist; dass es Mitpatienten gibt, denen es offenbar schlechter ging
als ihr, hat Frau X. neuen Lebensmut gegeben und sie offener für andere Menschen gemacht;
die daraufhin möglichen Gespräche konnten ihr wiederum veränderte Lebensperspektiven
nahebringen; schließlich hat der Masseur bei Frau X. erotische Gefühle ausgelöst, die
wiederum in der geschilderten aktuellen sozialen Situation zur Realisierung eines
„Kurschattens“ führten; dieser hat aufgrund seiner anziehenden Wirkung Frau X. zu der
Überzeugung bringen können, dass es doch besser sei, die Diätvorschriften einzuhalten und
nicht etwa sich am Nachmittag ins Café zu setzen, um dort die Sahnetorte zu verspeisen ...“.
Zu Recht fragt Plaum die Suche nach Wirkfaktoren in einer komplexen Welt glossierend - „Was hat
zur Verbesserung des gesundheitlichen Zustandes von Frau X. während einer Kur geführt? Bäder?
Massagen? Das Klima? Die Distanz von zuhause? Der Kontakt zu Mitpatienten? Der ‚Kurschatten’?“
Im gewählten Beispiel muss man sagen: wohl alles „irgendwie“. Doch nichts wirkt als isolierbarer
„Faktor“ als solcher – und auch nicht im Sinne varianzanalytischer Wechselwirkung „zusammen“.
Denn man kann sich gut vorstellen, dass in Gruppen mit Personen unter „fast“ genau denselben
Bedingungen die Gesamtwirkung völlig unterschiedlich ausfällt. Ein Forschungs-Ansatz, bei welchem
der Einfluss des Kurschattens, oder des Masseurs etc. als unabhängige Variable in einem RCT-Design
untersucht werden soll, wäre daher entsprechend lächerlich. Und bei einem anderen Patienten wirken
vielleicht in derselben Kurklinik andere Aspekte zusammen. Man kann sogar davon ausgehen, dass
die Patienten selbst auch etwas Kompetenz besitzen, aus den reichhaltigen Programmen und
komplexen Möglichkeiten einer solchen Klinik das auszuwählen, was für sie gut ist. Und dass es
vielleicht reicht, sie bei dieser Wahl und bei der Reflexion darüber zu begleiten und zu beraten.
Eine solche Sicht passt nicht in die Forschungsdesigns, nach denen sich die Psychotherapie in ihrem
Nachweis von Effektivität und empirischer Evidenz ausrichten muss. Dennoch wäre es wohl falsch,
Kurkliniken als „unwirksam“ oder „wissenschaftlich nicht anerkannt“ zu brandmarken und aus der
BRD zu verbannen, so wie es in den ambulanten Praxen mit fast allen psychotherapeutischen
Angeboten nach dem Psychotherapeutengesetz von 1999 geschehen ist. Es ist ja ohnedies mehr als
merkwürdig, dass in deutschen Kliniken sehr wohl vieles von dem eingesetzt und im Kassensystem
abgerechnet wird, was angeblich „nicht wirksam“ sein soll obwohl (oder gerade weil) Kliniken mit
sehr spitzem Bleistift rechnen müssen und sich keine überflüssigen Ausgaben leisten können. Aber sie
wissen, wie gute Hausärzte, um einen eher ganzheitlichen Heilerfolg, der nicht beliebig in
Einzelfaktoren zerlegt werden kann so wie eine Körperzelle in einzelne materiellen Bestandteile
zerlegt werden kann, die aber jeweils kein „Leben“ ausmachen. Dennoch gibt es zahlreiche
Möglichkeiten, den Erfolg einer Kurklinik bei den Patienten zu evaluieren um sicherzustellen, dass
mit Steuer- und Krankenkassengeldern nicht einfach Unwirksames bezahlt wird. Dies würde
allerdings ein Umdenken in dem bedeuten, was heute in der BRD unter „Evidenzbasierung“
verstanden wird.
Ist EbM auf RCT-Basis wirklich notwendiger Standard?
Sieht man sich Diskurse an, mit denen hierzulande über EbM diskutiert wird und welche Art von
Forschung man dabei als relevant bzw. als irrelevant ansieht, so wird deutlich, wie stark ein guter
Ansatz für andere Zwecke umfunktioniert wird. Bereits David Sackett (der „Vater“ der EbM) sah sich
genötigt, kritisch vor "top-down cook-books", dem "misuse of evidence based medicine" zu warnen
und darauf hinzuweisen, dass EbM allzu oft von „Kaufleuten“ und Managern dazu eingesetzt wird,
einfach Kosten zu senken (Sackett 1996). Und auch das Deutsche Cochrane Centrum betont auf seiner
Website: „Für viele Fragestellungen stehen keine RCT’s oder systematischen Übersichten zur
Verfügung, oder sind aufgrund der Studienfrage nicht sinnvoll oder nicht durchführbar. EbM bezieht
sich daher ausdrücklich auf die jeweils ’bestverfügbare Evidenz’. Dies kann in Einzelfällen auch
einmal ein Expertenkonsens oder ein Ergebnis aus der Grundlagenforschung sein“.
2
Und eigentlich
sollte es nachdenklich stimmen, wenn selbst führende Vertreter der EbM in Deutschland, wie Norbert
Schmacke (2006), explizit auf die Berücksichtigung auch qualitativer Methoden verweisen.
Doch die Gremien, welche in der BRD darüber die Entscheidungsmacht zugesprochen bekommen
haben, welche Psychotherapie Patienten im Rahmen der Praxen in Anspruch nehmen dürfen, haben
für EbM inzwischen in hohem Maße zweckentfremdet. Es geht kaum noch um die gute Kernidee, mit
EbM Wissen und Entscheidungshilfen für Ärzte und Psychotherapeuten bereitzustellen. Sondern EbM
wird zum Mittel der Selektion in berufs- und verbandspolitischen Konkurrenzkämpfen
umfunktionalisiert und dazu zunächst in seiner Komplexität beschnitten und auf ein ebenso einfaches
wie fragwürdiges Grundmuster reduziert: Letztlich werden nur RCT-studien gezählt und alle anderen
Informationen und Belege aus wissenschaftlichen Studien über die Wirksamkeit eines
Psychotherapieverfahrens missachtet und damit entwertet. In dieser Hinsicht haben der Gemeinsame
Bundesausschuss, G-BA, und die deutschen Bundegerichte leider eine verheerende Entwicklung
eingeleitet: Der G-BA ist zwar „nur“ für die sozialrechtliche Zulassung zuständig. De facto aber kann
ohne eine solche „GB-A Anerkennung“ nur unter so extrem erschwerten und verteuerten
Bedingungen (nämlich selbstzahlende Privatpatienten) die auch notwendigen Ausbildungstherapien
organisiert werden, dass z.B. der Ausbildungsgang an der Universität Hamburg in
Gesprächspsychotherapie (GPT) wieder eingestellt werden musste. Daher war mit dem obskuren
Bewertungs-Verfahren im G-BA, an dessen Ende die Verweigerung der sozialrechtlichen
Anerkennung der GPT stand, faktisch die gesamte Humanistische Psychotherapie in Deutschland
administrativ entsorgt. Dass die Expertengruppe der Bundespsychotherapeutenkammer, alles
international renommierte Psychotherapieforscher, im „Psychotherapeutenjournal“ nur resümierend
feststellen konnte: es „stellt sich heraus, dass der G-BA seine Beurteilung nicht auf der Grundlage des
aktuellen Standes der wissenschaftlichen Erkenntnisse vorgenommen hat und so zu einem Ergebnis
kommt, das weder von der Wissenschaft noch vom Berufsstand geteilt wird. Es erhebt sich der
Verdacht, dass ein Interessenkonflikt vorliegt“ (Strauß et al. 2010, S. 160), nutze letztlich wenig: Die
obersten Gerichte (Bundesverwaltungsgericht und Bundesozialgericht) entschieden letztlich aus
formaljuristischen Erwägungen sich auf die inhaltliche Sache einzulassen, hatten die Richter
offensichtlich keine Lust dass der G-BA juristisch gesehen faktisch beliebige Handlungsfreiheit hat
und so willkürlich und wenig fachgerecht vorgehen darf.
3
Juristisch so gestärkt nutzt der G-BA nun auch für den zweiten großen Bereich, die systemische
Psychotherapie, bisher alle Möglichkeiten, um das Verfahren zu verschleppen. Angesichts solcher
2
Siehe www.cochrane.de
3
In der Tat muss bezweifelt werden, dass beim G-BA nur einfach Inkompetenz am Werk war, da er seiner
„Prüfung“ ganz gezielt eine Definition des Verfahrens zugrunde gelegt hat, welche die einhellige Definition der
Fachprofessoren ebenso wie die gängigen Lehrbücher einfach ignorierte. Eine detailliertere Dokumentation ist
unter www.aghpt.de/indec.php/texte/57-gba-skandal zu finden.
interessengeleiteten Willkür ist fraglich, wie weit nicht auch der dritte große Bereich die
psychodynamische Psychotherapie in Deutschland administrativ entsorgt wird und letztlich eine
Monokultur des vierten psychotherapeutischen Verfahrensclusters, der Verhaltenstherapie, übrig
bleibt. Dass die Vertreter der psychodynamische Psychotherapie, die in vielen wichtigen Gremien
bedeutendes Mitspracherecht hatten, diese Entwicklung aus welchen Gründen auch immer
mitgetragen oder gar mit gefördert haben, ist fatal. Allerdings ist dies nicht Thema dieses Beitrags.
Dass Gremien aus Funktionären, wie der G-BA, unter dem Einfluss o.a. massiver Lobbyarbeit nicht
immer fachgerechte, am Wohl der Patienten orientier Entscheidungen treffen, sondern
interessengeleitete Dynamiken allzu oft die Oberhand gewinnen, ist wenig berichtenswert. Es ist
allerdings ärgerlich, wenn die diese Interessen nicht offen ausgefochten sondern mit „Wissenschaft“
und „EbM“ argumentativ verbrämt werden.
Zu hören ist auch oft das Argument, die Psychotherapie müsse sich mit dem Beleg ihrer Wirksamkeit
eben dem Medizin-Sektor anpassen, wo längst EbM allgemeiner Standard sei. Doch auch diese
Behauptung ist fragwürdig: So stellte der deutsche „Sachverständigenrat für die Konzertierte Aktion
im Gesundheitswesen (SVR)“ noch in seinem Gutachten von 1999 klar, dass eine "Inventur des
Evidenz-Bestands" der Medizin sehr ernüchternd gewirkt habe, "weil sie aufzeigte, dass die Bereiche
gesicherten Wissens in der Medizin sehr viel kleiner und die Grauzonen sehr viel größer sind als
erwartet". Gemäß einer Übersicht von 1992 zeigte sich, dass "nur etwa 4% aller ambulant und
stationär erbrachten Dienstleistungen dem Anspruch auf belastbare Evidenz genügen, 45% genügen
einfacheren Evidenzkriterien und für den 'Rest' (rechnerisch 51%) gibt es heute keine
wissenschaftliche Evidenz" (SVR 1999, S. 79).
Im Gegensatz zu der vom G-BA vertretenen Richtlinien-Psychotherapie, die ein strikt ätiologisches
Krankheitsmodell fordert (Faber &Haarstrick 1999, S. 11 ff.) und eine "konditionalistische
Betrachtungsweise" (S. 13) von Krankheit ausdrücklich ablehnt, kommt der Sachverständigenrat zu
einer ganz anderen Gewichtung: "Vor diesem Hintergrund bedarf das ätiologische
Krankheitsverständnis einer Revision zugunsten eines konditionalen Krankheitsverständnisses, nach
dem Krankheit wesentlich von den Lebensumständen, vom Lebensstil und der patientenseitigen
Interpretation abhängt" (SVR 1999, S. 68).
In diesem Kontext wies der SVR auf die generellen Probleme der Medizin als angewandter
Naturwissenschaft hin und fordert explizit eine Ergänzung der evidence-based medicine durch die
narrative-based medicine (NbM) (Greenhalgh 1999), die sich nicht auf Naturwissenschaften, sondern
auf Phänomenologie und Hermeneutik stützt.
"Die Anwendung (der) Erkenntnisse verleiht ihr jedoch erst in einem System völlig anderer Denk- und
Bewertungsstrukturen, nämlich dem Leben des individuellen Patienten und dem gesellschaftlich
kulturellen Umfeld, ihren Sinn" (SVR 1999, S. 66).
"In der NbM wird ärztliches Handeln als ein deutender Vorgang betrachtet, der narrative Fähigkeiten
erfordert, um die 'Geschichten' der Patienten und der Kliniker mit objektivierbaren medizinischen
Befunden (z.B. Testergebnissen) zu verbinden. Die Akkumulation fallbezogener Erfahrungen (case
expertise) befähigt den klinisch tätigen Arzt, bei der klinischen Entscheidungsfindung die
angemessenste medizinische Maxime auszuwählen. Unter case expertise ist hierbei die Fähigkeit des
Arztes zu verstehen, die Geschichten und die 'Krankheitsskripte' (aber auch die klinischen Anekdoten
der Kollegen) zu verstehen und zutreffend zu deuten. Schwierigkeiten der Ärzte, wissenschaftliche Er-
kenntnisse im Kontext der klinischen Begegnung mit den Patienten angemessen umzusetzen,
entstehen aus der Sicht der NbM vor allem dann, wenn das narrativ-deutende Paradigma aufgegeben
wird und sich klinisches Handeln ausschließlich auf externe wissenschaftliche Evidenz stützt" (SVR
1999, S. 67).
Entsprechend ergänzend zum ätiologischen Modell schlägt der SVR systemtheoretische Ansätze (z.B.
das Situationskreismodell von v.Uexküll und Wesiack), insbesondere aber auch lebenswelt-
theoretische bzw. phänomenologisch-hermeneutische Ansätze vor.
"Diese Denkrichtungen gehen über den systemischen Ansatz hinaus, indem den Prozessen im System
nur eine Funktion innerhalb eines jeweiligen unter Umständen sehr engen Kontextes zugewiesen wird.
Es geht darum, den subjektiven Krankheitswert und damit die Ebene des Krankheitserlebens des
Patienten, ebenso wie die realen Konsequenzen einer Krankheit einzubeziehen. Die Bemühungen der
Medizin, Lebensqualität als Folge von Krankheit oder auch einer Therapie zu erfassen, lassen sich hier
zuordnen" (SVR 1999, S. 69).
In einem späteren Gutachten kam der SVR zu folgender Aussage, was die „evidenzbasierten
Leitlinien“ betrifft – Handlungsempfehlungen für Ärzte (und Patienten), um die wissenschaftlichen
Erkenntnisse auch tatsächlich umzusetzen:
Es „besteht das prinzipielle Problem, dass die auf populationsbezogenen empirischen Befunden
basierenden Leitlinien in ihrer praktischen Anwendung auf den individuellen Patienten bezogen
werden müssen. ... Randomisierte, kontrollierte klinische Studien, die lediglich die Effektivität (und
gegebenenfalls die Effizienz) einer Maßnahme unter artifiziellen Studienbedingungen (‚efficacy’)
beschreiben, werden in vielen Fällen überbewertet“ SVR, Gutachten 2003, S. 87)
Resümee
Resümierend lässt sich sagen, dass EbM im Ansatz und in der Intention zwar prinzipiell positiv zu
sehen ist, in der Praxis hierzulande aber durch Gremien wie z.B. den G-BA zunehmend entstellt und
zweckentfremdet eingesetzt wird. Aus dem guten Anliegen, für Praktiker einen informativen
Überblick über von ihnen schwer zu bewältige Flut an Forschungsergebnissen bereit zu stellen, wurde
missbräuchlich ein Instrument zur Selektion und Maßregelung entwickelt. Der Begriff
„Evidenzbasierung“ ist so (wortwörtlich) zu einem Schlag-Wort verkommen, um inhaltliche
Argumente und Diskurse zu unterbinden: Gut zwei Jahrzehnte nach Einführung von EbM durch die
Gruppe um David Sackett, werden die eindringlichen Warnungen des Gründers (z.B. Sackett et al.
1996) ignoriert und oft eine entstellte Form, die lediglich RCT-Studien berücksichtigt, irreführend als
„EbM“ ausgegeben.
Diese starke Betonung von RCT-Studien macht dort Sinn, wo experimentelle Designs dem
Untersuchungsgegenstand angemessen sind dies gilt neben der Apparate- und Pharmaforschung in
der Medizin vor allem dann, wenn klar definierbare und operationalisierbare Programme angewendet
werden können. Für Teile der Verhaltenstherapie und recht bedingt auch für andere
Psychotherapieansätze ist das noch hinreichend gewährleistet. Für viele andere psychotherapeutische
Ansätze hingegen, die wesentlich auf der situationsspezifischen und passungsgerechten Entfaltung von
Prinzipien beruhen, ist diese Methodik weitgehend inadäquat. Die Reduktion von EbM auf RCT-
Designs schließt somit nicht nur Teile wissenschaftlicher Methodik von vornherein aus (wie z.B. das
gesamte Spektrum qualitativer Forschung) sondern enthält zusätzlich einen starken Bias für nur eine
der vier zentralen psychotherapeutischen Grundorientierungen nämlich für die
verhaltenstherapeutische auf Kosten der psychodynamischen, humanistischen und systemischen
Grundorientierung.
Auch aus Sicht des Allgemeinen Modell der Psychotherapie (AMP) von Orlinsky & Howard (1987),
das international als Minimalkonsens über Wirkungskomplexität gilt, stellt eine auf RCT-Designs
reduzierte EbM eine unzulässige Verkürzung auf einen winzigen Ausschnitt dessen dar, was als zu
berücksichtigende Einflussgrößen unter dem Begriff der „Passung“ in die Diskurse Einzug gehalten
hat. Ignoriert werden in RCT-Designs weiterhin die essentiellen Auswirkungen von nicht-linearen
Entwicklungsverläufen, welche aber (auch) für psychotherapeutische Veränderungen typisch sind.
Eingesetzt im Rahmen von „Evidenzbasierung“ werden weiterhin modellhafte Algorithmen der
Metaanalyse. In diesen spielt das Konzept der „Effektstärke“ eine zentrale Rolle. Auf Grund dieser
Begrifflichkeit nehmen viele Kliniker irrtümlich an, es handle sich dabei um ein Maß der klinischen
Effektes von Interventionen in Wirklichkeit aber geht es um die statistische Diskriminierung zweier
Populationen, die nur unter bestimmten weiteren Bedingungen überhaupt so etwas wie klinische
Effekte abbildet. Durch eine leider nicht untypische Mystifikation von numerischen Ergebnissen, die
Computerprogramme geliefert haben, bleibt auch hier bisweilen der inhaltliche Sachverstand von
Klinikern und Therapeuten auf der Strecke.
Insgesamt gesehen ist das Ausmaß an methodischem Unverständnis und faktischem Missbrauch der
guten Idee von „Evidenzbasierung“ gerade auch von einflussreichen Gremien wie dem G-BA derart
gravierend, dass EbM daher für die Bewertung von Psychotherapie sehr kritisch gesehen werden
muss. Sie dient inzwischen wohl auch eher einer interessengeleiteten Selektion bestimmter
psychotherapeutischer Ansätze als der Information über den Stand wissenschaftlicher Forschung oder
gar dem Wohl von Patienten.
Literatur
Asay, T. P., & Lambert, M. J. (1999). The Empirical Case for the Corechtenmmon Factors in Therapy:
Quantitative Findings. In Hubble, M., Duncan, B. L., & Miller, D. (eds.), The Heart & Soul of
Change: What Works in Therapy. Washington, D.C.: American Psychological Association.
Deutsch: Asay, T. P., & Lambert, M. J. (2001). Empirische Argumente für die allen Therapien
gemeinsamen Faktoren: quantitative Ergebnisse. In: Hubble, M., Duncan B. L., & Miller, D.
(Hrsg.), So wirkt Psychotherapie (S. 4181) Dortmund: Verlag modernes lernen.
Faber, F.H. &Haarstrick, R. (1999). Kommentar Psychotherapierichtlinien. 4. Auflage. Neckarsulm:
Jungjohann Verlagsges.
Greenhalgh, T. (1999). Narrative based medicine in an evidence based world, in: BMJ Vol. 318,
30.1.1999
Kienle, G. S. et al. (2003). Evidenzbasierte Medizin: Konkurs der ärztlichen Urteilskraft? Deutsches
Ärzteblatt, 100, C1688-C1692
Kriz, J. (1996). Grundfragen der Forschungs- und Wissenschaftsmethodik. In: Hutterer-Krisch, R.
et.al.: Psychotherapie als Wissenschaft - Fragen der Ethik, Bd. 5 der "Serie Psychotherapie"
(Hrsg.: G. Sonneck), Wien: Facultas, 15-160
Kriz, J. (2000): Perspektiven zur „Wissenschaftlichkeit von Psychotherapie. In: Hermer, M. (Hrsg.):
Psychotherapeutische Perspektiven am Beginn des 21. Jahrhunderts. Tübingen: DGVT-Verlag, 43
66
Kriz, J. (2003): Gutachten über den Begriff der Wissenschaftlichkeit in der Psychotherapie in:
Punktum. Zeitschrift des SBAP, Zürich (Sonderdruck, Mai 2003)
Kriz, J. (2006). Wie evident ist klinische Evidenz? In: Bührmann, A. et al. (Hrsg.) Gesellschaftstheorie
und die Heterogenität empirischer Sozial--forschung. Münster, WD-Verlag, S. 32 43
Kriz, J. (2007): Wie lässt sich die Wirksamkeit von Verfahren X wissenschaftlich begründen? Versuch
der Präzisierung einer methodologischen Hintergrunds-Kontroverse. Psychotherapeutenjournal, 6,
258-261
Kriz, J. (2008): Vermessene Wissenschaftlichkeit. Kritische Aspekte und bedenkliche Tendenzen des
Methodenpapiers. Psychotherapeutenjournal, 7, 117-119
Kriz, Jürgen (2011): Ohne ein wenig Weisheit geht es nicht. Plädoyer gegen den Reduktionismus in
der gegenwärtigen Wirksamkeitsideologie. In: M. Wollschläger (Hrsg.). Weisheit und
Psychotherapie. Tübingen: dgvt-Verlag, S. 95 122
Kriz, J. (2012): Evidenzbasiertes Entscheiden zwischen guter Theorie und missbräuchlicher Praxis.
KERBE, Forum für Sozialpsychiatrie, H.1. 2012, S. 22-24
Kriz, Jürgen (2014): Aspekte „wissenschaftlicher“ Faktengläubigkeit – und ihr Nutzen. geographische
revue, 16/1, S. 7-19
Norcross, J. C. (2011). Psychotherapy Relationships That Work: Evidence-Based Responsiveness.
Oxford University Press
Orlinsky, D. E. & Howard, K. (1987). A generic model of psychotherapy. J. Integrative Eclectic
Psychother 6: S. 6-27. (Deutsch: 1988. Ein allgemeines Psychotherapiemodell. Integrative
Therapie 4: 281-308)
Perrez, M. (1982a). Was nützt Psychotherapie ? Psychol. Rundschau, 33, 121-126
Perrez, M. (1982b). Die Wissenschaft soll für die psychotherapeutische Praxis nicht länger tabu
bleiben. Psychol. Rundschau, 33, 136-141
Plaum, E. (1999). Weshalb fährt der IC 781 am 26. Geburtstag von Sabine M. um 13.49 Uhr mit einer
Geschwindigkeit von 82,5 km/h durch den Bahnhof Eichstätt? Oder: Das Elend mit der Suche
nach reinen Wirkfaktoren in einer hochkomplexen Realität. Gestalt Theory, 21, 191207
Reinecker, H. (1996). Therapieforschung. In: Margraf, Jürgen (Hg.), Lehrbuch der Verhaltenstherapie.
Heidelberg: Springer,. 31-47
Sackett, D.L.et al. (1996): Evidence based Medicine: What It Is and What It Isn't. British medical
journal . 312, 71-72
Schelsky, H. (1977). Die Arbeit tun die anderen. Klassenkampf und Priesterherrschaft der
Intellektuellen. München: dtv
Schmacke, N. (2006) Evidenzbasierte Medizin und Psychotherapie: die Frage nach den angemessenen
Erkenntnismethoden Psychotherapie, Psychosomatische Medizin und Medizinische Psychologie,
i.Dr.
Seligman, M.E. P. (1997): Die Effektivität von Psychotherapie. Die Consumer Reports-Studie, in:
Integrative Therapie 22,4, 264-288 (amer. Original in: American Psychologist 50, 965-974
Srauß, B., et al. (2010). Wie wissenschaftlich fundiert sind Entscheidungen des Gemeinsamen
Bundesausschusses zur Psychotherapie? Psychotherapeutenjournal, 160-168
SVR (1999): Bedarfsgerechtigkeit und Wirtschaftlichkeit, Bd. II: Qualitätsentwicklung in Medizin und
Pflege, BT-Drs. 14/5661 v. 21.3.2001
SVR (2003): Gutachten 2003. Kurzfassung (Quelle: Homepage des SVR)
Westmeyer, H. (1978). Wissenschaftstheoretische Grundlagen der klinischen Psychologie. In:
Baumann, U. et al. (Hrsg.): Klinische Psychologie Trends in Forschung und Praxis. Bern:
Huber, 108-132
Westmeyer, H. (1980). Zur Paradigmadiskussion in der Psychologie. In: Michaelis, W. (Hg.),
Kongreßber. Dt.Ges.f.Psychol S. 115-126
Zarbock, G. (2010). Der Master in Psychologie als optimale Basisqualifikation für Psychotherapeuten.
Psychotherapeutenjournal, 2, 125-129
... Diese Kriterien hat er laufend verengt, sodass er das an sich sinnvolle Konzept der Evidenzbasierten Medizin (evidence-based medicine; EbM) soweit reduziert hat, dass er nur noch Studien im RCT-Design anerkennt und alle anderen ausschliesst. Das ist ein Missbrauch des Konzepts der EbM (Kriz, 2014;Thielen & Kriz, 2018, S. 28), das gerade vorsieht, dass auch andersartige Studien für eine sinnvolle Evidenzbasierung zu berücksichtigen sind. Das schreibt der WBP (2010) in seinem Methodenpapier zwar auch, wendet aber seine eigenen Kriterien in den jüngsten Gutachten zur Humanistischen Psychotherapie und zur Gestalttherapie nicht an (GwG, 2018). ...
... Hart kritisiert wird dieser Goldstandard für die Psychotherapie auch deshalb, weil dieses Design aus der experimentellen Psychologie stammt, in einem Verständnis, dass die Person des Therapeuten oder der Therapeutin austauschbar sein sollte, also höchstens als Störvariable zu kontrollieren ist. Das mag, wie Kriz (2014) zeigt, für den Ansatz der frühen Verhaltenstherapie passen, nicht aber für psychodynamische und humanistische Verfahren. Er sieht den Wert der EbM in der Prüfung von ganzen Therapieprogrammen, nicht aber im Prüfen von Therapieverläufen, wo es andere Designs braucht, um Prozesse der Veränderung zu erforschen. ...
... Wenn nun in der Psychotherapieforschung für den vermeintlichen "Goldstandard" der RCT-Studien (randomisierte kontrollierte Studien) Daten aus Einzelverläufen aggregiert werden, unterstellt man -wie beim Sägezahnmodell von Flugkurven -einen Verlauf von Veränderung, der für die meisten Fälle schlicht falsch ist. Daran stört sich allerdings kaum jemandwie auch an weiteren fragwürdigen Annahmen der RCT-Forschung nicht (Kriz 2014b) -, weil es bei der Propagierung der RCT-Designs ohnedies weniger um Wissenschaft, sondern vielmehr um Be-rufspolitik geht. Und die Wissensbedürfnisse von Praktikern fallen hier ohnedies weitgehend unter den Tisch. ...
Article
Full-text available
Dieser Beitrag ist eine Replik auf einen kürzlich von Claus Nowak publizierten Artikel „Systemisch – was denn sonst!“. Trotz großer Sympathie für Nowaks Plädoyer, stärker die klassischen Ansätze in der Beratung wertschätzend zu nutzen – allen voran die der Humanistischen Psychologie –, zeigt unsere Analyse, dass Begriffe wie „systemisch“ und „Systemtheorie“ unser Verständnis für etliche neue Phänomene erweitern. Ein angemessener Gebrauch von „systemisch“ und die korrekte Nutzung der „Systemtheorie“ sind daher keineswegs überflüssig.
... Auch Kriz (2014) unterzieht die gängige Praxis der Therapieforschung und der Evidenzbasierung einer kritischen Analyse, wobei er den grundsätzlichen Wert der evidenzbasierten Medizin und der klassisch-experimentellen Therapieforschung anerkennt, zugleich in einer sorgfältigen methodischen Analyse auf deren Voraussetzungen, Grenzen und damit Anwendungslimitierung verweist. Behandlungs-und Anforderungsalltag des Psychotherapeuten stellen sich wesentlich komplexer dar, als dies in den experimentellen Studien abgebildet wird (Kriz, 2014). Selbst für die Verhaltenstherapie, die in ihrer Zentrierung auf Therapietechniken noch am ehesten mit einem experimentellen Design der Therapieforschung vereinbar erscheint, fordert Zarbock (2010) eine Kompetenz der Fallkonzeptualisierung, die weit hinausgreift über die "Behandlung von Diagnosen mit medikationsähnlichen Standardinterventionen" -eine Position, die unter den Anwendern der Verhaltenstherapie unstrittig ist (Zarbock, 2010). ...
Article
Full-text available
Kurzfassung Die Organisationsentwicklung in der psychosomatischen Rehabilitation ist auf zwei Ebenen durch Neueinführungen gekennzeichnet, die auf eine Qualitätsverbesserung zielen: Als evidenzbasierte Therapievorgabe wurden die Reha-Therapiestandards Depressive Störungen verbindlich eingeführt, die in elf Therapiemodulen geeignete therapeutische Leistungen aufführen, für die Mindestquoten der Erfüllung definiert sind. Zwei Module beziehen sich auf die Psychotherapie im engeren Sinne. Auf betriebswirtschaftlich-ökonomischer Ebene werden Prozessoptimierungen durchgeführt, die über das etablierte QM-System hinausreichen und unter Effizienzgesichtspunkten Personalbemessungen durchführen. Beide Bereiche – die Therapievorgaben wie auch die Prozessoptimierung – werden einer kritischen Analyse unterzogen. Limitierungen aus therapeutischer Perspektive werden aufgezeigt und therapeutisch gebotene Erfordernisse benannt. Aus der Verknüpfung beider Ebenen resultieren noch weiterreichende Konsequenzen für die Therapiegestaltung in der Rehabilitation. Die Mindestvorgaben der Therapiestandards werden unter dem Gebot der betriebswirtschaftlichen Sparsamkeit zu Maximalleistungen. Dies impliziert als Konsequenz rigide Vorgaben, Reglementierung und damit Verlust an therapeutisch gebotenem Entscheidungsspielraum für die The-rapien, ferner eine hochstrukturierte Verplanung der therapeutisch Handelnden. Dies wird weder der Kompetenz noch dem erforderlichen Handlungs- und Gestaltungsrahmen der Therapeuten gerecht. Verschiedene Aspekte einer dringend erforderlichen Flexibilität der Therapieführung werden dargelegt, so z.B. der Umgang mit Zielkonflikten, die ein indivi-dualisiertes therapeutisches Procedere erfordern. Diese Entwicklung wird in Kontrast gesetzt zu modernen Konzepten der Organisations- und Arbeitspsychologie, die – jenseits der Forma-lisierung – die Impulsgeber für Ergebnisqualität, Stresslimitierung und Mitarbeitergesundheit erforscht hat. Neben den vertrauten Top-down-Maßnahmen der Organisationsführung gewinnen nunmehr vom proaktiv handelnden Mitarbeiter ausgehende Strategien der Selbstregulierung im Sinne von Bottom-up-Maßnahmen herauszuhebende Bedeutung. Das korrespondierende Modell der Mitarbeiterführung wird als transformational gekennzeichnet. Stichwörter: Psychosomatische Rehabilitation, Reha-Therapiestandards Depression, Prozessoptimierung
... Und wenn sich bei einem Patienten in einer bestimmten Therapiestunde, in der er über sein Verhältnis zu seinem Bruder spricht, plötzlich die "Erkenntnis" einstellt: "Aha, so ist das also mit meinem Bruder", so war diese Erkenntnis nicht nach zehn Minuten zu einem Viertel oder nach zwanzig Minuten zur Hälfte vorhanden. Umso erstaunlicher ist es, dass RCT-Designs in der Psychotherapieforschung weiterhin eine so übergroße Bedeutung haben, obwohl sie die essentiellen Auswirkungen von nicht linearen Entwicklungsverläufen, die (auch) für psychotherapeutische Veränderungen typisch sind, zugunsten eines linearen Modells ignorieren (Kriz, 2014). ...
Preprint
Das Handbuch Künstlerischer Therapien besteht aus 13 Diskursen, die in zwei aufeinanderfolgenden Teilen systematisch die theoretischen Grundlagen der Künstlerischen Therapien in den Blick nehmen: Teil 1 versteht sich als Kritik der therapeutischen Praxis, Teil 2 als Philosophie der therapeutischen Praxis. Der erste Teil des Buches beschäftigt sich mit den Fragen: Ist vor dem Hintergrund handlungstheoretischer Überlegungen eine kausale Verknüpfung von Therapieziel und therapeutischer Intervention möglich? Was ist einem diagnostischen Blick überhaupt zugänglich und wie verändert der Blick seinen Gegenstand? Wie funktioniert Sprache in der Therapie und welchen Einfluss hat sie auf das therapeutische Geschehen? Welche Rolle spielen Selbsterfahrungspraktiken in der Therapie und mit welchem Verständnis von Gesundheit und Krankheit gehen sie einher? Und schließlich: Wie verhalten sich künstlerische Praktiken zu therapeutischen Praktiken und wie lässt sich ihr Zusammenhang begründen? Der zweite Teil des Buches geht den Fragen nach: Was passiert, wenn eine Grenze zwischen Kunst- und Lebensräumen gezogen, überschritten oder aufgelöst wird? Wie verhalten sich soziale Interaktionen und zwischenmenschliche Kommunikationsprozesse zu den an ihnen beteiligten Medien? Wie ist es möglich, sich künstlerisch auszudrücken und was ereignet sich an der Schnittstelle von Wahrnehmen und Darstellen? Welche Rolle spielen ästhetische Urteile in der künstlerischen Praxis und inwieweit lassen sie sich zum produktiven Ausgangspunkt für ideologiekritische Reflexionen nehmen? Wie ist es möglich, über Bilder zu sprechen? Und vor allem: Wie kann ein performatives Kunstverständnis zum Fundament der therapeutischen Praxis werden? Das Buch bewegt sich damit an der Schnittstelle zwischen künstlerischen und therapeutischen Praktiken und bringt sie aus einer philosophischen, anthropologischen und ästhetischen Perspektive in einen Zusammenhang. Das Handbuch ist sowohl für Therapeuten interessant, die sich als Künstler verstehen und mit genuin künstlerischen Mitteln arbeiten als auch für Therapeuten, die in ihrer Praxis Vorgehensweisen aus den Künsten einen Stellenwert einräumen, ohne sich selber ausdrücklich als Künstler zu verstehen. Mit dem Handbuch formulieren wir keinen geringeren Anspruch, als einen Paradigmenwechsel in den Künstlerischen Therapien zu vollziehen.
Article
Full-text available
In diesem Beitrag wird zunächst hervorgehoben, dass «Evidenzbasierung» ein gutes und nützliches Konzept ist, aber durch eine Reduktion auf RCTs inzwischen oft missbräuchlich verwendet wird. Zwar ist das RCT-Design durchaus ein hervorragendes Modell zur Untersuchung experimenteller Forschungsfragen. Dies gilt aber nur dann, wenn klar definierbare Ursachen und ebenso klar definierbare Wirkungen hinreichend isolierbar sind und diese dabei die Untersuchungsrealität brauchbar abbilden. Je grösser der Handlungsspielraum zur Gestaltung der Ursachen (Interventionen) ist und je komplexer die relevanten Wirkungen sind, desto weniger tauglich ist dieser Ansatz. Wie sodann aufgezeigt wird, eigenen sich RCT-Designs in der Psychotherapieforschung besonders dann, wenn manualisierte Programme angewendet werden. Dies ist primär für die Verhaltenstherapie der Fall. Für psychotherapeutisches Vorgehen, das wesentlich in der prozess-spezifischen Entfaltung von Prinzipien begründet ist, sprengt die grosse Variabilität der Detail-Ursachen (Interventionen) die erforderliche massenstatistische Homogenität für ein experimentelles Design. Die Forderung, Wirksamkeit vor allem mit RCT-Designs zu belegen, läuft dort auf methodische Artefakte hinaus, beziehungsweise stülpt eine bestimmte psychotherapeutische Präferenz, nämlich für die Verhaltenstherapie, auf dem Wege der Wissenschaftsmethodik anderen Psychotherapieansätzen über. Abschliessend werden noch einige weitere Reduktionen und Missinterpretationen im Zusammenhang mit RCTund Metastudien-Designs problematisiert.
Article
Full-text available
Abstract Anhand von 3 ausführlich diskutierten Beispielen - Hochschulrankings, "Vermessung" des Menschen im Dienste der Rassenidelogie des 19. Jahrhunderts, und der aktuellen als "wissenschaftlich" verbrämten Berufspolitik im Bereich Psychotherapie in der BRD - wird gezeigt, das "Faktengläubigkeit" nicht nur dem wissenschaftstheoretisch begründeten Erkenntnismodell seit Jahrzehnten widerspricht. Es wird auch der Nutzen aufgezeigt, den eine solche inadäquate Reduktion kompelxer Zusammenhänge für viele aufweist. Der Beitrag schließt mit folgenden resümierenden Fragen: Vor Gericht, in der Politik, bei der Gesundheitsreform und anderen Entscheidungen über Ressourcen: überall werden wissenschaftliche Gutachten und Stellungnahmen aufgeboten, welche komplexe Sachverhalte auf wenige „Wahrheiten“ und „Fakten“ reduzieren. Und nicht selten dienen wissenschaftliche Werke, gefüllt mit Zeichennetzen aus kompliziert klingenden Begriffen, eher dazu, andere zu „erschlagen“, als dazu, auf ihnen stehend etwas weiter blicken zu können und so den zwangsläufig begrenzten Horizont ein wenig weiter rücken zu lassen. Studierende und Jungwissenschaftler müssten daher eigentlich dazu angehalten werden, vermeintliche „Fakten“ nicht einfach hinzunehmen, sondern die Bedingungen ihrer Erforschung zu reflektieren und vor allem durch Wissenschaftskritik auf die Kontextualität aller Befunde hinzuweisen. Doch ist dafür angesichts der anfangs geschilderten Rahmenbedingungen heutiger Wissenschaft (einschließlich der Studienbedingungen) noch Raum? Was kann getan werden, um der Gratifikationen für unkritische Produktion und Reproduktion von „Fakten“ wieder mehr Wertschätzung für kritische Reflexion an die Seite zu stellen? Was muss geschehen, damit Verantwortung für wissenschaftliches Handeln übernommen und nicht auf eine angebliche „Objektivität“ der Methoden abgeschoben wird?
Article
Full-text available
Offers a model of the common features of schools of therapeutic practice. Five components of process active in any therapy are described: the therapeutic contract, therapeutic intervention, the therapeutic bond between therapist and patient, patient's and therapist's states of self-relatedness, and therapeutic realization. Clinical and research implications of relationships among process variables are discussed; and the social, cultural, and psychological determinants of process components and their consequences are considered. (PsycINFO Database Record (c) 2012 APA, all rights reserved)
Article
Die evidenzbasierte Medizin (EbM) hat sowohl als Methode zur systematischen Bewertung von Nutzen und Risiken als auch als Entscheidungshilfe fur die Praxis im vergangenen Jahrzehnt international grose Verbreitung gefunden. Als Goldstandard in der Therapieforschung hat sich die randomisierte, kontrollierte Studie (RCT) etabliert. Diese Ansatze stosen in der medizinischen Fachwelt gleichwohl nach wie vor auf Skepsis, weil befurchtet wird, dass RCTs das Feld der Versorgung nicht ausreichend genau abbilden konnen. Diese Bedenken sind insbesondere in Psychiatrie und Psychotherapie stark vertreten. Der Artikel entwickelt auf zwei Ebenen eine die EbM unterstutzende Argumentation: weder lassen sich Grunde finden, warum RCTs fur die Verbesserung der Versorgung psychisch Kranker nicht nutzenstiftend sein konnen, noch erschopft sich relevante Versorgungsforschung in den unverzichtbaren RCTs. Die Bedeutung qualitativer Methoden ist eine mindestens so gewichtige Black Box der Gesundheitsforschung wie der sinnhafte Einsatz von RCTs. Evidence-based Medicine (EbM) was accepted during the last decade both as a method for systematically evaluating risks and benefits and a decision aid for therapists in practice. Randomized controlled trials (RCT) have become the gold standard for medical research. The medical community is sceptical about RCTs because many therapists are not convinced that care can be mirrored adequately enough, though. The doubts are especially strong among psychiatrists and psychotherapists. The paper argues in favour of EbM in two ways. Firstly, from a scientific point of view there are no reasons why RCTs could not contribute to improve the standards of care. Secondly, health services research doesn't amount to much more than RCTs. The importance of qualitative methods is a black box as large within health services research as the meaningful use of RCTs.
Article
Explores the usefulness of psychotherapy and draws a distinction between psychotherapy as technological rules and psychotherapy as practice. The utility of psychotherapy is thought to lie in its efficacy. It is proposed, however, that the efficacy of the technological rule must not be confounded with the efficacy of individual therapeutic practices, since the application of the technological rules differ from therapist to therapist. (English abstract) (21 ref) (PsycINFO Database Record (c) 2012 APA, all rights reserved)