ArticlePDF Available

Screening psychischer Störungen mit dem“Gesundheitsfragebogen für Patienten (PHQ-D)“

Authors:

Abstract

Zusammenfassung. Ziel dieser Studie ist die Validierung der deutschen Version des “Patient Health Questionnaire (PHQ-D)“. Der PHQ wurde zum praktikablen Screening psychischer Storungen fur die Primarmedizin entwickelt und erfasst direkt die diagnostischen Kriterien des DSM-IV. N = 357 allgemeinmedizinische/internistische Patienten und N = 171 psychosomatische Patienten wurden mit dem PHQ-D und dem Strukturierten Klinischen Interview fur DSM-IV (SKID-I) untersucht, wobei das SKID-I als diagnostischer Goldstandard diente. Arzte und Patienten wurden zur Akzeptanz des PHQ-D befragt. Eine ausgezeichnete Kriteriumsvaliditat des PHQ-D zeigte sich insbesondere bei der Diagnose der Major Depression, wo die Sensitivitat fur die medizinische Stichprobe bei 95% und die Spezifitat bei 86% lag. Gute teststatistische Werte ergaben sich u.a. auch fur die Panikstorung. Die Anwendung des PHQ-D wurde von jeweils mehr als 90% der Patienten und Arzte gut akzeptiert. Mit dem PHQ-D liegt ein praktikables, valides und gut akzept...
171
Validierung des PHQ-D
Sonderdruck aus: Diagnostica, 50, Heft 4, 171–181, © Hogrefe Verlag Göttingen 2004
Screening psychischer Störungen
mit dem „Gesundheitsfragebogen
für Patienten (PHQ-D)“
Ergebnisse der deutschen Validierungsstudie
Kerstin Gräfe, Stephan Zipfel, Wolfgang Herzog und Bernd Löwe
DOI: 10.1026/0012-1924.50.4.171
Zusammenfassung. Ziel dieser Studie ist die Validierung der deutschen Version des „Patient Health Questionnaire
(PHQ-D)“. Der PHQ wurde zum praktikablen Screening psychischer Störungen für die Primärmedizin entwickelt und erfasst
direkt die diagnostischen Kriterien des DSM-IV. N = 357 allgemeinmedizinische/internistische Patienten und N = 171 psycho-
somatische Patienten wurden mit dem PHQ-D und dem Strukturierten Klinischen Interview für DSM-IV (SKID-I) untersucht,
wobei das SKID-I als diagnostischer Goldstandard diente. Ärzte und Patienten wurden zur Akzeptanz des PHQ-D befragt. Eine
ausgezeichnete Kriteriumsvalidität des PHQ-D zeigte sich insbesondere bei der Diagnose der Major Depression, wo die
Sensitivität für die medizinische Stichprobe bei 95% und die Spezifität bei 86% lag. Gute teststatistische Werte ergaben sich
u.a. auch für die Panikstörung. Die Anwendung des PHQ-D wurde von jeweils mehr als 90% der Patienten und Ärzte gut
akzeptiert. Mit dem PHQ-D liegt ein praktikables, valides und gut akzeptiertes Instrument zur Anwendung in Forschung und
klinischer Praxis vor. Sein Einsatz kann zur verbesserten Versorgung psychischer Störungen beitragen.
Schlüsselwörter: Screening-Fragebogen, Validität, psychische Störungen, medizinische Grundversorgung, psychosomatische
Medizin
Screening for psychiatric disorders with the Patient Health Questionnaire (PHQ). Results from the German validation study
Abstract. The aim of this study was to validate the German version of the “Patient Health Questionnaire (PHQ)”. The PHQ
has been developed to screen for mental disorders in primary care, using diagnostic criteria from the DSM-IV. Three hundred
and fifty-seven medical outpatients and 171 psychosomatic outpatients completed the PHQ and the Structured Clinical
Interview for DSM-IV (SCID), the latter serving as criterion standard. Acceptability of the PHQ as the screening instrument
was investigated for physicians and patients. For the diagnosis of major depressive disorder, the PHQ showed excellent
criterion validity (medical patients: sensitivity, 95%; specificity, 86%). Good operating characteristics were also found for
the diagnosis of panic disorder. The use of the PHQ was well accepted by more than 90% of both physicians and patients.
Overall, the PHQ is a valid, effective, and well accepted diagnostic tool for use in research and clinical practice. Its’
application in primary care and other clinical settings might contribute to better diagnosis and treatment of mental disorders.
Key words: screening test, validity, mental disorders, primary care, psychosomatic medicine
Zwanzig bis 35% aller Patienten mit körperlichen Erkran-
kungen leiden unter psychischen Störungen (Kessler
et al., 1994; Henningsen, Zimmermann & Sattel, 2003; Lin-
den et al., 1996; Spitzer et al., 1999; Tress et al., 1997).
Typischerweise ist für diese Patienten der Hausarzt der
erste Ansprechpartner. Auch für diese Patientengruppe
ist die Effizienz psychotherapeutischer oder -pharmakolo-
gischer Interventionen gut belegt, wobei eine breite empi-
rische Evidenz insbesondere für depressive Störungen
und Angststörungen vorliegt (Coulehan et al., 1997;
Jarrett et al., 2001; Simon et al., 1995; Fava et al., 2001;
Westen & Morrison, 2001). Voraussetzung für eine effek-
tive Behandlung stellt eine entsprechende Psychodiag-
nostik dar, die jedoch gerade bei Hausärzten – mit dem
größten Anteil an der Versorgung von psychisch komor-
biden Patienten – unzureichend ist. Aktuelle Studien
zeigen Erkennungsraten von lediglich 30–50% bei depres-
siven Störungen in der Primärmedizin (Docherty, 1997;
Hansen et al., 2001; Löwe, Spitzer et al., 2004), bei Panik-
störungen liegt die Erkennungsrate bei etwa 15% (Löwe,
Diese Studie wurde durch eine Forschungsförderung der Firma
Pfizer GmbH, Karlsruhe, sowie eine Forschungsförderung der Medi-
zinischen Fakultät der Universität Heidelberg (Projekt 121/2000),
finanziell unterstützt. Es bestanden keine Interessenkonflikte.
Danken möchten wir insbesondere den zahlreichen Patienten und
Ärzten, die sich an unserer Studie beteiligt haben. Für ihren großen
Einsatz bei der Organisation und Datenerhebung gilt unser Dank
unseren Kolleginnen Frau Dipl.-Psych. Andrea Quenter und Frau
Dipl.-Psych. Christine Buchholz, sowie für die Datenerhebung und
-eingabe Frau cand. med. Levke Willand und Frau Dipl.-Psych.
Ingeborg Warnke. Auch sind wir Frau Dorothea Niehoff und Herrn
Dipl.-Math. Steffen Witte für ihre hervorragende methodische
Unterstützung dankbar.
172
Kerstin Gräfe, Stephan Zipfel, Wolfgang Herzog und Bernd Löwe
Gräfe et al., 2003a). Die restlichen Patienten bleiben uner-
kannt und somit unbehandelt. Auf Grund dieser Situation
gab die U.S. Preventive Services Task Force kürzlich
(2002) die Empfehlung aus, dass alle erwachsenen Patien-
ten in der Primärmedizin auf depressive Störungen ge-
screent werden.
Psychodiagnostik
in der Primärversorgung:
Stand der Forschung
Screeningverfahren gelten inzwischen auf Grund ihres
geringen Zeitaufwands als eine effektive Methode zur
Psychodiagnostik (Williams et al., 2002). Die große Mehr-
heit der heute verwendeten Selbstratingverfahren zur
Beurteilung psychischer Störungen, wie die „Hospital
Anxiety and Depression Scale (HADS-D)“ (Herrmann
et al., 1995), das „Beck Depressions Inventar (BDI)“ (Beck
& Steer, 1995) oder die Symptom-Checkliste (SCL-90-R)
von Derogatis (Francke, 1995) wurde in den 60er (BDI),
70er (SCL-90) und 80er Jahren (HADS) entwickelt und be-
rücksichtigt deshalb naturgemäß noch nicht die diagnos-
tischen Kriterien für psychische Störungen nach DSM-IV
bzw. ICD-10. Auf Grund dessen werden sie eher zur
dimensionalen Abbildung des Schweregrades als zur
kategorialen Diagnosestellung nach den bekannten Klas-
sifikationssystemen eingesetzt.
In den letzten Jahrzehnten entstanden einige wenige
Verfahren, die klinische Symptome auf Grundlage der
DSM-IV-Kriterien erfassen. Eine deutsche Entwicklung ist
das Diagnostische Expertensystem für psychische Stö-
rungen (DIA-X) (Wittchen & Perkonigg, 1997), welches
Einsatz in einer großen epidemiologischen Allgemein-
arztstudie fand (Krause et al., 2001; Wittchen, 2000). Das
DIA-X ist ein modular aufgebautes Beurteilungssystem,
welches mittels kurzer Screeningbögen das Vorliegen
irgendeiner psychischen Störung (DIA-SSQ), einer De-
pression (DIA-DSQ) oder einer Angststörung (DIA-ASQ)
erfasst, und diese im zweiten Schritt mittels eines struktu-
rierten Interviews genauer abklärt. Eine Weiterentwick-
lung des ASQ stellt das Generalisierte Angst-Screening-
Questionnaire GAS-Q dar (Wittchen et al., 2002; Wittchen
et al., 2001). Zum gegenwärtigen Zeitpunkt ist u.W.
jedoch noch keine Studie zur Validität der Verfahren publi-
ziert. Ein weiteres umfassendes Instrument zum Screening
auf psychische Störungen ist der amerikanische „Psychia-
tric Diagnostic Screening Questionnaire“ (Zimmerman &
Mattia, 2001a; Zimmerman & Mattia, 2001b). Dieses In-
strument wurde allerdings zur Anwendung im ambulanten
psychiatrischen Bereich entwickelt und ist ebenso wie
weitere störungsspezifische Einzelverfahren, z.B. der „So-
cial Phobia Diagnostic Questionnaire“ (Newman et al.,
2003) für die Anwendung im primärmedizinischen Bereich
auf Grund der hohen Zahl von Items zu aufwändig.
Speziell zur Anwendung im Bereich der Primärmedizin
entwickelten Spitzer et al. (1994) mit der „Primary Care Eva-
luation of Mental Disorders (PRIME-MD)“ ein zweistufi-
ges Screeninginstrument für psychische Störungen. Die-
ses ermöglicht mittels kurzem Screeningfragebogen und
anschließendem semistrukturiertem Interview (ca. 10 min.)
eine valide Diagnostik psychischer Störungen. Eine
Weiterentwicklung des PRIME-MD stellt der „Patient
Health Questionnaire (PHQ)“ (Spitzer et al., 1999) dar, der
ebenfalls eine Psychodiagnostik nach den Kriterien des
DSM-IV (American Psychiatric Association, 1994) ermög-
licht. Im Gegensatz zur PRIME-MD beruht der PHQ kom-
plett auf einem Selbstrating des Patienten und bean-
sprucht durchschnittlich nur zwei Minuten für die Aus-
wertung durch den Arzt. Auf Grund seiner Kürze und
einfachen Auswertung, seiner guten testdiagnostischen
Eigenschaften und seiner internationalen Verfügbarkeit
(z.B. Kroenke et al., 2001; Spitzer et al., 2000; Persoons
et al., 2003; Diez-Quevedo et al., 2001), ist der PHQ zum
Standardinstrument für die Diagnostik psychischer Stö-
rungen in der amerikanischen Primärmedizin geworden
(Williams et al., 2002). Seit seiner Publikation 1999 sind
über 80 Arbeiten in peerreviewten Zeitschriften erschie-
nen, in denen der PHQ als diagnostisches Instrument ein-
gesetzt wurde. Die deutsche Version des Patient Health
Questionnaire (PHQ), der „Gesundheitsfragebogen für
Patienten (PHQ-D)“ (Löwe et al., 2002) wurde in mehreren
Schritten von Übersetzung und Rückübersetzung nach
„State of the Art“-Kriterien (Bracken & Barona, 1991) er-
stellt. Die Validität der deutschen Version (PHQ-D) wurde
bisher nur fragmentarisch für depressive Störungen
(Löwe, Spitzer et al., 2004) und die Panikstörung (Löwe,
Gräfe et al., 2003a) beschrieben. Die Zielsetzung der vor-
liegenden Arbeit besteht in der umfassenden Untersu-
chung der Validität aller Skalen des PHQ-D für a) eine
Stichprobe aus internistisch allgemeinmedizinischen Pa-
tienten und für b) eine Stichprobe aus psychosomatisch-
psychotherapeutischen Patienten. Es handelt sich dabei
um die international erste Arbeit, in welcher der PHQ für
psychosomatisch-psychotherapeutische Patienten vali-
diert wird. Das Instrument wird ausführlicher im Metho-
denteil beschrieben.
Fragestellungen
A) Als Maß für die Kriteriumsvalidität werden die Klas-
sifikationseigenschaften des Instrumentes ermittelt. Das
„Strukturierte Diagnostische Interview für DSM-IV,
Achse I (SKID-I)“ (Wittchen et al., 1997) dient dabei als
diagnostischer Goldstandard.
B) Es soll überprüft werden, ob der PHQ-D zur Diag-
nostik psychischer Störungen sowohl in der Inneren Me-
dizin/Allgemeinmedizin als auch in der Psychosomatik/
Psychotherapie geeignet ist.
C) Zur Bestimmung der Konstruktvalidität wird der
Zusammenhang von PHQ-D-Diagnosen mit psychosozia-
ler Funktionsfähigkeit, Inanspruchnahmeverhalten und
Arbeitsunfähigkeit untersucht.
D) Als weitere Testeigenschaften werden Interkorrela-
tionen sowie interne Konsistenzen (Cronbachs Alpha) der
kontinuierlichen Skalen berechnet.
173
Validierung des PHQ-D
E) Zusätzlich werden Vergleichswerte für die kontinu-
ierlichen Skalen zur Depressivität (PHQ-9) und Somatisie-
rungsschwere (PHQ-15) ermittelt.
F) Es wird die Akzeptanz des Einsatzes des PHQ-D
sowohl bei den Patienten als auch bei den behandelnden
Ärzten untersucht.
Methode
Stichprobe
Die Studie wurde in sieben Ambulanzen der Medizini-
schen Universitätsklinik sowie in zwölf Hausarztpraxen
in Heidelberg durchgeführt. Einschlusskriterien für die
Teilnahme an der Studie waren Volljährigkeit, eine vorlie-
gende Einverständniserklärung, aktuelle Krankheitsbe-
schwerden, ausreichende Deutsch-, Lese- und Schreib-
kenntnisse sowie ein ausreichender Gesundheitszustand
des Patienten.
Dazu wurde an vorher festgelegten Tagen (Montags,
Mittwochs, Freitags) jeder anzutreffende Patient ange-
sprochen, aufgeklärt und um Teilnahme an der Studie
(PHQ-D) gebeten; jeder dritte Patient (vorher festgelegt)
wurde um ein zusätzliches SKID-Interview (jeweils am Tag
des Arztbesuches oder innerhalb einer Woche) gebeten.
Dieses Verfahren wurde jeden Tag so lange durchgeführt,
bis eine festgelegte Patientenzahl zur Teilnahme am PHQ-
D und am SKID-Interview einverstanden war. Diese vor-
her festgelegte Zahl war abhängig von den jeweiligen
Kapazitäten der Interviewer und lag bei zwei bis fünf
SKID-Interviews pro Tag.
Von den insgesamt N = 2050 angesprochenen ambu-
lanten Patienten lehnten N = 431 Patienten die Teilnahme
komplett ab oder konnten die Fragebögen nicht beantwor-
ten (21%). Somit verblieben N = 1619 Patienten, die ihre
Fragebögen vollständig ausfüllten. Von diesen wurde bei
N = 528 Patienten das „Strukturierte Klinische Interview
nach DSM-IV, Achse I (SKID-I)“(Wittchen et al., 1997)
durchgeführt.
Von den Patienten mit SKID-Interview stammen 247
Patienten (46.8%) aus den verschiedenen internistischen
Ambulanzen und 110 Patienten (20.8%) aus den Hausarzt-
praxen. Diese Patienten bilden gemeinsam die Gruppe der
medizinischen Patienten“ (N = 357). Die 171 Patienten
(32.4%) aus der psychosomatischen Ambulanz, die zu-
meist von ihren Hausärzten oder von anderen Ambulan-
zen oder Stationen der Medizinischen Klinik in die psy-
chosomatische Ambulanz überwiesen wurden, bilden die
Gruppe der „psychosomatischen Patienten“. 67.8% der
Gesamtstichprobe sind weiblich, das mittlere Alter liegt
bei 41.9 Jahren (SD = 13.8). Die Schulbildung teilt sich wie
folgt auf: 29.2% haben Abitur, 27.9% Mittlere Reife,
37.8% Hauptschulabschluss, 2.7% sind ohne Schulab-
schluss oder noch in der Schule, 2.5% haben sonstige
Schulbildungen. Die Substichproben „medizinische“ vs.
„psychosomatische“ Patienten unterscheiden sich hin-
sichtlich Geschlecht und Schulbildung nicht signifikant,
jedoch sind die Patienten der psychosomatischen Ambu-
lanz durchschnittlich jünger (M = 39.3 Jahre, SD = 14.9 vs.
M = 43.3 Jahre, SD = 13.0; F = 9.39, df = 1, p = .002).
Erhebungsinstrumente
Patientenfragebogen
Der „Gesundheitsfragebogen für Patienten (PHQ-D)“ er-
fasst acht psychische Störungen, die sich in zwei Gruppen
einteilen lassen: A) Störungen, für die im PHQ-D alle diag-
nostischen Kriterien für die spezifische Diagnose nach
DSM-IV abgefragt werden („threshold“ disorders). Hierzu
zählen im PHQ-D die Major Depression, die Panikstörung
und die Bulimia nervosa. Bei diesen Störungen wird jedes
diagnostische Kriterium einer Störung durch jeweils ein
Item abgefragt. Die kategoriale Auswertung erfolgt nach
modifizierten Auswertungsalgorithmen des DSM-IV. B)
Störungen, für die weniger Kriterien abgefragt werden, als
für eine spezifische DSM-IV-Diagnose erforderlich sind
(„subthreshold disorders“). Hierzu zählen die anderen
depressiven Störungen, andere Angststörungen, soma-
toforme Störungen, Alkoholabusus und die Binge-Eating-
Störung. Auf Grund der Unvollständigkeit der abgefrag-
ten DSM-IV-Kriterien haben diese Sektionen eher eine
Screeningfunktion als eine diagnostische Funktion. Da
der PHQ-D die diagnostischen DSM-IV-Kriterien direkt
abfragt, besitzt das Instrument eine hohe Inhaltsvalidität.
In Ergänzung zu den diagnostischen Modulen werden die
psychosoziale Funktionsfähigkeit sowie acht häufige psy-
chosoziale Stressoren erfragt. Die Kurzform des PHQ-D ist
auf eine Seite beschränkt und erfasst depressive Störun-
gen (Major Depression und andere depressive Störun-
gen), die Panikstörung sowie die psychosoziale Funk-
tionsfähigkeit (siehe Anhang 1).
Neben der kategorialen Diagnostik psychischer Stö-
rungen nach DSM-IV können das Depressionsmodul
(„PHQ-9“) sowie das Somatisierungsmodul („PHQ-15“)
auch dimensional ausgewertet werden (Kroenke et al.,
2001; Kroenke et al., 2002). Die dimensionale Auswertung
erlaubt die Bestimmung von Schweregraden, welche ins-
besondere zur Verlaufsdiagnostik sowie zur Beurteilung
des Therapieeffektes herangezogen werden können.
Kürzlich konnte gezeigt werden, dass die Depressions-
skala des PHQ-D eine gute Änderungssensitivität auf-
weist (Löwe, Kroenke et al., in press). In Ergänzung zur
kategorialen Auswertung ermöglicht die kontinuierliche
Auswertung durch Auswahl spezifischer Cut-off-Werte
eine flexible Anpassung an die entsprechende Verwen-
dung des Fragebogens; so werden u.a. für Screeningfra-
gestellungen niedrigere Cut-off-Werte empfohlen als für
epidemiologische Fragestellungen (Löwe, Spitzer et al.,
2004). Auch für die 10-Item-Skala der psychosozialen
Stressoren (z.B. finanzielle Sorgen, Sorgen über Gesund-
heit etc.; PHQ-10) ist eine Schweregradbestimmung mög-
lich (Klapow et al., 2002).
Der gesamte Fragebogen besteht insgesamt aus 78
Items, die direkt aus den Kriterien des DSM-IV abgeleitet
174
Kerstin Gräfe, Stephan Zipfel, Wolfgang Herzog und Bernd Löwe
sind. Der Zustimmungsgrad wird je nach Diagnosesektion
auf einer zwei- bis fünfstufigen Antwortskala angegeben.
Die beiden Skalen zur zusätzlichen Schweregradbestim-
mung reichen von 0–27 (PHQ-9, 4-Punktskala von 0–3)
bzw. von 0–30 (PHQ-15, 3-Punktskala von 0–2).
Im Rahmen unserer Untersuchung füllten die Patien-
ten neben dem PHQ-D Items zu soziodemographischen
Angaben, Arbeitsfähigkeit, Arztbesuchen usw. aus.
Die Patientenakzeptanz des PHQ-D wurde erfasst
durch Fragen, wie gut das Ausfüllen des PHQ-D dem Pati-
enten gefallen hat, wie schwierig und wie zeitaufwändig
dies war. Diese Fragen wurden im Anschluss an das klini-
sche Interview gestellt.
Einen kurzen Fragebogen zur Arztakzeptanz des
PHQ-D erhielten die Ärzte nach ihrer Teilnahme an der
Untersuchung. Dieser erfasst, wie sinnvoll der Arzt den
Fragebogeneinsatz fand, bei welchen Patienten er ihn ein-
setzen würde und ob die Verwendung des PHQ-D Auswir-
kungen auf die Behandlung der Patienten hatte.
Patienteninterview
Das „Strukturierte Klinische Interview für DSM-IV,
Achse I (SKID-I)“ (Wittchen et al., 1997) ist ein reliables
Standardinstrument zur Diagnostik psychischer Störun-
gen, und diente in unserer Studie als diagnostischer Gold-
standard. Vor Beginn der Datenerhebung erhielten vier
Mitarbeiter eine umfassende externe SKID-Schulung. Sie
führten alle Interviews ohne Kenntnis des Screeninger-
gebnisses durch. Zusätzlich wurden insgesamt 60 Video-
bänder zur Bestimmung der Interrater-Reliabilität aufge-
zeichnet und, nach zufälliger Zuordnung, von jeweils ei-
nem zweiten Interviewer bewertet. Die Interrater-Reliabili-
tät für das SKID-Interview wurde als Kappa-Koeffizient
(N, KI = 95%) (Fleiss, 1971) berechnet. Dieser beträgt für
die Diagnose der Major Depression N = .88 (.47–1.0), alle
depressiven Störungen N = 1.0 (.68–1.0), Angststörungen
N = .96 (.67-1.0), somatoforme Störungen N = .70 (.13–1.0)
sowie Essstörungen N = 1.0 (.33–1.0).
Statistische Auswertung
Die statistischen Analysen wurden mit dem Softwarepa-
ket SAS 8.01 for Windows (SAS-Institute Inc., 1999)
durchgeführt.
Zur Ermittlung der Kriteriumsvalidität dienen Sensiti-
vitäten, Spezifitäten und prädiktive Werte. Sensitivitäten
reflektieren den Anteil der Patienten mit der (Ziel-)Erkran-
kung, die durch ein positives Testergebnis identifiziert
wurden (richtig positive Entscheidung). Spezifitäten be-
schreiben den Anteil der Patienten ohne die (Ziel-)Erkran-
kung, die durch den Test als gesund identifiziert wurden
(richtig negative Entscheidung). Positive prädiktive Wer-
te bezeichnen die Wahrscheinlichkeit, bei positivem Test-
ergebnis tatsächlich krank zu sein, negative prädiktive
Tabelle 1. Diagnosegruppen (nach SKID-I)
psychosomatische medizinische
Ambulanz Ambulanzen/
(N = 171) Hausarztpatienten
(N = 357)
psychische Diagnosen N (%) N (%)
Psychische Störung 127 (74.27) 102 (28.57)
Somatisierungsstörung 17 (9.94) 14 (3.92)
Major Depression 50 (29.24) 22 (6.16)
Andere depressive Störung 32 (18.71) 33 (9.24)
Panikstörung 32 (18.71) 15 (4.20)
Agoraphobie (ohne Panikstörung) 4 (2.34) 8 (2.24)
Phobien 15 (8.77) 26 (7.28)
Generalisierte Angststörung 14 (8.19) 6 (1.68)
Bulimia nervosa 8 (4.68)
Anorexia nervosa 9 (5.26)
Binge Eating Disorder 14 (8.19) 12 (3.36)
Alkoholabusus 13 (7.60) 7 (1.96)
medizinische Diagnosen N (%) N (%)
Endokrine, Ernährungs-/Stoffwechselkrankheiten 12 (7.02) 74 (20.73)
Krankheiten des Kreislaufsystems 12 (7.02) 51 (14.29)
Krankheiten des Verdauungssystems 6 (3.51) 36 (10.08)
Krankheiten des Muskel-Skelett-Systems 5 (2.91) 103 (28.58)
Sonstige Erkrankungen 30 (17.54) 75 (21.0)
175
Validierung des PHQ-D
Werte die Wahrscheinlichkeit, bei negativem Testergeb-
nis tatsächlich gesund zu sein.
Zur Bestimmung der Konstruktvalidität wurde der Zu-
sammenhang der Diagnose einer psychischen Störung
durch den PHQ-D mit der Häufigkeit der Arztbesuche, der
Anzahl der behandelnden Ärzte, der psychosozialen
Beeinträchtigung sowie der Arbeitsfähigkeit quantifiziert.
Abhängig von der Anzahl der Stufen der Kriteriums-
variable wurden hierfür negative Binominalregressionen
(= 10 Stufen), Poisson-Regressionen (3–9 Stufen) sowie
logistische Regressionsanalysen (dichotome Kriteriums-
variable) verwendet. Um den Einfluss von Alter und Ge-
schlecht zu kontrollieren, wurden die Analysen an diese
beiden Variablen adjustiert. Die internen Konsistenzen
der beiden kontinuierlichen Skalen Depressivität (PHQ-9)
und Somatisierung (PHQ-15) wurden anhand Cronbachs
Alpha ermittelt. Die Analysen zur Konstruktvalidität und
zur internen Konsistenz wurden an der Gesamtstichprobe
durchgeführt, da hier eine möglichst große Varianz der
untersuchten Variablen wünschenswert ist. Als Signifi-
kanzniveau wurde für alle Analysen das konventionelle
5%-Niveau festgelegt.
Ergebnisse
Insgesamt leiden 229 Patienten (43.4%) nach SKID-I an
mindestens einer psychischen Störung. Die häufigsten
medizinischen Diagnosen sind Krankheiten des Muskel-
Skelett-Systems und des Bindegewebes (ICD-10: M00-99),
endokrine, Ernährungs- und Stoffwechselkrankheiten
(ICD-10: E00-90) sowie Krankheiten des Kreislaufsystems
(ICD-10: I00-99). Tabelle 1 zeigt die Verteilung der Diag-
nosegruppen in den beiden Substichproben. Die Häufig-
keiten der einzelnen psychischen Störungen von den
Patienten der Medizinischen Klinik und den Hausarztpa-
tienten unterscheiden sich nicht signifikant (Chi-Quadrat-
Test; alle psychischen Störungen jeweils p > .05), so dass
die Zusammenfassung dieser beiden Stichproben zur
Gruppe der „medizinischen Patienten“ gerechtfertigt er-
scheint.
Kriteriumsvalidität
Tabelle 2 und 3 zeigen die Klassifikationseigenschaften
für die kategorialen Skalen sowie für die dimensionale
Auswertung der Depressivitätsskala (PHQ-9). Lediglich
die Klassifikationseigenschaften für die Somatisierungs-
skala wurden nicht berechnet, da der letzte Schritt des
diagnostischen Prozesses bei einer somatoformen Stö-
rung – die ärztliche Abklärung einer organischen Ursache
– im Rahmen der Studie nicht durchgeführt werden konnte
und damit keine valide SKID-Diagnose vorlag. Wie die
Konfidenzintervalle zeigen, bestehen bedeutsame Unter-
schiede zwischen Testcharakteristika der medizinischen
und psychosomatischen Patientengruppe vor allem hin-
sichtlich der positiven prädiktiven Werte. Diese liegen in
der Stichprobe der psychosomatischen Patienten höher
als bei den medizinischen Patienten.
Tabelle 2. Klassifikationseigenschaften des PHQ-D, kategoriale Auswertung
a
Medizinische Stichprobe, N = 357 Psychosomatische Stichprobe, N = 171
Sensitivität Spezifität PPV NPV Sensitivität Spezifität PPV NPV
% (95% KI)% (95% KI)% (95% KI)% (95% KI)% (95% KI)% (95% KI)% (95% KI)% (95% KI)
Alle psychischen Störungen (Achse I) 77 (66–88) 83 (78–87) 56 (49–63) 93 (90–95) 85 (77–91) 70 (56–81) 85 (80–90) 70 (60–80)
Alle depressiven Störungen
b
75 (61–85) 90 (86–93) 57 (48–66) 95 (93–97) 78 (68–86) 71 (60–81) 71 (64–78) 78 (70–85)
Major Depression 86 (65–97) 94 (91–96) 47 (36–58) 99 (98–100) 78 (64–88) 80 (72–87) 63 (54–72) 89 (85–94)
Alle Angststörungen 67 (43–85) 94 (91–96) 41 (28–53) 98 (96–99) 71 (55–84) 71 (63–79) 45 (37–54) 88 (83–93)
Panikstörung 73 (45–93) 98 (96–99) 60 (41–79) 99 (98–99) 73 (54–88) 92 (86–96) 67 (54–81) 94 (90–97)
Essstörung 58 (28–85) 94 (91–96) 24 (12–35) 98 (98–99) 68 (45–86) 89 (83–94) 49 (35–62) 95 (92–98)
Bulimia nervosa 68 (45–86) 89 (83–94) c c 75 (35–97) 98 (95–99) c c
Alkoholabusus 57 (18–90) 96 (94–98) 24 (09–39) 99(98–100) 62 (32–86) 98 (94–99) 73 (49–97) 97 (95–99)
Anmerkungen:
a
SKID–I als Kriteriumsstandard;
b
Major Depression, Dysthyme Störung, Nicht näher bezeichnete (NNB) Depressive Störung, Bipolare Störungen, NNB Affektive Störung,
Affektive Störung aufgrund eines medizinischen Krankheitsfaktors, substanzinduzierte affektive Störung, Major Depression teilremittiert, Anpassungsstörung mit depressiver Stimmung;
c
Werte
nicht berechnet, da Prävalenz in der medizinischen Patientengruppe = 0%.
176
Kerstin Gräfe, Stephan Zipfel, Wolfgang Herzog und Bernd Löwe
Der PHQ-D weist auf allen Skalen gute Klassifikations-
eigenschaften auf. Die Sensitivität des Fragebogens für
die Diagnose einer psychischen Störung (Achse I) be-
trägt bei psychosomatischen Patienten 85% (Spezifität =
70%), bei medizinischen Patienten 77% (Spezifität = 83%).
Die Sensitivität für die Diagnose der Gesamtgruppe
depressiver Störungen beträgt bei kategorialer Auswer-
tung 78% (psychosomatische Pat.) bzw. 75% (medizini-
sche Pat.), die Spezifität 70% (psychosomatische Pat.)
bzw. 90% (medizinische Pat.). Für die Diagnose einer Ma-
jor Depression weist der PHQ-D eine Sensitivität von 78%
(psychosomatische Pat.) bzw. 86% (medizinische Pat.)
und eine entsprechende Spezifität von 80% bzw. 94% auf.
Die Sensitivität für die Panikstörung beträgt bei psycho-
somatischen Pat. 73% (Spezifität von 92%), bei medizini-
schen Pat. ebenfalls 73% (Spezifität von 98%).
Bei dimensionaler Auswertung schwanken die in Ta-
belle 3 dargestellten Sensitivitäten, abhängig vom jeweili-
gen Cut-off-Wert, für die Diagnose der Major Depression
zwischen 73% und 98% (Spezifität von 55% bis 95%).
Für die Diagnose aller depressiven Störungen ergeben
sich Sensitivitäten von 58% bis 93% (Spezifitäten von
54% bis 92%).
Konstruktvalidität
Die Ergebnisse zur Konstruktvalidität des PHQ-D sind in
Tabelle 4 zusammengefasst. Patienten, bei denen mittels
PHQ-D eine psychische Störung diagnostiziert wurde,
hatten signifikant mehr Arztbesuche, waren stärker psy-
chosozial beeinträchtigt und häufiger arbeitsunfähig als
Patienten, bei denen keine psychische Störung diagnosti-
ziert wurde. Mean Risk bzw. Odds Ratio in der Tabelle
bezeichnen den Faktor, um den sich Patienten mit und
ohne Diagnose einer psychischen Störung unterschei-
den. Beispielsweise hatten Patienten mit psychischen
Störungen eine 2.2fach erhöhte Rate von Arbeitsunfähig-
keit und 1.4fach mehr Arztbesuche in den letzten 3 Mona-
ten, verglichen mit Patienten ohne psychische Störun-
gen. Wie das Konfindenzintervall zeigt, ergab sich für
die Anzahl der in den letzten Monaten besuchten Ärzte
nur eine grenzwertig signifikante Erhöhung auf dem
5%-Niveau.
Reliabilität
Für die Depressivitätsskala des PHQ-D beträgt die interne
Konsistenz nach Cronbach D = .88, für die Somatisie-
rungsskala ist D = .79. Für die übrigen diagnostischen
Skalen ist die Berechnung der internen Konsistenz auf
Grund einer ausschließlich kategorialen Auswertung (mit
vorliegenden Sprungregeln) nicht sinnvoll.
Die Pearson Produkt-Moment-Korrelation der beiden
kontinuierlichen Skalen (Depressivität und Somatisie-
rung) zeigt einen positiven Zusammenhang von r = .60
(p < .001).
Tabelle 3. Klassifikationseigenschaften des PHQ-D, dimensionale Auswertung
a
Medizinische Stichprobe, N = 357 Psychosomatische Stichprobe, N = 171
Sensitivität Spezifität PPV NPV Sensitivität Spezifität PPV NPV
% (95% KI)% (95% KI)% (95% KI)% (95% KI)% (95% KI)% (95% KI)% (95% KI)% (95% KI)
Major Depression
– Cut-off 10 95 (77–99) 83 (78–87) 26 (21–31) 99 (98–100) 98 (89–99) 55 (46–64) 47 (42–52) 98 (96–99)
– Cut-off 11 95 (77–99) 86 (82–89) 30 (24–36) 99 (99–100) 98 (89–99) 61 (51–70) 51 (45–56) 98 (96–99)
– Cut-off 12 91 (71–98) 89 (85–92) 35 (27–42) 99 (98–100) 94 (83–98) 67 (58–75) 54 (47–60) 96 (93–99)
– Cut-off 13 82 (60–95) 92 (88–95) 39 (29–49) 99 (98–100) 86 (73–94) 75 (66–82) 58 (50–66) 93 (88–97)
– Cut-off 14 73 (50–89) 95 (92–97) 49 (36–63) 98 (97– 99) 76 (61–87) 82 (74–89) 63 (54–73) 89 (84–94)
Depressive Störungen
b
– Cut-off 8 85 (72–93) 76 (71–81) 39 (33–44) 96 (95–99) 93 (84–97) 54 (43–65) 65 (60–70) 89 (81–97)
– Cut-off 9 79 (66–89) 81 (76–85) 42 (35–49) 96 (93–98) 91 (83–96) 61 (50–71) 68 (62–74) 88 (81–96)
– Cut-off 10 72 (58–83) 87 (82–90) 49 (40–57) 95 (92–97) 88 (78–94) 64 (53–74) 69 (63–76) 85 (77–93)
– Cut-off 11 68 (54–80) 89 (85–93) 53 (44–62) 94 (92–96) 86 (77–93) 71 (61–80) 74 (78–81) 88 (82–94)
– Cut-off 12 58 (44–72) 92 (88–95) 56 (45–67) 93 (90–95) 78 (67–86) 74 (63–82) 73 (66–80) 78 (71–85)
Anmerkungen:
a
SKID-I als Kriteriumsstandard;
b
Major Depression, Dysthyme Störung, Nicht näher bezeichnete (NNB) Depressive Störung, Bipolare Störungen, NNB Affektive Störung,
Affektive Störung aufgrund eines medizinischen Krankheitsfaktors, substanzinduzierte affektive Störung, Major Depression teilremittiert, Anpassungsstörung mit depressiver Stimmung.
177
Validierung des PHQ-D
Vergleichswerte
Depressivität (PHQ-9)
Patienten mit einer Major Depression (SKID-I) hatten
einen durchschnittlichen Depressivitäts-Summenwert
von M = 17.9 (SD = 4.5). Dagegen lag der Summenwert für
Patienten mit allen depressiven Störungen bei M = 11.7
(SD = 5.0) und für Patienten ohne depressive Störung bei
M = 5.9 (SD = 4.2, F = 249.6, p < .001).
Somatische Symptomschwere (PHQ-15)
Patienten mit einer psychischen Störung (SKID-I) hatten
eine durchschnittliche somatische Symptomschwere von
9.8 (SD = 5.4), Patienten ohne psychische Störung einen
Wert von 6.4 (SD = 3.9, t = 7.8, p < .001). Die somatische
Symptomschwere lag bei der psychosomatischen Patien-
tengruppe bei 9.7 (SD = 5.5), bei medizinischen Patienten
bei 7.1 (SD = 4.4, t = 5.7, p < .001).
Akzeptanz des PHQ-D
Die Befragung zur Akzeptanz des PHQ-D ergab bei den
Patienten folgendes Ergebnis: 96.9% der Befragten geben
an, dass ihnen das Ausfüllen des PHQ-D gefallen bzw. sie
nicht gestört habe, 88.4% beurteilen das Ausfüllen als
nicht schwierig und nur 16.4% halten das Ausfüllen für zu
zeitaufwändig. 93.8% der Patienten denken, dass der Fra-
gebogen dem Arzt hilft, Patienten besser zu behandeln
und 99.3% der Befragten wären bereit, ihn erneut auszu-
füllen.
Die Patientenangaben zwischen der medizinischen
und der psychosomatischen Stichprobe unterscheiden
sich in zwei Items: So zeigte sich die medizinische Stich-
probe insgesamt zufriedener mit dem PHQ-D (98.7% vs.
88.7%, F
2
= 15.91, p < .001) und wertete ihn signifikant
seltener als zu zeitaufwändig (13.5% vs. 27.4%, F
2
= 6.9,
p < .01) im Vergleich zu der psychosomatischen Stich-
probe. Auf Seiten des behandelnden Arztes ergaben sich
folgende Rückmeldungen: 96.9% der N = 32 Ärzte halten
den Einsatz des PHQ-D für sinnvoll, 25% würden ihn bei
allen Patienten einsetzen, 68.8% bei ausgewählten Patien-
ten und 6.3% würden ihn nicht einsetzen. 72.7% denken,
dass der Einsatz des PHQ-D positive Auswirkungen auf
die Behandlung hat, während keiner der Befragten negati-
ve Auswirkungen befürchtete.
Diskussion
Ziel dieser Studie war es, die deutsche Version des „Pa-
tient Health Questionnaire (PHQ)“ anhand eines struktu-
rierten Interviews zu validieren. Es ist international die
erste Studie, welche den PHQ in Bezug auf die Diagnosen
eines diagnostischen Standardinstruments validiert; die
amerikanische sowie die spanische Version des PHQ wur-
den an klinischen Diagnosen validiert (Spitzer et al., 1999).
Die bisher beschriebenen guten diagnostischen Qualitä-
ten des PHQ, insbesondere für alle depressiven Stö-
rungen, die Major Depression sowie die Panikstörung,
werden durch die Validierung der deutschen Version be-
stätigt.
Durch unsere Studie konnte gezeigt werden, dass der
PHQ-D hervorragende interne Konsistenzen bzgl. der
kontinuierlichen Skalen sowie sehr gute bis zufrieden-
stellende Klassifikationseigenschaften auf allen Skalen
aufweist. Der PHQ-D ist ein valides Screeninginstrument
insbesondere zur Diagnostik aller depressiven Störungen,
der Major Depression, der Panikstörung sowie der Bulimia
Tabelle 4. Konstruktvalidität des PHQ-9
a
Psychische Störung Keine psychische Adjustierte MR
a
im PHQ, N = 224 Störung im PHQ, N = 304
M SD M SD MR (95 % KI)
Anzahl der Arztbesuche in den
letzten 3 Monaten (1–50)
b
9.2 14.8 6.8 13.5 1.4 (1.2–1.6)
Anzahl der Ärzte in den
letzten 3 Monaten (1–5)
c
2.7 1.3 2.4 1.2 1.2 (1.0–1.3)
Psychosoziale Beeinträchtigung
nach PHQ (1–4)
c
2.3 0.9 1.6 0.6 1.5 (1.3–1.7)
N % N % OR (95% KI)
Derzeit arbeitsunfähig
d
77 34.4 58 19.1 2.2 (1.4–3.4)
Anmerkungen:
a
Regressionen mit Adjustierung an Alter und Geschlecht. MR = Mean Ratio, OR = Odds Ratio;
b
Negative Binominalregression;
c
Poisson Regression;
d
Logistische Regression.
178
Kerstin Gräfe, Stephan Zipfel, Wolfgang Herzog und Bernd Löwe
nervosa. Die Klassifikationseigenschaften der übrigen
Diagnosegruppen fallen etwas niedriger aus und sind da-
her eher für Screeningzwecke geeignet. Die etwas niedri-
geren Klassifikationseigenschaften für die Diagnose der
Gesamtgruppe aller depressiven Störungen im Vergleich
zur Major Depression könnten Resultat einer größeren
symptomatischen Heterogenität der verschiedenen de-
pressiven Störungen sein.
Erstmals wurde der PHQ auch an einer psychosomati-
schen Patientengruppe validiert. Unsere Ergebnisse bele-
gen, dass er auch in dieser Patientengruppe zur Diagno-
stik psychischer Störungen gut geeignet ist.
Eine gute Konstruktvalidität konnte durch die Bestäti-
gung der Annahme aufgezeigt werden, dass Patienten mit
einer psychischen Störung nach PHQ-D eine erniedrigte
psychosoziale Funktionsfähigkeit sowie eine erhöhte In-
anspruchnahme medizinischer Leistungen und eine er-
höhte Arbeitsunfähigkeit aufweisen.
Zusätzlich zur Psychodiagnostik nach DSM-IV ermög-
licht der PHQD eine Schweregradbestimmung der Depres-
sivität und der somatischen Symptomschwere. Diese
Werte können nützlich sein für die Therapieeinleitung und
die Beurteilung des Therapieergebnisses. Im Vergleich zu
anderen Depressionsfragebögen, welche sich in der Regel
auf die Kernsymptome depressiver Störungen beziehen
(depressive Stimmung und Interessenverlust bzw. Anhe-
donie), erfasst der PHQ-D relevante klinische Informatio-
nen über alle diagnostischen Kriterien depressiver Stö-
rungen, so beispielsweise auch über Schlafstörungen,
Appetitverlust, Suizidalität sowie mangelnden Selbstwert,
was von hohem klinischen Wert ist.
In der vorliegenden Studie konnten bereits publizierte
Empfehlungen für Cut-off-Werte repliziert werden (Löwe,
Spitzer et al., 2004). Für Screeningzwecke, wo eine hohe
Sensitivität von zentraler Bedeutung ist, erscheint ein Cut-
off Wert von 11 für die Diagnose einer Major Depres-
sion und ein Cut-off von 9 für die Diagnose aller depres-
siven Störungen gerechtfertigt. Dies gilt sowohl für medi-
zinische als auch für psychosomatische Stichproben. Für
Anwendungen, in denen eher ausgeglichene Werte von
Sensitivität und Spezifität gewünscht sind, z.B. in epide-
miologischen Untersuchungen, werden etwas niedrigere
Cutoff-Werte bzw. die Verwendung der kategorialen
Algorithmen empfohlen (Löwe, Spitzer et al., 2004). Diese
Werte zeigen eine gute Übereinstimmung mit den von
Kroenke et al. (2001) vorgeschlagenen Cut-off-Werten
von 5 (mild), 10 (moderate), 15 (moderate-severe)
und 20 (severe). Im Gegensatz zu den von Kroenke vor-
geschlagenen Werten berücksichtigen sie aber, ob de-
pressive Störungen insgesamt oder nur die Major Depres-
sion diagnostiziert werden soll. Auch für die Panikstörung
wurden neben dem originalen Auswertungsalgorithmus
alternative Algorithmen validiert, welche eine Steigerung
der Sensitivität ermöglichten (Löwe, Gräfe et al., 2003a).
Limitationen. Unsere Stichprobe setzt sich aus ambu-
lanten internistischen, allgemeinmedizinischen und psy-
chosomatischen Patienten aus Heidelberg zusammen. Die
prädiktiven Werte eines Instrumentes sind abhängig von
der Prävalenz der Störung in der untersuchten Gruppe,
während die Sensitivität und Spezifität theoretisch präva-
lenzunabhängig sind. Insofern sind die hier dargestellten
Werte nur bedingt repräsentativ für andere Stichproben
von medizinischen bzw. psychosomatischen Patienten.
Ein Vergleich der Studienteilnehmer mit den Nichtteilneh-
mern (Fragebogen unausgefüllt oder unvollständig) er-
gab, dass diese sich nicht hinsichtlich des Geschlechts
unterschieden. Allerdings waren die Nichtteilnehmer
signifikant älter (M = 55.1 Jahre, SD = 13.0 vs. M = 43.4
Jahre, SD = 13.0, df = 1, F = 102.24, p < .001). Die gemeinsa-
me Auswertung der internistischen und allgemeinmedizi-
nischen Patienten erschien gerechtfertigt, da beide Stich-
proben gleiche Störungsprävalenzen aufwiesen.
Zusammenfassend kann der PHQ-D als ein hoch vali-
des Instrument zum Screening der Depression und Pa-
nikstörung nach den Kriterien des DSM-IV empfohlen
werden. In vorangegangenen Publikationen konnten wir
zeigen, dass er für depressive Störungen und die Panik-
störung signifikant bessere diagnostische Eigenschaften
aufweist als vergleichbare Instrumente (Löwe, Spitzer
et al., 2004; Löwe, Gräfe et al., 2003a). Die gute Akzeptanz
des PHQ-D als Screeninginstrument durch Patienten und
Ärzte zeigt, dass die Integration des PHQ-D in den klini-
schen Alltag ein realistisches Ziel ist. Die Anwendung
des PHQ-D als ein kurzes und praktikables Screeningin-
strument ist ein erster wichtiger Schritt im diagnostischen
Prozess, der durch eine genaue Anamnese, ein diagnosti-
sches Interview und/oder – insbesondere im Bereich der
Somatoformen Störungen – körperliche Untersuchungen
sinnvoll ergänzt wird (Löwe et al., 2003b).
Damit kann der PHQ-D als ein wertvoller, valider, kos-
ten- und zeitsparender Bestandteil einer umfassenden
Diagnostik psychischer Störungen bei internistischen, all-
gemeinmedizinischen und bei psychosomatischen Patien-
ten gesehen werden. Diese wiederum ist für eine adäquate
und effektive Behandlung psychischer Komorbidität eine
notwendige Voraussetzung.
Literatur
American Psychiatric Association (1994). Diagnostic and Sta-
tistical Manual of Mental Disorders DSM-IV (Fourth Edi-
tion). Washington DC: American Psychiatric Association.
Beck, A. T. & Steer, R. A. (1995). Beck-Depressions-Inventar
(BDI) (2., überarbeitete Auflage). Göttingen: Huber.
Bracken, B. & Barona, A. (1991). State of the art procedures for
translating, validating and using psychoeducational tests in
cross-cultural assessment. School Psychology International,
12, 119–132.
Coulehan, J. L., Schulberg, H. C., Block, M. R., Madonia, M. J.,
& Rodriguez, E. (1997). Treating depressed primary care
patients improves their physical, mental, and social
functioning. Archives of Internal Medicine, 157, 1113–1120.
Diez-Quevedo, C., Rangil, T., Sanchez-Planell, L., Kroenke, K.
& Spitzer, R. L. (2001). Validation and utility of the Patient
Health Questionnaire in diagnosing mental disorders in 1003
general hospital spanish inpatients. Psychosomatic Medici-
ne, 63, 679-686.
Docherty, J. P. (1997). Barriers to the diagnosis of depression in
primary care. Journal of Clinical Psychiatry, 58 (Suppl 1),
5–10.
179
Validierung des PHQ-D
Fava, G. A., Rafanelli, C., Grandi, S., Conti, S., Ruini, C., Man-
gelli, L. & Belluardo, P. (2001). Long-term outcome of panic
disorder with agoraphobia treated by exposure. Psycholog-
ical Medicine, 31, 891–898.
Fleiss, J. L. (1971). Measuring nominal scale agreement among
many raters. Psychological Bulletin, 76, 378–382.
Francke, G. (1995). SCL-90-R. Die Symptom-Checkliste von
Derogatis. Deutsche Version. Göttingen: Beltz Test.
Hansen, M. S., Fink, P., Frydenberg, M., Oxhoj, M., Sonder-
gaard, L. & Munk-Jorgensen, P. (2001). Mental disorders
among internal medical inpatients: prevalence, detection, and
treatment status. Journal of Psychosomatic Research, 50,
199–204.
Henningsen, P., Zimmermann, T. & Sattel, H. (2003). Medically
unexplained physical symptoms, anxiety, and depression: a
meta-analytic review. Psychosomatic Medicine, 65, 528–
533.
Herrmann, C., Buss, U. & Snaith, R. (1995). Hospital Anxiety
and Depression Scale (HADS-D) – Deutsche Version [Ger-
man version]. Bern: Huber.
Jarrett, R. B., Kraft, D., Doyle, J., Foster, B. M., Eaves, G. G. &
Silver, P. C. (2001). Preventing recurrent depression using
cognitive therapy with and without a continuation phase: a
randomized clinical trial. Archives of General Psychiatry, 58,
381–388.
Kessler, R. C., McGonagle, K. A., Zhao, S., Nelson, C. B.,
Hughes, M., Eshleman, S., Wittchen, H. U. & Kendler, K. S.
(1994). Lifetime and 12-month prevalence of DSM-III-R
psychiatric disorders in the United States. Results from the
National Comorbidity Survey. Archives of General Psychia-
try, 51, 8–19.
Klapow, J., Kroenke, K., Horton, T., Schmidt, S., Spitzer, R. L.
& Williams, J. B. W. (2002). Psychological Disorders and
Distress in Older Primary Care Patients: A Comparison of
Older and Younger Samples. Psychosomatic Medicine, 64,
635–643.
Krause, P, Wittchen, H., Höfler, M., Winter, S., Spiegel, B. &
Pfister, H. (2001). „Generalisierte Angst und Depression in
der Allgemeinarztpraxis“ (GAD-P). Studiendesign und Me-
thodik. Fortschritte der Medizin, Sonderheft I/2001, 5–12.
Kroenke, K., Spitzer, R. L. & Williams, J. B. (2001). The
PHQ-9. Validity of a brief depression severity measure.
Journal of General Internal Medicine, 16, 606–613.
Kroenke, K., Spitzer, R. L. & Williams, J. B. (2002). The
PHQ-15: Validity of a New Measure for Evaluating the
Severity of Somatic Symptoms. Psychosomatic Medicine,
64, 258–266.
Linden, M., Maier, W., Achberger, M., Herr, R., Helmchen, H.
& Benkert, O. (1996). Psychische Erkrankungen und ihre
Behandlung in Allgemeinarztpraxen in Deutschland: Ergeb-
nisse aus einer Studie der Weltgesundheitsorganisation
(WHO). Nervenarzt, 67, 205–215.
Löwe, B., Spitzer, R. L., Zipfel, S. & Herzog, W. (2002). Ge-
sundheitsfragebogen für Patienten (PHQ-D). Manual und
Testunterlagen (2. Auflage). Karlsruhe: Pfizer.
Löwe, B., Gräfe, K., Zipfel, S., Spitzer, R., Herrmann-Lingen,
C., Witte, S. & Herzog, W. (2003a). Detecting Panic Dis-
order in Medical Outpatients: Comparative Validation of
the Hospital Anxiety and Depression Scale, the Patient
Health Questionnaire, a Screening Question, and Phy-
sicians’ Diagnosis. Journal of Psychosomatic Research, 55,
515–519.
Löwe, B., Gräfe, K., Kroenke, K., Zipfel, S., Quenter, A., Wild,
B., Fiehn, C. & Herzog, W. (2003b). Predictors of psychia-
tric comorbidity in medical outpatients. Psychosomatic
Medicine, 65, 764–770.
Löwe, B., Kroenke, K., Herzog, W. & Gräfe, K. (in press).
Measuring depression outcome with a brief self-report in-
strument: sensitivity to change of the Patient Health Ques-
tionnaire (PHQ-9). Journal of Affective Disorders.
Löwe, B., Spitzer, R. L., Gräfe, K., Kroenke, K., Quenter, A.,
Zipfel, S., Bucholz, C., Witte, S. & Herzog, W. (2004). Com-
parative validity of three screening questionnaires for DSM-
IV depressive disorders and physicians’ diagnoses. Journal
of Affective Disorders, 78, 131–140.
Newman, M. G., Kachin, K. E., Zuellig, A. R., Constantino, M.
J. & Cashman-McGrath, L. (2003). The social phobia diag-
nostic questionnaire: preliminary validation of a new self-
report diagnostic measure of social phobia. Psychological
Medicine, 33, 623–635.
Persoons, P., Luyckx, K., Desloovere, C., Vandenberghe, J. &
Fischler, B. (2003). Anxiety and mood disorders in otorhi-
nolaryngology outpatients presenting with dizziness: Vali-
dation of the self-administered PRIME-MD Patient Health
Questionnaire and epidemiology. General Hospital Psychia-
try, 25, 316–323.
SAS-Institute Inc. (1999). SAS Language Reference (Version
Version 8). [Computer software]. Carry, NC.
Simon, G., Ormel, J., Von Korff, M. & Barlow, W. (1995).
Health care costs associated with depressive and anxiety
disorders in primary care. American Journal of Psychiatry,
152, 352–357.
Spitzer, R. L., Kroenke, K., Linzer, M., Hahn, S. R., Williams, J.
B., deGruy, F. V., III, Brody, D. & Davies, M. (1995).
Health-related quality of life in primary care patients with
mental disorders. Results from the PRIMEMD 1000 Study.
JAMA, 274, 1511–1517.
Spitzer, R. L., Kroenke, K. & Williams, J. B. (1999). Validation
and utility of a self-report version of PRIME-MD: The
PHQ primary care study. JAMA, 282, 1737–1744.
Spitzer, R. L., Williams, J. B., Kroenke, K., Hornyak, R.
& McMurray, J. (2000). Validity and utility of the PRIME-
MD patient health questionnaire in assessment of 3000
obstetric-gynecologic patients: the PRIME-MD Patient
Health Questionnaire Obstetrics-Gynecology Study. Amer-
ican Journal of Obstetrics and Gynecology, 183, 759–769.
Tress, W., Kruse, J., Heckrath, C., Schmitz, N. & Albert, L.
(1997). Psychogene Erkrankungen in hausärztlichen
Praxen. Zeitschrift für Psychosomatische Medizin, 43, 211–
232.
U.S. Preventive Services Task Force (2002). Screening for De-
pression: Recommendations and rationale. Annuals of Inter-
nal Medicine, 136, 760–764.
Westen, D. & Morrison, K. (2001). A multidimensional meta-
analysis of treatments for depression, panic, and generalized
anxiety disorder: an empirical examination of the status of
empirically supported therapies. Journal of Consulting and
Clinical Psychology, 69, 875–899.
Williams, J. W., Noel, P. H., Cordes, J. A., Ramirez, G. & Pigno-
ne, M. (2002). Is this patient clinically depressed? JAMA,
287, 1160–1170.
Wittchen, H., Zaudig, M. & Fydrich T. (1997). Strukturiertes
Klinisches Interview für DSM-IV (SKID), Achse I. Göttin-
gen: Hogrefe.
Wittchen, H. & Perkonigg, A. (1997). DIA-X-Screening-Verfah-
ren: Fragebogen DIA-SSQ: Screening für psychische Stö-
rungen; Fragebogen DIA-ASQ: Screening für Angststörun-
gen; Fragebogen DIA-DSQ: Screening für Depressionen.
Frankfurt: Swets & Zeitlinger bv.
Wittchen, H. (2000). Depressionen in der Allgemeinarztpraxis.
Die bundesweite Depressionsstudie. Stuttgart: Schattauer.
Wittchen, H. U., Krause, P., Hoyer, J., Beesdo, K., Jacobi, F.,
Höfler, M. & Winter, S. (2001). Prävalenz und Korrelate
Generalisierter Angststörungen in der Allgemeinarztpraxis.
Fortschritte der Medizin, 119 Suppl 1, 17–25.
Wittchen, H. U., Kessler, R. C., Beesdo, K., Krause, P., Hofler,
M. & Hoyer, J. (2002). Generalized anxiety and depression
in primary care: prevalence, recognition, and management.
Journal of Clinical Psychiatry, 63 Suppl 8, 24–34.
180
Kerstin Gräfe, Stephan Zipfel, Wolfgang Herzog und Bernd Löwe
Zimmerman, M. & Mattia, J. I. (2001 a). A self-report scale to
help make psychiatric diagnoses: the Psychiatric Diagnostic
Screening Questionnaire. Archives of General Psychiatry,
58, 787–794.
Zimmerman, M. & Mattia, J. I. (2001b). The Psychiatric Diag-
nostic Screening Questionnaire: development, reliability and
validity. Comprehensive Psychiatry, 42, 175–189.
Dipl.-Psych. Kerstin Gräfe
Medizinische Klinik der Universität Heidelberg
Abt. Innere Medizin II
(Allgemeine Klinische und Psychosomatische Medizin
und Sektion Allgemeinmedizin)
Im Neuenheimer Feld 410
69120 Heidelberg
E-Mail: Kerstin_Graefe@med.uni-heidelberg.de
181
Validierung des PHQ-D
Wenn „NEIN“, gehen Sie bitte weiter zu Frage 3.
... Depression levels were assessed using the Dutch (van Steenbergen-Weijenburg et al., 2010) and German (Gräfe et al., 2004) translation of the Patient Health Questionnaire-9 (PHQ-9; Kroenke et al., 2001). The PHQ-9 assesses depression symptoms experienced during the past two weeks. ...
Preprint
Full-text available
Background: There is a need for an interview to assess criteria for Prolonged Grief Disorder (PGD) included in the text-revised fifth edition of the Diagnostic and Statistical Manual for Mental Disorder (DSM-5-TR) and 11th edition of the International Classification of Disease (ICD-11). We evaluated the psychometric properties of the Traumatic Grief Inventory-Clinician Administered (TGI-CA); a new interview for DSM-5-TR and ICD-11 PGD. Methods: In 211 Dutch and 222 German bereaved adults, the: (i) factor structure, (ii) internal consistency, (iii) test-retest reliability, (iv) measurement invariance across subgroups (e.g., differing in language and since loss), (v) prevalence of probable caseness, (vi) convergent validity, and vii) known-groups validity were examined. Results: Confirmatory factor analyses (CFAs) showed acceptable fit for the unidimensional model for DSM-5-TR and ICD-11 PGD. Omega values indicated good internal consistency. Test-retest reliability was high. Multi-group CFAs demonstrated configural and metric invariance for DSM-5-TR and ICD-11 PGD criteria for all group-comparisons; for some we also found support for scalar invariance. Rates of probable caseness for DSM-5-TR PGD were lower than ICD-11 PGD. Optimal agreement in caseness was reached when increasing the number of accessory symptoms for ICD-11 PGD from 1+ to 3+. Convergent and known-groups validity was demonstrated for both criteria-sets. Limitations: The TGI-CA was developed for use in practice. However, this validation study was conducted in a non-clinical setting. Conclusions: The TGI-CA seems a reliable and valid interview for DSM-5-TRand ICD-11 PGD symptomatology. More research among larger and more diverse samples is needed to further test its psychometric properties.
... Primary outcome The primary outcome measure is mental distress, as measured by the composite score of the 7-item Generalized Anxiety Screener (GAD-7) and 8-item Patient Health Questionnaire (PHQ-8). Individually, both scales have demonstrated satisfactory validity and reliability and are widely used outcome measures in psychotherapy research [25][26][27][28]. As a composite score, the PHQ-ADS, a sum score of the GAD-7 and PHQ-9, has been found to have good convergent and construct validity as well as sensitivity to change in both anxiety and depression [29]. ...
Article
Full-text available
Background In blended therapy, face-to-face psychotherapy and Internet-based interventions are combined. Blended therapy may be advantageous for patients and psychotherapists. However, most blended interventions focus on cognitive behavioral therapy or single disorders, making them less suitable for routine care settings. Methods In a randomized controlled trial, we will compare blended therapy and face-to-face therapy in routine care. We intend to randomize 1152 patients nested in 231 psychotherapists in a 1:1 ratio. Patients in the blended therapy group will receive access to a therapeutic online intervention (TONI). TONI contains 12 transdiagnostic online modules suited for psychodynamic, cognitive behavioral, and systemic therapy. Psychotherapists decide which modules to assign and how to integrate TONI components into the psychotherapeutic process to tailor treatment to their patients’ specific needs. We will assess patients at baseline, 6 weeks, 12 weeks, and 6 months. Patients enrolled early in the trial will also complete assessments at 12 months. The primary outcomes are depression and anxiety at 6-month post-randomization, as measured by PHQ-8 and GAD-7. The secondary outcomes include satisfaction with life, level of functioning, personality traits and functioning, eating pathology, sexual problems, alcohol/drug use, satisfaction with treatment, negative effects, and mental health care utilization. In addition, we will collect several potential moderators and mediators, including therapeutic alliance, agency, and self-efficacy. Psychotherapists will also report on changes in symptom severity and therapeutic alliance. Qualitative interviews with psychotherapists and patients will shed light on the barriers and benefits of the blended intervention. Furthermore, we will assess significant others of enrolled patients in a sub-study. Discussion The integration of online modules which use a common therapeutic language and address therapeutic principles shared across therapeutic approaches into regular psychotherapy has the potential to improve the effectiveness of psychotherapy and transfer it into everyday life as well help save therapists’ resources and close treatment gaps. A modular and transdiagnostic setup of the blended intervention also enables psychotherapists to tailor their treatment optimally to the needs of their patients. Trial registration German Clinical Trials Register (DRKS) DRKS00028536. Registered on 07.06.2022.
... Depressive Tendenzen. Der Online-Fragebogen erfasste die Ausprägung von depressiven Tendenzen mit Hilfe des PHQ-9 (Gilbody et al., 2007;Gräfe et al., 2004). Mit jedem der neun Items fragt der PHQ-9 die subjektiv wahrgenommene Beeinträchtigung durch depressionsrelevante Symptome nach DSM-5 bzw. ...
Article
Background Quarantine and physical distancing represent the two most important non-pharmaceutical actions to contain the COVID-19 pandemic. Comparatively little is known about possible adverse consequences of these behavioural measures in Germany. This study aimed at investigating potential early adverse effects associated with quarantine and physical distancing at the beginning of the countrywide lockdown in Germany in March 2020. Method Using a cross-sectional online survey (N = 4,268), adverse consequences attributed to physical distancing, symptoms of psychopathology, and sociodemographic variables were explored in the total sample as well as in high-risk groups (i.e., people with a physical or mental condition). Results The most frequently reported adverse effects were impairment of spare time activities, job-related impairment, and adverse emotional effects (e.g., worries, sadness). Participants with a mental disorder reported the highest levels of adverse consequences (across all domains) compared to participants with a physical disease or participants without any mental or physical condition. No significant association between the duration of the behavioural protective measures and the severity of adverse mental health effects was observed. Conclusion Results showed that non-pharmaceutical actions were associated with adverse effects, particularly in people with mental disorders. The findings are of relevance for tailoring support to special at-risk groups in times of behavioural preventive strategies.
Thesis
Full-text available
Sufficient studies are currently available that summarize and compare the mental health of the population and hospital staff during the COVID-19 pandemic, but mostly insufficiently compare them with the time before the pandemic. There is currently no study that compares the mental health of the population and hospital staff of a country internationally during and before the pandemic. In this work, (1) the mental health (stress, depression, anxiety, mental well-being, mental quality of life) of Austrian hospital staff is empirically assessed using questionnaires (PSS-10, PHQ-9, GAD-7, WHO-5, WHOQOL-BREF), compared to an Austrian population sample and checked for differences. The Austrian hospital staff (N= 1.037) differs significantly from the Austrian population in all outcomes (stress ↑, depression ↑, quality of life ↑, anxiety ↓, mental well-being ↓), except for the degree of insomnia, with a small effect size (Hedges g: -0.33-0.02). The results were then (2) compared internationally and to the pre-pandemic period using a systematic literature review. The mental health of the Austrian (stress ↑, depression ↑, anxiety ↑, quality of life ↓) and global (depression ↑, anxiety ↑, insomnia ↑) population, as well as of hospital staff (depression ↑, anxiety ↑) has worsened in all comparable outcomes compared to the time before the pandemic. In an international comparison, the Austrian population has shown better mental health in the period of the pandemic so far (depression ↓, anxiety ↓). In an international comparison, the Austrian hospital staff is less anxious in times of high stress, with a similar prevalence of depression and insomnia. The results should be interpreted with caution due to the lack of representativeness. For the Austrian population and hospital staff, it will be essential in the future that mental health is promoted more, that the taboo on mental treatment is broken and that outpatient and inpatient mental care is significantly expanded.
Article
Full-text available
Behavioral activation (BA) interventions systematically encourage positive and value-based activities. Engaging in them is an effective way to counteract negative affect, but it is unknown whether there are subtypes of activities that may have differential effects on mood. This study investigated the factorial structure of 99 potentially rewarding activities used in an online BA intervention during the COVID-19 lockdown. About 3624 German-speaking participants evaluated a list of 99 activities that were easy to apply. We analyzed the initially 99 activities by means of confirmatory factor analysis. Since activities can either be seen as reflective or formative indicators, a reflective as well as a formative model was analyzed. Although the range of chosen activities differed clearly between respondents, a one-factor model provided the best fit. It seems that a general "activity" factor is more important for explaining whether people choose a certain activity or not, than specific characteristics of the activity itself.
Article
Full-text available
The theory of the behavioral immune system (BIS) describes a set of behaviors that protect the individual from infectious diseases and that are motivated by disgust and the perceived vulnerability to disease. As interpersonal touch is one of the most common situations of potential transmission of infectious diseases in our everyday life, it seems likely that being touched by an apparently sick individual activates disgust. Our aim was to determine if risk of contamination from interpersonal touch alters the pleasantness of interpersonal touch and modulates facially expressed emotions. In total, 64 participants received interpersonal stroking by either a healthy or by sick-appearing experimenter. Half the strokes were performed at a slow velocity of 3 cm/s and half at a faster velocity of 30 cm/s, to modulate the degree of C-tactile fiber activation in the touch perceiver. While the experimental sickness manipulation did not influence the reported touch pleasantness, there was a tendency for a diminished expression of happiness in the slow stroking condition. In addition, the desire to clean the arm after stroking correlated positively to disgust sensitivity and to germ aversion, which is a subscale of the perceived vulnerability to disease. Contrary to previous studies, participants did not prefer the slow over the fast stroking velocity, irrespective of sickness induction. Our results lead us to assume that disgust in interpersonal touch depends especially on the touch receiver and we speculate that a rather conservative reactivity of the BIS allows for an adaptive behavioral balance in interpersonal relations. This balance may be needed to weight the risks of contamination against the benefits of interpersonal touch for social interaction.
Article
Objectives: Predictive processing approaches to belief updating in depression propose that depression is related to more negative and more precise priors. Also, belief updating is assumed be negatively biased in comparison to normative Bayesian updating. There is a lack of efficient methods to mathematically model belief updating in depression. Methods: We validated a novel performance belief updating paradigm in a nonclinical sample (N = 133). Participants repeatedly participated in a non-self-related emotion recognition task and received false feedback. Effects of the feedback manipulation and differences in depressive symptoms on belief updating were analysed in Bayesian multilevel analyses. Results: Beliefs were successfully manipulated through the feedback provided. Depressive symptoms were associated with more negative updating than normative Bayesian updating but results were influenced by few cases. No evidence of biased change in beliefs or overly precise priors was found. Depressive symptoms were associated with more negative updating of generalised performance beliefs. Conclusions: There was cautious support for negatively biased belief updating associated with depressive symptoms, especially for generalised beliefs. The content of the task may not be self-relevant enough to cause strong biases. Further explication of Bayesian models of depression and replication in clinical samples is needed.
Article
Negative outcome expectations of psychological treatments predict unfavorable treatment outcomes. Therefore, therapists should approach negative outcome expectations and ideally transform them into more positive outcome expectations. In this study, we investigated the therapist’s interpersonal behavior to optimize the modification of negative outcome expectations. After inducing negative expectations in an online experiment, we presented different videos of therapist–patient interactions to violate the induced negative outcome expectations. We kept the expectation-violating information constant and manipulated the therapist’s warmth and competence. Results confirmed a significant influence of the therapist’s warmth and competence on expectation violation, which led to the most positive outcome expectations when the therapist was both warm and competent. In contrast to former correlational analyses, our experimental study confirms the causal role of the therapist’s interpersonal behavior and its impact on changing patients’ negative outcome expectations. On the basis of these findings, more powerful approaches to optimize critical outcome expectations can be developed.
Article
As stress in students has increased in the last years, factors predicting stress need to be investigated. The aim of the present study was to replicate previous findings using the demand-control model and to examine the role of emotional distress in a transactional model (inspired by Lazarus’ transactional stress model). Stress, mental health, demands and control and several additional attributes were assessed. Different multiple linear hierarchical regressions were examined. The demand-control model explained a total of 55% in variance (including depression and anxiety as confounding variables). The transactional model explained a total of 62% in variance. All in all, the predictive validity of the transactional model exceeded that of the demand-control model in predicting students’ perceived stress. Especially intraindividual aspects like self-efficacy, coping and resources are of relevance for student interventions.
Article
Full-text available
Background: Cognitive therapy (CT) may reduce depressive relapse and recurrence when patients learn and use the associated skills. Reported relapse and recurrence rates after CT discontinuation vary widely. The factors that determine when CT is preventive remain unidentified. We developed continuation-phase CT (C-CT) to teach responders skills to prevent relapse. This is the first randomized trial comparing CT with and without a continuation phase in responders to CT who were vulnerable, given their history of recurrent unipolar depression.
Article
Full-text available
The purpose of this paper is to outline state of the art procedures for test translation, validation and use in multicultural, multilingual assessment. Guidelines are based on psychometric, linguistic, cultural and practical considerations. The authors encourage sound practice within the international psychological community in its assessment of children outside the intended source language and/or culture of available tests.
Article
This statement summarizes the current U.S. Preventive Services Task Force (USPSTF) recommendations for screening for depression and the supporting scientific evidence and updates the 1996 USPSTF recommendations on this topic. At that time, the USPSTF concluded that there was insufficient evidence to recommend for or against routine use of standardized questionnaires to screen for depression in primary care patients. The complete information on which the current statement is based, including evidence tables and references, is available in the accompanying article in this issue and in the systematic evidence review on this topic, which can be obtained through the USPSTF Web site (www.ahrq.gov/clinic/uspstfix.htm) and in print through the Agency for Healthcare Research and Quality Publications Cleaninghouse (800-358-9295).
Article
The treatment of psychogenic disorders in Germany is mainly done by general practitioners. Therefore, we investigated the frequency of psychogenic disorders in 18 general practitioners' offices and describe medical and psychosocial aspects of this health care system. 572 patients after the general practitioner's consultation were examined and diagnosed by a psychotherapist (among others Impairment Score, DSM-III-R classification). We also collected patients' self-ratings by questionnaires (SCL-90-R, questions about subjective illness theory). 36,4% of patients fulfilled relevant DSM-III-R criteria and showed considerable impairment (IS > 4). By means of SCL-90-R, 31,7% are classified as psychogenically ill. There is no sex difference in the frequency of psychogenic disorder, but in DSM-III-R diagnostic range. Totally, the general practitioners with 11,5% of their patients lead a conversation in the sense of psychosomatic basic care, but only 3,3% are referred to psychotherapy. These numbers are higher with psychogenically ill patients who themselves assume a psychic cause of their illness. Our data document the importance of psychosomatic medicine and the general practitioners' psychosomatic basic care in their diagnostics and therapy.
Article
AIM: The investigators evaluated the (target-day) point prevalence and correlates of generalized anxiety and depression in German primary care practices. METHOD: The study used a representative national sample of more than 500 primary care practices. On a target day, all primary care patients were examined by questionnaires (GAS-Q and DSQ). RESULTS: Conservatively estimated, 5.3% of all primary care patients met criteria for generalized anxiety disorder (GAD). Similar prevalence estimations were found for Major Depression. Only 30% of all GAD patients met criteria for depression cross-sectionally. Patients with GAD (whether comorbid with depression or not) were more frequently female, reported an onset of GAD mostly between ages of 25 and 45 years, had increased rates of disability and impairment in major social roles and high utilization rates of all health care resources. They also revealed a predominantly chronic course of illness over a period of several years and an increased suicide rate. The presence of physical illness increased rates of handicap/impairment days in the past month. Associated negative outcomes were found to be similar to those observed in depressive disorders. Patients with GAD reported significantly more frequently sleep, anxiety and depressive problems as primary reasons for contact. CONCLUSION: The GAD-P study highlights the significance of GAD in primary care as a condition that occurs at about the same frequency as major depression. Further, the relatively high proportion of pure GAD suggests that the frequency of depression-comorbidity of GAD has previously been overestimated.
Article
Background: This study describes the functioning of primary care patients with major depressive disorder, the relationship of medical comorbidity to functional status, and the effects of depression-specific treatment on functional status after 8 months. Methods: Patients were randomized to a protocol intervention (nortriptyline hydrochloride or interpersonal psychotherapy) or to usual care with the patient's physician in a clinical trial of primary care treatments of depression. Their functional status was evaluated using the Medical Outcomes Study 36-Item Short Form Health Survey (SF-36) and the Global Assessment Scale. Medical comorbidity was assessed with the Duke Severity of Illness Checklist. The Hamilton Rating Scale for Depression and Beck Depression Inventory were used to measure depressive severity. Assessments were conducted at baseline and at 1, 2, 4, and 8 months after randomization. Results: At baseline, patients reported substantial impairments in the functional domains as assessed by the SF-36 and Global Assessment Scale. Severity of general medical illness and depression were not correlated. Greater medical comorbidity was associated with diminished physical, but not psychological, functioning. Mean scores on SF-36 scales and the Global Assessment Scale improved significantly during the 8 months of follow-up. Patients assigned to protocol treatments showed greater improvement, compared with those assigned to usual care, on the SF-36 mental summary scale and most individual scales but not on the SF-36 physical summary scale. However, patients who completed protocol treatment also experienced significant improvement on the physical summary scale. Medical comorbidity was only a weak predictor of outcome. Conclusions: Primary care patients with major depressive disorder report substantial impairments in physical, psychological, and social functioning on initial assessment. Severity of baseline medical comorbidity did not correlate with severity of depression and only weakly correlated with functional status at 8 months. Functional impairments improve with time, but standardized depression-specific treatment is associated with greater improvement in more domains of functioning than is a physician's usual care. Arch Intern Med. 1997;157:1113-1120
Article
Objective. —To determine if different mental disorders commonly seen in primary care are uniquely associated with distinctive patterns of impairment in the components of health-related quality of life (HRQL) and how this compares with the impairment seen in common medical disorders.Design. —Survey.Setting. —Four primary care clinics.Subjects. —A total of 1000 adult patients (369 selected by convenience and 631 selected by site-specific methods to avoid sampling bias) assessed by 31 primary care physicians using PRIME-MD (Primary Care Evaluation of Mental Disorders) to make diagnoses of mood, anxiety, alcohol, somatoform, and eating disorders.Main Outcome Measures. —The six scales of the Short-Form General Health Survey and self-reported disability days, adjusting for demographic variables as well as psychiatric and medical comorbidity.Results. —Mood, anxiety, somatoform, and eating disorders were associated with substantial impairment in HRQL. Impairment was also present in patients who only had subthreshold mental disorder diagnoses, such as minor depression and anxiety disorder not otherwise specified. Mental disorders, particularly mood disorders, accounted for considerably more of the impairment on all domains of HRQL than did common medical disorders. Finally, we found marked differences in the pattern of impairment among different groups of mental disorders just as others have reported unique patterns associated with different medical disorders. Whereas mood disorders had a pervasive effect on all domains of HRQL, anxiety, somatoform, and eating disorders affected only selected domains.Conclusions. —Mental disorders commonly seen in primary care are not only associated with more impairment in HRQL than common medical disorders, but also have distinct patterns of impairment. Primary care directed at improving HRQL needs to focus on the recognition and treatment of common mental disorders. Outcomes studies of mental disorders in both primary care and psychiatric settings should include multidimensional measures of HRQL.(JAMA. 1995;274:1511-1517)
Article
Objective: While considerable attention has focused on improving the detection of depression, assessment of severity is also important in guiding treatment decisions. Therefore, we examined the validity of a brief, new measure of depression severity. Measurements: The Patient Health Questionnaire (PHQ) is a self-administered version of the PRIME-MD diagnostic instrument for common mental disorders. The PHQ-9 is the depression module, which scores each of the 9 DSM-IV criteria as "0" (not at all) to "3" (nearly every day). The PHQ-9 was completed by 6,000 patients in 8 primary care clinics and 7 obstetrics-gynecology clinics. Construct validity was assessed using the 20-item Short-Form General Health Survey, self-reported sick days and clinic visits, and symptom-related difficulty. Criterion validity was assessed against an independent structured mental health professional (MHP) interview in a sample of 580 patients. Results: As PHQ-9 depression severity increased, there was a substantial decrease in functional status on all 6 SF-20 subscales. Also, symptom-related difficulty, sick days, and health care utilization increased. Using the MHP reinterview as the criterion standard, a PHQ-9 score > or =10 had a sensitivity of 88% and a specificity of 88% for major depression. PHQ-9 scores of 5, 10, 15, and 20 represented mild, moderate, moderately severe, and severe depression, respectively. Results were similar in the primary care and obstetrics-gynecology samples. Conclusion: In addition to making criteria-based diagnoses of depressive disorders, the PHQ-9 is also a reliable and valid measure of depression severity. These characteristics plus its brevity make the PHQ-9 a useful clinical and research tool.