ArticlePDF Available

Messgüte des vereinfachtenBeck-Depressions-Inventars (BDI-V)

Authors:
  • Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau

Abstract

Zusammenfassung. An einer demographisch heterogenen Gelegenheitsstichprobe (n = 200) und drei klinischen Stichproben (Major Depressive Disorder, n = 60; Angst- und Essstorungen, n = 11; Schizophrenie, n = 40) wurden Messeigenschaften des vereinfachten Beck-Depressions-Inventars (BDI-V) ermittelt. Homogenitat und Reliabilitat des BDI-V ubersteigen jene des Original-BDI (BDI-O) und jene weiterer vier Depressionsskalen. BDI-V und BDI-O konvergieren auf der Ebene einzelner Symptome (durchschnittliche Korrelation in der Gesamtstichprobe = .70) und auf der Ebene des Summenwertes (r = .91 in der Gesamtstichprobe). Beide BDI-Versionen korrelieren in ahnlicher Hohe mit anderen Selbstbeschreibungsmasen der Depression (durchschnittliche Korrelation = .70) und einem Expertenrating (Hamilton-Skala, r = .50). BDI-V und BDI-O differenzieren ahnlich gut zwischen klinisch unauffalligen Personen und Patienten mit einer depressiven Primar- oder Sekundarsymptomatik. Vergleichbar gut gelingt mit beiden Versionen auch die Diff...
147
Messgüte des BDI-V
Sonderdruck aus: Diagnostica, 49, Heft 4, 147–156, © Hogrefe-Verlag Göttingen 2003
Messgüte des vereinfachten
Beck-Depressions-Inventars (BDI-V)
Manfred Schmitt, Mingo Beckmann, Detlev Dusi, Jürgen Maes,
August Schiller und Klaus Schonauer
DOI: 10.1026//0012-1924.49.4.147
Zusammenfassung. An einer demographisch heterogenen Gelegenheitsstichprobe (n = 200) und drei klinischen Stichpro-
ben (Major Depressive Disorder, n = 60; Angst- und Essstörungen, n = 11; Schizophrenie, n = 40) wurden Messeigenschaften
des vereinfachten Beck-Depressions-Inventars (BDI-V) ermittelt. Homogenität und Reliabilität des BDI-V übersteigen jene
des Original-BDI (BDI-O) und jene weiterer vier Depressionsskalen. BDI-V und BDI-O konvergieren auf der Ebene einzelner
Symptome (durchschnittliche Korrelation in der Gesamtstichprobe = .70) und auf der Ebene des Summenwertes (r = .91 in der
Gesamtstichprobe). Beide BDI-Versionen korrelieren in ähnlicher Höhe mit anderen Selbstbeschreibungsmaßen der Depres-
sion (durchschnittliche Korrelation = .70) und einem Expertenrating (Hamilton-Skala, r = .50). BDI-V und BDI-O differen-
zieren ähnlich gut zwischen klinisch unauffälligen Personen und Patienten mit einer depressiven Primär- oder Sekundärsymp-
tomatik. Vergleichbar gut gelingt mit beiden Versionen auch die Differenzierung klinischer Gruppen. Eine konfirmatorische
Faktorenanalyse ergab in der klinisch unauffälligen Stichprobe eine geringfügige Abweichung von perfekter Messäquivalenz
(1.00 r .95). Diese Abweichung ist für die diagnostische Praxis unbedeutend. Mit dem vereinfachten BDI steht ein
Instrument zur Verfügung, das gleich gute Messeigenschaften aufweist wie das Original, diesem in seiner Messökonomie aber
deutlich überlegen ist und sich deshalb insbesondere für epidemiologische Screenings an großen Stichproben eignet.
Schlüsselwörter: Messäquivalenz, klinische Differenzialdiagnostik, Testökonomie
Validity of the simplified Beck Depression Inventory
Abstract. A simplified version of the Beck Depression Inventory was administered to participants of a demographically
heterogeneous sample (n = 200) and to three clinical samples (Major Depressive Disorder, n = 60; Anxiety and Eating
Disorders, n = 11; Schizophrenia, n = 40). The reliability of the simplified BDI (.93) exceeded the reliability of the original
BDI (.84) and the reliabilities of four other depression scales. Both BDI versions converge well on the level of symptoms
(average correlation = .70 in the total sample) and on the level of sum scores (r = .91 in the total sample). Both BDI versions
correlate equally high with other self-report measures of depression (average correlation = .70) and an expert rating of
depression (Hamilton-Scale, r = .50). Both versions discriminate depressed individuals about equally well from normal
individuals. They also discriminate about equally well between clinical samples. Confirmatory factor analyses show a slight
deviation from perfect measurement equivalence (1.00 r .95). This deviation from perfect equivalence is trivially low
with regard to practical applications of the BDI. It is concluded that the simplified BDI measures depression equally well but
more efficiently than the original BDI. The simplified version is therefore especially suitable for large scale epidemiological
screenings.
Key words: measurement equivalence, differential validity, measurement efficiency
Das Depressions-Inventar von Beck (BDI) ist eines der
bedeutendsten Instrumente in der klinisch-psychologi-
schen Diagnostik. Zahlreiche Untersuchungen bescheini-
gen dem BDI eine gute Zuverlässigkeit und Validität
(Beck, Steer & Garbin, 1988; Lukesch, 1974; Richter, 1991;
Richter, Werner & Bastine, 1994; Röhrle, 1988). In der ak-
tuellen Originalversion werden 21 depressionstypische
Symptome über je vier Aussagen steigender Schwierig-
keit erfasst (Beck & Steer, 1987; deutsch: Hautzinger,
Bailer, Worall & Keller, 1994). Diese Form der Skalierung
reduziert die Ökonomie des BDI. Diagnostikanden müs-
sen insgesamt 84 Aussagen (plus eine Alternativfrage zur
Motivation der Gewichtsreduktion) lesen, verarbeiten und
beantworten. Bei schwer depressiven Patienten bedeutet
dies eine erhebliche und vermutlich unnötige Beanspru-
chung, die zum vorzeitigen Abbruch des Verfahrens füh-
ren kann. Zudem verursacht das Format des BDI im Rah-
men epidemiologischer Screenings und multivariater Fra-
gebogenstudien an großen Stichproben Kosten, die mög-
licherweise vermeidbar wären.
Trotz der Verfügbarkeit von Depressionsskalen, die
das Problem der umständlichen Intensitätsskalierung des
BDI und seine geringe Ökonomie nicht teilen (Hautzinger
& Meyer, 2002), erscheint eine Optimierung des BDI wün-
schenswert, da dieses Inventar weltweit eine führende
Rolle spielt und vermutlich auch in Zukunft spielen wird.
Zudem ist die Existenz mehrerer Messverfahren für ein
Konstrukt vorteilhaft, um Testeffekte in Wiederholungs-
untersuchungen zu minimieren, wie sie in der Klinischen
Psychologie im Rahmen der Kontrolle von Therapieeffek-
ten auftreten können. Weiterhin können alternative Mess-
148 Manfred Schmitt et al.
instrumente zur Konstruktdifferenzierung beitragen, ins-
besondere wenn die Instrumente in verschiedenen theo-
retischen Traditionen wurzeln oder unterschiedliche
Ausschnitte eines psychologischen Phänomenbereichs
akzentuieren. Ferner ist die Verfügbarkeit alternativer
Messverfahren zur Abschätzung von Methodenvarianz
hilfreich (Eid & Diener, im Druck). Schließlich kann es
vorteilhaft sein, das Format eines Messinstrumentes zu
variieren, um es an unterschiedliche Verwendungszusam-
menhänge anzupassen. Die Intensitätsskalierung des BDI
mag in einem klinischen Interview Vorteile haben, wäh-
rend sie bei der selbstständigen Bearbeitung einfacher
aufgebauten Verfahren sicher unterlegen ist.
Aus diesen Gründen schlugen Schmitt und Maes
(2000) zur Steigerung der Ökonomie eine vereinfachte Fas-
sung des BDI vor (BDI-V). 20 Symptome des Original BDI
(BDI-O) wurden übernommen. Auf das Symptom des
Gewichtsverlusts wurde verzichtet, weil es von allen
Symptomen die geringste Trennschärfe besitzt (Hautzin-
ger et al., 1994; Kammer, 1983). Die Symptome werden im
Unterschied zum BDI-O nicht durch vier, sondern nur
durch eine Aussage operationalisiert. Zur Messung der
Symptomstärke wird eine sechsstufige Häufigkeitsskala
(0/nie-1-2-3-4-5/fast immer) verwendet. Der Verein-
fachungsvorschlag von Schmitt und Maes (2000) führt zu
einer Kürzung von 84 (+2) auf 20 Items. Instruktion, Item-
wortlaut, Antwortformat und Layout des BDI-V sind in
Abbildung 1 wiedergegeben.
Aus der Anzahl der 20 Items und der gewählten num-
merischen Verankerung der Antwortstufen (0 bis 5) ergibt
sich für die Skala (Itemsumme) ein Wertebereich von 0 bis
100. Schmitt und Maes (2000) untersuchten die Mess-
eigenschaften des BDI-V an einer heterogenen Stichpro-
be von 2500 Personen und ermittelten eine interne Kon-
sistenz (α) von .90. In Latent-State-Trait-Analysen erwies
sich der Summenwert als sehr reliabel (.95). Die Trait-Kon-
sistenz betrug über einen Zeitraum von zwei Jahren .64,
die Messgelegenheitsspezifität .26, die Methodenspezifi-
tät für Testhälften .05. Zur Konstruktvalidierung des ver-
einfachten BDI wurden von Schmitt und Maes (2000) Kor-
relationen mit anderen Indikatoren
des Wohlbefindens, mit demogra-
phischen Variablen, mit der objek-
tiven und subjektiven Qualität der
beruflichen Situation, mit dem
Glauben an eine gerechte und eine
ungerechte Welt, mit Kontrollier-
barkeitsüberzeugungen und mit
Einschätzungen beruflicher Mög-
lichkeiten im vereinigten Deutsch-
land ermittelt. Die ermittelten Kor-
relationen stimmten mit den theo-
retischen Erwartungen überein
und sprechen für die Konstruktva-
lidität des BDI-V.
Allerdings war die Untersu-
chung von Schmitt und Maes
(2000) nicht mit dem Ziel einer Vali-
dierung des BDI-V geplant wor-
den. Vielmehr wurden die Messei-
genschaften des BDI-V im Rahmen
einer Längsschnittstudie zu den
psychologischen Folgen der deut-
schen Wiedervereinigung unter-
sucht. Schmitt und Maes (2000)
schlugen deshalb weitere Unter-
suchungen zu den Messeigen-
schaften vor, insbesondere (1)
eine Prüfung der Messäquivalenz
des vereinfachten BDI mit dem
Original-BDI, (2) eine Konstrukt-
validierung an anderen Selbst-
und Fremdbeschreibungsmaßen
der Depression, (3) eine Untersu-
chung der differentialdiagnosti-
schen Trennschärfe bei der Unter-
scheidung klinischer Gruppen, (4)
die Normierung an einer bevölke-
rungsrepräsentativen Stichprobe
sowie (5) die empirische Bestim-Abbildung 1. Instruktion, Itemwortlaut, Antwortformat und Layout des BDI-V.
149
Messgüte des BDI-V
mung der Änderungssensitivität als Funktion des Zeit-
raums, den die Person laut Instruktion bei der Beantwor-
tung der Fragen integrieren soll.
Die vorliegende Studie zielt auf die ersten drei dieser
Desiderate. Einer klinisch unauffälligen, demographisch
heterogenen Gelegenheitsstichprobe von 200 Personen
wurden das vereinfachte BDI, das Original-BDI sowie vier
weitere Depressionsskalen vorgelegt. Weiterhin wurden
beide BDI-Versionen Personen zur Bearbeitung vorgelegt,
die sich wegen psychischer Störungen in stationärer Be-
handlung befanden, sich laut Diagnose aber systematisch
im Schweregrad ihrer depressiven Belastung unterschei-
den sollten. Eine erste Gruppe bestand aus Patienten, bei
denen die Depression als primäre Störung im Vordergrund
stand. Für diese Gruppe wurden die höchsten BDI-Werte
erwartet. Patienten mit einer Angst- oder Essstörung als
Hauptdiagnose bildeten eine zweite klinische Gruppe. Bei
Patienten mit primären Angst- und Essstörungen gehören
depressive Verstimmungen relativ häufig zur komorbiden
Symptomatik (Angold, Costello & Erkanli, 1999; Ihle &
Esser, 2002; Kennedy et al., 1994; Rief & Fichter, 1992).
Deshalb sollten Patienten dieser Störungsgruppen im Ver-
gleich zur klinisch unauffälligen Stichprobe erhöhte
Depressionswerte aufweisen, nicht aber das Depres-
sionsniveau der primär depressiven Patienten erreichen.
Schließlich wurden beide BDI-Versionen einer Gruppe von
schizophrenen Patienten vorgelegt. Da bei der Diagnose
der Schizophrenie affektive Psychosen ausgeschlossen
sein müssen (Saß, Wittchen & Zaudig, 1996), wurden für
die Gruppe schizophrener Patienten keine im Vergleich zur
klinisch unauffälligen Stichprobe erhöhten Depressions-
werte erwartet. Um zusätzlich zur Diagnose ein weiteres
Außenkriterium für die Konstruktvalidität des BDI-V zu
gewinnen, wurde bei allen Patienten der Schweregrad der
derzeitigen Depression von einem Experten eingeschätzt.
Methode
Messinstrumente
Selbstbeschreibungsmaße der Depression
In der klinisch unauffälligen Stichprobe wurden außer dem
BDI-O und dem BDI-V vier weitere Selbstbeschreibungs-
maße der Depression erhoben:
(1) Die aus 24 Items bestehende Depressionsskala der
Kurzform des MMPI (Gehring & Blaser, 1993),
(2) Die aus 20 Items bestehende Allgemeine Depres-
sionsskala (ADS) von Hautzinger und Bailer (1993), einer
deutschsprachigen Version der Center for Epidemiologi-
cal Studies Depression Scale (CES-D) von Radloff (1977),
(3) Die aus 16 Items bestehende Depressivitäts-Skala
(DS) nach von Zerssen (1976),
(4) Die aus 20 Items bestehende Self-Rating Depres-
sion Scale (SDS) von Zung (1965) in der deutschen Fas-
sung des CIPS (1996).
Die Reihenfolge der Skalen war bei allen Probanden
konstant: MMPI, BDI-O, BDI-V, ADS, DS, SDS. Die Erhe-
bung geschah vollständig anonym. Die Instrumente wur-
den den Probanden gemeinsam mit einem Umschlag
ausgehändigt oder zugesandt, in dem die ausgefüllten
Fragebögen ohne Angabe des Absenders zurück-
geschickt oder an einer Sammelstelle abgebeben werden
sollten.
Nachdem sich gezeigt hatte, dass viele Patienten mit
einer depressiven Primärsymptomatik durch die Befra-
gung an ihre Belastbarkeitsgrenze stießen, wurde ent-
schieden, in den klinischen Gruppen nur die beiden
BDI-Versionen sowie ein Expertenrating der Depression
zu erheben.
Expertenrating der Depression
Der Schweregrad der Depression der Probanden der klini-
schen Stichproben wurde von dem behandelnden Psy-
chiater oder Psychologen ohne Kenntnis der BDI-Werte
des Patienten anhand der Hamilton Depression Scale
(HAMD) eingestuft (Hamilton, 1967). Alle Experten waren
in der Anwendung der HAMD geschult und erfahren.
Verwendet wurde die aktuelle deutsche Fassung, die 21
Items umfasst, wobei nur die ersten 16 Items verrechnet
werden (CIPS, 1996).
Stichproben und Datenerhebung
Die Gesamtstichprobe besteht aus vier Teilstichproben,
einer klinisch unauffälligen Stichprobe (n = 200) sowie drei
Stichproben von Personen, die zum Zeitpunkt der Unter-
suchung wegen psychischer Störungen in stationärer
Behandlung waren.
Klinisch unauffällige Stichprobe
Bei der klinisch unauffälligen Stichprobe handelt es sich
um eine demographisch heterogene Gelegenheitsstich-
probe von 81 Männern und 119 Frauen, die nach dem
Schneeballprinzip gewonnen wurde. Das Alter reichte von
15 bis 78 Jahren (M = 35; SD = 13). 33% der Probanden
waren zum Zeitpunkt der Datenerhebung verheiratet, 29 %
lebten in fester Partnerschaft, 30 % waren alleinstehend,
7% lebten getrennt oder in Scheidung, 2 % waren verwit-
wet. 4% der Probanden hatten keinen Hauptschulab-
schluss, 24% hatten einen Hauptschulabschluss, 3 %
hatten eine Real- oder Handelsschule ohne Abschluss be-
sucht, 18% hatten die Mittlere Reife erworben, 10% hat-
ten das Gymnasium ohne Abschluss besucht, 5% nann-
ten das Abitur als höchsten Abschluss, 16% hatten ein
Studium begonnen aber nicht abgeschlossen, 20% hatten
ein Studium abgeschlossen.
Klinische Stichproben
Die Probanden der klinischen Stichproben wurden zum
Zeitpunkt der Datenerhebung im Zentrum für Psychiatrie
150 Manfred Schmitt et al.
Weinsberg, im Zentrum für Psychiatrie Reichenau und
in der Klinik für Psychosomatik und Psychotherapie (Me-
dian Kliniken, Klinik Moselhöhe) in Bernkastel-Kues sta-
tionär behandelt. Die Diagnosen wurden vom zuständi-
gen Psychiater oder Psychologen nach den Kriterien des
DSM-IV oder der ICD-10 gestellt, wobei die diagnostisch
relevanten Informationen in der Regel mittels semistruktu-
rierter Interviews erhoben und die diagnostische Klassifi-
kation unter Zuhilfenahme der Internationalen Diagnose-
Checklisten von Hiller, Zaudik und Mombour (1995) vor-
genommen wurde. Die Zuordnung der Patienten zu den
Diagnosegruppen erfolgte nach ihrer primären Störung.
Es wurden nur Patienten in die Untersuchung aufgenom-
men, deren primäre Störung eindeutig und deutlich höher
ausgeprägt war als komorbide Störungen. Mit jedem Pa-
tienten wurde vor der Datenerhebung ein Gespräch ge-
führt mit dem Ziel abzuklären, ob die Person kognitiv und
emotional zur Beantwortung der Fragebögen in der Lage
sein würde. Die beiden BDI-Versionen und das Experten-
rating wurden in einer Zeitspanne von 7 bis 28 Tagen nach
der stationären Aufnahme erhoben.
MDD-Stichprobe. 31 Männern und 29 Frauen erfüllten
die Diagnosekriterien einer Major Depressive Disorder
nach DSM-IV. Das Alter dieser Patienten erstreckte sich
von 18 bis 69 Jahren (M = 45; SD = 13) und verteilte sich
wie folgt: 15–24 (n = 5), 25–34 (n = 8), 35–44 (n = 16), 45–54
(n = 14), 55–64 (n = 14), 65–74 (n = 3).
Angst- und Essstörungen. Bei 10 Frauen und einem
Mann waren eine Angst- oder eine Essstörung als Haupt-
störung diagnostiziert worden. Patienten mit Angststö-
rungen erfüllten die Kriterien einer der beiden DSM-IV
Kategorien „Panikstörungen mit Agoraphobie“ oder „Pa-
nikstörungen ohne Agoraphobie“. Patienten mit Essstö-
rungen erfüllten die Kriterien einer der beiden DMS-IV Ka-
tegorien „Anorexia nervosa“ oder „Bulimia nervosa“. Das
Alter dieser Probanden erstreckte sich von 17 bis 54 Jah-
ren (M = 33; SD = 11) und verteilte sich wie folgt: 15–24
(n = 3), 25–34 (n = 4), 35–44 (n = 2), 45–54 (n = 2).
Schizophrenie. 23 Männer und 17 Frauen waren nach
DSM-IV oder ICD-10 als schizophren diagnostiziert wor-
den. Zwei Patienten befanden sich im Residualzustand mit
Restsymptomatik auf einer psychotherapeutischen Sta-
tion. Die restlichen 38 Patienten befanden sich im Akutzu-
stand auf einer geschlossenen Station. Das Alter dieser
Gruppe erstreckte sich von 19 bis 71 Jahren (M = 38; SD =
13) und verteilte sich wie folgt: 15–24 (n = 8), 25–34 (n = 9),
35–44 (n = 10), 45–54 (n = 7), 55–64 (n = 5), 65–74 (n = 1).
Man beachte, dass sich die drei klinischen Gruppen im
Spezifitätsgrad ihrer Störung unterscheiden. Während die
Patienten der ersten und dritten Gruppe durch eine spezi-
fische Hauptdiagnose definiert sind, entstammen die Pa-
tienten der zweiten Gruppe zwei Störungsgruppen. Für
unsere Fragestellung ist dieser Unterschied jedoch nicht
entscheidend. Relevant ist lediglich, dass die Depression
bei Patienten der ersten Gruppe die primäre Störung dar-
stellt, bei Patienten der zweiten Gruppe zu den komorbi-
den, also sekundären Störungen gehört und bei Patienten
der dritten Gruppe gar nicht vorkommen sollte.
Von untergeordneter Bedeutung ist weiterhin, ob sich
die Gruppen in demographischen, biographischen, medi-
zinischen oder psychologischen Merkmalen unterschei-
den, die als Ursachen, Korrelate oder Folgen depressiver
Störungen bekannt sind oder vermutet werden. Solche
Unterschiede sind im Zusammenhang unserer Fragestel-
lung nachrangig, da es um die Validität der Symptomdiag-
nose, insbesondere die Symptomstärke, und nicht um Fra-
gen der Störungsätiologie geht. Zwar können Ursachen,
Korrelate und Folgen depressiver Erkrankungen ihrerseits
für die Konstruktvalidierung eines Depressionsmaßes
herangezogen werden. Diese Validierungsmöglichkeiten
bieten sich hier wegen der vergleichsweise geringen
Stichprobengrößen jedoch nicht an und wurden überdies
bereits von Schmitt und Maes (2000) genutzt.
Ergebnisse
Optimierung der Hamilton-Skala
Eine Analyse der Messeigenschaften der Hamilton-Skala
ergab eine unbefriedigende interne Konsistenz α von .68.
Die Inspektion der Trennschärfen ergab eindeutig, dass
die geringe Homogenität den Items 9 (Erregung), 15
(Hypochondrie) und 16 (Gewichtsverlust) zuzuschreiben
war, deren Trennschärfen sich nicht signifikant von Null
unterschieden und deskriptiv sogar negativ waren. Zu-
sätzliche Analysen ergaben, dass die Trennschärfen der
beiden Items 18 a und 18b (Tagesschwankungen), die laut
CIPS (1996) nicht in den Summenwert einfließen sollen,
ähnlich hoch ausfielen wie die nach Anweisung zu ver-
rechnenden Items. Die Items 9, 15 und 16 wurden deshalb
ausgeschlossen und die Items 18a und 18 b zur Reliabili-
tätsteigerung in die Skala aufgenommen. Für die so opti-
mierte Skala ergab sich eine gute interne Konsistenz
α von .82. Wie sich zeigen wird, wirkt sich die Optimie-
rung der Hamilton-Skala nicht nur günstig auf ihre Reliabi-
lität aus, sondern erhöht auch ihre Korrelation mit den
beiden BDI-Versionen, was als Steigerung der Validität
der Hamilton-Skala interpretiert werden kann.
Trennschärfen der Depressionssymptome
im Original-BDI und im vereinfachten BDI
Tabelle 1 enthält die korrigierten Trennschärfen der BDI-
Items, die für die beiden Versionen in drei Stichproben
getrennt berechnet wurden, der klinisch unauffälligen
Stichprobe, der MDD-Stichprobe und der Gesamtstich-
probe. Ein Vergleich der Koeffizienten über die Stichpro-
ben zeigt, dass für beide BDI-Versionen durchschnittlich
die höchsten Trennschärfen in der Gesamtstichprobe und
die geringsten Trennschärfen in der MDD-Stichprobe er-
reicht werden. Dieses Muster spiegelt die größere Varianz
der Symptomschwere in der Gesamtstichprobe wider, die
sich dort aus der Varianz innerhalb der Gruppen und der
Varianz zwischen allen Gruppen zusammensetzt. Ein Ver-
gleich der Trennschärfen über die BDI-Versionen ergibt,
dass die Items des vereinfachten BDI überwiegend und
151
Messgüte des BDI-V
durchschnittlich höhere Trennschärfen aufweisen als die
Items des Original-BDI. Vergleicht man die Trennschärfen
über die Symptome, fällt zunächst die geringe Trennschär-
fe der Gewichtsabnahme beim Original-BDI auf, die schon
in früheren Untersuchungen beobachtet worden war und
Schmitt und Maes (2000) bei der Vereinfachung des BDI
zum Verzicht auf dieses Item veranlasst hatte. Weiterhin
liegen bei beiden BDI-Versionen die Trennschärfen psy-
chosomatischer Symptome (Weinen, Sorge um Ausse-
hen, Schlafstörungen, Appetitlosigkeit, gesundheitliche
Sorgen, Libidoverlust) unterhalb jener der genuin psy-
chologischen Anzeichen der Depression (Traurigkeit,
Hoffnungslosigkeit, Unzufriedenheit, Genussunfähigkeit,
Schuldgefühl, Selbsthass, Selbstanklage, Suizidalität).
Zur Beurteilung der Messäquivalenz der beiden BDI-
Versionen ist neben der absoluten Höhe auch die relative
Höhe der Trennschärfe eines Symptoms im Vergleich zu
anderen Symptomen von Bedeutung (Schmitt, Maes &
Seiler, 2001). Eine hohe Ähnlichkeit der Trennschärfen-
profile würde dafür sprechen, dass beide BDI-Versionen
die einzelnen Symptome in ähnlicher Weise verorten, dem
jeweiligen Symptom also eine eher zentrale oder eine eher
periphere Bedeutung zuweisen. Zur Klärung dieser Frage
wurde die Rangkorrelation (nach Spearman) zwischen den
Trennschärfen der beiden BDI-Versionen berechnet. Die
ermittelten rho-Werte betragen .65 (klinisch unauffällige
Stichprobe), .61 (MDD-Stichprobe) und .85 (Gesamtstich-
probe). Vor allem in der Gesamtstichprobe mit der größten
Symptomvarianz werden die einzelnen Symptome also
von beiden BDI-Versionen sehr ähnlich verortet.
Homogenität und Reliabilität
der Depressionsskalen
Tabelle 2 enthält Homogenitätskennwerte für die sechs in
der klinisch unauffälligen Stichprobe verwendeten De-
pressionsskalen. Mit α lässt sich die Mindestreliabilität
einer Skala abschätzen (Cronbach, 1951). α variiert bei
konstanter Skalenhomogenität mit der Skalenlänge. Hin-
gegen sind die mittlere Itemkorrelation [M (rii)], die mittle-
re korrigierte Trennschärfe [M (rit)] und der durchschnitt-
liche Varianzanteil eines Items, der durch die erste unro-
tierte Hauptachse erklärt wird [M (a2)], von der Skalenlän-
ge unabhängig.
Die Werte in Tabelle 2 zeigen, dass das vereinfachte
BDI homogener und reliabler ist als alle anderen Depres-
sionsskalen, die verwendet wurden. Auch in allen klini-
schen Stichproben liegt die Zuverlässigkeit des verein-
fachten BDI über jener des Original-BDI (MDD: .84 versus
.79; Angst- und Essstörungen: .84 versus .72; Schizophre-
nie: .88 versus .80).
Tabelle 1. Korrigierte Trennschärfen der Items des Original-BDI und des vereinfachten BDI
Symptom klinisch-unauffällige MDD-Stichprobe Gesamtstichprobe
Stichprobe (59 n 60) (308 n 311)
(198 n 200)
BDI-O BDI-V BDI-O BDI-V BDI-O BDI-V
1. Stimmung .54 .74 .57 .47 .74 .79
2. Hoffnungslosigkeit .46 .64 .47 .56 .71 .78
3. Unzufriedenheit .57 .68 .42 .64 .68 .76
4. Genussunfähigkeit .60 .69 .34 .64 .72 .80
5. Schuldgefühl .50 .60 .56 .59 .66 .72
6. Bestrafungsgefühl .52 .69 .43 .55 .60 .71
7. Selbsthass .51 .79 .34 .51 .66 .76
8. Selbstanklage .46 .74 .45 .50 .62 .75
9. Selbstbestrafung .47 .46 .33 .39 .60 .59
10. Weinen .45 .53 .29 .23 .56 .56
11. Reizbarkeit .36 .72 .18 .32 .42 .62
12. Sozialer Rückzug .40 .51 .45 .44 .56 .60
13. Entschlusslosigkeit .40 .67 .48 .35 .63 .72
14. Körperwahrnehmung .30 .47 .43 .29 .54 .46
15. Arbeitsunfähigkeit .54 .64 .33 .41 .67 .74
16. Schlafstörungen .32 .49 .14 .24 .46 .62
17. Ermüdbarkeit .49 .75 .48 .58 .67 .82
18. Appetitlosigkeit .31 .44 .17 .26 .49 .50
19. Gewichtsabnahme .16 .03 .32
20. Hypochondrie .31 .46 .11 .16 .49 .56
21. Libidoverlust .26 .35 .42 .30 .52 .51
M (rit) .44 .60 .37 .42 .60 .67
152 Manfred Schmitt et al.
Korrelation des vereinfachten BDI
mit anderen Depressionsmaßen
Um weiterer Hinweise auf die konvergente Validität des
vereinfachten BDI zu erhalten, wurde es in der klinisch
unauffälligen Stichprobe mit den anderen Depressions-
skalen und in den klinischen Stichproben mit dem Exper-
tenrating (Hamilton-Skala) korreliert. Tabelle 3 zeigt, dass
das vereinfachte BDI in der klinisch unauffälligen Stich-
probe am höchsten mit dem Original-BDI und ähnlich hoch
wie dieses mit allen anderen Depressionsmaßen korreliert.
Besonders einschlägig für die Beurteilung der Validi-
tät des BDI als Selbstbeschreibungsmaß ist seine Konver-
genz mit dem Urteil eines ausgebildeten und erfahrenen
Diagnostikers. Beide BDI-Versionen korrelieren gleich
und zufriedenstellend hoch mit der Hamilton-Skala.
Korrelation des vereinfachten BDI
mit dem Original BDI
Um die Messäquivalenz der beiden BDI-Versionen detail-
lierter zu klären, wurden sie auf der Ebene einzelner
Symptome und des Summenwertes in der klinisch unauf-
fälligen Stichprobe, der MDD-Stichprobe und der Gesamt-
stichprobe korreliert (Tabelle 4).
Gemessen an der eingeschränkten Zuverlässigkeit
(und damit Validität) von Ein-Item-Maßen ist die Konver-
genz auf Symptomebene mit einer Ausnahme (Weinen)
beträchtlich. Auch auf der Ebene des Summenwertes
konvergieren beide BDI-Versionen gut. In der klinisch
unauffälligen Stichprobe erreicht die Korrelation der
Summenwerte annähernd die geschätzte Reliabilität (inter-
ne Konsistenz) des Original-BDI.
Test der Messäquivalenz
der beiden BDI-Versionen
Die deskriptiven Befunde, die bisher berichtet wurden,
sprechen für eine gute Konvergenz der beiden BDI-Ver-
sionen. Um diesen Eindruck strenger zu prüfen, wurde für
die beiden BDIs ein simultanes, kongenerisches Messmo-
dell spezifiziert und die Äquivalenzhypothese statistisch
getestet. Für jede BDI-Version wurde ein Faktor angenom-
men, der die Kovarianz ihrer Testhälften erklärt. Getestet
wurde die Nullhypothese, dass die beiden BDI-Faktoren
perfekt korrelieren, also identisch sind. Parameterschät-
Tabelle 2. Reliabilität und Homogenität der verwendeten Depressionsskalen (klinisch unauffällige Stichprobe,
192 n 200)
BDI-O BDI-V MMPI ADS DS SDS
α.84 .93 .78 .85 .87 .88
M(rii).21 .39 .13 .22 .33 .22
M(rit).44 .60 .32 .43 .54 .43
M(a2).27 .44 .18 .33 .39 .28
Anmerkungen: α = Cronbach’s α; M(rii) = mittlere Itemkorrelation; M(rit) = mittlere korrigierte Trennschärfe; M(a2) = durch die erste
unrotierte Hauptachse durchschnittlich erklärter Varianzanteil eines Items.
Tabelle 3. Produkt-Moment-Korrelationen des vereinfachten BDI mit anderen Selbstbeschreibungsmaßen der Depression
(klinisch unauffällige Stichprobe, 197 n 200) und einem Expertenrating (Hamilton-Skala, klinische Stich-
proben, n = 53)
123456
1 BDI-V
2 BDI-O .82
3 MMPI .66 .66
4 ADS .70 .72 .65
5 DS .70 .71 .63 .70
6 SDS .73 .75 .67 .75 .79
7 Je an/wg. Depr. erkrankt/behandelt .26 .24 .23 .27 .27 .26
8 Hamilton-Skala-optimiert .60 .59
9 Hamilton-Skala-Original (CIPS) .50 .51
Anmerkung: Alle Korrelationen signifikant (p < .01).
153
Messgüte des BDI-V
zung und Modelltest wurden mit LISREL 8.51 sowohl in
der klinisch unauffälligen Stichprobe als auch der Gesamt-
stichprobe vorgenommen. Auf einen Modelltest inner-
halb der einzelnen klinischen Gruppen wurde aus Gründen
der geringen Teststärke verzichtet. Um die Notwendigkeit
der Spezifikation korrelierter Testhälftenfaktoren (Metho-
denfaktoren) zu vermeiden, wurden die Items des Original-
BDI nach der odd-even-Methode geteilt (erste Testhälfte
= gerade Items, zweite Testhälfte = ungerade Items), die
Items des vereinfachten BDI hingegen nach der split-half-
Methode (erste Testhälfte = Items 1 bis 10, zweite Test-
hälfte = Items 11 bis 20). Faktorladungen und Residualva-
rianzen wurden zur Schätzung freigegeben, die Varianzen
der Faktoren sowie die Korrelation zwischen diesen auf 1
fixiert. Während das Modell die Kovarianzstruktur der vier
Testhälften in der Gesamtstichprobe sehr gut erklären
kann (χ2(2) = 2.83, p = .24), muss es, sofern man einen
strengen Maßstab anlegt (α > .05), in der klinisch unauf-
fälligen Stichprobe verworfen werden (χ2(2) = 7.84,
p = .02). In einem zweiten Schritt wurde deshalb die Korre-
lation der beiden Faktoren im Modell für die klinisch un-
auffällige Stichprobe zur Schätzung freigegeben. Dadurch
verbesserte sich der Fit des Modells erheblich (χ2(1) =
1.61, p = .20) und signifikant (χ2(1) = 6.23, p < .05).
Abbildung 2 gibt die geschätzten Parameter der stan-
dardisierten Lösung der akzeptierten Modelle für die bei-
den Stichproben wieder. Von besonderem Interesse ist
hier die geschätzte Korrelation der beiden BDI-Faktoren in
der klinisch unauffälligen Stichprobe. Der Schätzwert be-
trägt .95 und liegt damit nur wenig unterhalb des Idealwer-
tes von 1.
Tabelle 4. Produkt-Moment-Korrelation des vereinfachten BDI mit dem Original-BDI auf der Ebene einzelner Symptome
und des Summenwertes
Symptom klinisch unauffällige MDD-Stichprobe Gesamtstichprobe
Stichprobe (n = 60) (309 n 311)
(198 n 200)
1. Stimmung .67 .67 .75
2. Hoffnungslosigkeit .62 .56 .75
3. Unzufriedenheit .57 .66 .72
4. Genussunfähigkeit .60 .38 .71
5. Schuldgefühl .71 .66 .77
6. Bestrafungsgefühl .70 .79 .78
7. Selbsthass .57 .62 .71
8. Selbstanklage .57 .61 .66
9. Selbstbestrafung .72 .76 .79
10. Weinen .30 .21 .39
11. Reizbarkeit .38 .67 .53
12. Sozialer Rückzug .68 .70 .74
13. Entschlusslosigkeit .57 .75 .71
14. Körperwahrnehmung .58 .39 .53
15. Arbeitsunfähigkeit .69 .72 .79
16. Schlafstörungen .64 .80 .76
17. Ermüdbarkeit .56 .68 .70
18. Appetitlosigkeit .64 .77 .73
19. Hypochondrie .59 .74 .69
20. Libidoverlust .76 .91 .84
mittlere Korrelation auf Symptomebene .60 .65 .70
Korrelation der BDI-Summenwerte .82 .88 .91
Anmerkung: Alle Korrelationen sind signifikant (p > .01, einseitig).
Abbildung 2. Parameter der akzeptierten Messmodelle für
Testhälften der beiden BDI-Versionen in der klinisch un-
auffälligen Stichprobe/der Gesamtstichprobe.
BDI-O
BDI-O-2BDI-O-1
BDI-V
BDI-V-2BDI-V-1
.23 / .12
.88 / .94 .93 / .94 .87 / .89.83 /.92
.95 / 1. 00
.31 / .16 .14 / .12 .24 / .20
.95 / 1.00
154 Manfred Schmitt et al.
Differentialdiagnostische Trennschärfe
der BDI-Versionen
Wenn die beiden BDI-Versionen valide sind, sollte es
möglich sein, die Stichproben anhand der BDI-Messwerte
zu differenzieren. Wenn beide Versionen messäquivalent
sind, sollte diese Differenzierung mit beiden Versionen
gleich gut gelingen. Die oben formulierten Hypothesen
über Mittelwertsunterschiede zwischen den Stichproben
lassen sich wie folgt zusammenfassen: MDD > Angst- und
Essstörungen > Schizophrenie = klinisch unauffällige
Stichprobe.
Die Mittelwerte in Tabelle 5 bestätigen diese Erwar-
tung für beide BDI-Versionen. Klinisch unauffällige Pro-
banden und Patienten, die als schizophren diagnostiziert
wurden, unterscheiden sich nur geringfügig und statis-
tisch nicht signifikant (p > .05) in den durchschnittlichen
BDI-Summenwerten voneinander. Hingegen sind im Ver-
gleich zu den durchschnittlichen BDI-Werten dieser bei-
den Gruppen jene der Patienten mit Angst- und Essstö-
rungen um mehr als eine Standardabweichung (d > 1), jene
der MDD-Stichprobe um mehr als zwei Standardabwei-
chungen (d > 2) erhöht (bei Verwendung gepoolter Stan-
dardabweichungen).
Tabelle 6 enthält Korrelationen zwischen den BDI-
Summenwerten und binären Gruppenkontrasten. Der ab-
soluten Höhe dieser Koeffizienten nach trennt das Origi-
nal-BDI klinisch unauffällige Personen und Patienten
mit einer depressiven Primär- oder Sekundärsymptomatik
etwas genauer, während das vereinfachte BDI zwischen
den klinischen Gruppen geringfügig besser diskriminiert.
Statistisch signifikant sind die Unterschiede zwischen den
Korrelationskoeffizienten jedoch nicht.
Diskussion
Die Ergebnisse dieser Untersuchung bescheinigen dem
vereinfachten BDI von Schmitt und Maes (2000) sehr gute
Messeigenschaften. Das vereinfachte BDI ist etwas
homogener und etwas zuverlässiger als das Original und
die anderen Selbstbeschreibungsmaße der Depression,
die hier verwendet wurden. Zahlreiche Befunde sprechen
dafür, dass die Vereinfachung des BDI zu keiner wesent-
lichen Änderung seiner Messeigenschaften geführt hat.
Beide BDI-Versionen korrelieren höher miteinander als mit
allen anderen Depressionsmaßen. Auf der Ebene der
einzelnen Symptome wurde eine Konvergenz der beiden
BDI-Versionen beobachtet, die angesichts der einge-
schränkten Reliabilität von Items bemerkenswert hoch
ausfällt. Weiterhin korrelieren beide BDI-Versionen nicht
nur sehr ähnlich mit allen anderen Selbstbeschreibungs-
maßen der Depression, die hier verwendet wurden, son-
dern in gleicher Höhe auch mit einem Expertenrating.
Vollkommen messäquivalent sind die beiden BDI-Ver-
sionen höchstwahrscheinlich dennoch nicht. Erstens be-
stehen die BDI-Versionen den strengen Äquivalenztest
mittels einer konfirmatorischen Faktorenanalyse nur in der
Gesamtstichprobe, nicht aber in der klinisch unauffälligen
Tabelle 5. Mittlere Ausprägung und Streuung der BDI-Summenwerte in den Stichproben
klinisch Unauffällige MDD Angst- und Schizophrenie
(n = 200) (n = 60) Essstörungen (n = 40)
(n = 11)
BDI-Version M SD M (z) M SD M (z) M SD M (z) M SD M (z)
BDI-O 6.9 6.3 –0.42 28.0 9.0 1.53 16.6 6.1 0.48 7.9 6.0 –0.33
BDI-V 18.9 14.1 –0.36 53.7 14.9 1.39 38.3 13.4 0.62 16.9 13.3 –0.46
Anmerkungen: M = mittlerer Summenwert; SD = Standardabweichung des Summenwertes; M (z) = mittlerer z-Wert bei Standardisierung in der
Gesamtstichprobe; der Wertebereich des vereinfachten BDI reicht von 0 bis 100; der Wertebereich des Original-BDI reicht von 0 bis 63.
Tabelle 6. Punkt-biseriale Korrelationen zwischen binären Gruppenkontrasten und den BDI-Summenwerten
BDI-Version klinisch klinisch MDD gegen MDD gegen Anst- und
Unauffällige Unauffällige Angst- und Schizophrenie Essstörungen
gegen MDD gegen Essstörungen gegen
Angst- und Schizophrenie
Essstörungen
BDI-O .78 .32 .35 .78 .51
BDI-V .71 .29 .42 .79 .55
Anmerkung: Alle Korrelationen sind signifikant (p < .01).
155
Messgüte des BDI-V
Stichprobe, wenngleich auch dort die geschätzte Korrela-
tion zwischen den BDI-Faktoren mit einem Wert von .95
nur wenig unterhalb des Idealwertes von 1 liegt. Auch
bei der Differenzierung der Stichproben divergieren die
BDI-Versionen geringfügig. Während mit dem Original-
BDI die klinisch unauffällige Stichprobe etwas besser von
den beiden klinischen Stichproben mit depressiver Primär-
oder Sekundärsymptomatik unterschieden werden konn-
te, differenzierte der vereinfachte BDI etwas genauer zwi-
schen den klinischen Gruppen. Diese Unterschiede sind
aber statistisch nicht signifikant und sollten nicht inter-
pretiert werden. Eine generelle Überlegenheit der einen
oder der anderen BDI-Version bei der Differentialdiag-
nose depressiver Störungen kann daraus aber nicht ab-
geleitet werden. Zudem sollten Konsequenzen für die
diagnostische Anwendungspraxis nur abgeleitet werden,
sofern sich die Ergebnisse in unabhängigen Nachfolge-
untersuchungen bestätigen und inferenzstatistisch absi-
chern lassen.
Zusammenfassend betrachtet berechtigen die Befun-
de von Schmitt und Maes (2000) und die Befunde der vor-
liegenden Untersuchung zu der Schlussfolgerung, dass
mit dem vereinfachten BDI ein Instrument zur Verfügung
steht, welches in seiner Messqualität dem Original gleich-
wertig ist, dieses im Bereich der Messökonomie aber
übertrifft. In den meisten Fällen der klinischen Einzelfall-
diagnostik dürfte diese Überlegenheit des BDI-V nicht
ausschlaggebend sein. Zum Tragen kommt sie aber in Un-
tersuchungen an großen Stichproben und bei der Anwen-
dung als Screening-Verfahren. Dort spart die Verwendung
des BDI-V nicht nur Druckkosten und Zeit bei der Erhe-
bung und Auswertung, sondern vermeidet auch eine un-
nötige zeitliche und kognitive Belastung der Probanden
und schafft damit Raum für den Einsatz von Messinstru-
menten für weitere Konstrukte, die von theoretischer oder
praktischer Bedeutung sind.
Zur weiteren Klärung der Messeigenschaften des
BDI-V möchten wir abschließend vier Untersuchungen
anregen.
(1) Die Stichprobe von Schmitt und Maes (2000) war
ebenso wenig wie die Stichprobe dieser Untersuchung
bevölkerungsrepräsentativ. Zur Normierung des Verfah-
rens sollten die Messeigenschaften des BDI-V an einer
bevölkerungsrepräsentativen Stichprobe bestimmt wer-
den.
(2) Da in der Überschrift des Verfahrens vom „gegen-
wärtigen Lebensgefühl“ die Rede ist und in der Instruk-
tion kein zeitlicher Rahmen zur Beurteilung der Symptom-
häufigkeit vorgegeben wird, könnte der Zeitrahmen, den
Personen bei der Beantwortung der Items vor Auge ha-
ben, Varianz erzeugen. Zwar impliziert die Antwortskala
durch die gewählte Bezeichnung der Pole eine zeitliche
Standardisierung, Schwankungen in der Symptom-
konzentration könnten sich aber niederschlagen. Trotz
gleicher Symptombelastung werden Personen, die an
Zeiträume erhöhter Symptomhäufigkeit denken, höhere
BDI-V-Werte erzielen als Personen, die Phasen geringer
Symptombelastung erinnern. Bereits Schmitt und Maes
(2000) hatten deshalb empfohlen, den Einfluss unter-
schiedlicher Zeitvorgaben in der Instruktion zu unter-
suchen.
(3) Angesichts der begrenzten Koinzidenz depressiver
Symptome könnte der Verdacht aufkommen, dass die Ho-
mogenität und die interne Konsistenz des BDI-V künstlich
erhöht sind. Für diese Überlegung sprechen Befunde
zum sequentiellen Priming (Duckworth, Bargh, Garcia &
Chaiken, 2002) und zur Stimmungskongruenz des Urteils
(Mayer, Gaschke, Braverman & Evans, 1992). Die Beant-
wortung der Frage zur Häufigkeit eines Symptoms A kann
die Erinnerung an ein Symptom B erleichtern, wenn beide
Symptome im semantischen Netzwerk verknüpft sind.
Weiterhin kann sich die Frage nach depressiven Symp-
tomen stimmungsverändernd auswirken und dadurch
wiederum die Zugänglichkeit stimmungskongruenter Ge-
dächtnisinhalte beeinflussen. Beide Prozesse könnten
die Itemkorrelationen künstlich in die Höhe treiben und
die Validität des BDI-V gefährden. Allerdings sind alle an-
deren hier verwendeten Selbstbeschreibungsmaße von
der gleichen Artefaktproblematik betroffen, so dass eine
spezifische Artefaktanfälligkeit des BDI-V nicht anzuneh-
men ist. Dennoch verdient das Argument eine empirische
Untersuchung über die verteilte (statt massierte) Vorgabe
der Items. Voraktivierungseffekte und Stimmungseffekte
sind relativ kurzlebig. Sie sollten keine Rolle mehr spielen,
wenn die Itemsequenz des BDI-V durch unverwandte
Füllitems unterbrochen wird. Wenn eine solche Untersu-
chung die hohe interne Konsistenz des BDI-V bestätigt,
sollte diese zum Anlass genommen werden, die Itemzahl
zugunsten einer weiteren Steigerung der Messökonomie
zu reduzieren? Wir würden von einer solchen Kürzung
abraten, um die Äquivalenz der beiden BDI-Versio-
nen nicht zu gefährden. Außerdem würde eine weitere
Kürzung des Instruments im Vergleich zum Gewinn
an Ökonomie, der durch die Vereinfachung des BDI-O
zum BDI-V erzielt wurde, nur unbedeutend zu Buche
schlagen.
(4) Zur weiteren Validierung des BDI-V bietet sich ein
Vergleich von BDI-V-Selbsteinschätzungen mit BDI-V-
Fremdeinschätzungen an. Angehörigen und Freunden
bleiben depressive Symptome in der Regel nicht verbor-
gen. Selbstbericht-Fremdbericht-Korrelationen sollten
deshalb eine Höhe erreichen, wie sie für Persönlichkeits-
skalen typischerweise gefunden werden (Funder, 1999).
Literatur
Angold, A., Costello, E. J. & Erkanli, A. (1999). Comorbidity.
Journal of Child Psychology and Psychiatry, 40, 57–87.
Beck, A. T. & Steer, R. A. (1987). Beck Depression Inventory
(BDI). San Antonio: The Psychological Corporation Inc.
Beck, A. T., Steer, R. A. & Garbin, M. G. (1988). Psychometric
properties of the Beck Depression Inventory: Twenty-five
years of evaluation. Clinical Psychology Review, 8, 77–100.
CIPS (Collegium Internationale Psychiatriae Scalarum) (Hrsg.).
(1996). Internationale Skalen für Psychiatrie. Weinheim:
Beltz.
Cronbach, L. J. (1951). Coefficient alpha and the internal struc-
ture of tests. Psychometrika, 16, 297–334.
156 Manfred Schmitt et al.
Duckworth, K. L., Bargh, J. A., Garcia, M. & Chaiken, S. (2002).
The automatic evaluation of novel stimuli. Psychological
Science, 13, 513–519.
Eid, M. & Diener, E. (Hrsg.). (in Druck). Handbook of psycholo-
gical measurement – a multimethod perspective. Washing-
ton, DC: American Psychological Association.
Funder, D. C. (1999). Personality judgment: A realistic approach
to person perception. San Diego, CA: Academic Press.
Gehring, A. & Blaser, A. (1993). MMPI. Minnesota Multiphasic
Personality Inventory. Deutsche Kurzform für Handauswer-
tung. Bern: Huber.
Hamilton, M. (1967). Development of a rating scale for primary
depressive illness. British Journal of Social and Clinical Psy-
chology, 6, 278–296.
Hautzinger, M. & Bailer, M. (1993). Allgemeine Depressions
Skala. Weinheim: Beltz.
Hautzinger, M., Bailer, M., Worall, H. & Keller, F. (1994). Beck-
Depressions-Inventar (BDI). Bern: Huber.
Hautzinger, M. & Meyer, T. D. (2002). Diagnostik Affektiver
Störungen. Göttingen: Hogrefe.
Hiller, W., Zaudig, M. & Mombour, W. (1995). IDCL. Interna-
tionale Diagnosen Checklisten für ICD-10 und DSM-IV.
Bern: Huber.
Ihle, W. & Esser, G. (2002). Epidemiologie psychischer Störun-
gen im Kindes- und Jugendalter: Prävalenz, Verlauf, Komor-
bidität und Geschlechtsunterschiede. Psychologische Rund-
schau, 53, 159–169.
Kammer, D. (1983). Eine Untersuchung der psychometrischen
Eigenschaften des deutschen Beck-Depressionsinventars
(BDI). Diagnostica, 29, 48–60.
Kennedy, S. H., Kaplan, A. S., Garfinkel, P. E., Rockert, W.,
Toner, B. & Abbey, S. E. (1994). Depression in anorexia
nervosa and bulimia nervosa: Discriminating depressive
symptoms and episodes. Journal of Psychosomatic Re-
search, 38, 773–782.
Lukesch, H. (1974). Testkriterien des Depressionsinventars von
A. T. Beck. Psychologische Praxis, 18, 60–78.
Mayer, J. D., Gaschke, Y. N., Braverman, D. L. & Evans, T. W.
(1992). Mood-congruent judgment is a general effect. Jour-
nal of Personality & Social Psychology, 63, 119–132.
Radloff, L. S. (1977). The CES-D Scale: A self-report depres-
sion scale for research in the general population. Applied
Psychological Measurement, 1, 385–401.
Richter, P. (1991). Zur Konstruktvalidität des Beck-Depres-
sionsinventars bei der Erfassung depressiver Verläufe.
Regensburg: Roderer.
Richter, P., Werner, J. & Bastine, R. (1994). Psychometrische
Eigenschaften des Beck-Depressionsinventars (BDI): Ein
Überblick. Zeitschrift für Klinische Psychologie, 23, 3–19.
Rief, W. & Fichter, M. (1992). The Symptom Check List SCL-
90-R and its ability to discriminate between dysthymia, an-
xiety disorders, and anorexia nervosa. Psychopathology, 25,
128–138.
Röhrle, B. (1988). Fragebogen zur verhaltenstherapeutischen
Diagnostik depressiver Störungen. Ein Kompendium. Tü-
bingen: DGVT.
Saß, H., Wittchen, H.-U. & Zaudig, M. (1996). Diagnostisches
und Statistisches Manual Psychischer Störungen DSM-IV
(Deutsche Bearbeitung und Einführung). Göttingen: Ho-
grefe.
Schmitt, M. & Maes, J. (2000). Vorschlag zur Vereinfachung
des Beck-Depressions-Inventars (BDI). Diagnostica, 46,
38–46.
Schmitt, M., Maes, J. & Seiler, U. (2001). Zur Meßäquivalenz
und strukturellen Invarianz von Indikatoren der seelischen
Gesundheit bei Ost- und Westdeutschen. Zeitschrift für Dif-
ferentielle und Diagnostische Psychologie, 21, 87–99.
Zerssen, D. von (1976). Depressivitäts-Skala DS. Weinheim:
Beltz.
Zung, W. W. K. (1965). A self rating depression scale. Archives
of General Psychiatry, 13, 361–367.
Prof. Dr. Manfred Schmitt
Fachbereich I – Psychologie
Universität Trier
54286 Trier
E-Mail: schmittm@uni-trier.de
www: http://sozpsy.uni-trier.de/~schmittm/
... As a co-primary outcome of potential efficacy, we administered a 20-item version of the BDI. 34 This self-report measure is known for its excellent psychometric properties, including construct validity and test-retest reliability, in individuals without aphasia. The BDI has been successfully piloted in individuals with aphasia, as indicated by phase-IIA RCT data. ...
... To address this point empirically, we administered the Self-Efficacy Questionnaire 37 as an external criterion to determine the psychometric adequacy of the BDI. 34 Both the Self-Efficacy Questionnaire and BDI are self-report measures. ...
Article
Full-text available
Background: Limiting the ability to engage in social interaction, aphasia increases the risk of poststroke depression and may prevent classical forms of psychotherapy. Our parallel-group, blinded-assessment, quasi-randomized controlled trial explores the feasibility and potential efficacy of intensive social interaction as a means to alleviate poststroke depression in subacute aphasia. Methods: We adopted a linguistically validated treatment program based on massed practice and conversational turn-taking (Intensive Language-Action Therapy). In a routine outpatient setting, 60 individuals with poststroke depression and subacute aphasia (0.5-6 months following left-hemispheric ischemia or hemorrhage) were assigned to Intensive Language-Action Therapy combined with standard care (Group I) or standard care alone (Group II). End points included feasibility (primary outcome) alongside change on self-report and clinician-rated measures of depression severity (co-primary outcomes: Beck's Depression Inventory; Hamilton Rating Scale for Depression) after a 1-month treatment period (5 weekly 1-hour sessions), controlled for progress in language performance (secondary outcome: Aachen Aphasia Test, AAT). Results: 100% treatment participation demonstrated feasibility of Intensive Language-Action Therapy in poststroke depression. Analyses (n=60) revealed significant between-group differences on the Beck's Depression Inventory (change in Group I [95% CI]: -12.6 [±4.9]; in Group II: -5.8 [±3.2]; P=0.040) and Hamilton Rating Scale for Depression (change in Group I: -5.0 [±1.4]; in Group II: -3.3 [±1.2]; P=0.002), indicating small-to-medium effect sizes in reducing depression severity with Intensive Language-Action Therapy (η2≤0.101). No significant between-group differences emerged on expressive AAT subscales. Conclusions: Our results confirm the feasibility and potential efficacy of intensive social interaction for treatment of poststroke depression in subacute aphasia. Registration: URL: www. Clinicaltrials: gov; Unique identifier: NCT04318951.
... The BDI-V is a simpli ed version of the BDI that applies a standard Likert scale (0-5) to 20 items (sum score ranging from 0 to 100). This scale showed a good psychometric quality in a German sample [57]. ...
Preprint
Full-text available
Background Body dysmorphic disorder (BDD) is an impairing psychological disorder with a high prevalence in clinical and cosmetic surgery settings. In the new ICD-11, BDD is grouped with the obsessive-compulsive spectrum disorders and the diagnostic criteria are updated, largely corresponding with the DSM-5. Available diagnostic interviews and screening scales for BDD are not based on these current criteria. In this paper, a newly developed screening questionnaire (BDD-S) and structured clinical interview (BDD-CI) according to the ICD-11 and DSM-5 criteria were preliminarily validated. Methods The BDD-S and the BDD-CI cover all core BDD symptoms. Open-ended questions allow for the addition of qualitative information on affected body parts and behavioural and mental aspects. We determined the internal consistency and construct validity of the BDD-S and suggested a cutoff value. We assessed a subsample with the BDD-CI and estimated a prevalence. The BDD-S was translated into Farsi and applied to an Iranian sample. BDD-S scores, social anxiety symptoms, and general psychopathological impairment were compared between a German and an Iranian sample. Results Internal consistency of the BDD-S was excellent (ω = .92). A high correlation with the body dysmorphic concerns and moderate correlations with measures of other mental disorders supported good construct validity. We determined a cutoff value of 19 for balanced sensitivity and specificity (sensitivity = 0.92, specificity = 0.87, AUC = .94). We estimated a prevalence of 2.76% for the German sample. The cultural comparison showed that the BDD-S score was higher in the Iranian sample. Conclusions With the BDD-S, we developed an economic and versatile screening instrument based on current diagnostic criteria, to be followed up with the BDD-CI when applicable, to obtain a clinical diagnosis. In the next step, the measures must be validated in larger clinical samples.
... Depressive symptoms The level of depressive symptoms was measured using the German version of the simplified Beck Depression Inventory (BDI-V). 43 This represents an economic and userfriendly version of the well-established and validated BDI-V. ...
Article
Full-text available
Objective This study investigates whether psychological well‐being in post‐bariatric patients seeking body contouring procedures differ from those who do not seek body contouring procedures, those who have already undergone body contouring procedures, and those who are unsure about body contouring procedures. Methods An anonymous, nonrandomized, cross‐sectional survey study was designed. Psychological well‐being of four groups of post‐bariatric‐patients (undergone body contouring procedures, seeking body contouring procedures, not seeking body contouring procedures, unsure about body contouring procedures) was compared. Results A total of 345 patients were included in this study. No significant difference between patients seeking body contouring procedures and those not seeking body contouring procedures was found with regard to depressive symptoms, self‐esteem, and body image. Patients who had already undergone body contouring procedures scored lower on depressive symptoms (p=.035), and reported to feel more attractive (p<.001) and less insecure (p=.030) than patients who had not undergone body contouring procedures yet but seeked it. Satisfaction with the result of the body contouring procedures was associated with lower depression levels (p<.001), higher self‐esteem (p<.001) and a more positive body‐image (p<.001). Conclusions Depressive symptoms or a low self‐esteem are not motivational factors for post‐bariatric patients to seek body contouring procedures. body contouring procedures is, however, associated with improvement in psychological well‐being in post‐bariatric patients. The patients’ satisfaction with the result of the body contouring procedures is significantly associated with positive psychological well‐being. This article is protected by copyright. All rights reserved.
... We used further measures in the online survey for other purposes than those presented here and provide the full set of all measures used for the current research in the order they were presented in Supplement 1b (https://osf.io/95sme/). In the present study, we assessed the following constructs by established measures: well-being (Dalbert, 2002), connectedness with nature (Dutcher et al., 2007), social support (Satow, 2012), loneliness (Russell et al., 1978), distress (Kessler et al., 2002), depression (Schmitt et al., 2003), thoughtlessness (Michalak et al., 2011), perspective taking (Davis, 1980). Before presenting the measures, the participants received instructions encouraging them to think about how they usually act in different situations. ...
Article
Research on people's experiences during the Covid-19-pandemic provides growing evidence on subjective well-being and distress under pandemic conditions, however mainly at a country, not state level. The relationship between positive and negative experiences is described in Diener's conceptualization of subjective well-being. We assumed that people who experience well-being and positive affect through connectedness with nature, and social support during the pandemic feel relatively less alone, distressed, depressed, self-focused, and thoughtless. We further assumed changes in these constructs during the pandemic. The aim of this research was to examine the concurrent relationships between these positive and negative experiences of German adults simultaneously as well as their changes over 3 weeks in 2020. Owing to German federalism, we expected these changes to differ between German states. A sample of 1,038 adults responded to an online questionnaire twice (April and May 2020). A structural equation model including 16 factors and 12 covariates yielded the expected negative relationships and different mild change effects between the German states. For example, adults' connectedness with nature increased while loneliness and distress decreased in Saxony, whereas thoughtlessness increased in Bavaria. The results imply a new finding that different changes in adults' positive and negative experiences during the pandemic exist.
... Two patients and two controls were ambidextrous, but only one patient completed the task with the left hand. We used the Beck Depression Inventory (BDI) to screen for depression [49]. Included participants had ≤ 19 points (lower scores corresponding to no depression or only mild depressive symptoms). ...
Article
Full-text available
Essential tremor (ET) is a progressive movement disorder whose pathophysiology is not fully understood. Current evidence supports the view that the cerebellum is critically involved in the genesis of the tremor in ET. However, it is still unknown whether cerebellar dysfunction affects not only the control of current movements but also the prediction of future movements through dynamic adaptation toward a changed environment. Here, we tested the capacity of 28 patients with ET to adapt in a visuomotor adaptation task known to depend on intact cerebellar function. We found specific impairments in that task compared to age-matched healthy controls. Adaptation to the visual perturbation was disrupted in ET patients, while de-adaptation, the phase after abrupt removal of the perturbation, developed similarly to control subjects. Baseline tremor-independent motor performance was as well similar to healthy controls, indicating that adaptation deficits in ET patients were not rooted in an inability to perform goal-directed movements. There was no association between clinical severity scores of ET and early visuomotor adaptation abilities. These results provide further evidence that the cerebellum is dysfunctional in ET.
Article
Full-text available
Background Epidemiological research has failed to confirm laterality of lesion site as a neurobiological source of post-stroke psychopathology. However, acquired communication disorders have proved to be a key risk factor for depression, apart from established parameters such as pre-stroke psychopathology and physical immobility. Objectives The present work examines a new predictor of post-stroke psychopathology: psychological flexibility. This concept describes an accepting attitude toward irreversible loss following stroke while using remaining agency. Design Overall, 70 individuals engaged in a cross-sectional study conducted in the subacute stage after an ischemic or hemorrhagic event, a period with elevated prevalence of mental-health problems (2 weeks to 6 months after stroke). Methods Outcomes included standardized self-report and clinician-rated measures of depression, anxiety disorders, and general psychopathology (Beck Depression Inventory; Hospital Anxiety and Depression Scale; ICD-10 Symptom Rating; Hamilton Depression Rating Scale) alongside lack of psychological flexibility (Acceptance and Action Questionnaire II). The study design controlled for pre-stroke psychopathology and physical immobility (Barthel Index). Results Partial correlation analyses revealed a significant medium-to-large association between the entire set of clinical outcomes and lack of psychological flexibility (r ⩽ 0.62, p < 0.001). In moderator analyses, the magnitude of this association did not vary significantly with diagnosis of acquired communication disorders (i.e., aphasia, apraxia of speech or dysarthria; separately or combined). Conclusion The current results demonstrate a substantial link between post-stroke psychopathology and psychological flexibility. This finding opens new avenues for research on depression and other mental-health problems in stroke survivors with and without acquired communication disorders. Registration www.drks.de; identifier: DRKS00031204
Article
Full-text available
This study investigates the psychometric characteristics of the General Decision-Making Scale (GDMS) on a sample of Slovak high-school and university students. Secondly, it addresses the relationship between decision-making styles and a) decision making competencies and b) mental health as validity criteria. Participants were 427 Slovak high school and university students (64.6% females). The GDMS showed a good internal consistency and its original factor structure was confirmed. Low but significant relationships between the decision-making styles were found. Two decision-making styles served as significant predictors of the general decision-making competency (avoidant and spontaneous) and another two were found to predict mental health. The intuitive decision-making style was a protective factor and the avoidant style was a risk factor.
Article
Objective: Following a life course perspective, this study examines the link between partnership trajectories and three dimensions of psychological well-being: psychological health, overall sense of self-worth and quality of life. Background: Assuming that life outcomes are the result of prior decisions, experiences and events, partnership histories can be seen as a resource for psychological well-being. Furthermore, advantages or disadvantages from living with or without a partner should accumulate over time. While previous cross-sectional research has mainly focused on the influence of partnership status or a status change on well-being, prior longitudinal studies could not control for reverse causality of well-being and partnership trajectories. This research addresses the question of how different patterns of partnership biographies are related to a person's well-being in middle adulthood. Selection effects of pre-trajectory well-being as well as current life conditions are also taken into account. Method: Using data from the German LifE Study, the partnership trajectories between ages of 16 and 45 are classified by sequence and cluster analysis. OLS regression is then used to examine the link between types of partnership trajectories and depression, self-esteem and overall life satisfaction at age 45. Results: For women, well-being declined when experiencing unstable non-cohabitational union trajectories or divorce followed by unpartnered post-marital trajectories. Men suffered most from being long-term single. The results could not be explained by selection effects of pre-trajectory well-being. Conclusion: While women seem to 'recover' from most of the negative effects of unstable partnership trajectories through a new partnership, for men it was shown that being mainly unpartnered has long-lasting effects on their psychological well-being.
Article
Full-text available
Background and Objectives Comorbidity between major depressive disorder (MDD) and alcohol use disorder (AUD) is highly prevalent but reasons for this association are unclear. Rumination may activate metacognitive beliefs that contribute to the development and maintenance of rumination and depression. Negative metacognitions can further lead to other dysfunctional coping strategies (i.e., consumption of alcohol). We examined whether alcohol reduces (state) metacognitions, rumination and other disorder-specific processes in a group of individuals suffering from MDD. Method In an experiment with three randomized conditions we investigated whether the consumption of alcohol, placebo or no alcohol (orange juice) affects (meta-)cognitions, depressive symptoms and / or psychophysiological variables while participants ruminate. Results Voluntary rumination increased self-reported sadness, tension and rumination, tensed facial muscles and increased heart rate, but did not affect (state) metacognitions and heart rate variability. The consumption of alcohol did not influence rumination, metacognitions, depressive or psychophysiological measures. Limitations We recruited a depressed population but excluded pathological alcohol use due to ethical considerations. Conclusions We found no evidence that alcohol consumption affects rumination, metacognitions and other disorder-specific processes in MDD. However, rumination had a negative effect on various depression-specific processes, although it did not activate (negative state) metacognitions.
Article
Purpose: Anxiety disorders are relatively common during pregnancy and the postnatal period. Despite their potential acceptability to users, psychological interventions research for this population is still in its infancy. The meta-analysis aimed to comprehensively evaluate the evidence of the effectiveness of psychological interventions for reducing perinatal anxiety. Method: The review followed PRISMA guidelines. A total of 26 studies published between 2004 and 2022 fulfilled inclusion criteria of which 22 were included in the meta-analysis. Results: Results indicated that psychological interventions were more effective than control conditions in reducing symptoms of perinatal anxiety (equivalent to a medium post treatment effect size). Effect sizes were robust for cognitive, behavioural and mindfulness-based interventions. Targeting anxiety also appeared to impact on depression symptoms. There was substantial evidence of methodological heterogeneity. Conclusions: This review demonstrates that psychological interventions are effective in reducing symptoms of both anxiety and comorbid anxiety and depression in both the antenatal and postnatal periods. Further research on longer-term effects, infant outcomes, treatment approach and modality are required.
Article
Full-text available
Zusammenfassung. Um die Okonomie des Beck-Depressions-Inventars zu verbessern, wird die Itemzahl von 84 auf 20 gekurzt. Fur jedes Symptom wird nur ein Item verwendet. Das Gewichtssymptom entfallt. Die Intensitatsskalierung erfolgt uber sechsstufige Anwortskalen, auf denen die Symptomhaufigkeit eingeschatzt wird. Die Meseigenschaften des modifizierten BDI wurden an einer Stichprobe von 2500 Probanden untersucht. Die interne Konsistenz der Skala betragt = .90. Latent-State-Trait-Analysen ergeben eine sehr gute Reliabilitat des Summenwertes (.95), eine hohe Trait-Konsistenz uber einen Zeitraum von zwei Jahren (.64), eine deutliche Mesgelegenheitsspezifitat (.26) sowie eine geringe Methodenspezifitat (.05). Korrelationen des modifzierten BDI mit anderen Indikatoren des Wohlbefindens, mit demographischen Variablen, mit der objektiven und subjektiven Qualitat der eigenen beruflichen Situation, mit dem Glauben an eine gerechte und eine ungerechte Welt, mit Kontrollierbarkeitsuberzeugungen und mit Einschatzungen ...
Article
Mood congruency refers to a match in affective content between a person's mood and his or her thoughts. The mood-congruent judgment effect states in part that attributes will be judged more characteristic, and events more likely, under conditions of mood congruence. Thus, the happy person will believe good weather is more likely than bad weather (relative to such a judgment in a state of mood incongruence). Three studies showed that the effect generalizes to non-self-relevant judgments with natural mood. Study 1 (N = 202) generalized it across a variety of specific emotions, Study 2 (N = 1,065) generalized it across a variety of tasks, and Study 3 (N = 524) generalized it to a nonlaboratory, statewide sample. The three studies redefine mood-congruent judgment more broadly and thereby inform the debate about its underlying mechanisms. The relation between mood-congruent judgment and personality is discussed.
Article
RECENT development and use of the Self-Rating Depression Scale (SDS) has Proven to be a valuable tool in the assessment of depressive disorders in a group of hospitalized inpatients.1 There is a similar need in outpatient clinics to quantitate the amount of depressive symptomatology present or absent in the patients seen for treatment. Depressive symptoms may be present in any of the psychiatric disturbances seen in such a clinic, and a diagnosis of depressive disorder must still be made on a clinical basis. However, the use of such a scale is valuable in documenting and quantitating initial symptoms and complaints, and following changes in the patient's clinical course subsequent to treatment, using any of the modalities available. The purpose of a self-rating depression scale to be used in such an outpatient clinic setting would be similar to the ones stated previously with respect to its
Article
Zusammenfassung. In der vorliegenden Arbeit wird ein Uberblick uber den aktuellen Wissensstand zur Entwicklungsepidemiologie psychischer Storungen des Kindes- und Jugendalters gegeben. Der Median der Periodenpravalenzraten der wichtigsten Studien betrug 18%, wobei ca. ¾ der Pravalenzraten zwischen 15 und 22% lagen. Damit sind psychische Storungen bei Kindern und Jugendlichen in etwa gleich haufig wie bei Erwachsenen. Als haufigste Storungen zeigten sich Angststorungen mit einer durchschnittlichen Pravalenz von 10,4%, gefolgt von dissozialen Storungen mit 7,5%. Es ergaben sich konsistent hohe Persistenzraten der Storungen von ungefahr 50%, wobei dissoziale Storungen die ungunstigsten Verlaufe aufwiesen. Die haufigsten komorbiden Storungen waren dissoziale Storungen bei Vorliegen einer hyperkinetischen Storung und Angststorungen bei Vorliegen einer depressiven Storung. Bis zum Alter von 13 Jahren wurden durchgehend hohere Gesamtpravalenzen psychischer Storungen bei Jungen gefunden, wogegen im Zuge der Adole...
Article
The CES-D scale is a short self-report scale designed to measure depressive symptomatology in the general population. The items of the scale are symptoms associated with depression which have been used in previously validated longer scales. The new scale was tested in household interview surveys and in psychiatric settings. It was found to have very high internal consistency and adequate test- retest repeatability. Validity was established by pat terns of correlations with other self-report measures, by correlations with clinical ratings of depression, and by relationships with other variables which support its construct validity. Reliability, validity, and factor structure were similar across a wide variety of demographic characteristics in the general population samples tested. The scale should be a useful tool for epidemiologic studies of de pression.
Article
Zusammenfassung: An einer Stichprobe von 1268 Ostdeutschen und 925 Westdeutschen werden drei Thesen zur Meßäquivalenz und strukturellen Invarianz von Indikatoren der seelischen Gesundheit untersucht: (1) Belastungssensible Indikatoren der seelischen Gesundheit haben im Osten eine geringere Trennschärfe, da dort aufgrund des gesellschaftlichen Umbruchs die interindividuelle Belastungsvarianz im Vergleich zur Varianz der Bewältigungskompetenz größer ist als im Westen. (2) Indikatoren der seelischen Gesundheit sind bei Ostdeutschen längsschnittlich weniger stabil, da die Lebensbedingungen und die daraus entstehenden Be- und Entlastungen im Osten stärkeren intraindividuellen Veränderungen unterliegen als im Westen. (3) Kognitiv-evaluative Komponenten des Wohlbefindens (Lebenszufriedenheit) korrelieren bei Ostdeutschen geringer mit emotionalen und psychosomatischen Aspekten des Wohlbefindens (seelische Gesundheit, Depressivität, Selbstwertgefühl) als bei Westdeutschen, jedoch nur in Lebensbereichen, die vom gesellschaftlichen Umbruch stark betroffen sind. Begründet wird diese Erwartung mit der verzögerten Wirkung evaluativer Komponenten auf emotionale und somatische Komponenten der seelischen Gesundheit. Alle drei Hypothesen konnten empirisch bestätigt werden.