Content uploaded by Manfred Schmitt
Author content
All content in this area was uploaded by Manfred Schmitt on Jul 06, 2016
Content may be subject to copyright.
147
Messgüte des BDI-V
Sonderdruck aus: Diagnostica, 49, Heft 4, 147–156, © Hogrefe-Verlag Göttingen 2003
Messgüte des vereinfachten
Beck-Depressions-Inventars (BDI-V)
Manfred Schmitt, Mingo Beckmann, Detlev Dusi, Jürgen Maes,
August Schiller und Klaus Schonauer
DOI: 10.1026//0012-1924.49.4.147
Zusammenfassung. An einer demographisch heterogenen Gelegenheitsstichprobe (n = 200) und drei klinischen Stichpro-
ben (Major Depressive Disorder, n = 60; Angst- und Essstörungen, n = 11; Schizophrenie, n = 40) wurden Messeigenschaften
des vereinfachten Beck-Depressions-Inventars (BDI-V) ermittelt. Homogenität und Reliabilität des BDI-V übersteigen jene
des Original-BDI (BDI-O) und jene weiterer vier Depressionsskalen. BDI-V und BDI-O konvergieren auf der Ebene einzelner
Symptome (durchschnittliche Korrelation in der Gesamtstichprobe = .70) und auf der Ebene des Summenwertes (r = .91 in der
Gesamtstichprobe). Beide BDI-Versionen korrelieren in ähnlicher Höhe mit anderen Selbstbeschreibungsmaßen der Depres-
sion (durchschnittliche Korrelation = .70) und einem Expertenrating (Hamilton-Skala, r = .50). BDI-V und BDI-O differen-
zieren ähnlich gut zwischen klinisch unauffälligen Personen und Patienten mit einer depressiven Primär- oder Sekundärsymp-
tomatik. Vergleichbar gut gelingt mit beiden Versionen auch die Differenzierung klinischer Gruppen. Eine konfirmatorische
Faktorenanalyse ergab in der klinisch unauffälligen Stichprobe eine geringfügige Abweichung von perfekter Messäquivalenz
(1.00 r .95). Diese Abweichung ist für die diagnostische Praxis unbedeutend. Mit dem vereinfachten BDI steht ein
Instrument zur Verfügung, das gleich gute Messeigenschaften aufweist wie das Original, diesem in seiner Messökonomie aber
deutlich überlegen ist und sich deshalb insbesondere für epidemiologische Screenings an großen Stichproben eignet.
Schlüsselwörter: Messäquivalenz, klinische Differenzialdiagnostik, Testökonomie
Validity of the simplified Beck Depression Inventory
Abstract. A simplified version of the Beck Depression Inventory was administered to participants of a demographically
heterogeneous sample (n = 200) and to three clinical samples (Major Depressive Disorder, n = 60; Anxiety and Eating
Disorders, n = 11; Schizophrenia, n = 40). The reliability of the simplified BDI (.93) exceeded the reliability of the original
BDI (.84) and the reliabilities of four other depression scales. Both BDI versions converge well on the level of symptoms
(average correlation = .70 in the total sample) and on the level of sum scores (r = .91 in the total sample). Both BDI versions
correlate equally high with other self-report measures of depression (average correlation = .70) and an expert rating of
depression (Hamilton-Scale, r = .50). Both versions discriminate depressed individuals about equally well from normal
individuals. They also discriminate about equally well between clinical samples. Confirmatory factor analyses show a slight
deviation from perfect measurement equivalence (1.00 r .95). This deviation from perfect equivalence is trivially low
with regard to practical applications of the BDI. It is concluded that the simplified BDI measures depression equally well but
more efficiently than the original BDI. The simplified version is therefore especially suitable for large scale epidemiological
screenings.
Key words: measurement equivalence, differential validity, measurement efficiency
Das Depressions-Inventar von Beck (BDI) ist eines der
bedeutendsten Instrumente in der klinisch-psychologi-
schen Diagnostik. Zahlreiche Untersuchungen bescheini-
gen dem BDI eine gute Zuverlässigkeit und Validität
(Beck, Steer & Garbin, 1988; Lukesch, 1974; Richter, 1991;
Richter, Werner & Bastine, 1994; Röhrle, 1988). In der ak-
tuellen Originalversion werden 21 depressionstypische
Symptome über je vier Aussagen steigender Schwierig-
keit erfasst (Beck & Steer, 1987; deutsch: Hautzinger,
Bailer, Worall & Keller, 1994). Diese Form der Skalierung
reduziert die Ökonomie des BDI. Diagnostikanden müs-
sen insgesamt 84 Aussagen (plus eine Alternativfrage zur
Motivation der Gewichtsreduktion) lesen, verarbeiten und
beantworten. Bei schwer depressiven Patienten bedeutet
dies eine erhebliche und vermutlich unnötige Beanspru-
chung, die zum vorzeitigen Abbruch des Verfahrens füh-
ren kann. Zudem verursacht das Format des BDI im Rah-
men epidemiologischer Screenings und multivariater Fra-
gebogenstudien an großen Stichproben Kosten, die mög-
licherweise vermeidbar wären.
Trotz der Verfügbarkeit von Depressionsskalen, die
das Problem der umständlichen Intensitätsskalierung des
BDI und seine geringe Ökonomie nicht teilen (Hautzinger
& Meyer, 2002), erscheint eine Optimierung des BDI wün-
schenswert, da dieses Inventar weltweit eine führende
Rolle spielt und vermutlich auch in Zukunft spielen wird.
Zudem ist die Existenz mehrerer Messverfahren für ein
Konstrukt vorteilhaft, um Testeffekte in Wiederholungs-
untersuchungen zu minimieren, wie sie in der Klinischen
Psychologie im Rahmen der Kontrolle von Therapieeffek-
ten auftreten können. Weiterhin können alternative Mess-
148 Manfred Schmitt et al.
instrumente zur Konstruktdifferenzierung beitragen, ins-
besondere wenn die Instrumente in verschiedenen theo-
retischen Traditionen wurzeln oder unterschiedliche
Ausschnitte eines psychologischen Phänomenbereichs
akzentuieren. Ferner ist die Verfügbarkeit alternativer
Messverfahren zur Abschätzung von Methodenvarianz
hilfreich (Eid & Diener, im Druck). Schließlich kann es
vorteilhaft sein, das Format eines Messinstrumentes zu
variieren, um es an unterschiedliche Verwendungszusam-
menhänge anzupassen. Die Intensitätsskalierung des BDI
mag in einem klinischen Interview Vorteile haben, wäh-
rend sie bei der selbstständigen Bearbeitung einfacher
aufgebauten Verfahren sicher unterlegen ist.
Aus diesen Gründen schlugen Schmitt und Maes
(2000) zur Steigerung der Ökonomie eine vereinfachte Fas-
sung des BDI vor (BDI-V). 20 Symptome des Original BDI
(BDI-O) wurden übernommen. Auf das Symptom des
Gewichtsverlusts wurde verzichtet, weil es von allen
Symptomen die geringste Trennschärfe besitzt (Hautzin-
ger et al., 1994; Kammer, 1983). Die Symptome werden im
Unterschied zum BDI-O nicht durch vier, sondern nur
durch eine Aussage operationalisiert. Zur Messung der
Symptomstärke wird eine sechsstufige Häufigkeitsskala
(0/nie-1-2-3-4-5/fast immer) verwendet. Der Verein-
fachungsvorschlag von Schmitt und Maes (2000) führt zu
einer Kürzung von 84 (+2) auf 20 Items. Instruktion, Item-
wortlaut, Antwortformat und Layout des BDI-V sind in
Abbildung 1 wiedergegeben.
Aus der Anzahl der 20 Items und der gewählten num-
merischen Verankerung der Antwortstufen (0 bis 5) ergibt
sich für die Skala (Itemsumme) ein Wertebereich von 0 bis
100. Schmitt und Maes (2000) untersuchten die Mess-
eigenschaften des BDI-V an einer heterogenen Stichpro-
be von 2500 Personen und ermittelten eine interne Kon-
sistenz (α) von .90. In Latent-State-Trait-Analysen erwies
sich der Summenwert als sehr reliabel (.95). Die Trait-Kon-
sistenz betrug über einen Zeitraum von zwei Jahren .64,
die Messgelegenheitsspezifität .26, die Methodenspezifi-
tät für Testhälften .05. Zur Konstruktvalidierung des ver-
einfachten BDI wurden von Schmitt und Maes (2000) Kor-
relationen mit anderen Indikatoren
des Wohlbefindens, mit demogra-
phischen Variablen, mit der objek-
tiven und subjektiven Qualität der
beruflichen Situation, mit dem
Glauben an eine gerechte und eine
ungerechte Welt, mit Kontrollier-
barkeitsüberzeugungen und mit
Einschätzungen beruflicher Mög-
lichkeiten im vereinigten Deutsch-
land ermittelt. Die ermittelten Kor-
relationen stimmten mit den theo-
retischen Erwartungen überein
und sprechen für die Konstruktva-
lidität des BDI-V.
Allerdings war die Untersu-
chung von Schmitt und Maes
(2000) nicht mit dem Ziel einer Vali-
dierung des BDI-V geplant wor-
den. Vielmehr wurden die Messei-
genschaften des BDI-V im Rahmen
einer Längsschnittstudie zu den
psychologischen Folgen der deut-
schen Wiedervereinigung unter-
sucht. Schmitt und Maes (2000)
schlugen deshalb weitere Unter-
suchungen zu den Messeigen-
schaften vor, insbesondere (1)
eine Prüfung der Messäquivalenz
des vereinfachten BDI mit dem
Original-BDI, (2) eine Konstrukt-
validierung an anderen Selbst-
und Fremdbeschreibungsmaßen
der Depression, (3) eine Untersu-
chung der differentialdiagnosti-
schen Trennschärfe bei der Unter-
scheidung klinischer Gruppen, (4)
die Normierung an einer bevölke-
rungsrepräsentativen Stichprobe
sowie (5) die empirische Bestim-Abbildung 1. Instruktion, Itemwortlaut, Antwortformat und Layout des BDI-V.
149
Messgüte des BDI-V
mung der Änderungssensitivität als Funktion des Zeit-
raums, den die Person laut Instruktion bei der Beantwor-
tung der Fragen integrieren soll.
Die vorliegende Studie zielt auf die ersten drei dieser
Desiderate. Einer klinisch unauffälligen, demographisch
heterogenen Gelegenheitsstichprobe von 200 Personen
wurden das vereinfachte BDI, das Original-BDI sowie vier
weitere Depressionsskalen vorgelegt. Weiterhin wurden
beide BDI-Versionen Personen zur Bearbeitung vorgelegt,
die sich wegen psychischer Störungen in stationärer Be-
handlung befanden, sich laut Diagnose aber systematisch
im Schweregrad ihrer depressiven Belastung unterschei-
den sollten. Eine erste Gruppe bestand aus Patienten, bei
denen die Depression als primäre Störung im Vordergrund
stand. Für diese Gruppe wurden die höchsten BDI-Werte
erwartet. Patienten mit einer Angst- oder Essstörung als
Hauptdiagnose bildeten eine zweite klinische Gruppe. Bei
Patienten mit primären Angst- und Essstörungen gehören
depressive Verstimmungen relativ häufig zur komorbiden
Symptomatik (Angold, Costello & Erkanli, 1999; Ihle &
Esser, 2002; Kennedy et al., 1994; Rief & Fichter, 1992).
Deshalb sollten Patienten dieser Störungsgruppen im Ver-
gleich zur klinisch unauffälligen Stichprobe erhöhte
Depressionswerte aufweisen, nicht aber das Depres-
sionsniveau der primär depressiven Patienten erreichen.
Schließlich wurden beide BDI-Versionen einer Gruppe von
schizophrenen Patienten vorgelegt. Da bei der Diagnose
der Schizophrenie affektive Psychosen ausgeschlossen
sein müssen (Saß, Wittchen & Zaudig, 1996), wurden für
die Gruppe schizophrener Patienten keine im Vergleich zur
klinisch unauffälligen Stichprobe erhöhten Depressions-
werte erwartet. Um zusätzlich zur Diagnose ein weiteres
Außenkriterium für die Konstruktvalidität des BDI-V zu
gewinnen, wurde bei allen Patienten der Schweregrad der
derzeitigen Depression von einem Experten eingeschätzt.
Methode
Messinstrumente
Selbstbeschreibungsmaße der Depression
In der klinisch unauffälligen Stichprobe wurden außer dem
BDI-O und dem BDI-V vier weitere Selbstbeschreibungs-
maße der Depression erhoben:
(1) Die aus 24 Items bestehende Depressionsskala der
Kurzform des MMPI (Gehring & Blaser, 1993),
(2) Die aus 20 Items bestehende Allgemeine Depres-
sionsskala (ADS) von Hautzinger und Bailer (1993), einer
deutschsprachigen Version der Center for Epidemiologi-
cal Studies Depression Scale (CES-D) von Radloff (1977),
(3) Die aus 16 Items bestehende Depressivitäts-Skala
(DS) nach von Zerssen (1976),
(4) Die aus 20 Items bestehende Self-Rating Depres-
sion Scale (SDS) von Zung (1965) in der deutschen Fas-
sung des CIPS (1996).
Die Reihenfolge der Skalen war bei allen Probanden
konstant: MMPI, BDI-O, BDI-V, ADS, DS, SDS. Die Erhe-
bung geschah vollständig anonym. Die Instrumente wur-
den den Probanden gemeinsam mit einem Umschlag
ausgehändigt oder zugesandt, in dem die ausgefüllten
Fragebögen ohne Angabe des Absenders zurück-
geschickt oder an einer Sammelstelle abgebeben werden
sollten.
Nachdem sich gezeigt hatte, dass viele Patienten mit
einer depressiven Primärsymptomatik durch die Befra-
gung an ihre Belastbarkeitsgrenze stießen, wurde ent-
schieden, in den klinischen Gruppen nur die beiden
BDI-Versionen sowie ein Expertenrating der Depression
zu erheben.
Expertenrating der Depression
Der Schweregrad der Depression der Probanden der klini-
schen Stichproben wurde von dem behandelnden Psy-
chiater oder Psychologen ohne Kenntnis der BDI-Werte
des Patienten anhand der Hamilton Depression Scale
(HAMD) eingestuft (Hamilton, 1967). Alle Experten waren
in der Anwendung der HAMD geschult und erfahren.
Verwendet wurde die aktuelle deutsche Fassung, die 21
Items umfasst, wobei nur die ersten 16 Items verrechnet
werden (CIPS, 1996).
Stichproben und Datenerhebung
Die Gesamtstichprobe besteht aus vier Teilstichproben,
einer klinisch unauffälligen Stichprobe (n = 200) sowie drei
Stichproben von Personen, die zum Zeitpunkt der Unter-
suchung wegen psychischer Störungen in stationärer
Behandlung waren.
Klinisch unauffällige Stichprobe
Bei der klinisch unauffälligen Stichprobe handelt es sich
um eine demographisch heterogene Gelegenheitsstich-
probe von 81 Männern und 119 Frauen, die nach dem
Schneeballprinzip gewonnen wurde. Das Alter reichte von
15 bis 78 Jahren (M = 35; SD = 13). 33% der Probanden
waren zum Zeitpunkt der Datenerhebung verheiratet, 29 %
lebten in fester Partnerschaft, 30 % waren alleinstehend,
7% lebten getrennt oder in Scheidung, 2 % waren verwit-
wet. 4% der Probanden hatten keinen Hauptschulab-
schluss, 24% hatten einen Hauptschulabschluss, 3 %
hatten eine Real- oder Handelsschule ohne Abschluss be-
sucht, 18% hatten die Mittlere Reife erworben, 10% hat-
ten das Gymnasium ohne Abschluss besucht, 5% nann-
ten das Abitur als höchsten Abschluss, 16% hatten ein
Studium begonnen aber nicht abgeschlossen, 20% hatten
ein Studium abgeschlossen.
Klinische Stichproben
Die Probanden der klinischen Stichproben wurden zum
Zeitpunkt der Datenerhebung im Zentrum für Psychiatrie
150 Manfred Schmitt et al.
Weinsberg, im Zentrum für Psychiatrie Reichenau und
in der Klinik für Psychosomatik und Psychotherapie (Me-
dian Kliniken, Klinik Moselhöhe) in Bernkastel-Kues sta-
tionär behandelt. Die Diagnosen wurden vom zuständi-
gen Psychiater oder Psychologen nach den Kriterien des
DSM-IV oder der ICD-10 gestellt, wobei die diagnostisch
relevanten Informationen in der Regel mittels semistruktu-
rierter Interviews erhoben und die diagnostische Klassifi-
kation unter Zuhilfenahme der Internationalen Diagnose-
Checklisten von Hiller, Zaudik und Mombour (1995) vor-
genommen wurde. Die Zuordnung der Patienten zu den
Diagnosegruppen erfolgte nach ihrer primären Störung.
Es wurden nur Patienten in die Untersuchung aufgenom-
men, deren primäre Störung eindeutig und deutlich höher
ausgeprägt war als komorbide Störungen. Mit jedem Pa-
tienten wurde vor der Datenerhebung ein Gespräch ge-
führt mit dem Ziel abzuklären, ob die Person kognitiv und
emotional zur Beantwortung der Fragebögen in der Lage
sein würde. Die beiden BDI-Versionen und das Experten-
rating wurden in einer Zeitspanne von 7 bis 28 Tagen nach
der stationären Aufnahme erhoben.
MDD-Stichprobe. 31 Männern und 29 Frauen erfüllten
die Diagnosekriterien einer Major Depressive Disorder
nach DSM-IV. Das Alter dieser Patienten erstreckte sich
von 18 bis 69 Jahren (M = 45; SD = 13) und verteilte sich
wie folgt: 15–24 (n = 5), 25–34 (n = 8), 35–44 (n = 16), 45–54
(n = 14), 55–64 (n = 14), 65–74 (n = 3).
Angst- und Essstörungen. Bei 10 Frauen und einem
Mann waren eine Angst- oder eine Essstörung als Haupt-
störung diagnostiziert worden. Patienten mit Angststö-
rungen erfüllten die Kriterien einer der beiden DSM-IV
Kategorien „Panikstörungen mit Agoraphobie“ oder „Pa-
nikstörungen ohne Agoraphobie“. Patienten mit Essstö-
rungen erfüllten die Kriterien einer der beiden DMS-IV Ka-
tegorien „Anorexia nervosa“ oder „Bulimia nervosa“. Das
Alter dieser Probanden erstreckte sich von 17 bis 54 Jah-
ren (M = 33; SD = 11) und verteilte sich wie folgt: 15–24
(n = 3), 25–34 (n = 4), 35–44 (n = 2), 45–54 (n = 2).
Schizophrenie. 23 Männer und 17 Frauen waren nach
DSM-IV oder ICD-10 als schizophren diagnostiziert wor-
den. Zwei Patienten befanden sich im Residualzustand mit
Restsymptomatik auf einer psychotherapeutischen Sta-
tion. Die restlichen 38 Patienten befanden sich im Akutzu-
stand auf einer geschlossenen Station. Das Alter dieser
Gruppe erstreckte sich von 19 bis 71 Jahren (M = 38; SD =
13) und verteilte sich wie folgt: 15–24 (n = 8), 25–34 (n = 9),
35–44 (n = 10), 45–54 (n = 7), 55–64 (n = 5), 65–74 (n = 1).
Man beachte, dass sich die drei klinischen Gruppen im
Spezifitätsgrad ihrer Störung unterscheiden. Während die
Patienten der ersten und dritten Gruppe durch eine spezi-
fische Hauptdiagnose definiert sind, entstammen die Pa-
tienten der zweiten Gruppe zwei Störungsgruppen. Für
unsere Fragestellung ist dieser Unterschied jedoch nicht
entscheidend. Relevant ist lediglich, dass die Depression
bei Patienten der ersten Gruppe die primäre Störung dar-
stellt, bei Patienten der zweiten Gruppe zu den komorbi-
den, also sekundären Störungen gehört und bei Patienten
der dritten Gruppe gar nicht vorkommen sollte.
Von untergeordneter Bedeutung ist weiterhin, ob sich
die Gruppen in demographischen, biographischen, medi-
zinischen oder psychologischen Merkmalen unterschei-
den, die als Ursachen, Korrelate oder Folgen depressiver
Störungen bekannt sind oder vermutet werden. Solche
Unterschiede sind im Zusammenhang unserer Fragestel-
lung nachrangig, da es um die Validität der Symptomdiag-
nose, insbesondere die Symptomstärke, und nicht um Fra-
gen der Störungsätiologie geht. Zwar können Ursachen,
Korrelate und Folgen depressiver Erkrankungen ihrerseits
für die Konstruktvalidierung eines Depressionsmaßes
herangezogen werden. Diese Validierungsmöglichkeiten
bieten sich hier wegen der vergleichsweise geringen
Stichprobengrößen jedoch nicht an und wurden überdies
bereits von Schmitt und Maes (2000) genutzt.
Ergebnisse
Optimierung der Hamilton-Skala
Eine Analyse der Messeigenschaften der Hamilton-Skala
ergab eine unbefriedigende interne Konsistenz α von .68.
Die Inspektion der Trennschärfen ergab eindeutig, dass
die geringe Homogenität den Items 9 (Erregung), 15
(Hypochondrie) und 16 (Gewichtsverlust) zuzuschreiben
war, deren Trennschärfen sich nicht signifikant von Null
unterschieden und deskriptiv sogar negativ waren. Zu-
sätzliche Analysen ergaben, dass die Trennschärfen der
beiden Items 18 a und 18b (Tagesschwankungen), die laut
CIPS (1996) nicht in den Summenwert einfließen sollen,
ähnlich hoch ausfielen wie die nach Anweisung zu ver-
rechnenden Items. Die Items 9, 15 und 16 wurden deshalb
ausgeschlossen und die Items 18a und 18 b zur Reliabili-
tätsteigerung in die Skala aufgenommen. Für die so opti-
mierte Skala ergab sich eine gute interne Konsistenz
α von .82. Wie sich zeigen wird, wirkt sich die Optimie-
rung der Hamilton-Skala nicht nur günstig auf ihre Reliabi-
lität aus, sondern erhöht auch ihre Korrelation mit den
beiden BDI-Versionen, was als Steigerung der Validität
der Hamilton-Skala interpretiert werden kann.
Trennschärfen der Depressionssymptome
im Original-BDI und im vereinfachten BDI
Tabelle 1 enthält die korrigierten Trennschärfen der BDI-
Items, die für die beiden Versionen in drei Stichproben
getrennt berechnet wurden, der klinisch unauffälligen
Stichprobe, der MDD-Stichprobe und der Gesamtstich-
probe. Ein Vergleich der Koeffizienten über die Stichpro-
ben zeigt, dass für beide BDI-Versionen durchschnittlich
die höchsten Trennschärfen in der Gesamtstichprobe und
die geringsten Trennschärfen in der MDD-Stichprobe er-
reicht werden. Dieses Muster spiegelt die größere Varianz
der Symptomschwere in der Gesamtstichprobe wider, die
sich dort aus der Varianz innerhalb der Gruppen und der
Varianz zwischen allen Gruppen zusammensetzt. Ein Ver-
gleich der Trennschärfen über die BDI-Versionen ergibt,
dass die Items des vereinfachten BDI überwiegend und
151
Messgüte des BDI-V
durchschnittlich höhere Trennschärfen aufweisen als die
Items des Original-BDI. Vergleicht man die Trennschärfen
über die Symptome, fällt zunächst die geringe Trennschär-
fe der Gewichtsabnahme beim Original-BDI auf, die schon
in früheren Untersuchungen beobachtet worden war und
Schmitt und Maes (2000) bei der Vereinfachung des BDI
zum Verzicht auf dieses Item veranlasst hatte. Weiterhin
liegen bei beiden BDI-Versionen die Trennschärfen psy-
chosomatischer Symptome (Weinen, Sorge um Ausse-
hen, Schlafstörungen, Appetitlosigkeit, gesundheitliche
Sorgen, Libidoverlust) unterhalb jener der genuin psy-
chologischen Anzeichen der Depression (Traurigkeit,
Hoffnungslosigkeit, Unzufriedenheit, Genussunfähigkeit,
Schuldgefühl, Selbsthass, Selbstanklage, Suizidalität).
Zur Beurteilung der Messäquivalenz der beiden BDI-
Versionen ist neben der absoluten Höhe auch die relative
Höhe der Trennschärfe eines Symptoms im Vergleich zu
anderen Symptomen von Bedeutung (Schmitt, Maes &
Seiler, 2001). Eine hohe Ähnlichkeit der Trennschärfen-
profile würde dafür sprechen, dass beide BDI-Versionen
die einzelnen Symptome in ähnlicher Weise verorten, dem
jeweiligen Symptom also eine eher zentrale oder eine eher
periphere Bedeutung zuweisen. Zur Klärung dieser Frage
wurde die Rangkorrelation (nach Spearman) zwischen den
Trennschärfen der beiden BDI-Versionen berechnet. Die
ermittelten rho-Werte betragen .65 (klinisch unauffällige
Stichprobe), .61 (MDD-Stichprobe) und .85 (Gesamtstich-
probe). Vor allem in der Gesamtstichprobe mit der größten
Symptomvarianz werden die einzelnen Symptome also
von beiden BDI-Versionen sehr ähnlich verortet.
Homogenität und Reliabilität
der Depressionsskalen
Tabelle 2 enthält Homogenitätskennwerte für die sechs in
der klinisch unauffälligen Stichprobe verwendeten De-
pressionsskalen. Mit α lässt sich die Mindestreliabilität
einer Skala abschätzen (Cronbach, 1951). α variiert bei
konstanter Skalenhomogenität mit der Skalenlänge. Hin-
gegen sind die mittlere Itemkorrelation [M (rii)], die mittle-
re korrigierte Trennschärfe [M (rit)] und der durchschnitt-
liche Varianzanteil eines Items, der durch die erste unro-
tierte Hauptachse erklärt wird [M (a2)], von der Skalenlän-
ge unabhängig.
Die Werte in Tabelle 2 zeigen, dass das vereinfachte
BDI homogener und reliabler ist als alle anderen Depres-
sionsskalen, die verwendet wurden. Auch in allen klini-
schen Stichproben liegt die Zuverlässigkeit des verein-
fachten BDI über jener des Original-BDI (MDD: .84 versus
.79; Angst- und Essstörungen: .84 versus .72; Schizophre-
nie: .88 versus .80).
Tabelle 1. Korrigierte Trennschärfen der Items des Original-BDI und des vereinfachten BDI
Symptom klinisch-unauffällige MDD-Stichprobe Gesamtstichprobe
Stichprobe (59 n 60) (308 n 311)
(198 n 200)
BDI-O BDI-V BDI-O BDI-V BDI-O BDI-V
1. Stimmung .54 .74 .57 .47 .74 .79
2. Hoffnungslosigkeit .46 .64 .47 .56 .71 .78
3. Unzufriedenheit .57 .68 .42 .64 .68 .76
4. Genussunfähigkeit .60 .69 .34 .64 .72 .80
5. Schuldgefühl .50 .60 .56 .59 .66 .72
6. Bestrafungsgefühl .52 .69 .43 .55 .60 .71
7. Selbsthass .51 .79 .34 .51 .66 .76
8. Selbstanklage .46 .74 .45 .50 .62 .75
9. Selbstbestrafung .47 .46 .33 .39 .60 .59
10. Weinen .45 .53 .29 .23 .56 .56
11. Reizbarkeit .36 .72 .18 .32 .42 .62
12. Sozialer Rückzug .40 .51 .45 .44 .56 .60
13. Entschlusslosigkeit .40 .67 .48 .35 .63 .72
14. Körperwahrnehmung .30 .47 .43 .29 .54 .46
15. Arbeitsunfähigkeit .54 .64 .33 .41 .67 .74
16. Schlafstörungen .32 .49 .14 .24 .46 .62
17. Ermüdbarkeit .49 .75 .48 .58 .67 .82
18. Appetitlosigkeit .31 .44 .17 .26 .49 .50
19. Gewichtsabnahme .16 – .03 – .32 –
20. Hypochondrie .31 .46 .11 .16 .49 .56
21. Libidoverlust .26 .35 .42 .30 .52 .51
M (rit) .44 .60 .37 .42 .60 .67
152 Manfred Schmitt et al.
Korrelation des vereinfachten BDI
mit anderen Depressionsmaßen
Um weiterer Hinweise auf die konvergente Validität des
vereinfachten BDI zu erhalten, wurde es in der klinisch
unauffälligen Stichprobe mit den anderen Depressions-
skalen und in den klinischen Stichproben mit dem Exper-
tenrating (Hamilton-Skala) korreliert. Tabelle 3 zeigt, dass
das vereinfachte BDI in der klinisch unauffälligen Stich-
probe am höchsten mit dem Original-BDI und ähnlich hoch
wie dieses mit allen anderen Depressionsmaßen korreliert.
Besonders einschlägig für die Beurteilung der Validi-
tät des BDI als Selbstbeschreibungsmaß ist seine Konver-
genz mit dem Urteil eines ausgebildeten und erfahrenen
Diagnostikers. Beide BDI-Versionen korrelieren gleich
und zufriedenstellend hoch mit der Hamilton-Skala.
Korrelation des vereinfachten BDI
mit dem Original BDI
Um die Messäquivalenz der beiden BDI-Versionen detail-
lierter zu klären, wurden sie auf der Ebene einzelner
Symptome und des Summenwertes in der klinisch unauf-
fälligen Stichprobe, der MDD-Stichprobe und der Gesamt-
stichprobe korreliert (Tabelle 4).
Gemessen an der eingeschränkten Zuverlässigkeit
(und damit Validität) von Ein-Item-Maßen ist die Konver-
genz auf Symptomebene mit einer Ausnahme (Weinen)
beträchtlich. Auch auf der Ebene des Summenwertes
konvergieren beide BDI-Versionen gut. In der klinisch
unauffälligen Stichprobe erreicht die Korrelation der
Summenwerte annähernd die geschätzte Reliabilität (inter-
ne Konsistenz) des Original-BDI.
Test der Messäquivalenz
der beiden BDI-Versionen
Die deskriptiven Befunde, die bisher berichtet wurden,
sprechen für eine gute Konvergenz der beiden BDI-Ver-
sionen. Um diesen Eindruck strenger zu prüfen, wurde für
die beiden BDIs ein simultanes, kongenerisches Messmo-
dell spezifiziert und die Äquivalenzhypothese statistisch
getestet. Für jede BDI-Version wurde ein Faktor angenom-
men, der die Kovarianz ihrer Testhälften erklärt. Getestet
wurde die Nullhypothese, dass die beiden BDI-Faktoren
perfekt korrelieren, also identisch sind. Parameterschät-
Tabelle 2. Reliabilität und Homogenität der verwendeten Depressionsskalen (klinisch unauffällige Stichprobe,
192 n 200)
BDI-O BDI-V MMPI ADS DS SDS
α.84 .93 .78 .85 .87 .88
M(rii).21 .39 .13 .22 .33 .22
M(rit).44 .60 .32 .43 .54 .43
M(a2).27 .44 .18 .33 .39 .28
Anmerkungen: α = Cronbach’s α; M(rii) = mittlere Itemkorrelation; M(rit) = mittlere korrigierte Trennschärfe; M(a2) = durch die erste
unrotierte Hauptachse durchschnittlich erklärter Varianzanteil eines Items.
Tabelle 3. Produkt-Moment-Korrelationen des vereinfachten BDI mit anderen Selbstbeschreibungsmaßen der Depression
(klinisch unauffällige Stichprobe, 197 n 200) und einem Expertenrating (Hamilton-Skala, klinische Stich-
proben, n = 53)
123456
1 BDI-V
2 BDI-O .82
3 MMPI .66 .66
4 ADS .70 .72 .65
5 DS .70 .71 .63 .70
6 SDS .73 .75 .67 .75 .79
7 Je an/wg. Depr. erkrankt/behandelt .26 .24 .23 .27 .27 .26
8 Hamilton-Skala-optimiert .60 .59
9 Hamilton-Skala-Original (CIPS) .50 .51
Anmerkung: Alle Korrelationen signifikant (p < .01).
153
Messgüte des BDI-V
zung und Modelltest wurden mit LISREL 8.51 sowohl in
der klinisch unauffälligen Stichprobe als auch der Gesamt-
stichprobe vorgenommen. Auf einen Modelltest inner-
halb der einzelnen klinischen Gruppen wurde aus Gründen
der geringen Teststärke verzichtet. Um die Notwendigkeit
der Spezifikation korrelierter Testhälftenfaktoren (Metho-
denfaktoren) zu vermeiden, wurden die Items des Original-
BDI nach der odd-even-Methode geteilt (erste Testhälfte
= gerade Items, zweite Testhälfte = ungerade Items), die
Items des vereinfachten BDI hingegen nach der split-half-
Methode (erste Testhälfte = Items 1 bis 10, zweite Test-
hälfte = Items 11 bis 20). Faktorladungen und Residualva-
rianzen wurden zur Schätzung freigegeben, die Varianzen
der Faktoren sowie die Korrelation zwischen diesen auf 1
fixiert. Während das Modell die Kovarianzstruktur der vier
Testhälften in der Gesamtstichprobe sehr gut erklären
kann (χ2(2) = 2.83, p = .24), muss es, sofern man einen
strengen Maßstab anlegt (α > .05), in der klinisch unauf-
fälligen Stichprobe verworfen werden (χ2(2) = 7.84,
p = .02). In einem zweiten Schritt wurde deshalb die Korre-
lation der beiden Faktoren im Modell für die klinisch un-
auffällige Stichprobe zur Schätzung freigegeben. Dadurch
verbesserte sich der Fit des Modells erheblich (χ2(1) =
1.61, p = .20) und signifikant (χ2(1) = 6.23, p < .05).
Abbildung 2 gibt die geschätzten Parameter der stan-
dardisierten Lösung der akzeptierten Modelle für die bei-
den Stichproben wieder. Von besonderem Interesse ist
hier die geschätzte Korrelation der beiden BDI-Faktoren in
der klinisch unauffälligen Stichprobe. Der Schätzwert be-
trägt .95 und liegt damit nur wenig unterhalb des Idealwer-
tes von 1.
Tabelle 4. Produkt-Moment-Korrelation des vereinfachten BDI mit dem Original-BDI auf der Ebene einzelner Symptome
und des Summenwertes
Symptom klinisch unauffällige MDD-Stichprobe Gesamtstichprobe
Stichprobe (n = 60) (309 n 311)
(198 n 200)
1. Stimmung .67 .67 .75
2. Hoffnungslosigkeit .62 .56 .75
3. Unzufriedenheit .57 .66 .72
4. Genussunfähigkeit .60 .38 .71
5. Schuldgefühl .71 .66 .77
6. Bestrafungsgefühl .70 .79 .78
7. Selbsthass .57 .62 .71
8. Selbstanklage .57 .61 .66
9. Selbstbestrafung .72 .76 .79
10. Weinen .30 .21 .39
11. Reizbarkeit .38 .67 .53
12. Sozialer Rückzug .68 .70 .74
13. Entschlusslosigkeit .57 .75 .71
14. Körperwahrnehmung .58 .39 .53
15. Arbeitsunfähigkeit .69 .72 .79
16. Schlafstörungen .64 .80 .76
17. Ermüdbarkeit .56 .68 .70
18. Appetitlosigkeit .64 .77 .73
19. Hypochondrie .59 .74 .69
20. Libidoverlust .76 .91 .84
mittlere Korrelation auf Symptomebene .60 .65 .70
Korrelation der BDI-Summenwerte .82 .88 .91
Anmerkung: Alle Korrelationen sind signifikant (p > .01, einseitig).
Abbildung 2. Parameter der akzeptierten Messmodelle für
Testhälften der beiden BDI-Versionen in der klinisch un-
auffälligen Stichprobe/der Gesamtstichprobe.
BDI-O
BDI-O-2BDI-O-1
BDI-V
BDI-V-2BDI-V-1
.23 / .12
.88 / .94 .93 / .94 .87 / .89.83 /.92
.95 / 1. 00
.31 / .16 .14 / .12 .24 / .20
.95 / 1.00
154 Manfred Schmitt et al.
Differentialdiagnostische Trennschärfe
der BDI-Versionen
Wenn die beiden BDI-Versionen valide sind, sollte es
möglich sein, die Stichproben anhand der BDI-Messwerte
zu differenzieren. Wenn beide Versionen messäquivalent
sind, sollte diese Differenzierung mit beiden Versionen
gleich gut gelingen. Die oben formulierten Hypothesen
über Mittelwertsunterschiede zwischen den Stichproben
lassen sich wie folgt zusammenfassen: MDD > Angst- und
Essstörungen > Schizophrenie = klinisch unauffällige
Stichprobe.
Die Mittelwerte in Tabelle 5 bestätigen diese Erwar-
tung für beide BDI-Versionen. Klinisch unauffällige Pro-
banden und Patienten, die als schizophren diagnostiziert
wurden, unterscheiden sich nur geringfügig und statis-
tisch nicht signifikant (p > .05) in den durchschnittlichen
BDI-Summenwerten voneinander. Hingegen sind im Ver-
gleich zu den durchschnittlichen BDI-Werten dieser bei-
den Gruppen jene der Patienten mit Angst- und Essstö-
rungen um mehr als eine Standardabweichung (d > 1), jene
der MDD-Stichprobe um mehr als zwei Standardabwei-
chungen (d > 2) erhöht (bei Verwendung gepoolter Stan-
dardabweichungen).
Tabelle 6 enthält Korrelationen zwischen den BDI-
Summenwerten und binären Gruppenkontrasten. Der ab-
soluten Höhe dieser Koeffizienten nach trennt das Origi-
nal-BDI klinisch unauffällige Personen und Patienten
mit einer depressiven Primär- oder Sekundärsymptomatik
etwas genauer, während das vereinfachte BDI zwischen
den klinischen Gruppen geringfügig besser diskriminiert.
Statistisch signifikant sind die Unterschiede zwischen den
Korrelationskoeffizienten jedoch nicht.
Diskussion
Die Ergebnisse dieser Untersuchung bescheinigen dem
vereinfachten BDI von Schmitt und Maes (2000) sehr gute
Messeigenschaften. Das vereinfachte BDI ist etwas
homogener und etwas zuverlässiger als das Original und
die anderen Selbstbeschreibungsmaße der Depression,
die hier verwendet wurden. Zahlreiche Befunde sprechen
dafür, dass die Vereinfachung des BDI zu keiner wesent-
lichen Änderung seiner Messeigenschaften geführt hat.
Beide BDI-Versionen korrelieren höher miteinander als mit
allen anderen Depressionsmaßen. Auf der Ebene der
einzelnen Symptome wurde eine Konvergenz der beiden
BDI-Versionen beobachtet, die angesichts der einge-
schränkten Reliabilität von Items bemerkenswert hoch
ausfällt. Weiterhin korrelieren beide BDI-Versionen nicht
nur sehr ähnlich mit allen anderen Selbstbeschreibungs-
maßen der Depression, die hier verwendet wurden, son-
dern in gleicher Höhe auch mit einem Expertenrating.
Vollkommen messäquivalent sind die beiden BDI-Ver-
sionen höchstwahrscheinlich dennoch nicht. Erstens be-
stehen die BDI-Versionen den strengen Äquivalenztest
mittels einer konfirmatorischen Faktorenanalyse nur in der
Gesamtstichprobe, nicht aber in der klinisch unauffälligen
Tabelle 5. Mittlere Ausprägung und Streuung der BDI-Summenwerte in den Stichproben
klinisch Unauffällige MDD Angst- und Schizophrenie
(n = 200) (n = 60) Essstörungen (n = 40)
(n = 11)
BDI-Version M SD M (z) M SD M (z) M SD M (z) M SD M (z)
BDI-O 6.9 6.3 –0.42 28.0 9.0 1.53 16.6 6.1 0.48 7.9 6.0 –0.33
BDI-V 18.9 14.1 –0.36 53.7 14.9 1.39 38.3 13.4 0.62 16.9 13.3 –0.46
Anmerkungen: M = mittlerer Summenwert; SD = Standardabweichung des Summenwertes; M (z) = mittlerer z-Wert bei Standardisierung in der
Gesamtstichprobe; der Wertebereich des vereinfachten BDI reicht von 0 bis 100; der Wertebereich des Original-BDI reicht von 0 bis 63.
Tabelle 6. Punkt-biseriale Korrelationen zwischen binären Gruppenkontrasten und den BDI-Summenwerten
BDI-Version klinisch klinisch MDD gegen MDD gegen Anst- und
Unauffällige Unauffällige Angst- und Schizophrenie Essstörungen
gegen MDD gegen Essstörungen gegen
Angst- und Schizophrenie
Essstörungen
BDI-O .78 .32 .35 .78 .51
BDI-V .71 .29 .42 .79 .55
Anmerkung: Alle Korrelationen sind signifikant (p < .01).
155
Messgüte des BDI-V
Stichprobe, wenngleich auch dort die geschätzte Korrela-
tion zwischen den BDI-Faktoren mit einem Wert von .95
nur wenig unterhalb des Idealwertes von 1 liegt. Auch
bei der Differenzierung der Stichproben divergieren die
BDI-Versionen geringfügig. Während mit dem Original-
BDI die klinisch unauffällige Stichprobe etwas besser von
den beiden klinischen Stichproben mit depressiver Primär-
oder Sekundärsymptomatik unterschieden werden konn-
te, differenzierte der vereinfachte BDI etwas genauer zwi-
schen den klinischen Gruppen. Diese Unterschiede sind
aber statistisch nicht signifikant und sollten nicht inter-
pretiert werden. Eine generelle Überlegenheit der einen
oder der anderen BDI-Version bei der Differentialdiag-
nose depressiver Störungen kann daraus aber nicht ab-
geleitet werden. Zudem sollten Konsequenzen für die
diagnostische Anwendungspraxis nur abgeleitet werden,
sofern sich die Ergebnisse in unabhängigen Nachfolge-
untersuchungen bestätigen und inferenzstatistisch absi-
chern lassen.
Zusammenfassend betrachtet berechtigen die Befun-
de von Schmitt und Maes (2000) und die Befunde der vor-
liegenden Untersuchung zu der Schlussfolgerung, dass
mit dem vereinfachten BDI ein Instrument zur Verfügung
steht, welches in seiner Messqualität dem Original gleich-
wertig ist, dieses im Bereich der Messökonomie aber
übertrifft. In den meisten Fällen der klinischen Einzelfall-
diagnostik dürfte diese Überlegenheit des BDI-V nicht
ausschlaggebend sein. Zum Tragen kommt sie aber in Un-
tersuchungen an großen Stichproben und bei der Anwen-
dung als Screening-Verfahren. Dort spart die Verwendung
des BDI-V nicht nur Druckkosten und Zeit bei der Erhe-
bung und Auswertung, sondern vermeidet auch eine un-
nötige zeitliche und kognitive Belastung der Probanden
und schafft damit Raum für den Einsatz von Messinstru-
menten für weitere Konstrukte, die von theoretischer oder
praktischer Bedeutung sind.
Zur weiteren Klärung der Messeigenschaften des
BDI-V möchten wir abschließend vier Untersuchungen
anregen.
(1) Die Stichprobe von Schmitt und Maes (2000) war
ebenso wenig wie die Stichprobe dieser Untersuchung
bevölkerungsrepräsentativ. Zur Normierung des Verfah-
rens sollten die Messeigenschaften des BDI-V an einer
bevölkerungsrepräsentativen Stichprobe bestimmt wer-
den.
(2) Da in der Überschrift des Verfahrens vom „gegen-
wärtigen Lebensgefühl“ die Rede ist und in der Instruk-
tion kein zeitlicher Rahmen zur Beurteilung der Symptom-
häufigkeit vorgegeben wird, könnte der Zeitrahmen, den
Personen bei der Beantwortung der Items vor Auge ha-
ben, Varianz erzeugen. Zwar impliziert die Antwortskala
durch die gewählte Bezeichnung der Pole eine zeitliche
Standardisierung, Schwankungen in der Symptom-
konzentration könnten sich aber niederschlagen. Trotz
gleicher Symptombelastung werden Personen, die an
Zeiträume erhöhter Symptomhäufigkeit denken, höhere
BDI-V-Werte erzielen als Personen, die Phasen geringer
Symptombelastung erinnern. Bereits Schmitt und Maes
(2000) hatten deshalb empfohlen, den Einfluss unter-
schiedlicher Zeitvorgaben in der Instruktion zu unter-
suchen.
(3) Angesichts der begrenzten Koinzidenz depressiver
Symptome könnte der Verdacht aufkommen, dass die Ho-
mogenität und die interne Konsistenz des BDI-V künstlich
erhöht sind. Für diese Überlegung sprechen Befunde
zum sequentiellen Priming (Duckworth, Bargh, Garcia &
Chaiken, 2002) und zur Stimmungskongruenz des Urteils
(Mayer, Gaschke, Braverman & Evans, 1992). Die Beant-
wortung der Frage zur Häufigkeit eines Symptoms A kann
die Erinnerung an ein Symptom B erleichtern, wenn beide
Symptome im semantischen Netzwerk verknüpft sind.
Weiterhin kann sich die Frage nach depressiven Symp-
tomen stimmungsverändernd auswirken und dadurch
wiederum die Zugänglichkeit stimmungskongruenter Ge-
dächtnisinhalte beeinflussen. Beide Prozesse könnten
die Itemkorrelationen künstlich in die Höhe treiben und
die Validität des BDI-V gefährden. Allerdings sind alle an-
deren hier verwendeten Selbstbeschreibungsmaße von
der gleichen Artefaktproblematik betroffen, so dass eine
spezifische Artefaktanfälligkeit des BDI-V nicht anzuneh-
men ist. Dennoch verdient das Argument eine empirische
Untersuchung über die verteilte (statt massierte) Vorgabe
der Items. Voraktivierungseffekte und Stimmungseffekte
sind relativ kurzlebig. Sie sollten keine Rolle mehr spielen,
wenn die Itemsequenz des BDI-V durch unverwandte
Füllitems unterbrochen wird. Wenn eine solche Untersu-
chung die hohe interne Konsistenz des BDI-V bestätigt,
sollte diese zum Anlass genommen werden, die Itemzahl
zugunsten einer weiteren Steigerung der Messökonomie
zu reduzieren? Wir würden von einer solchen Kürzung
abraten, um die Äquivalenz der beiden BDI-Versio-
nen nicht zu gefährden. Außerdem würde eine weitere
Kürzung des Instruments im Vergleich zum Gewinn
an Ökonomie, der durch die Vereinfachung des BDI-O
zum BDI-V erzielt wurde, nur unbedeutend zu Buche
schlagen.
(4) Zur weiteren Validierung des BDI-V bietet sich ein
Vergleich von BDI-V-Selbsteinschätzungen mit BDI-V-
Fremdeinschätzungen an. Angehörigen und Freunden
bleiben depressive Symptome in der Regel nicht verbor-
gen. Selbstbericht-Fremdbericht-Korrelationen sollten
deshalb eine Höhe erreichen, wie sie für Persönlichkeits-
skalen typischerweise gefunden werden (Funder, 1999).
Literatur
Angold, A., Costello, E. J. & Erkanli, A. (1999). Comorbidity.
Journal of Child Psychology and Psychiatry, 40, 57–87.
Beck, A. T. & Steer, R. A. (1987). Beck Depression Inventory
(BDI). San Antonio: The Psychological Corporation Inc.
Beck, A. T., Steer, R. A. & Garbin, M. G. (1988). Psychometric
properties of the Beck Depression Inventory: Twenty-five
years of evaluation. Clinical Psychology Review, 8, 77–100.
CIPS (Collegium Internationale Psychiatriae Scalarum) (Hrsg.).
(1996). Internationale Skalen für Psychiatrie. Weinheim:
Beltz.
Cronbach, L. J. (1951). Coefficient alpha and the internal struc-
ture of tests. Psychometrika, 16, 297–334.
156 Manfred Schmitt et al.
Duckworth, K. L., Bargh, J. A., Garcia, M. & Chaiken, S. (2002).
The automatic evaluation of novel stimuli. Psychological
Science, 13, 513–519.
Eid, M. & Diener, E. (Hrsg.). (in Druck). Handbook of psycholo-
gical measurement – a multimethod perspective. Washing-
ton, DC: American Psychological Association.
Funder, D. C. (1999). Personality judgment: A realistic approach
to person perception. San Diego, CA: Academic Press.
Gehring, A. & Blaser, A. (1993). MMPI. Minnesota Multiphasic
Personality Inventory. Deutsche Kurzform für Handauswer-
tung. Bern: Huber.
Hamilton, M. (1967). Development of a rating scale for primary
depressive illness. British Journal of Social and Clinical Psy-
chology, 6, 278–296.
Hautzinger, M. & Bailer, M. (1993). Allgemeine Depressions
Skala. Weinheim: Beltz.
Hautzinger, M., Bailer, M., Worall, H. & Keller, F. (1994). Beck-
Depressions-Inventar (BDI). Bern: Huber.
Hautzinger, M. & Meyer, T. D. (2002). Diagnostik Affektiver
Störungen. Göttingen: Hogrefe.
Hiller, W., Zaudig, M. & Mombour, W. (1995). IDCL. Interna-
tionale Diagnosen Checklisten für ICD-10 und DSM-IV.
Bern: Huber.
Ihle, W. & Esser, G. (2002). Epidemiologie psychischer Störun-
gen im Kindes- und Jugendalter: Prävalenz, Verlauf, Komor-
bidität und Geschlechtsunterschiede. Psychologische Rund-
schau, 53, 159–169.
Kammer, D. (1983). Eine Untersuchung der psychometrischen
Eigenschaften des deutschen Beck-Depressionsinventars
(BDI). Diagnostica, 29, 48–60.
Kennedy, S. H., Kaplan, A. S., Garfinkel, P. E., Rockert, W.,
Toner, B. & Abbey, S. E. (1994). Depression in anorexia
nervosa and bulimia nervosa: Discriminating depressive
symptoms and episodes. Journal of Psychosomatic Re-
search, 38, 773–782.
Lukesch, H. (1974). Testkriterien des Depressionsinventars von
A. T. Beck. Psychologische Praxis, 18, 60–78.
Mayer, J. D., Gaschke, Y. N., Braverman, D. L. & Evans, T. W.
(1992). Mood-congruent judgment is a general effect. Jour-
nal of Personality & Social Psychology, 63, 119–132.
Radloff, L. S. (1977). The CES-D Scale: A self-report depres-
sion scale for research in the general population. Applied
Psychological Measurement, 1, 385–401.
Richter, P. (1991). Zur Konstruktvalidität des Beck-Depres-
sionsinventars bei der Erfassung depressiver Verläufe.
Regensburg: Roderer.
Richter, P., Werner, J. & Bastine, R. (1994). Psychometrische
Eigenschaften des Beck-Depressionsinventars (BDI): Ein
Überblick. Zeitschrift für Klinische Psychologie, 23, 3–19.
Rief, W. & Fichter, M. (1992). The Symptom Check List SCL-
90-R and its ability to discriminate between dysthymia, an-
xiety disorders, and anorexia nervosa. Psychopathology, 25,
128–138.
Röhrle, B. (1988). Fragebogen zur verhaltenstherapeutischen
Diagnostik depressiver Störungen. Ein Kompendium. Tü-
bingen: DGVT.
Saß, H., Wittchen, H.-U. & Zaudig, M. (1996). Diagnostisches
und Statistisches Manual Psychischer Störungen DSM-IV
(Deutsche Bearbeitung und Einführung). Göttingen: Ho-
grefe.
Schmitt, M. & Maes, J. (2000). Vorschlag zur Vereinfachung
des Beck-Depressions-Inventars (BDI). Diagnostica, 46,
38–46.
Schmitt, M., Maes, J. & Seiler, U. (2001). Zur Meßäquivalenz
und strukturellen Invarianz von Indikatoren der seelischen
Gesundheit bei Ost- und Westdeutschen. Zeitschrift für Dif-
ferentielle und Diagnostische Psychologie, 21, 87–99.
Zerssen, D. von (1976). Depressivitäts-Skala DS. Weinheim:
Beltz.
Zung, W. W. K. (1965). A self rating depression scale. Archives
of General Psychiatry, 13, 361–367.
Prof. Dr. Manfred Schmitt
Fachbereich I – Psychologie
Universität Trier
54286 Trier
E-Mail: schmittm@uni-trier.de
www: http://sozpsy.uni-trier.de/~schmittm/