Content uploaded by Achim Wortmann
Author content
All content in this area was uploaded by Achim Wortmann on Sep 11, 2020
Content may be subject to copyright.
IHRO – Institut für Human Resource Management und Organisationspsychologie
1
Das MBTI ist ein handgemalter Zollstock
Prof. Dr. Achim Wortmann1
1 Professur Wirtschaftspsychologie, Institut für Human Resource Management und
Organisationspsychologie (IHRO), Hamburg, Germany
E-mail:wortmann@nbs.de
Published 11.09.2020
Abstract
Psychologische Messinstrumente sind in vielen Unternehmen für unterschiedlichste
Aufgabengebiete im Einsatz. Insbesondere im Bereich von Persönlichkeitspsychologischen
Verfahren sind jedoch oftmals Instrumente im Einsatz die fehlerhafte Information liefern. Das
führt zu falschen oder zumindest schlechteren betrieblichen Entscheidungen. Gute
Testverfahren sind kein akademischer Selbstzweck. Sie fördern betriebliche Effizienz und
verbessern die Entscheidungsgüte.
Keywords: Personaldiagnostik, Organisationsdiagnostik, Empirie, MBTI, Testkonstruktion, Validität, Entscheidungsfindung,
Effizienz, Persönlichkeit, Big Five
1. Alles ist messbar
Grundsätzlich ist jeder erfolgskritische Faktor eines
Projektes, eines Prozesses oder anderer Bereiche messbar.
Auch die sogenannten weichen Faktoren wie
Kommunikation, soziale Beziehungen innerhalb der
Projektgruppen oder Konflikt-Potenzial von anderen
betroffenen Stakeholdern können mit der richtigen
Operationalisierung sowie Datenerhebungsmethode
messbar gemacht werden.
Dabei sollte stets bedacht werden, dass insbesondere
Fragebogen-Beobachtungen oder Interviews empirischen
Gütekriterien entsprechen müssen. Diese Gütekriterien
stellen keine akademische Spitzfindigkeit dar. Sie sind viel
mehr grundlegende Voraussetzung dafür, dass die
erhobenen Daten auch tatsächlich möglichst messgenau
zum Informationsbedarf passen.
Grundsätzlich ist eine situative Interpretation schnell
gemacht und auch ein Fragebogen ist schnell ausgedacht.
Ob damit aber auch wirklich jene Information erhoben
werden, die benötigt werden und keine zwar
augenscheinlich plausiblen aber tatsächlich nicht validen
Daten in den Prozess der Erkenntnisgewinnung einfließen,
kann nur mit empirisch gesicherten Operationalisierungen
sichergestellt werden.
Wird auf diese empirische Fachkenntnis verzichtet, laufen
sowohl Datenerhebungen als auch Interpretationen Gefahr
potenziell falschen intuitiven Plausibilitätsschlüssen,
confirmation biases (Pfister, Jungermann, & Fischer, 2017, S.
360) Attributionsfehlern oder Projektions-Effekten (Landes
& Steiner, 2013, S. 467) aufzusitzen, um nur einige
nachgewiesene kognitive Effekte zu nennen, die zu
Fehlschlüssen führen können.
Diesen Fehlerquellen ungeprüft zu folgen, erhöht das Risiko
des Scheiterns erheblich. Problemfehler manifestieren sich
oft in Symptomen, deren Ursache meist an ganz anderer
Stelle zu finden ist. Ohne empirische Methodik laufen
Entscheidungsträger Gefahr sich an den Symptomen
abzuarbeiten, ohne die zugrundeliegenden Ursachen
wirkungsvoll anzugehen. Das kostet wertvolle Zeit und
andere wichtige Ressourcen insbesondere bei Projekten und
führt unter dem Strich zumeist erheblich aufwendigerem
Aktionismus.
Natürlich stellen diese Validierungen einen anfänglichen
Mehraufwand dar und benötigen zusätzliche zeitliche,
finanzielle, personelle und materielle Ressourcen. Dem steht
IHRO – Institut für Human Resource Management und Organisationspsychologie Wortmann (2020)
2
der mittelfristige Mehrwert einer möglichst hohen
Messgenauigkeit bei Wirksamkeitsprüfung und Evaluation
durch z.B. Controlling-Gruppen gegenüber. Fehlerhafte
Erhebungs- und Analyseinstrumente führen zu falschen
Daten, die wiederum zu falschen Erkenntnissen und damit
zu falschen Entscheidungen führen. Der Einsatz von
Unternehmensressourcen für die Validierung von
Erhebungs- und Analyse-Instrumenten stellt sicher, dass im
Laufe des Projektes die Controlling-Gruppe durch einen
fundierten und validen Informationsgewinn in der Lage ist,
die Unternehmensressourcen schonend und effizient da
einzusetzen, wo sie wirklich benötigt werden. Es geht also
vor allem um Effizienz.
Insbesondere der Einsatz von nicht validierten oder sogar
wissenschaftlich widerlegten Instrumenten führt zur
Fehlleitung wertvoller Ressourcen, die im Laufe des
Projektes an anderen Stellen oft bitter benötigt werden. Sie
führen zu enormer Ineffizienz der damit arbeitenden
Prozesse. Vor allem kommerziell betriebene, nicht-
wissenschaftliche Instrumente der Personal- und
Persönlichkeitsanalyse stellen eine nicht unerhebliche
Gefahr für diagnostische Laien dar. Viele auch renommierte
eingesetzte Methoden haben sich bei empirischer
Überprüfung als ungenau oder sogar fehlerhaft
herausgestellt. Insbesondere typologische Verfahren sind
daher eher aus historischen Gründen interessant, denn aus
fachlichen (Kersting, 2013, S. 27).
2. Die Konstruktion des MBTI
Besonders sei in diesem Kontext auf den weit verbreiteten
Myers-Briggs Type Indicator (MBTI) hingewiesen (Myers,
McCaulley, & Most, 1985). Der MBTI basiert auf den
Theorien von Carl Gustav Jung, dessen
Persönlichkeitstheorien in der Psychologie bis in die 1960er
Jahre hinein kaum wahrgenommen wurden (James &
Gilliland, 2014, S. 3). Es unterteilt die Teilnehmer in 16
verschiedene Persönlichkeitstypen, die sich aus einer Matrix
der zugrunde gelegten Eigenschaften Introversion (I) vs.
Extraversion (E), Intuition (N) vs. Sensorik (S), Denken (D) vs.
Fühlen (F) sowie Wahrnehmung (W) vs. Beurteilung (B)
ergeben.
Die Zuweisung der Eigenschaften sowie der Typen-
Paarungen erfolgt willkürlich nach Jungs
Persönlichkeitstheorie und baut auf keinerlei
wissenschaftlich belegtem Konzept auf.
Tabelle 1 Beispiel für die MBTI-Typenmatrix
Sensorik
Intuition
Denken
Fühlen
Denken
Beurteilung
Intro-
version
ISDB
ISFB
INFB
INDB
Wahr-
nehmung
ISDW
ISFW
INFW
INDW
Extra-
version
ESDW
ESFW
ENFW
ENDW
Beurteilung
ESDB
ESFB
ENFB
INDB
Jungs Persönlichkeitstheorie orientiert sich stattdessen am
Gegensatz von Bewusstem und Unbewusstem und entlehnt
mystische Elemente diverser Religionen bis hin zum Tarot
(Harris, 1996, S. 172ff):
„No other theory begins to approach the breadth and scope
of Jung's when it comes to views of the spirit, spirituality,
and whatever passes for each person's immortal deity. Jung
ranged across such arcane religions as Mithraism and
Gnosticism to Christianity, Buddhism, and Judaism to the
Great Spirit of the American Indian and tarot cards“ (James
& Gilliland, 2014, S. 9)
„Each individual has some combination of the foregoing
with the dominant attitude represented in the conscious
and the nondominant in the unconscious. Complimentary to
extroversion and introversion are four functions that allow
for further differentiation of personality type: thinking,
feeling, sensation, and intuition“ (James & Gilliland, 2014, S.
12)
Die mystischen und transzendenten Elemente werden von
Jung in scheinbar plausiblen Gegensatzpaaren gebildet.
Diese Paare werden in dominierende und untergeordnete
Elemente sortiert (Jung, 1971). Die Zuteilung erfolgt nach
Jungs Weltbild und Meinung in willkürlicher Weise und wird
schlicht als Annahme zugrunde gelegt. Ein empirischer Beleg
sowohl der mystischen Grundlagen als auch der
vorgenommenen Paarbildungen steht bis heute aus. Im
Gegenteil, das MBTI erwies sich in empirischen
Untersuchungen als nicht valide.
Ein Instrument einzusetzen, dass erwiesenermaßen nicht
valide ist, bedeutet, dass falsche oder sehr ungenaue
Informationen als Grundlage für betriebliche
Entscheidungen herangezogen werden. Das führt nicht nur
zu einer Fehlleitung von betrieblichen Ressourcen, sondern
auch zu einem Mangel notwendiger Ressourcen an den
wirklichen Bedarfspunkten.
IHRO – Institut für Human Resource Management und Organisationspsychologie Wortmann (2020)
3
3. Die Faktenlage zum MBTI
Auch wenn verschiedene Autoren, die das MBTI verwenden,
eine empirische Validität herbeiargumentieren wollen,
zeigen selbst deren Untersuchungen die mangelnde Solidität
des Konstruktes:
„(…) in terms of these traditional psychometric criteria, the
MBTI performed quite well, being clearly on a par with
results obtained using more well-accepted personality tests.
(…)“ (Bess, Harvey, & Swartz, 2003, S. 1)
„each MBTI item loaded on one latent factor – produced a
confirmatory factor analysis goodness of fit index (GFI) of
.88; the Sipps et al. (1985) study reported a GFI of .74 for
their best-fitting (oblique) 4-factor model.“ (ebd.)
Damit belegen die Autoren mit scheinbar beeindruckenden
statistischen Ergebnissen lediglich die Fehlerhaftigkeit des
MBTI. Denn bei näherem Hinsehen sind die referierten
Werte des GFI keine ausreichenden Werte. Die Modellgüte
wird nämlich erst ab einem GFI >= .90 als gut angesehen
(Hooper, Coughlan, & Mullen, 2008, S. 54).
Ebenso betragen die referierten Faktorladungen in der Regel
Werte im Bereich .40 bis .50 – lediglich einzelne Items
weisen jeweils niedrigere oder höhere Werte aus. Auch
diese Faktorladungen werden als eher schlechte statistische
Werte angesehen. Gute Faktorladungen betragen etwa .70
aufwärts (Beavers, et al., 2013, S. 9). Die hier referierten
Werte, die hauptsächlich im Bereich von .35 bis .55 legen,
sind eher schwache Faktorladungen. Diese schwachen
Zusammenhangswerte und die unzureichenden Werte der
Modell-Güte sind ein Beleg, dass das MBTI mangelhaft
konstruiert ist.
Im Vergleich dazu liegt die Modell-Güte eines
verhältnismäßig rudimentären Big-Five-Modells bei CFI=.927
bei einem Cut-Off-Wert bei .90 (Hu & Bentler, 1999; Al-
Mamary & Shamsuddin, 2015, S. 15) und die Faktorladungen
der Items liegen hauptsächlich im Bereich von .70 bis .80,
während einzelne Ausreißer im schlechtesten Fall einen
Wert von .41 ausweisen. (Wortmann, 2013, S. 279).
Das Big-Five-Inventar 2 (BFI-2) als Inventar eines
renommierten Modells erreicht eine Modellgüte von
CFI > .933 (Danner, et al., 2019, S. 126), während das
überarbeitete NEO-Persönlichkeits-Inventar NEO-PI-R
(Ostendorf & Angleitner, 2004) als eines der bekanntesten
Big-Five-Modelle nach Costa & McCrae (1992) erreicht in
der aktuellen Version eine Modellgüte von CFI=.998 (Juhel,
Brunot, & Zapata, 2012, S. 395).
Aufmerksamen Lesern ist an dieser Stelle wahrscheinlich
aufgefallen, dass in der Diskussion um die Modellgüte der
referierte Index von GFI (beim MBTI) zum CFI bei Big-Five,
BFI-2 und NEO-PI-R gewechselt hat. Das hängt damit
zusammen, dass aufgrund der Fehleranfälligkeit des GFI von
einer Verwendung abgeraten wird:
„the use of fit indices as the GFI is not recommended
because the sample size and the number of variables affect
them.“ (Rossier, Verardi, Massoudi, & Aluja, 2008, S. 215)
Während der CFI dagegen aufgrund seiner Robustheit
empfohlen wird:
„The CFI is recommended to be taken as measure of model
fit as it is less affected by sample size“ (Erum, Rafique, & Ali,
2017, S. 1107)
Fazit
Belegte Messinstrumente sind kein wissenschaftlicher
Selbstzweck. Der empirische Belegt dient dazu, die
Messgenauigkeit und die möglichst geringe
Fehleranfälligkeit zu dokumentieren und nachzuweisen.
Nicht-Valide Instrumente in der Personal- oder
Organisationsdiagnostik zu verwenden, führt unweigerlich
zu fehlerhaften Entscheidungen und damit zur Fehl-Leitung
von wertvollen und begrenzten betrieblichen Ressourcen!
Ihr Einsatz ist vergleichbar mit dem Verwenden von
ungeeichten Waagen oder Zapfsäulen. Im Falle des MBTI ist
es durchaus vergleichbar mit dem Messen der Körpergröße
einer Person unter Verwendung eines von Hand
selbstgemalten Zollstocks. Der sieht in diesem Fall schön
aus, die Messdaten wirken überzeugend, sind aber leider
erwiesenermaßen falsch.
Für Aufgabengebiet des MBTI gibt es sogar frei verfügbare
und nachweisbar valide Instrumente, die stattdessen
eingesetzt werden sollten. Je nachdem welche
Eigenschaften und Erkenntnisse erfasst werden sollen, kann
sogar die Eigenkonstruktion eines psychometrischen
Inventars sinnvoll sein.
Literaturverzeichnis
Al-Mamary, Y. H., & Shamsuddin, A. (2015). The Impact of
Top Management Support, Training, and Perceived
Usefulness on Technology Acceptance.
Mediterranean Journal of Social Sciences, S. 11-17.
Beavers, A. S., Lounsbury, J. W., Richards, J. K., Huck, S. W.,
Skolitz, G. J., & Esquivel, S. L. (2013). Practical
IHRO – Institut für Human Resource Management und Organisationspsychologie Wortmann (2020)
4
Considerations for Using Exploratory Factor
Analysis in Educational Research. Practical
Assessment, Research & Evaluation. 18 (6), S. 1-13.
Bess, T. L., Harvey, R. J., & Swartz, D. (2003). Hierarchical
Confirmatory Factor Analysis of the Myers-Briggs
Type Indicator. Annual Conference of the Society for
Industrial and Organizational Psychology, 1-13.
Costa, P. T., & McCrae, R. R. (1992). Four ways five factors
are basic. Personality and individual differences, 13
(6), 653-665.
Danner, D., Rammstedt, B., Bluemke, M., Lechner, C.,
Berres, S., Knopf, T., John, O. P. (2019). Das Big Five
Inventar 2: Validierung eines
Persönlichkeitsinventars zur Erfassung von 5
Persönlichkeitsdomänen und 15 Facetten.
Diagnostica : Zeitschrift für psychologische
Diagnostik und differentielle Psychologie. 65 (3), S.
121-132.
Erum, H., Rafique, H., & Ali, A. (2017). Effect of E-Marketing
Adoption Strategy on Export Performance of SMEs.
International Journal of Management Excellence. 7
(2), S. 1103-1112.
Harris, A. S. (1996). Living with paradox. An introduction to
Jungian psychology. Albany, NY (US): Brooks.
Hooper, D., Coughlan, J., & Mullen, M. (2008). Structural
Equation Modelling: Guidelines for Determining
Model Fit. Journal of Business Research Method. 1.,
S. 53-60.
Hu, L.-t., & Bentler, P. M. (1999). Cutoff criteria for fit
indexes in covariance. Structural Equation
Modeling, S. 1-55.
James, R. K., & Gilliland, B. E. (2014). Jungian Therapy -
Theories and strategies in counseling and
psychotherapy. Memphis, TN (US): University of
Memphis.
Juhel, J., Brunot, S., & Zapata, G. (2012). Response Distortion
on the NEO PI-R among Candidates Taking the
Entrance Examination to the National School of
Civil Aviation (ENAC-France). Psychology. 3 (5), S.
393-398.
Jung, C. G. (1971). Personality types. The portable Jung. New
York : Penguin Books.
Kersting, M. (2013). Persönlichkeit ist keine Typfrage.
Personalmagazin. 13., S. 26-29.
Landes, M., & Steiner, E. (2013). Psychologie der Wirtschaft.
Wiesbaden: Springer.
Myers, I. B., McCaulley, M. H., & Most, R. (1985). Manual, a
guide to the development and use of the Myers-
Briggs type indicator. Palo Alto, CA (US): consulting
psychologists press.
Ostendorf, F., & Angleitner, A. (2004). Neo-
Persönlichkeitsinventar nach Costa und McCrae:
Neo-PI-R; Manual. Göttingen: Hogrefe.
Pfister, H.-R., Jungermann, H., & Fischer, K. (2017). Die
Psychologie der Entscheidung - Eine Einführung.
Berlin: Springer.
Rossier, J., Verardi, S., Massoudi, K., & Aluja, A. (2008).
Psychometric properties of the French version of
the Zuckerman-Kuhlman Personality Questionnaire.
International Journal of Clinical and Health
Psychology. 8 (1), S. 203-217.
Wortmann, A. (2013). Die Rolle von Persönlichkeit bei der
Inneren Kündigung im Bezug zu den Prädiktoren
Psychologischer Vertrag und Sensibilität für
Ungerechtigkeit. Hamburg: Wortmann.