ArticlePDF Available

The influence of working at non-standard working hours on the workhome situation

Authors:

Abstract and Figures

The present study was designed to map the causal relationships between nonstandard working hours and work-home interference (WHI) and home-work interference (HWI). To this purpose, a longitudinal full-panel design was employed. Using such a design, we examined both the causal effects of non-standard working hours on WHI /HWI and the causal effects of WHI /HWI on non-standard working hours. We also investigated the moderating effect of gender in these relationships. Data were collected in two waves (2002 and 2004) among 337 Dutch employees and self-employed persons who lived together with a partner and had at least one child living in the household. We included evening work and weekend work as types of non-standard working hours. Data were analyzed by means of structural equation modeling. Results showed that, among women with children, evening work was related to elevated levels of WHI and HWI two years later. A comparable relationship for men with children was not found. A possible explanation for this finding is that for women working at non-standard hours appears to cause WHI and HWI, as working at non-standard hours interferes with their responsibilities at home, which they are still more often accountable for than men. Furthermore, WHI turned out to be related to an increase in evening work and weekend work two years later for both men and women. A possible explanation for this finding is that workers try to reduce WHI by means of working at nonstandard hours.
Content may be subject to copyright.
De invloed van afwijkende werktijden
175
De invloed van afwijkende
werktijden op de werk-
thuissituatie
Madelon L.M. van Hooff, Maartje C. Bakhuys Roozeboom,
Ernest M.M. de Vroome en Peter G.W. Smulders*
Deze studie heeft tot doel de causale relaties tussen afwijkende werktij-
den en werk-thuis interferentie (WTI) en thuis-werkinterferentie (TWI) te
onderzoeken. Hiervoor is gebruikgemaakt van een longitudinaal full-panel
design. Hierdoor kunnen niet alleen de effecten van afwijkende werktijden
op WTI en TWI worden onderzocht, maar ook de invloed van WTI en TWI
op het werken op afwijkende werktijden. Tevens is de modererende invloed
van sekse in deze relaties onderzocht.
Data zijn verzameld op twee momenten (2002 en 2004) onder
337 Nederlandse werknemers en zelfstandigen, die samenleefden met een
partner en ten minste één thuiswonend kind hadden. Avondwerk en week-
endwerk zijn meegenomen als indicatoren van afwijkende werktijden. Data
zijn geanalyseerd met behulp van structurele modelvergelijkingen.
Resultaten laten zien dat voor vrouwen met kinderen het werken tijdens
de avond gepaard gaat met een toename in WTI en TWI twee jaar later.
Een vergelijkbare relatie voor mannen wordt niet gevonden. Een mogelijke
verklaring hiervoor is dat het werken op afwijkende tijden bij vrouwen
interfereert met de zorgtaken waar zij nog steeds vaker dan mannen ver-
antwoordelijk voor zijn.
Verder blijkt uit de studie dat WTI voor zowel mannen als vrouwen gerela-
teerd is aan een toename in avond- en weekendwerk twee jaar later. Een
mogelijke verklaring hiervoor is dat het werken op afwijkende werktijden
gebruikt wordt om WTI tegen te gaan.
Trefwoorden: afwijkende werktijden, avondwerk, weekendwerk, werk-
thuis interferentie, thuis-werkinterferentie
* M.L.M. van Hooff is werkzaam bij de Universiteit van Amsterdam.
M.C. Bakhuys Roozeboom, E.M.M. de Vroome en P.G.W. Smulders zijn werkzaam bij TNO
Kwaliteit van Leven.
Correspondentieadres: Postbus 718, 2130 AS Hoofddorp, tel. 023-5549536, e-mail:
maartje.bakhuysroozeboom@tno.nl.
GenO2010-3.indd 175 03-08-2010 14:53:09
Gedrag & Organisatie 2010-23, nr. 3
De invloed van afwijkende werktijden
176
1 Inleiding
Het vinden en behouden van een goede balans tussen werk en privé is tegenwoordig
voor veel werknemers een belangrijk streven. Het combineren van beide domeinen
gaat soms echter gepaard met conflicten of problemen. Het proces waarbij het func-
tioneren van een werknemer thuis negatief beïnvloed wordt door de eisen die het
werk stelt, wordt ‘werk-thuis interferentie’ (WTI) genoemd (Geurts, Taris, Kompier,
Dikkers, Van Hooff et al., ). Hiervan is bijvoorbeeld sprake als participatie in
familieactiviteiten wordt gehinderd door iemands werkrooster, of als het moeilijk is
om na een stressvolle werkdag thuis te ontspannen. Omgekeerd kan ook de thuissitu-
atie het functioneren op het werk negatief beïnvloeden, denk bijvoorbeeld aan een
werknemer die zich niet goed kan concentreren door problemen thuis, of iemand die
een gedeelte van de werkdag mist door een ziek kind. Deze negatieve invloed van
thuis op werk staat bekend onder de noemer ‘thuis-werkinterferentie’ (TWI) (Geurts
et al., ).
Er is de afgelopen decennia veel onderzoek gedaan naar WTI en TWI. De potenti-
ele gevolgen van WTI zijn duidelijk gedocumenteerd in een meta-analyse van Allen,
Herst, Bruck en Sutton (). Zij vinden associaties met burnout en depressie, maar
ook met verloopgeneigdheid en verminderde tevredenheid over het leven in het
algemeen. Over de gevolgen van TWI is nog relatief weinig bekend (Peeters &
Heiligers, ), maar de studies die zijn gedaan op dit terrein vinden een relatie
tussen TWI enerzijds en depressieve gevoelens, stress (Frone, Russell & Cooper,
a; Frone, Russell & Cooper, ; Kelloway, Gottlieb & Barham, ) en ver-
loopgeneigdheid (Kelloway et al., ) anderzijds. Een studie van Kinnunen en
Mauno () laat zien dat TWI meer gerelateerd is aan de kwaliteit van het privé-
leven dan aan werkgerelateerde uitkomsten.
Met betrekking tot de oorzaken van WTI en TWI laat een recente meta-analyse
(Byron, ) zien dat kenmerken van het werk belangrijke determinanten zijn van
WTI en – in mindere mate – ook van TWI. Het aantal werkuren, overbelasting in
het werk en inflexibiliteit van het werkschema blijken sterk gerelateerd te zijn aan
WTI. Deze laatste twee variabelen blijken tevens gerelateerd aan TWI.
De steeds gangbaarder wordende niet-standaard werkpatronen, zoals werken tijdens
de avond en in het weekend, zijn nog niet vaak onderwerp van onderzoek geweest in
relatie tot WTI/TWI (Wilson, Polzet-Debruyne, Chen & Fernandes, ). Studies
die aandacht hebben besteed aan WTI en TWI in relatie tot afwijkende werktijden,
richtten zich voornamelijk op de relatie tussen werken in ploegendienst en WTI en
vinden een positieve relatie tussen beide concepten (Staines & Pleck, ; Bohle &
Tilley, ; Jansen, Kant, Nijhuis, Swaen, & Kristensen, ; Demerouti, Geurts,
Bakker & Euwema, ; Shamir, ). Met uitzondering van een studie van Shamir
(), die een positieve relatie aantoont tussen werken in het weekend en WTI, is
de invloed van andere typen afwijkende werktijden, zoals werken in de avond of nacht,
op WTI en op TWI nog nauwelijks onderwerp van onderzoek geweest. Gezien de
negatieve gevolgen die het ervaren van WTI en TWI kan hebben (Allen et al., ),
is het interessant meer inzicht te ontwikkelen in de relatie tussen het werken op
afwijkende tijden en WTI en TWI.
Om de causale relaties tussen WTI en TWI en het werken op afwijkende tijden te
onderzoeken, maakt deze studie gebruik van een longitudinaal full-panel design bin-
GenO2010-3.indd 176 03-08-2010 14:53:09
De invloed van afwijkende werktijden
177
Gedrag & Organisatie 2010-23, nr. 3
nen een steekproef van werkende ouders, waarbij alle variabelen op twee momenten
gemeten zijn, gescheiden door een tijdsinterval van twee jaar. Dit maakt het mogelijk
verschillende typen causale relaties te onderzoeken, namelijk de ‘normale’ causale
relatie (werktijden WTI/TWI), de ‘omgekeerde’ causale relatie (WTI/TWI
werktijden) en de ‘reciproke’ causale relatie (werktijden WTI/TWI én WTI/TWI
werktijden). Bij het bestuderen van afwijkende werktijden kijken we enkel naar
‘officiële’ werkuren die ’s avonds en in het weekend worden gemaakt. Overwerken op
afwijkende tijden wordt in dit onderzoek buiten beschouwing gelaten.
1.1 Afwijkende werktijden en WTI en TWI
Er zijn redenen om te veronderstellen dat er een relatie bestaat tussen het werken op
afwijkende werktijden enerzijds en WTI en TWI anderzijds. Onderzoek van Major,
Klein en Ehrhart () toont bijvoorbeeld een verband aan tussen het maken van
veel werkuren en WTI, waarbij het ‘tijdsconflict’ als verklaring wordt opgevoerd. Dit
is een conflict dat optreedt wanneer de tijd die besteed wordt aan één rol (bijvoorbeeld
die van werkende) ervoor zorgt dat het vervullen van een andere rol (bijvoorbeeld die
van ouder of partner) in het gedrang komt (Greenhaus, Parasuraman, Granrose,
Rabinowitz & Beutell, ). Dit tijdsconflict zou ook op kunnen treden bij het
werken op afwijkende werktijden. Activiteiten met het gezin vinden doorgaans gro-
tendeels tijdens de avond- en weekenduren plaats. Ook zorg voor kinderen is iets
waar tijdens deze tijdstippen aandacht aan besteed moet worden. Het werken op
afwijkende werktijden (’s avonds of in het weekend) vergroot de kans dat men
bepaalde gezinsactiviteiten niet kan bijwonen en dat men bepaalde zorgtaken niet op
zich kan nemen. Zo vinden La Valle, Arthur, Millward, Scott en Clayden () dat
ouders, die op afwijkende tijden werken, minder tijd besteden aan lezen of spelen met
de kinderen of het helpen met huiswerk, dan ouders, die op standaardtijden werken.
Wij veronderstellen in deze studie dat ouders door het werken op afwijkende tijden
minder tijd hebben voor zorgtaken en gezinsactiviteiten, en daardoor meer WTI
ervaren.
Het tijdsconflict zou ook de andere kant op kunnen werken. Dit is het geval wanneer
de tijdsinvestering in de thuissituatie ten koste gaat van de tijd om het werk uit te
voeren. Werkzaam zijn op de tijden waarin zich het grootste gedeelte van het gezins-
leven afspeelt, kan de kans vergroten dat het werk op een gegeven moment te lijden
heeft onder zaken die in de thuissituatie geregeld moeten worden. Zo kan er ook een
relatie tussen het werken op afwijkende werktijden en TWI worden verondersteld.
Hypothese 1a: Werken tijdens de avond en in het weekend is geassocieerd met ver-
hoogde niveaus van WTI en TWI twee jaar later.
Behalve dat werken op afwijkende tijden invloed kan hebben op het ervaren van WTI
en TWI, is het ook mogelijk dat het ervaren van WTI en TWI effect heeft op de
mate waarin werknemers op afwijkende tijden werken. Longitudinaal onderzoek van
Jansen et al. () geeft aanwijzingen voor deze hypothese. In hun onderzoek wordt
WTI op de eerste meting in verband gebracht met een afname van het aantal werk-
uren bij fulltimers op de tweede meting. Het is mogelijk dat deze fulltimers minder
zijn gaan werken om werk en privé beter op elkaar af te kunnen stemmen. Ook in de
GenO2010-3.indd 177 03-08-2010 14:53:09
Gedrag & Organisatie 2010-23, nr. 3
De invloed van afwijkende werktijden
178
huidige studie veronderstellen we dat WTI en TWI van invloed zijn op het werken
op afwijkende tijden. Het is denkbaar dat werknemers die op afwijkende tijden wer-
ken, en daardoor WTI en TWI ervaren, besluiten minder of niet op afwijkende tijden
te gaan werken als copingsmechanisme’ om WTI en TWI te verminderen. Zo komen
we tot de volgende hypothese:
Hypothese 1b: WTI en TWI vertonen een negatieve relatie met het werken tijdens
de avond en in het weekend twee jaar later.
1.2 Sekseverschillen in de relatie tussen afwijkende werktijden en WTI en
TWI
Hoewel verscheidene studies zich hebben gericht op verschillen tussen mannen en
vrouwen met betrekking tot de prevalentie van TWI en WTI, zijn de resultaten
hiervan niet éénduidig. Een aantal studies vindt geen sekseverschillen ten aanzien
van WTI en TWI (Eagle, Miles & Icenogle, ; Frone, Russell & Cooper, b;
Kinnunen, Geurts & Mauno, ). Sommige studies tonen wel duidelijke verschil-
len aan tussen mannen en vrouwen ten aanzien van WTI en TWI. Cinamon en Rich
() en Duxbury, Higgins en Lee () vinden dat vrouwen meer WTI ervaren
dan mannen. Williams en Alliger () concluderen dan vrouwen niet alleen meer
WTI ervaren dan mannen, maar ook meer TWI. Daarnaast heeft eerder onderzoek
voor verschillende uitkomstvariabelen en antecedenten gevonden dat de relatie met
WTI/TWI gemodereerd wordt door sekse. Zo blijkt het effect van sociale steun op
het ervaren van WTI en TWI voor mannen en vrouwen verschillend te zijn (Van
Daalen, Willemsen & Sanders, ). Sociale steun van leidinggevende en collega’s
blijkt bij mannen WTI te reduceren, terwijl bij vrouwen sociale steun van de leiding-
gevende zelfs tot een toename van WTI leidt. Onderzoek van Wallace () onder
advocaten wijst uit dat de werkcontext voor vrouwen een andere impact heeft op WTI
dan voor mannen. Voor mannen leidt het maken van veel werkuren, het werken met
veel vrouwen en het hebben van een echtgenote als broodwinner, tot meer WTI,
terwijl bij vrouwen vooral het soort bedrijf gerelateerd is aan de WTI die zij ervaren.
Uit onderzoek van Gutek, Searle en Klepa () blijkt dat bij een gelijk aantal werk-
uren vrouwen meer WTI ervaren dan mannen. Zij voeren als verklaring het ‘gender
role framework’ op. Volgens dit model worden mannen meer geassocieerd met werk
en vrouwen meer met zorgtaken (Gutek et al. ). Mannen en vrouwen die tijd
besteden aan het vervullen van de rol van de andere sekse, worden verondersteld het
gevoel te hebben hun eigen rol tekort te doen, waardoor WTI (vooral bij werkende
vrouwen) en TWI (vooral bij zorgende mannen) kunnen ontstaan. Vanuit deze rede-
nering zouden werkuren dus vooral voor vrouwen gerelateerd zijn aan WTI, omdat
zij naarmate ze meer werken meer het gevoel hebben het ‘eigen domein’, namelijk de
zorgtaken, te verwaarlozen.
Hoewel de rol van sekse in de relatie tussen afwijkende werktijden en WTI/TWI nog
niet eerder onderwerp van onderzoek is geweest, zou het ‘gender role framework’ ook
hier van toepassing kunnen zijn. Het feit dat vrouwen in het algemeen een grotere
verantwoordelijkheid dragen voor de zorg voor hun kinderen dan mannen (bijv.
Lundberg & Frankenhaeuser, ) maakt wellicht dat vrouwen zich ook meer dan
mannen verantwoordelijk voelen voor deze taken en daardoor, meer dan mannen,
GenO2010-3.indd 178 03-08-2010 14:53:10
De invloed van afwijkende werktijden
179
Gedrag & Organisatie 2010-23, nr. 3
ervaren dat de thuissituatie te lijden heeft onder het werken op afwijkende werktijden.
Dat dit nog steeds actueel is, blijkt uit het feit dat – hoewel er zich de afgelopen jaren
veel veranderingen hebben voorgedaan in dit opzicht – vrouwen in Nederland in de
praktijk nog steeds een grotere verantwoordelijkheid voor zorgtaken dragen dan
mannen (Portegijs, Hermans & Lalta, ). Aangezien werkende mannen gemid-
deld minder tijd besteden aan zorgtaken dan werkende vrouwen (Breedveld & Van
den Broek, ), zullen mannen wellicht ook minder dan vrouwen het gevoel hebben
thuis tekort te schieten wanneer zij door het werken op afwijkende werktijden min-
der aandacht besteden aan gezinsactiviteiten. We veronderstellen met andere woorden
dat het werken op afwijkende tijden bij vrouwen leidt tot een toename van WTI, en
bij mannen niet of nauwelijks. Daarnaast is het voorstelbaar dat vrouwen door hun
grotere verantwoordelijkheid voor de zorgtaken een sterkere negatieve invloed van
de thuissituatie op het werk ervaren. Met andere woorden, we veronderstellen ook
dat het werken op afwijkende tijden vooral bij vrouwen zal leiden tot TWI, terwijl
hier bij mannen niet tot nauwelijks sprake van zal zijn.
Hypothese 2: Werken tijdens de avond en in het weekend zal bij vrouwen sterker
positief gerelateerd zijn aan WTI en TWI twee jaar later, dan bij mannen.
De literatuur geeft geen aanwijzingen voor verwachtingen met betrekking tot sekse-
verschillen in de longitudinale relatie tussen WTI/TWI en het werken op afwijkende
tijden twee jaar later.
1.3 Controlevariabelen
Omdat het werken op afwijkende tijden gepaard zou kunnen gaan met werkkenmer-
ken, die op hun beurt de kans op WTI en TWI kunnen vergroten, zullen we in deze
studie voor een aantal werkkenmerken controleren. Hierbij gaat het om werkken-
merken, waarvan we uit onderzoek weten dat ze ofwel gerelateerd zijn aan zowel
WTI/TWI als aan het werken op afwijkende tijden, ofwel gerelateerd zijn aan één
van beide, maar waarvan de mogelijkheid bestaat dat er ook een verband is met de
ander.
Uit onderzoek (Klein Hesselink, Houtman, Hooftman & Bakhuys Roozeboom, )
blijkt dat werken op afwijkende tijden in die sectoren voorkomt (zoals zorg en trans-
port) waar ook hoge taakeisen, gebrek aan autonomie, gebrek aan sociale steun en
lange werkuren (vooral transport) voorkomen. Eerdere studies hebben laten zien dat
deze werkkenmerken positief gerelateerd zijn aan WTI of TWI (Jansen et al., ;
O’Driscoll, Poelmans, Spector, Kalliath, Allen et al., ; Van Daalen et al., ;
Frone, Russell & Cooper, ; Major et al., ). Daarom zal in de analyses van dit
onderzoek gecontroleerd worden voor taakeisen, autonomie, sociale steun en werk-
uren.
Ten slotte zal worden gecontroleerd voor leeftijd, aangezien leeftijd negatief samen-
hangt met de geneigdheid om op afwijkende werktijden te werken (Koppes, Klein
Hesselink, Mol & Van den Bossche, ) en leeftijd tevens een rol speelt in de mate
waarin werknemers WTI en TWI ervaren (Klein Hesselink et al., ).
GenO2010-3.indd 179 03-08-2010 14:53:10
Gedrag & Organisatie 2010-23, nr. 3
De invloed van afwijkende werktijden
180
2 Methode
2.1 Respondenten en procedure
Voor dit onderzoek is gebruikgemaakt van longitudinale data uit de TNO
Arbeidssituatie Survey (TAS; Smulders, Andries & Otten, ; Smulders, ). In
 vulden . zelfstandigen en werknemers (respons = ) een vragenlijst in
over hun arbeidssituatie. Een aantal van hen participeerde in  wederom in het
onderzoek, wat resulteerde in een longitudinaal databestand van  werkende
Nederlanders (respons follow-up = ). Omdat in dit onderzoek de combinatie
tussen arbeid en zorg centraal staat, hebben we ons in de analyses beperkt tot respon-
denten die tijdens de eerste meting aangaven gehuwd te zijn of samen te wonen, en
thuiswonende kinderen te hebben. Alleenstaande ouders zijn vanwege hun kleine
aantal (n = ) niet in het onderzoek opgenomen in verband met de homogeniteit
van de steekproef. Deze selectie resulteerde in een steekproef van  werkende
Nederlanders ( vrouw; gemiddelde leeftijd . jaar; SD = .; gemiddeld aantal
werkuren per week .; SD = .). Om te voorkomen dat verschillen in respons tus-
sen verschillende deelpopulaties (bijvoorbeeld mannen en vrouwen, leeftijdscatego-
rieën) zouden leiden tot selectiviteit in de steekproef, is voor deze verschillen gecor-
rigeerd door middel van weging. Als bron van populatiegegevens is hierbij
gebruikgemaakt van de Enquête Beroepsbevolking () van het CBS. De weging
is uitgevoerd met het programma Bascula (Nieuwenbroek & Slootbeek, ). Voor
meer informatie over de weging wordt verwezen naar Smulders et al. ().
2.2 Onderzoeksvariabelen
Werk-thuis interferentie. Werk-thuis interferentie is op beide tijdstippen gemeten met
één item (‘Mist of verwaarloost u familie- of gezinsactiviteiten door uw werk?’;  =
nee, nooit;  = ja, een enkele keer;  = ja, vaak;  = ja, zeer vaak).
Thuis-werk interferentie. Ook voor het in kaart brengen van thuis-werkinterferentie
is op beide tijdstippen gebruikgemaakt van één item (‘Mist of verwaarloost u uw
werkzaamheden door familie- en gezinsverantwoordelijkheden?’;  = nee, nooit;  =
ja, een enkele keer;  = ja, vaak;  = ja, zeer vaak).
Afwijkende werktijden. Respondenten is op beide tijdstippen gevraagd voor alle dag-
delen van de week (ochtend, middag, avond, nacht; maandag tot en met zondag) aan
te geven of ze tijdens dit dagdeel normaal gesproken werken. Vervolgens werd het
aantal avonden en het aantal ochtenden en middagen dat in het weekend gewerkt
wordt, opgeteld. Er zijn vrij hoge correlaties tussen de twee typen afwijkende werk-
tijden (zie tabel ). Aangezien nachtwerk erg weinig voorkwam, is ervoor gekozen
om nachtwerk in deze analyse buiten beschouwing te laten.
2.3 Controlevariabelen
Voor alle controlevariabelen is gebruikgemaakt van de gegevens uit .
Taakeisen. Taakeisen zijn in kaart gebracht met vijf items, bijvoorbeeld ‘Moet u erg
snel werken en ‘Moet u heel veel werk doen?’ ( = nooit;  = soms;  = vaak;  = altijd;
α = .). De items zijn ontleend aan de Job Content Questionnaire (Karasek, Brisson,
Kawakami, Houtman, Bongers et al., ).
GenO2010-3.indd 180 03-08-2010 14:53:10
De invloed van afwijkende werktijden
181
Gedrag & Organisatie 2010-23, nr. 3
Autonomie. De mate van autonomie in het werk is eveneens met vijf items gemeten.
Voorbeelden zijn: ‘Kunt u zelf beslissen hoe u uw werk uitvoert?’ en ‘Bepaalt u zelf
de volgorde van uw werkzaamheden?’ ( = nooit;  = soms;  = vaak;  = altijd; α =
.). Ook deze items zijn afkomstig uit de Job Content Questionnaire (Karasek et
al., ).
Steun leidinggevende. Er zijn vier items die betrekking hebben op de steun die werk-
nemers van hun leidinggevende krijgen, bijvoorbeeld ‘Mijn chef heeft oog voor het
welzijn van de medewerkers’ en ‘Mijn chef besteedt aandacht aan wat ik zeg ( =
helemaal mee oneens;  = mee oneens;  = mee eens;  = helemaal mee eens; α = .).
Deze vragen zijn ontleend aan het door Karasek ontwikkelde begrip ‘supervisory
support’ en vertaald door Houtman, Goudswaard, Dhondt, Van der Grinten,
Hildebrandt et al. ().
Steun collega’s. Ook de steun die werkenden van hun collega’s ontvangen is in kaart
gebracht met vier items, bijvoorbeeld ‘Mijn collega’s helpen mij om het werk gedaan
te krijgen en ‘Mijn collega’s zijn vriendelijk’ ( = helemaal mee oneens;= mee oneens;
 = mee eens;= helemaal mee eens; α = .). Deze vragen zijn ontleend aan het door
Karasek ontwikkelde begrip ‘co-worker support’ en vertaald door Houtman et al.
().
Werkuren. Respondenten is gevraagd hoeveel uur per week ze gemiddeld werken
(contracturen voor werknemers).
2.4 Analyses
De data zijn geanalyseerd met behulp van Structural Equation Modeling (Jöreskog &
Sörbom, ), zoals geïmplementeerd in het computerprogramma LISREL ..
Deze analysetechniek maakt het mogelijk de data weer te geven in verschillende
causale modellen en deze modellen vervolgens met elkaar te vergelijken om te bepa-
len welk model het beste bij de data past.
Om de hypothesen van dit onderzoek te toetsen is de fit van verschillende modellen
met elkaar vergeleken. Voor elk van de typen afwijkende werktijden (avond en week-
end) is een vergelijkbare reeks modellen tegen elkaar getoetst. In deze modellen zijn
WTI, TWI en afwijkende werktijden op tijdstip (t) als afhankelijke variabelen
opgenomen. Dezelfde variabelen op tijdstip  (t), evenals de controlevariabelen, dien-
den als onafhankelijke variabelen.
Er zijn telkens zes modellen met elkaar vergeleken. Model , het stabiliteitsmodel,
bevat alleen effecten van elke t variabele naar dezelfde variabele op t. Dit model
veronderstelt geen causale relaties tussen afwijkende werktijden en WTI/TWI en
vice versa. Ook zijn in dit model relaties gemodelleerd tussen de controlevariabelen
op t en WTI/TWI op t.
Model , het causaliteitsmodel, is hetzelfde als het stabiliteitsmodel, maar om de
causale relaties te onderzoeken tussen afwijkende werktijden en WTI/TWI (hypo-
these a), bevat dit model daarnaast paden van afwijkende werktijden op t naar WTI
en TWI op t. Omdat het causaliteitsmodel een uitbreiding is van het stabiliteits-
model, wordt daarin gecontroleerd voor WTI en TWI op t.
Model , het omgekeerde causaliteitsmodel, is eveneens identiek aan stabiliteitsmo-
del, maar bevat daarnaast paden van WTI en TWI op t naar afwijkende werktijden
GenO2010-3.indd 181 03-08-2010 14:53:10
Gedrag & Organisatie 2010-23, nr. 3
De invloed van afwijkende werktijden
182
op t. In dit model worden de causale relaties tussen WTI/TWI en afwijkende werk-
tijden gemodelleerd (hypothese b).
In Model , het reciproke model, worden de drie voorgaande modellen geïntegreerd.
Dit model gaat ervan uit dat afwijkende werktijden gerelateerd zijn aan WTI en TWI
twee jaar later, maar dat WTI en TWI ook gerelateerd zijn aan afwijkende werktijden
twee jaar later.
In de Modellen  tot en met  zijn de covariantie-matrices van mannen en vrouwen
apart in de analyse opgenomen, maar zijn de waarden van alle paden in het model
voor beide seksen gelijk gesteld. Om te onderzoeken of de relaties tussen afwijkende
werktijden op t en WTI/TWI op t verschillen tussen mannen en vrouwen, worden
deze in Model , het causaliteitsmodel met sekseverschillen, apart geschat voor man-
nen en vrouwen (hypothese ). Hiermee vormt het causaliteitsmodel met seksever-
schillen een uitbreiding van het reciproke model, waarbij in het causaliteitsmodel met
sekseverschillen alleen de relatie tussen afwijkende werktijden op t en WTI/TWI
op t apart wordt geschat voor mannen en vrouwen.
Ten slotte worden in Model , het reciproke model met sekseverschillen, naast de
relaties tussen afwijkende werktijden op t en WTI/TWI op t ook de relaties tussen
WTI/TWI op t en afwijkende werktijden op t apart geschat voor mannen en
vrouwen, om te bekijken of ook daar verschillen bestaan. Hiermee vormt het reciproke
model met sekseverschillen een uitbreiding van het causaliteitsmodel met seksever-
schillen.
De fit van de verschillende modellen is geëvalueerd met behulp van de Delta χ-toets,
the Root Mean Square Error of Approximation (RMSEA) en de Comparative Fit
Index (CFI; Bentler, ). Waarden van . en hoger (CFI) en . of lager (RMSEA)
duiden op een acceptabele fit (Byrne, ). Er zijn tevens Delta χ-toetsen uitgevoerd
om de verschillende modellen te vergelijken.
3 Resultaten
3.1 Avondwerk
Tabel  geeft een overzicht van de gemiddelden, standaarddeviaties en correlaties van
de onderzoeksvariabelen. Uit de tabel blijkt dat de respondenten op beide metingen
gemiddeld één dag in de week avondwerk verrichten. Avondwerk hangt vooral posi-
tief samen met het aantal werkuren, met werk-thuis interferentie en met het ver-
richten van weekendwerk. Op de eerste meting geven  respondenten aan één of
meer avonden per week te werken. Op de tweede meting zijn dit er .
In tabel  is de fit weergegeven van de modellen die getoetst zijn om de causale rela-
ties tussen avondwerk en WTI/TWI en vice versa te onderzoeken. De fit van het
causaliteitsmodel (avondwerk t WTI en TWI t) is niet beter dan die van het
stabiliteitsmodel (geen causale relaties). Het omgekeerde causaliteitsmodel (WTI en
TWI t avondwerk t) en het reciproke model (avondwerk t WTI/TWI t en
WTI/TWI t avondwerk t) passen beide echter wel beter bij de data dan het
stabiliteitsmodel. Omdat er in het reciproke model geen significante relaties zijn
GenO2010-3.indd 182 03-08-2010 14:53:10
De invloed van afwijkende werktijden
183
Gedrag & Organisatie 2010-23, nr. 3
Tabel 1 Gemiddelden, standaarddeviaties en correlaties van studievariabelen
MSD12345678910 11 12 13 14 15
1. Sekse 1.29 .46 1
2. Taakeisen 2.47 .56 –.09 1
3. Autonomie 2.86 .66 –.01 –.041 1
4. Steun chef 2.83 .61 .08 –.24** .12* 1
5. Steun collega 3.23 .47 .20** –.09 .00 .33** 1
6. Leeftijd 41.01 7.57 –.09 .07 .15** –.02 –.08 1
7. Werkuren 34.01 11.13 –.69** .09 .12* –.03 –.10 .15** 1
8. WTI t1 1.68 .65 –.09 .27** .11* –.06 –.05 .05 .32** 1
9. WTI t2 1.70 .68 –.07 .21** .04 –.06 .04 .04 .28** .55** 1
10. TWI t1 1.44 .53 –.02 .12* .14** –.04 –.02 .02 .22** .43** .30** 1
11. TW I t2 1.46 .56 .11* .16** –.01 –.12 –.01 –.01 .00 .24** .39** .32** 1
12. Avonden t1 .92 1.90 –.14* .02 .01 –.07 .03 .00 .23** .25** .28** .18** .13* 1
13. Weekend t1 .49 1.09 –.08 –.05 –.05 .08 .05 –.01 .07 .17** .13* .01 –.00 .51** 1
14. Avonden t2 1.02 1.99 –.07 .01 –.11* –.01 .13* –.09 .18** .29** .31** .08 .10 .57** .29** 1
15. Weekend t2 .58 1.16 .01 –.04 –.02 .15** .18** –.06 .01 .19** .10 –.03 –.02 .33** .52** .57** 1
* p < .05; ** p < .01
GenO2010-3.indd 183 03-08-2010 14:53:10
Gedrag & Organisatie 2010-23, nr. 3
De invloed van afwijkende werktijden
184
tussen avondwerk op t en WTI op t (β = + .; ns) en TWI op t (β = + .; ns) én
omdat het omgekeerde causaliteitsmodel een spaarzamer model is dan reciproke
model, wordt het omgekeerde causaliteitsmodel als best passende model beschouwd.
Hypothese a, die een positieve relatie veronderstelde tussen avondwerk op t en WTI
en TWI op t, wordt dus niet bevestigd.
Tabel 2 De fit van modellen die de relatie tussen avondwerk en WTI en TWI in kaart
brengen
Model χ2
df p
RMSEA CFI ∆χ2 (Mx – My) df
p
1. Stabiliteitsmodel 87.15 39 0.00 .09 .92
2. Causaliteitsmodel 82.81 37 0.00 .09 .93 4.34 (M2 – M1) 2 ns*
3. Omgekeerd
causaliteitsmodel
74.42 37 0.00 .08 .94 12.73 (M3 – M1) 2 < .01
4. Reciproke model 70.07 35 0.00 .08 .94 17.08 (M4 – M1) 4 < .01
5. Causaliteitsmodel
met sekseverschillen
53.60 33 0.01 .06 .97 29.20 (M5 – M2) 4 < .01
16.46 (M5 – M4) 2 < .01
6. Reciproke model
met sekseverschillen
53.04 31 0.01 .07 .96 17.03 (M6 – M4) 4 < .01
.57 (M6 – M5) 2 ns
* Significant indien p < .05
Stabiliteitsmodel: Alleen relaties van de t1 waarde van een variabele naar dezelfde
variabele op t2
Causaliteitsmodel: Stabiliteitsmodel en afwijkende werktijden t1 WTI en TWI t2
Omgekeerd causaliteitsmodel: Stabiliteitsmodel en WTI en TWI t1 afwijkende werktijden t2
Reciproke model: Stabiliteitsmodel en WTI en TWI t1 afwijkende werktijden t2
en afwijkende werktijden t1 WTI en TWI t2
Causaliteitsmodel met sekse-
verschillen:
Reciproke model, maar alléén afwijkende werktijden t1 WTI
en TWI t2 apart geschat voor mannen en vrouwen
Reciproke model met sekse-
verschillen:
Identiek aan causaliteitsmodel met sekseverschillen, maar zowel
afwijkende werktijden t1 WTI en TWI t2 als WTI en TWI t1
afwijkende werktijden t2 apart geschat voor mannen en vrouwen
In het omgekeerde causaliteitsmodel bestaat er een positieve relatie tussen WTI op
t en avondwerk op t (β = +.; p < .). Er is geen significant verband tussen TWI
op t en avondwerk op t (β =+ .; ns). Deze resultaten vormen geen bevestiging voor
hypothese b, die een negatieve relatie veronderstelde tussen avondwerk op t en WTI
en TWI op t.
Het causaliteitsmodel met sekseverschillen is identiek aan het reciproke model, maar
nu worden de relaties tussen avondwerk op t en WTI en TWI op t apart geschat
voor mannen en vrouwen. Het causaliteitsmodel met sekseverschillen past beter bij
de data dan het causaliteitsmodel en dan het reciproke model. In het causaliteitsmo-
del met sekseverschillen is er voor mannen geen relatie tussen avondwerk op t en
WTI (β = +.; ns) en TWI (β = +.; ns) op t. Voor vrouwen worden deze relaties
GenO2010-3.indd 184 03-08-2010 14:53:10
De invloed van afwijkende werktijden
185
Gedrag & Organisatie 2010-23, nr. 3
echter wel gevonden (WTI: β = +.; p < . en TWI; β = +.; p < .). Tezamen
bieden deze resultaten steun voor hypothese , waarin gesteld werd dat de relaties
tussen avondwerk en WTI en TWI sterker zijn voor vrouwen dan voor mannen.
De fit van het reciproke model met sekseverschillen, ten slotte, is weliswaar beter dan
die van het reciproke model, maar aangezien de fit niet beter is dan die van het cau-
saliteitsmodel met sekseverschillen, kan geconcludeerd worden dat de relaties tussen
WTI en TWI op t en avondwerk op t niet verschillend zijn voor mannen en vrou-
wen.
Figuur  geeft het uiteindelijke model weer voor avondwerk. Hierin geven diagonale
pijlen de relaties weer tussen WTI op t en avondwerk op t en tussen avondwerk op
t en WTI en TWI op t. Het figuur geeft weer dat het aantal werkuren positief
gerelateerd is aan WTI, dat sociale steun van collega’s positief geassocieerd is met het
werken op afwijkende werktijden en dat de leeftijd van de werknemer negatief samen-
hangt met het werken op afwijkende werktijden.
.23
.11
–.13
Tijdstip 1
.35
.23
.20
.38 (vrouwen)
.25 (vrouwen )
.40
WTI
TWI
Avondwerk
Tijdstip 2
WTI
TWI
Avondwerk
Werkuren
per week
Sociale steun
colleg a’s
Leeftijd
Figuur 1 Eindmodel voor avondwerk en werk thuis interferentie (WTI) en thuis-werk
interferentie (TWI) (gestandaardiseerde oplossing
3.2 Weekendwerk
Uit tabel  blijkt dat de respondenten gemiddeld een halve ochtend of middag in het
weekend werken. Weekendwerk hangt vooral positief samen met werk-thuis inter-
ferentie en met avondwerk. Het verrichten van weekendwerk op de tweede meting
hangt tevens positief samen met het ervaren van sociale steun. In totaal werken
 respondenten op t minstens één of meer ochtenden en/of middagen in het week-
end en op t zijn dit er .
De fit van de verschillende modellen die gespecificeerd zijn om de causale relaties
tussen weekendwerk en WTI/TWI en vice versa te onderzoeken is weergegeven in
tabel . Alle modellen hebben een acceptabele fit (RMSEA < . en CFI > .). Het
causaliteitsmodel (weekendwerk t WTI en TWI t) heeft geen betere fit dan het
stabiliteitsmodel (geen causale relaties). Het omgekeerde causaliteitsmodel (WTI en
TWI t weekendwerk t) past wel beter bij de data dan het stabiliteitsmodel.
Hetzelfde geldt voor het reciproke model (weekendwerk t WTI/TWI t en WTI/
GenO2010-3.indd 185 03-08-2010 14:53:10
Gedrag & Organisatie 2010-23, nr. 3
De invloed van afwijkende werktijden
186
TWI t weekendwerk t). Net als bij avondwerk zijn de relaties tussen weekend-
werk op t en WTI (β = +.; ns) en TWI (β = .; ns) op t in dit model niet sig-
nificant. Dit betekent dat hypothese a, die een positieve causale relatie veronderstelde
tussen weekendwerk op t en WTI en TWI op t, op basis van deze analyses niet
bevestigd kan worden.
Aangezien het omgekeerde causaliteitsmodel een spaarzamer model is dan het reci-
proke model (df =  in M en df =  in M), wordt het omgekeerde causaliteitsmo-
del tot ‘best passend model’ verkozen. In dit model is er een positieve relatie tussen
WTI op t en weekendwerk op t (β = +, p < .) en geen significante relaties tus-
sen TWI op t en weekendwerk op t (β = –.; ns). Deze resultaten vormen geen
bevestiging voor hypothese b, waarin een negatieve relatie verondersteld werd tussen
WTI en TWI op t en weekendwerk op t.
Het causaliteitsmodel met sekseverschillen is identiek aan het reciproke model, maar
nu worden de relaties tussen weekendwerk op t en WTI en TWI op t apart geschat
voor mannen en voor vrouwen. Het causaliteitsmodel met sekseverschillen past niet
beter bij de data dan het reciproke model of het causaliteitsmodel, wat erop duidt dat
Tabel 3 De fit van modellen die de relatie tussen weekendwerk en WTI en TWI in
kaart brengen
Model χ2
df p
RMSEA CFI ∆χ2 (Mx – My) df
p
1. Stabiliteitsmodel 59.36 39 .02 .06 .96
2. Causaliteitsmodel 57.22 37 .02 .06 .96 2.14 (M2 – M1) 2 ns*
3. Omgekeerd causali-
teitsmodel
51.56 37 .06 .05 .97 7.80 (M3 – M1) 2 <.01
4. Reciproke model 49.42 35 .05 .05 .97 9.94 (M4 – M1) 4 <.05
5. Causaliteitsmodel met
sekseverschillen
48.71 33 .04 .05 .97 8.51 (M5 – M2) 4 ns
0.71 (M5 – M4) 2 ns
6. Reciproke model met
sekseverschillen
46.47 31 .04 .06 .97 2.95 (M6 – M4) 4 ns
2.24 (M6 – M5) 2 ns
* Significant indien p < .05
Stabiliteitsmodel: Alleen relaties van de t1 waarde van een variabele naar dezelfde
variabele op t2
Causaliteitsmodel: Stabiliteitsmodel en afwijkende werktijden t1 WTI en TWI t2
Omgekeerd causaliteitsmodel: Stabiliteitsmodel en WTI en TWI t1 afwijkende werktijden t2
Reciproke model: Stabiliteitsmodel en WTI en TWI t1 afwijkende werktijden t2
en afwijkende werktijden t1 WTI en TWI t2
Causaliteitsmodel met sekse-
verschillen:
Reciproke model, maar alléén afwijkende werktijden t1 WTI
en TWI t2 apart geschat voor mannen en vrouwen
Reciproke model met sekse-
verschillen:
Identiek aan causaliteitsmodel met sekseverschillen, maar zowel
afwijkende werktijden t1 WTI en TWI t2 als WTI en TWI t1
afwijkende werktijden t2 apart geschat voor mannen en vrouwen
GenO2010-3.indd 186 03-08-2010 14:53:10
De invloed van afwijkende werktijden
187
Gedrag & Organisatie 2010-23, nr. 3
de relaties tussen weekendwerk op t en WTI/TWI op t niet verschillen tussen
mannen en vrouwen. Hypothese  wordt hiermee dus niet bevestigd voor weekend-
werk.
In het reciproke model met sekseverschillen, ten slotte, wordt bekeken of ook de
relaties tussen WTI/TWI op t en weekendwerk op t verschillen tussen mannen en
vrouwen. De fit van dit model is echter niet beter dan die van het reciproke model of
het causaliteitsmodel met sekseverschillen, waaruit geconcludeerd kan worden dat
ook de sterkte van deze relaties niet verschilt tussen mannen en vrouwen.
Tijdstip 1
.37
.25
.16
.48
.24
.17
WTI
TWI
Weekend-
werk
Tijdstip 2
WTI
TWI
Weekend-
werk
Werkuren
per week
Sociale steun
colleg a’s
Figuur 2 Eindmodel voor weekendwerk en werk-thuis interferentie (WTI) en thuis-
werk interferentie (TWI) (gestandaardiseerde oplossing)
Figuur  geeft het uiteindelijke model weer voor weekendwerk. Hierin is het effect
van WTI (t) op weekendwerk (t) met een diagonale pijl aangegeven. Net als figuur
laat deze figuur zien dat vooral weekendwerk en WTI tamelijk stabiel zijn in de tijd
en wederom blijkt het aantal werkuren positief samen te hangen met WTI, en soci-
ale steun van collega’s met het werken op afwijkende werktijden.
Al met al leveren de resultaten van de analyses gedeeltelijke steun voor hypothese :
voor vrouwen blijkt dat, na controle voor de effecten van leeftijd, taakeisen, sociale
steun van leidinggevende en collega’s, autonomie en werkuren, werken tijdens de
avond gepaard gaat met een toename in WTI en TWI twee jaar later. Voor mannen
wordt geen relatie gevonden tussen avond-, nacht- of weekendwerk en WTI/TWI.
Hypothese a, waarin voor beide seksen een positieve relatie tussen het werken op
afwijkende tijden en WTI/TWI wordt verondersteld, wordt niet bevestigd op basis
van deze analyses. Ook hypothese b wordt niet bevestigd. In plaats van de veronder-
stelde negatieve relatie tussen WTI/TWI en het werken op afwijkende tijden twee
jaar later, wordt een positieve relatie gevonden.
4 Discussie
In een steekproef van werkende ouders die (on)gehuwd samenleven met een partner,
zijn in deze studie de causale relaties onderzocht tussen het werken op afwijkende
GenO2010-3.indd 187 03-08-2010 14:53:11
Gedrag & Organisatie 2010-23, nr. 3
De invloed van afwijkende werktijden
188
tijden en het ervaren van werk-thuis interferentie (WTI) en thuis-werkinterferentie
(TWI). Tevens is bekeken of deze relaties verschillen tussen mannen en vrouwen.
Uit de resultaten blijkt dat voor vrouwen met kinderen, maar niet voor mannen met
kinderen, het werken tijdens de avond gepaard gaat met een toename in WTI en
TWI. Dat dit resultaat alleen wordt gevonden voor vrouwen en niet voor mannen,
kan mogelijk worden verklaard doordat vrouwen in het gezin doorgaans het grootste
gedeelte van de zorgtaken op zich nemen, terwijl mannen in dit opzicht een relatief
beperkte verantwoordelijkheid hebben (o.a. Breedveld & Van den Broek, ).
Voor het werken tijdens het weekend werd ook voor vrouwen geen relatie gevonden
met WTI en TWI. Weekendwerk is in dit onderzoek geoperationaliseerd als werken
tijdens één of meer ochtenden en/of middagen in het weekend. Het is goed mogelijk
dat de vrije tijd, die beschikbaar is tijdens de weekendavonden genoeg mogelijkheden
biedt om het werk en het gezin goed te kunnen combineren.
De resultaten van dit onderzoek laten verder zien dat WTI gepaard gaat met een
toename in plaats van met de veronderstelde afname in het werken tijdens de avond
en het weekend twee jaar later. Een verklaring hiervoor is mogelijk dat het werken
op afwijkende tijden sommige werknemers een zekere mate van flexibiliteit biedt om
werk en thuis beter te combineren. Het is mogelijk dat werkenden, die op een bepaald
moment in de tijd veel WTI ervaren, ervoor kiezen op afwijkende tijden te gaan
werken, omdat ze hopen dat dit na verloop van tijd zal leiden tot een vermindering
in WTI. Eerder onderzoek (Strazsdins, Korda, Lim, Broom & D’Souza, ) laat
bijvoorbeeld zien dat het werken op niet-standaard tijden het voor ouders mogelijk
maakt zelf voor kinderopvang te zorgen.
Een andere verklaring voor de gevonden positieve relatie tussen WTI en het werken
op afwijkende tijden ligt in de mogelijkheid dat beide positief samenhangen met een
niet gemeten derde variabele, zoals inflexibiliteit van het werkschema. Uit onderzoek
van Byron () blijkt dat inflexibiliteit van het werkschema gepaard gaat met een
verhoogd niveau van WTI. Het werken op afwijkende werktijden komt vooral veel
voor in sectoren als de zorg, het transport en de horeca (Klein Hesselink et al., ),
waarin het vaak lastig is om tijden aan te passen en werkschema’s weinig flexibel
zijn.
Om meer zicht te krijgen op de specifieke rol, die het werken op afwijkende tijden
speelt bij het combineren van werk en privé, zou het in toekomstig onderzoek interes-
sant zijn om over aanvullende informatie te beschikken over de reden van het werken
op afwijkende tijden. Zo kan beter onderscheiden worden in welke gevallen het
werken op afwijkende werktijden als hulpmiddel wordt ingezet en in welke gevallen
het werken op afwijkende tijden juist een stresserende factor is bij het combineren
van werk en privé.
Voor de controlevariabelen werd ook een aantal verbanden gevonden. In lijn met
eerder onderzoek (Major et al., ) bleek dat het aantal werkuren positief gerela-
teerd is aan WTI en dat leeftijd negatief samenhangt met avondwerk (Koppes et al.,
). Daarnaast werd een positief verband gevonden tussen sociale steun van col-
lega’s en het werken in de avond en in het weekend. Een mogelijke verklaring voor
deze bevinding is dat het werken op afwijkende werktijden ‘een band schept’ met
collega’s die in hetzelfde schuitje zitten. Andersom is het ook goed mogelijk dat wan-
neer het werken op afwijkende werktijden op vrijwillige basis is, het ervaren van
GenO2010-3.indd 188 03-08-2010 14:53:11
De invloed van afwijkende werktijden
189
Gedrag & Organisatie 2010-23, nr. 3
sociale steun bedraagt aan de geneigdheid van werknemers om op afwijkende werk-
tijden te werken. Deze bevinding is interessant in het licht van literatuur die aanwij-
zingen geeft voor sociale steun als ‘beschermende factor’ voor WTI en TWI (Van
Daalen et al., ). Zo is het mogelijk dat de ongunstige effecten van het werken
op afwijkende werktijden op WTI en TWI worden gebufferd door de sociale steun
die werknemers van collega’s ervaren.
4.1 Sterke en zwakke punten
Zoals elk onderzoek kent ook deze studie zijn beperkingen. Ten eerste zijn twee
kernconcepten in deze studie, namelijk WTI en TWI, elk slechts met behulp van één
item gemeten. Hoewel eerder onderzoek heeft laten zien dat het gebruik van één-
itemmaten zinvol is wanneer éénduidige concepten gemeten worden (Wanous,
Reichers & Hudy,  voor werktevredenheid en Van Hooff, Geurts, Taris &
Kompier,  voor vermoeidheid), is het mogelijk dat deze items geen volledig beeld
schetsen van alle diverse aspecten die aan WTI en TWI te onderscheiden zijn (zie
Greenhaus & Beutell, ). Toekomstig onderzoek kan het inzicht in de relaties
tussen afwijkende werktijden en WTI/TWI verder uitbreiden door gebruik te maken
van meetinstrumenten die meerdere aspecten van WTI en TWI in zich bergen (bijv.
Frone et al., a; b; Geurts et al., ; Kopelman, Greenhaus, & Connolly,
).
Een tweede punt van aandacht betreft de tijdspanne tussen de twee metingen. Deze
bedroeg in deze studie twee jaar. De vraag is of het proces, waarbij afwijkende tijden
tot WTI/TWI leiden en omgekeerd, ook daadwerkelijk binnen dit tijdsinterval
plaatsvindt. Wanneer het werkelijke causale interval kleiner is dan twee jaar, vormen
de in dit onderzoek gevonden relaties een onderschatting van de werkelijke relaties
tussen de concepten.
Naast deze mogelijke tekortkomingen kent deze studie ook een aantal sterke punten.
Ten eerste werd in dit onderzoek gebruikgemaakt van een longitudinaal design, dat
het niet alleen mogelijk maakte de relaties tussen afwijkende werktijden en WTI/
TWI op een later tijdstip te onderzoeken, maar ook in kaart kon brengen hoe WTI/
TWI gerelateerd zijn aan het werken op afwijkende tijden in de toekomst. De resul-
taten lieten inderdaad zien dat de relatie tussen afwijkende werktijden en WTI/TWT
gedeeltelijk reciprook is. Ten tweede besteedde dit onderzoek aandacht aan mogelijke
sekseverschillen in de relatie tussen het werken op afwijkende tijden en het ervaren
van WTI en TWI en bleek uit de resultaten dat deze relaties inderdaad voor een deel
verschillend zijn voor mannen en vrouwen.
4.2 Conclusie
Uit deze studie blijkt enerzijds dat voor vrouwen met kinderen het werken tijdens de
avond leidt tot een toename in WTI en TWI. Het is mogelijk dat het werken tijdens
de avond juist bij vrouwen interfereert met de zorgtaken waar zij vaker verantwoor-
delijkheid voor dragen dan mannen. Aangezien eerder onderzoek heeft laten zien dat
WTI op den duur tot gezondheidsklachten kan leiden (Van Hooff, Geurts, Taris,
Kompier, Dikkers et al., ), is aandacht voor deze ‘dubbele belasting’ van vrouwen
van belang.
GenO2010-3.indd 189 03-08-2010 14:53:11
Gedrag & Organisatie 2010-23, nr. 3
De invloed van afwijkende werktijden
190
Anderzijds blijkt uit deze studie dat werkenden die WTI ervaren in de loop van de
tijd eerder meer dan minder op afwijkende tijden gaan werken. Deze bevinding sug-
gereert dat werken op afwijkende tijden (ook) als middel wordt aangewend om werk
en privé beter te kunnen combineren.
Aanvullend onderzoek zou meer inzicht kunnen geven in de specifieke rol van het
werken op afwijkende tijden bij het combineren van werk en privé. Mogelijk vormen
de bevindingen van de huidige studie een ingang voor toekomstig onderzoek om de
wederzijdse relaties tussen WTI/TWI en afwijkende werktijden verder in kaart te
brengen.
Praktijkbox
Het is van belang dat vrouwen met kinderen, die avond- of nachtwerk verrichten, •
zich ervan bewust zijn dat dit problemen kan opleveren in de werk-privébalans.
Hierdoor kunnen zij bijvoorbeeld tijdig maatregelen treffen, zoals het uitbesteden
van huishoudelijke taken.
Gezien de negatieve gevolgen van problemen in de werk-privébalans, zoals stress, •
burnout, depressie en verloop, zijn ook werkgevers erbij gebaat om de negatieve
consequenties van avond- en nachtwerk bij vrouwen met kinderen te beperken.
Werkgevers zouden bijvoorbeeld regelingen kunnen treffen, zoals het aanbieden
van flexibele werktijden, waardoor vrouwen de werktijden zodanig kunnen inrich-
ten dat de privésituatie geen/beperkte hinder ondervindt.
De bevinding dat vrouwen wel problemen met de werk-privébalans ervaren door •
het werken in de avonduren, maar mannen niet, zou erop kunnen wijzen dat er
in de privésfeer vaak meer van vrouwen wordt gevraagd dan van mannen. Beleid
zou zich daarom kunnen richten op het stimuleren van een meer egalitaire taak-
verdeling binnen gezinnen, zodat de dubbele belasting bij vrouwen wat wordt
teruggedrongen.
Literatuur
Bentler, P.M. (). Comparative fit indexes in structural models. Psychological Bulletin, 107,
-.
Bohle, P. & Tilley, A. (). The impact of night work on psychological well-being.
Ergonomics, 32, -.
Breedveld, K. & Van den Broek, A. (). Trends in de tijd. Een schets van recente
ontwikkelingen in tijdsbesteding en tijdsordening. Den Haag: SCP; .
Byrne, B.M. (). Structural equation modeling with AMOS: Basic concepts, applications and
programming. Mahwah, NJ: Lawrence Erlbaum Associates.
Byron, K. (). A Meta-analytic review of work-family conflict and its antecedents.
Journal of Vocational Behavior, 67, -.
Cinamon, R.G. & Rich, Y. (). Gender differences in the importance of work and
family roles: Implications for work–family conflict. Sex Roles, 47, -.
Demerouti, E., Geurts, S.A.E., Bakker, A. & Euwema, M. (). The impact of shiftwork
on work-home conflict, job attitudes and health. Ergonomics, 47, -.
Duxbury, L., Higgins, C.A. & Lee, C.M. (). Work–family conflict: A comparison by
gender, family type, and perceived control. Journal of Family Issues, 15, -.
GenO2010-3.indd 190 03-08-2010 14:53:11
De invloed van afwijkende werktijden
191
Gedrag & Organisatie 2010-23, nr. 3
Eagle, B.W., Miles, E.W. & Icenogle, M.L. (). Interrole conflicts and the permeability
of work and family domains: Are there gender differences? Journal of Vocational
Behavior, 50, -.
Frone, M.R., Russell, M. & Cooper M.L. (a). Antecedents and outcomes of work–
family conflict: Testing a model of the work–family interface. Journal of Applied
Psychology,77, -.
Frone, M.R., Russell, M. & Cooper, M.L. (b). Prevalence of work–family conflict: Are
work and family boundaries asymmetrically permeable. Journal of Organizational
Behavior, 13, -.
Frone, M.R., Russell, M. & Cooper M.L. (). Relation of work–family conflict to health
outcomes: A four-year longitudinal study of employed parents. Journal of Occupational
and Organizational Psychology,70, -.
Geurts, S.A.E., Taris, T.W., Kompier, M.A.J., Dikkers, J.S.E., Van Hooff, M.L.M. &
Kinnunen, U.M. (). Work-home interaction from a work psychological perspective:
Development and validation of a new questionnaire. Work & Stress, 19, -.
Greenhaus, J.H. & Beutell, N.J. (). Sources of conflict between work and family roles.
Academy of Management Review, 10, -.
Greenhaus, J.H., Parasuraman, S., Granrose, C.S., Rabinowitz, S. & Beutell, N.J. ().
Sources of work-family conflict among two-career couples. Journal of Vocational
Behavior, 34, -.
Gutek, B. A., Nakamura, C.Y. & Nieva, V.F. (). The interdependence of work and
family roles. Journal of Occupational Behavior, 2, -.
Gutek, B.A., Searle, S. & Klepa, L. (). Rational versus gender role explanations for
work-family conflict. Journal of Applied Psychology, 76, -.
Houtman, I.L.D., Goudswaard, A., Dhondt, S., Van der Grinten, M., Hildebrandt, V. &
Kompier, M. (). Evaluatie van de monitorstudie naar stress en lichamelijke
belasting. Den Haag: VUGA.
Jansen, N.W.H., Kant, I., Nijhuis, F.J.N., Swaen, G.M.H. & Kristensen, T.S. (). Impact
of worktime arrangements on work-home interference among Dutch employees.
Scandinavian Journal of Work, Environment, & Health, 30, -.
Jöreskog, K.G. & Sörbom, D. (). LISREL 8: User’s Reference Guide. Chicago: Scientific
Software International.
Karasek, R., Brisson, C., Kawakami, N., Houtman, I., Bongers, P. & Amick B. (). The
Job Content Questionnaire (JCQ): An instrument for internationally comparative
assessments of psychosocial job characteristics. Journal of Occupational Health Psychology,
3, -.
Kelloway, E.K., Gottlieb, B.H. & Barham, L. (). The source, nature, and direction of
work and family conflict: A longitudinal investigation. Journal of Occupational Health
Psychology, 4, -.
Kinnunen, U. & Mauno, S. (). Antecedents and outcomes of work-family conflict
among employed women and men in Finland. Human Relations, 51, -.
Kinnunen, U., Geurts, S. & Mauno, S. (). Work-to-family conflict and its relationship
with satisfaction and well-being: A one-year longitudinal study on gender differences.
Work and Stress, 18, -.
Klein Hesselink, J., Houtman, I., Hooftman, W. & Bakhuys Roozeboom, M. ().
Arbobalans . Kwaliteit van de arbeid, effecten en maatregelen in Nederland. TNO:
Hoofddorp.
Kopelman, R., Greenhaus, J.H. & Connolly, T.F. (). A model of work, family, and
interrole conflict: A construct validation study. Organizational Behavior and Human
Performance, 32, -.
Koppes, L., Klein Hesselink, J., Mol, M. & Van den Bossche, S. (). Vinger aan de pols
van werkend Nederland. TNO: Hoofddorp.
La Valle, I., Arthur, S., Millward, C., Scott, J. & Clayden, M. (). Happy families?
Atypical work and its influence on family life. Bristol (UK): The Policy Press.
Lundberg, U. & Frankenhaeuser, M. (). Stress and workload of men and women in
high- ranking positions. Journal of Occupational Health Psychology, 4, -.
GenO2010-3.indd 191 03-08-2010 14:53:11
Gedrag & Organisatie 2010-23, nr. 3
De invloed van afwijkende werktijden
192
Major, V.S., Klein, K.J. & Ehrhart, M.G. (). Work time, work interference with family,
and psychological distress. Journal of Applied Psychology, 87, -.
Nieuwenbroek, N. & Slootbeek, G. (). Documentatie bij de cursus wegen met Bascula
., Research paper nr. . Voorburg/Heerlen: CBS.
O’Driscoll, M.P., Poelmans, S., Spector, P.E., Kalliath, T., Allen T.D. & Cooper, C.L.
(). Family responsive interventions, perceived organizational and supervisor
support, work–family conflict, and psychological strain. International Journal of Stress
Management 10, -.
Peeters, M. & Heiligers, Ph. (). Werk-thuisinterferentie. In W. Schaufeli, A. Bakker &
J. de Jonge (Red.), De Psychologie van Arbeid en Gezondheid. Houten/Mechelen: Bohn
Stafleu Van Loghum.
Portegijs, W., Hermans, B. & Lalta, V. (). Emancipatiemonitor 2006: Veranderingen in de
leefsituatie en levensloop. Den Haag: SCP.
Shamir, B. (). Some antecedents of work-nonwork conflict. Journal of Vocational
Behavior, 23, -.
Smulders, P.G.W., Andriesen, F. & Otten, F. (). Hoe denken Nederlanders over hun
werk…? Opzet, kwaliteit en eerste resultaten van de TNO Arbeidssituatie Survey.
Hoofddorp: TNO Arbeid.
Smulders, P.G.W. (). Nederlanders over hun werk: Methodologie en tabellenboek TNO
Arbeidssituatie Surveys 2000 en 2002. Hoofddorp: TNO Arbeid.
Staines, G. & Pleck, J. (). Nonstandard work schedules and family life. Journal of
Applied Psychology, 69, -.
Strazdins, L., Korda, R.J., Lim, L.L.Y., Broom, D.H. & D’Souza, R. M. (). Around-
the- clock: Parent work schedules and children’s well-being in a -h economy. Social
Science and Medicine, 59, -.
Van Daalen, G., Willemsen, T.M. & Sanders, K. (). Reducing work–family conflict
through different sources of social support. Journal of Vocational Behavior, 69, -.
Van Hooff, M.L.M., Geurts, S.A.E., Taris, T.W. & Kompier, M.A.J. (). ‘How fatigued
do you currently feel?’ Convergent and discriminant validity of a single-item fatigue-
measure. Journal of Occupational Health, 49, -.
Van Hooff, M.L.M., Geurts. S.A.E., Taris. T.W., Kompier, M.A.J., Dikkers, J.S.E.,
Houtman, I.L.D. & van den Heuvel, F.M.M. (). Disentangling the causal
relationships between work-home interference and employee health. Scandinavian
Journal of Work, Environment, and Health, 31, -.
Wallace, J.E. (). Work-to-nonwork conflict among married male and female lawyers.
Journal of Organizational Behavior, 20, -.
Wanous, J.P., Reichers, A.E. & Hudy, M.J. (). Overall job-satisfaction: How good are
single-item measures? Journal of Applied Psychology, 82, -.
Williams, K.J. & Alliger, G.M. (). Role stressors, mood spillover, and perceptions of
work–family conflict in employed parents. Academy of Management Journal, 37, -.
Wilson, M., Polzer-Debruyne, A., Chen, S. & Fernandes, S. (). Shift work
interventions for reduced work-family conflict. Employee Relations, 29, -.
The influence of working at non-standard working hours on the work-
home situation
M.L.M. van Hooff, M.C. Bakhuys Roozeboom, E.M.M. de Vroome & P.G.W.
Smulders, Gedrag & Organisatie, volume 23, September 2010, nr. 3, pp. 175-
193.
The present study was designed to map the causal relationships between non-
standard working hours and work-home interference (WHI) and home-work
interference (HWI). To this purpose, a longitudinal full-panel design was employed.
Using such a design, we examined both the causal effects of non-standard
working hours on WHI /HWI and the causal effects of WHI /HWI on non-standard
GenO2010-3.indd 192 03-08-2010 14:53:11
De invloed van afwijkende werktijden
193
Gedrag & Organisatie 2010-23, nr. 3
working hours. We also investigated the moderating effect of gender in these
relationships.
Data were collected in two waves (2002 and 2004) among 337 Dutch employees
and self-employed persons who lived together with a partner and had at least one
child living in the household. We included evening work and weekend work as
types of non-standard working hours. Data were analyzed by means of structural
equation modeling.
Results showed that, among women with children, evening work was related to
elevated levels of WHI and HWI two years later. A comparable relationship for
men with children was not found. A possible explanation for this finding is that for
women working at non-standard hours appears to cause WHI and HWI, as working
at non-standard hours interferes with their responsibilities at home, which they are
still more often accountable for than men.
Furthermore, WHI turned out to be related to an increase in evening work and
weekend work two years later for both men and women. A possible explanation
for this finding is that workers try to reduce WHI by means of working at non-
standard hours.
Key words: non-standard working hours, evening work, weekend work,
work-home interference, home-work interference
GenO2010-3.indd 193 03-08-2010 14:53:11
194
Oorzaken en effecten van presenteïsme
Longitudinale studie naar oorzaken
en effecten van presenteïsme1
Ernest M.M. De Vroome, Peter G.W. Smulders en Irene L.D. Houtman*
Met behulp van een longitudinaal
cross-lagged
onderzoek, zijn in deze
studie zowel mogelijke oorzaken als effecten onderzocht van presenteïsme
(ondanks gezondheidsklachten doorgaan met werken). Alle variabelen zijn
in 2002 en in 2004 met vragenlijsten gemeten onder een representatieve
Nederlandse steekproef (
N
= 653), en deze gegevens zijn op persoonsni-
veau longitudinaal gekoppeld. Zowel in 2002 als in 2004 werd door onge-
veer 60% van de respondenten presenteïsme gemeld. Er werden in deze
studie geen effecten van werkdruk gevonden. Emotionele uitputting bleek
een belangrijke determinant van later ziekteverzuim en van later presen-
teïsme, en ook ziekteverzuim had een direct effect op later presenteïsme.
Er werd echter geen reciproke relatie gevonden tussen presenteïsme en
verzuim. Dit betekent dat emotionele uitputting aan de basis ligt van zowel
verzuim als presenteïsme, en emotionele uitputting een belangrijk aangrij-
pingspunt kan vormen bij de reductie van zowel verzuim als presenteïsme.
Trefwoorden: werkdruk, presenteïsme, ziek doorwerken, emotionele
uitputting, ziekteverzuim
1 Inleiding
1.1 Doorwerken ondanks gezondheidsklachten (presenteïsme)
Reductie van ziekteverzuim staat hoog op de prioriteitenlijst van zowel de overheid
als het management van veel organisaties en is veelvuldig onderwerp van arbeids- en
organisatiepsychologisch onderzoek. Interventies ter reductie van verzuim hebben
ten doel de productiviteit te verhogen en de gezondheid en het welzijn van de
beroepsbevolking te verbeteren. Een belangrijke functie van ziekteverzuim is echter
om te herstellen van lichamelijke en/of psychische klachten, zoals emotionele uitput-
ting. Presenteïsme (doorwerken ondanks gezondheidsklachten; Johns, ) kan
mogelijk leiden tot het aanhouden van de onderliggende gezondheidsklachten en
herstel in de weg staan. Werknemersproductiviteit wordt daarmee niet alleen verlaagd
* De auteurs zijn werkzaam bij TNO Kwaliteit van Leven | Arbeid. Correspondentieadres:
Ernest M.M. de Vroome, Postbus 718, 2130 AS Hoofddorp, e-mail: Ernest.deVroome@
TNO.nl.
GenO2010-3.indd 194 03-08-2010 14:53:11
Oorzaken en effecten van presenteïsme
195
Gedrag & Organisatie 2010-23, nr. 3
door ‘absenteïsme’, maar ook door ‘presenteïsme’ (Schultz, Chen & Edington, ).
De doelstelling van de huidige studie is om de longitudinale samenhang te onder-
zoeken tussen werkdruk, presenteïsme, emotionele uitputting en ziekteverzuim.
Daarbij beperken we ons niet tot één beroepsgroep zoals verpleegkundigen
(Demerouti, Le Blanc, Bakker, Schaufeli & Hox, ), maar maken gebruik van een
landelijke representatieve steekproef, en we bekijken daarbij tevens of de samenhang
tussen bijvoorbeeld emotionele samenhang en presenteïsme verschillend is in ver-
schillende beroepsgroepen.
1.2 Definitie, operationalisatie en prevalentie
Er zijn in de literatuur grote verschillen in definitie en operationalisatie van presen-
teïsme (Johns, ; Schultz et al., ). Kivimäki, Head, Ferrie, Hemingway, Shipley
et al. () operationaliseerden presenteïsme als het gedurende een zekere tijd niet
hebben verzuimd, terwijl men wel een relatief slechte gezondheid heeft. Burton,
Chen, Conti, Schultz en Edington () definieerden en operationaliseerden pre-
senteïsme als het percentage waarmee de productiviteit als gevolg van gezondheids-
klachten lager wordt. Het maakt echter veel uit of de productiviteit bij presenteïsme
wordt geëvalueerd ten opzichte van gezonde werknemers, dan wel ten opzichte van
verzuimende werknemers ( Johns, ). In de meeste studies wordt aan de respon-
denten zelf gevraagd of zij ondanks gezondheidsklachten gewoon zijn gaan of zijn
blijven werken. Soms wordt presenteïsme geoperationaliseerd met een schaal
bestaande uit meerdere items (bijv. de Stanford Presenteeism Scale, Koopman, Pelletier,
Murray, Sharda, Berger et al., ), en soms met één zelfgerapporteerde vraag
omtrent doorwerken ondanks gezondheidsklachten (bijvoorbeeld Aronsson,
Gustafsson & Dallner, ).
Met de vele verschillende operationalisaties van presenteïsme wisselt ook de preva-
lentie daarvan. Hoeveel presenteïsme men vindt, is bovendien afhankelijk van de
onderzochte groep, tijd en geografische locatie. Bijvoorbeeld Aronsson et al. ()
rapporteerden dat  van de werknemers ten minste één keer per jaar ondanks
gezondheidsklachten had doorgewerkt, Aronsson en Gustafsson () rapporteer-
den , en Hansen en Andersen () . Ondanks de verschillen maken deze
cijfers duidelijk dat presenteïsme een veelvoorkomend verschijnsel is.
1.3 Determinanten van presenteïsme
Sommige onderzoekers zijn met een open vraag bij de betrokken werknemers zelf
nagegaan waarom zij soms doorwerken, ondanks gezondheidsklachten. Deze zelf
opgegeven redenen komen erop neer dat men doorwerkt om collega’s en/of cliënten
‘niet tekort te willen doen’, ‘uit loyaliteit’, dat men er als het ware ‘trots’ op is om er
‘altijd te zijn’, dat men een hoge ‘werkmoraal’ heeft en/of dat men niet improductief
aan de kantlijn wil zitten (Dew, Keefe & Small, ; Hansen & Andersen, ).
Een belangrijke sociale determinant van presenteïsme is met andere woorden de
sociale druk van collega’s om (‘gezien de hoge werkdruk’) door te werken, ofwel de
pressure to attend (Smulders & Nijhuis, ). Daarmee samenhangend vertonen ook
degenen die zichzelf in sterkere mate als onmisbaar zien, meer presenteïsme (Aronsson
et al., ; Aronsson & Gustafsson, ; Grinyer & Singleton, ), en ook als
men ‘te’ betrokken is bij zijn werk (overcommitment, Hansen & Andersen, ).
GenO2010-3.indd 195 03-08-2010 14:53:11
Gedrag & Organisatie 2010-23, nr. 3
Oorzaken en effecten van presenteïsme
196
Aangezien presenteïsme impliceert dat men (soms) gezondheidsklachten heeft, is de
factor ‘gezondheid’ een belangrijke determinant van presenteïsme (Aronsson et al.,
; Aronsson & Gustafsson, ; Hansen & Andersen, ). Onderliggende
gezondheidsklachten bij presenteïsme zijn vaak psychische klachten als depressie
(Aronsson et al., ; Burton, Pransky, Conti, Chen & Edington, ; Pilette,
), chronische vermoeidheid (Schultz et al., ), en (lage) rug- en nekklachten
(Aronsson et al., ; Burton et al., ), terwijl bijvoorbeeld luchtweginfecties in
veel mindere mate samengaan met presenteïsme (Schultz et al., ). Bovendien
vonden Burton et al. () dat verbeteringen in de gezondheidsrisico’s (minder
roken, minder stress e.d.) samenhangen met een overeenkomstige vermindering in
presenteïsme.
Sectoren met een verhoogde kans op presenteïsme zijn de gezondheidszorg (vooral
verpleging) en het onderwijs (Aronsson et al., ; Hansen & Andersen, ;
Pilette, ). Presenteïsme lijkt ook afhankelijk te zijn van de verzuimcultuur in een
organisatie. Soms wordt impliciet verwacht dat men zich volledig ‘opoffert’ voor zijn
werk, soms is er juist een tolerante verzuimcultuur, en is er een lage drempel om te
verzuimen (Dew et al., ). In andere organisaties ervaren de werknemers verzuim
juist als een risk-taking activity, die ten koste kan gaan van de interne concurrentie-
positie ten opzichte van collega’s (Grinyer & Singleton, ). In die verzuimcultuur
zal men sterker zijn geneigd om ondanks gezondheidsklachten door te werken.
Presenteïsme wordt meer gevonden bij jongeren dan bij ouderen (Hansen & Andersen,
). Dat heeft mogelijk te maken met de bevinding dat presenteïsme meer voor-
komt onder degenen met een verhoudingsgewijs slechtere (financiële) positie, een
laag inkomen (en ontevredenheid daarover), en een grotere baanonzekerheid
(Aronsson et al., ; Aronsson & Gustafsson, ; Hansen & Andersen, ;
Schultz et al., ). In dat licht zal een neergaande economie leiden tot een toename
van presenteïsme en een overeenkomstige afname van verzuim.
Werkdruk (job demands) in het algemeen (Kivimäki et al., ), maar ook specifieke
vormen van werkdruk, zoals tijdsdruk en conflicterende eisen, zijn een belangrijke
determinant van presenteïsme (Aronsson et al., ; Aronsson & Gustafsson, ;
Demerouti et al., ; Hansen & Andersen, ). Dat geldt met name als het werk
zich bij verzuim dreigt op te hopen, en er bovendien geen vervangers zijn die het werk
in de tussentijd op kunnen vangen (Johns, ).
1.4 Gevolgen van presenteïsme
Volgens Kivimäki et al. () accumuleren psychische klachten zich bij presenteïsme
en leidt presenteïsme tot verdere negatieve consequenties, zoals emotionele uitput-
ting, meer presenteïsme en toekomstig ziekteverzuim. Demerouti et al. () beves-
tigden dat presenteïsme kan leiden tot emotionele uitputting. In een prospectief
cohortonderzoek vonden Kivimäki et al. () dat werknemers met een slechte
gezondheid, maar die desondanks in drie jaar tijd niet verzuimden, beduidend meer
kans hadden op hart- en vaatziekten dan werknemers met een slechte gezondheid,
maar die een ‘normaal’ verzuimpatroon hadden. In sommige gevallen zal presenteïsme
onderdeel zijn van een manier van leven waarin men een slechte gezondheid ver-
waarloost, verzuimt om medische hulp te zoeken, en men geneigd is om niet goed
‘uit te zieken’ (Hansen & Andersen, ). Presenteïsme heeft niet alleen negatieve
GenO2010-3.indd 196 03-08-2010 14:53:11
Oorzaken en effecten van presenteïsme
197
Gedrag & Organisatie 2010-23, nr. 3
gezondheidsconsequenties, maar gaat ook ten koste van de productiviteit in kwanti-
tatieve en/of kwalitatieve zin en werkt kostenverhogend (Schultz et al., ).
Presenteïsme kan verminderde productie, productiefouten en/of ongevallen tot gevolg
hebben (Koopman et al., ).
1.5 Hypothesen
In deze studie worden de longitudinale relaties tussen werkdruk, presenteïsme, emo-
tionele uitputting en ziekteverzuim onderzocht. Ziekteverzuim wordt betrokken
aangezien ‘absenteïsme’ en ‘presenteïsme’ verschillende reacties zijn op dezelfde
gebeurtenis, het optreden van gezondheidsklachten ( Johns, ). We veronderstel-
len dat een hogere werkdruk samengaat met de neiging om ondanks gezondheids-
klachten door te werken, juist om die werkdruk op te vangen en (samen met collega’s)
te verhelpen. Hoe hoger de werkdruk, hoe eerder men de hulpbron ‘werken bij ziekte’
zal gebruiken om het evenwicht te herstellen (overeenkomstig de Conservation of
Resources Theory; Hobfoll, ). Bovendien gaan we ervan uit dat werkdruk fysieke,
cognitieve of emotionele energie kost en kan leiden tot (emotionele) uitputting.
Vervolgens nemen we aan dat doorwerken ondanks gezondheidsklachten extra ener-
gie kost om dezelfde productiviteit te bereiken als de collega’s die geen gezondheids-
klachten hebben, maar dat men die productiviteit wel zal willen bereiken, eveneens
om het evenwicht te herstellen (Hobfoll, ). Zowel de extra energie, die werken
ondanks ziekte vereist, de gezondheidsklachten zelf, als de verminderde herstelmo-
gelijkheden door presenteïsme, zullen de kans op (emotionele) uitputting vergroten.
Maar andersom geldt ook: degenen die emotionele uitputting vertonen zullen erva-
ren minder productief te zijn, en trachten dat te compenseren door meer uren te
maken en/of door met gezondheidsklachten door te werken. Dit impliceert een reci-
proke relatie tussen presenteïsme en (emotionele) uitputting.
Werkdruk en (emotionele) uitputting zijn gedocumenteerde determinanten van ziek-
teverzuim (bijv. Van der Doef & Maes, ; Borritz, Rugulies, Christensen, Villadsen
& Kristensen, ). Daarnaast veronderstellen we dat presenteïsme een vorm van
negatief copinggedrag is, mogelijk leidt tot behoud of zelfs versterking van de gezond-
heidsklachten en tot overeenkomstig verhoogd verzuim. Ten slotte zullen degenen
met verhoogd ziekteverzuim productiviteitsverlies ervaren en trachten dat verlies te
reduceren door (af en toe) ondanks gezondheidsklachten door te werken. Verhoogd
ziekteverzuim kan tevens tot later presenteïsme leiden vanwege loyaliteit met collega’s
of vanwege waargenomen sociale druk van collega’s ‘om de verloren tijd in te halen’.
Op basis van bovenstaande formuleren we de volgende hypothesen:
Hypothese 1. Werkdruk leidt tot presenteïsme en emotionele uitputting.
Hypothese 2. Er is een reciproke relatie tussen presenteïsme en emotionele uitput-
ting.
Hypothese 3. Werkdruk, presenteïsme en emotionele uitputting leiden (direct of
indirect) tot verhoogd ziekteverzuim.
Hypothese 4. Er is een reciproke relatie tussen presenteïsme en ziekteverzuim.
GenO2010-3.indd 197 03-08-2010 14:53:11
Gedrag & Organisatie 2010-23, nr. 3
Oorzaken en effecten van presenteïsme
198
Bovenstaande hypothesen vormen een causaal model, dat we met een longitudinaal
onderzoeksdesign en structurele vergelijkingsmodellen onderzoeken. Bovendien ana-
lyseren we of het beroep van de betrokkenen hierin een rol speelt. Zijn de factoren
werkdruk, presenteïsme, emotionele uitputting en ziekteverzuim afhankelijk van het
beroep, en zijn de onderlinge relaties tussen deze factoren afhankelijk van het beroep?
Met andere woorden, de vraag is of beroep een modererende factor is in de relaties
die in de hypothesen worden genoemd.
2 Methode
2.1 Respondenten
De geformuleerde hypothesen worden onderzocht met behulp van de Tweejaarlijkse
Arbeidssituatie Survey (TAS; Smulders, Andries & Otten, ), een groot monitor-
onderzoek onder een representatieve groep Nederlandse werknemers en zelfstandi-
gen, zoals uitgevoerd in  en . Hoewel het design van dit onderzoek groten-
deels serieel cross-sectioneel was (herhaalde metingen, maar bij verschillende
personen), kon een deel van de respondenten longitudinaal worden gevolgd.
Bij het samenstellen van de steekproef is gebruikgemaakt van de Intomart Respondenten
DataBank. Dit is een groot bestand respondenten van  jaar en ouder, die in het
verleden aan onderzoek hebben meegewerkt, hebben aangegeven dat ook in de toe-
komst te willen doen, en waarvan bekend is dat zij betaald werk hebben. Elk meetjaar
is een aselecte steekproef getrokken van ongeveer . personen, gestratificeerd
naar geslacht, leeftijd, opleiding en regio.
De vragenlijst werd schriftelijk toegezonden, maar bood de mogelijkheid om de lijst
op het internet in te vullen. Er werd eenmaal telefonisch gerappelleerd om aan dit
onderzoek mee te doen. Het responspercentage was elk jaar ongeveer .
In  zijn . respondenten uit  expliciet uitgenodigd om ook in  aan
het onderzoek mee toe doen. Op grond van hun unieke persoonscode en een match
op geslacht en geboortejaar, konden  respondenten worden onderscheiden die
zowel in  als in  hebben deelgenomen. Deze matching geeft voor dat
gedeelte van de steekproef een cohortstudie, waarmee de huidige onderzoeksvragen
longitudinaal kunnen worden onderzocht. In de analyses zijn zowel werknemers als
zelfstandigen betrokken, maar het aantal zelfstandigen is te klein om als inhoudelijke
factor in de analyses op te nemen.
2.2 Representativiteit
Met behulp van proportionele weging is in de analyses gecorrigeerd voor de non-
respons, en wel zodanig dat de verdeling op geslacht, leeftijd, opleiding, stedelijk-
heidsgraad en bedrijfssector representatief is voor Nederlandse werknemers en zelf-
standigen in het algemeen. Proportionele weging houdt in dat er weliswaar wordt
gewogen, maar dat het gemiddelde weeggewicht gelijk is aan één. Het aantal vrij-
heidsgraden in de statistische toetsen wordt met andere woorden niet kunstmatig
opgehoogd. In de uiteindelijke analyses is gebruik gemaakt van replicatie- of ‘frequen-
cy’-weging. Hierbij worden de puntschattingen (gemiddelden, correlatie- en regres-
GenO2010-3.indd 198 03-08-2010 14:53:11
Oorzaken en effecten van presenteïsme
199
Gedrag & Organisatie 2010-23, nr. 3
siecoëfficiënten) correct gecorrigeerd, maar bestaat het gevaar dat de standaardfouten
worden onderschat en de p-waarden overschat. De correlatietabel (tabel ) is echter
nagerekend met ‘probability’-weging, met correctie van de standaardfout. De verschil-
len in p-waarden ten opzichte van ‘frequency’-weging bleken in praktijk te verwaar-
lozen.
2.3 Operationalisatie van constructen
De werkdrukschaal is afkomstig van de Job Content Questionnaire (Karasek, Brisson,
Kawakami, Houtman, Bongers et al., ), vertaald en bewerkt door Houtman,
Goudswaard, Dhondt, Van der Grinten, Hildebrandt et al. (). Gevraagd wordt
of men erg snel moet werken, of men heel veel werk moet doen, extra hard moet
werken, of men te weinig tijd heeft om zijn of haar werk af te maken, en of het werk
hectisch is, met mogelijke antwoorden op een -puntsschaal ( = nooit –  = altijd).
In de longitudinale’ groep respondenten was de betrouwbaarheid van deze werkdruk-
schaal in beide metingen hoog (tabel ).
De vraag omtrent presenteïsme is gebaseerd op Aronsson et al. (), en luidde
zowel in  als in : ‘Is het de afgelopen  maanden voorgekomen dat u bent
gaan werken, terwijl u dacht dat u zich eigenlijk ziek had moeten melden? ( = nee,
= ja, wel eens,  = ja, meerdere keren).’ Degenen die helemaal niet ziek hebben
doorgewerkt (‘nee’) vergelijken we met degenen die dat ‘wel eens’ of ‘meerdere keren’
hebben gedaan.
Emotionele uitputting is in beide jaren gemeten met vijf items van de Utrechtse
Burnout Schaal (UBOS, Schaufeli & Van Dierendonck, ). Emotionele uitputting
vormt naast depersonalisatie en twijfel aan de persoonlijke bekwaamheid een van de
belangrijkste aspecten van burnout. Gevraagd werd of men zich mentaal uitgeput
voelt door het werk, of men zich aan het einde van de werkdag leeg voelt, of men zich
al vermoeid voelt bij het opstaan, of men een hele dag werken een zware belasting
vindt, en of men zich opgebrand voelt door het werk ( = nooit –  = dagelijks). In de
‘longitudinale’ groep respondenten was de betrouwbaarheid van deze emotionele
uitputtingschaal in beide metingen hoog (tabel ).
Verzuim is nagevraagd met: ‘Bent u de laatste  maanden wel eens van uw werk thuis
gebleven wegens ziekte of ongeval (nee/ja)?’ In  is vervolgens alleen gevraagd hoe
vaak men had verzuimd; in  bovendien hoeveel dagen men had verzuimd. Het
antwoord: ‘nee, niet verzuimd’ hebben we gesteld op ‘ keer’ respectievelijk ‘ ver-
zuimdagen’. Meer dan vijf keer verzuim is samengenomen met vijf keer verzuim, en
meer dan één maand verzuim met één maand verzuim. Vaker of langer verzuim kwam
slechts zelden voor, en zo wordt voorkomen dat extreme waarden onevenredig veel
invloed hebben. Het aantal keren verzuim in  fungeert in de analyses als deter-
minant; het aantal verzuimdagen in  als uitkomstmaat. Hoewel een consistente
meting de voorkeur had verdiend, is in het onderzoek in  niet gevraagd naar het
aantal verzuimdagen. Het aantal keren verzuim en het aantal dagen verzuim is in de
meting van  echter positief en sterk gecorreleerd (r = +.), hetgeen erop duidt
dat het om hetzelfde concept gaat.
Op exploratieve wijze gaan we tevens na of de onderzochte relaties afhankelijk zijn
van het beroep van de respondent. We onderscheiden daarbij de volgende beroeps-
groepen:
GenO2010-3.indd 199 03-08-2010 14:53:11
Gedrag & Organisatie 2010-23, nr. 3
Oorzaken en effecten van presenteïsme
Tabel 1 Gemiddelden, standaarddeviaties en intercorrelaties van de studievariabelen (N = 653, listwise deletion)
M SD
α1 2 3 4 5 6 7 8 9 10 11 12 13
1Geslacht (0 = man, 1 = vrouw) .47 .50 –
2Leeftijd (jaar) 41.4 9.5 –.11**
3Opleiding (1 = LBO,
2 = MBO, 3 = HTS/TH/WO)
2.04 .75 .14*** –.19***
4‘Blue collar’ beroep
(0 = nee, 1 = ja)
.24 .43 –.35*** –.02 –.41***
5‘White collar’ beroep
(0 = nee, 1 = ja)
.32 .47 .00 .01 .27*** –.38***
6Contactueel beroep
(0 = nee, 1 = ja)
.44 .50 .30*** .01 .10** –.50*** –.61***
7Werkdruk
(1 = nooit – 4 = altijd), 2002
2.47 .56 .82 –.05 .08 .09* –.05 .08* –.03
8Presenteïsme (0 = nee, 1 = ja),
2002
.60 .49 – –.05 –.01 –.05 –.02 –.08* .09* .16***
9Emotionele uitputting (1 =
nooit – 7 = dagelijks), 2002
2.59 1.34 .90 –.02 .03 .07 –.03 –.02 .04 .34*** .34*** –
10 Aantal keer verzuim
(laatste 12 maanden), 2002
1.01 1.19 .03 –.07 .09* .00 –.02 .02 .03 .25*** .28*** –
11 Werkdruk (1 = nooit –
4 = altijd), 2004
2.45 .53 .81 –.05 .06 .07 –.03 .00 .02 .62*** .17*** .26*** .03
12 Presenteïsme (0 = nee, 1 = ja),
2004
.58 .49 –.02 –.10* –.01 –.03 –.14*** .15*** .07 .39*** .26*** .22*** .18*** –
13 Emotionele uitputting (1 =
nooit – 7 = dagelijks), 2004
2.53 1.39 .91 –.04 –.02 .10** –.03 .04 –.01 .25*** .27*** .65*** .20*** .38*** .34*** –
14 Aantal verzuimdagen
(laatste 12 maanden), 2004
5.80 8.82 .06 .05 –.14*** .04 –.03 .00 .07 .16*** .20*** .33*** .09* .24*** .19***
M: gemiddelde; SD: Standaard Deviatie; α: Cronbachs betrouwbaarheidscoëfficiënt; * p < .05; ** p < .01; *** p < .001
GenO2010-3.indd 200 03-08-2010 14:53:11
Oorzaken en effecten van presenteïsme
201
Gedrag & Organisatie 2010-23, nr. 3
1 ‘Blue collar’: de beroepsgroep met onder meer agrarische, ambachtelijke of indus-
triële werkzaamheden, waarin het accent ligt op manueel technisch werk.
2 ‘White collar’: de beroepsgroep met voornamelijk administratieve- en andere
kantoorwerkzaamheden, waarin het accent vooral ligt op cognitief werk.
3 ‘Contactueel ’: de beroepsgroep met werkzaamheden in vooral het onderwijs, de
gezondheidszorg, in de handel en in het verkeer e.d., die als gemeenschappelijk
kenmerk hebben dat het contactuele werkzaamheden betreft, waarin men direct
en veel contact heeft met patiënten, leerlingen, klanten, passagiers e.d. De aan
de respondenten gestelde beroepsvraag met veertig categorieën is samengevat
tot deze drie hoofdgroepen.
2.4 Analyses
De hypothetisch geformuleerde causale relaties worden geanalyseerd met behulp van
structurele vergelijkingsmodellen (Structural Equations Modeling, SEM; Jöreskog &
Sörbom, ). Deze relaties worden achtereenvolgens in een aantal hiërarchisch
geordende modellen opgenomen, en de ‘fit’ van de achtereenvolgende modellen wordt
vergeleken en getoetst. De fit is de mate waarin de gemodelleerde relaties in staat zijn
om de waargenomen correlaties (tabel ) te reproduceren. In hun SEM-overzichtsartikel
concluderen MacCallum en Austin () dat de Root Mean Square Error of
Approximation (RMSEA) de meest geschikte maat is voor de absolute fit. Een RMSEA
boven de . duidt op een slecht passend model en een RMSEA onder de . op een
goed passend model. Daarnaast gebruiken we een incrementele fit-index (Normed Fit
Index, NFI, waarbij een waarde boven de . duidt op een acceptabele fit), en ook
een parsimony fit-index (de Parsimony Normed Fit Index, PNFI).
In alle onderzochte structurele modellen zijn de stabiliteitspaden opgenomen, het
effect van bijvoorbeeld presenteïsme in  op presenteïsme in . Met deze
stabiliteitspaden wordt gecorrigeerd voor de situatie in , en daarmee worden in
wezen de veranderingen van  naar  geanalyseerd. Bij deze analyses is boven-
dien consequent in alle modellen statistisch gecorrigeerd voor de mogelijk verstorende
variabelen geslacht, leeftijd en opleiding. Deze covariaten worden verondersteld direct
effect te hebben op de variabelen uit , en alleen indirect op de variabelen in .
Tussen de variabelen die in hetzelfde jaar zijn gemeten wordt een associatie, maar
geen causale samenhang gemodelleerd.
Aanvullend wordt onderzocht of de gevonden relaties afhankelijk zijn van het type
beroep waarin men werkzaam is, dus of beroep een modererende variabele is. Van de
nominale variabele ‘beroep’ (‘blue collar’-, ‘white collar’- en contactuele beroepen),
zijn twee dummy’s gemaakt, waarbij de tweede en de derde categorie worden verge-
leken met de eerste (‘indicator’-contrast). Vervolgens zijn de geëigende interactieter-
men berekend en opgenomen in het causale model. Bij het berekenen van de inter-
actietermen zijn (de dummys van) de hoofdfactoren gecentreerd om ongewenste
afhankelijkheid en multicollineariteit tussen de hoofdfactoren en de interactietermen
te vermijden (Aiken & West, ).
Aangezien de afhankelijke variabele presenteïsme in  dichotoom is, is het uit-
eindelijk gefitte SEM-model nagerekend met de voor een dichotome afhankelijke
variabele meest geëigende statistische analyse, namelijk logistische regressie. De resul-
taten van beide analyses bleken consistent. Op basis van de (logistische) regressie-
GenO2010-3.indd 201 03-08-2010 14:53:12
Gedrag & Organisatie 2010-23, nr. 3
Oorzaken en effecten van presenteïsme
202
analyse zijn multivariaat gemodelleerde proporties en gemiddelden van de afhanke-
lijke variabelen berekend, met name om de interactie-effecten in figuren weer te geven
en te interpreteren.
Ter controle is de ‘longitudinale groep vergeleken met de overige ofwel de ‘cross-
sectionele’ respondenten. De ‘longitudinale’ groep bleek echter niet in sterke mate af
te wijken van de overige respondenten. In de ‘longitudinale’ groep zitten weliswaar
iets meer vrouwen () dan in de ‘cross-sectionele’ groep (, p < .), maar er zijn
geen significante verschillen tussen deze groepen in opleiding of beroep. De ‘longi-
tudinale’ groep is iets ouder (. jaar in ) dan de ‘cross-sectionele’ groep (. jaar
in ; p < .), maar op de prevalentie van de in deze context belangrijkste varia-
bele, presenteïsme, verschillen deze groepen niet.
3 Resultaten
In  gaf  van de ‘longitudinale’ groep aan dat zij het afgelopen jaar wel eens
hadden doorgewerkt ondanks ziekte, en in  was dat . Deze percentages zijn
niet significant verschillend (McNemar-toets, p < .).
Of in bepaalde subgroepen vaker presenteïsme voorkomt, is onderzocht in de ‘cross-
sectionele’ groep, met beide jaargangen gecombineerd. In deze studie hangt presen-
teïsme niet samen met leeftijd. Van de vrouwen rapporteerde  presenteïsme in de
laatste twaalf maanden, van de mannen was dat significant minder (, p < .).
Presenteïsme vinden we in mindere mate bij de hoger opgeleiden (), dan bij de
respondenten met een lage of gemiddelde opleiding (. p < .). Ook in deze
studie kwam presenteïsme meer voor onder degenen met een contactueel beroep
(), vooral in vergelijking met ‘white collar’-beroepen (). Het meeste presen-
teïsme werd gevonden onder leraren en docenten ().
In tabel wordt een overzicht gegeven van de gemiddelden, standaarddeviaties,
betrouwbaarheden en intercorrelaties van de studievariabelen. De gemiddelde score
op de werkdrukschaal ( = nooit –  = altijd) was in  . (SD = .) en in 
. (SD = .); deze scores verschillen niet significant. De gemiddelde score op de
emotionele uitputtingschaal ( = nooit –  = dagelijks) was in  . (SD = .)
en in  . (SD = .), en ook deze scores verschillen niet significant. In de
‘longitudinale’ groep verzuimde in   ten minste één keer, in  is dat vrijwel
gelijk, . Het gemiddelde aantal keer verzuim onder degenen die verzuimden, was
in  gemiddeld . keer, en in  . keer (n.s.).
In het uitgangsmodel zijn alleen de zogeheten stabiliteitspaden opgenomen (model 
in tabel ), waarin elk van de uitkomstvariabelen in  alleen wordt verklaard door
de overeenkomstige variabele in . In model  zijn de paden van de ‘normale’ cau-
sale samenhang toegevoegd (de doorgetrokken lijnen in figuur ). Hiermee wordt de
fit van het model ten opzichte van het stabiliteitsmodel slechts marginaal beter (p(∆χ)
< .). Vervolgens zijn in model  naast de stabiliteitspaden (model ) alleen de ‘omge-
keerde’ causaliteitspaden gemodelleerd (de onderbroken lijnen in figuur ). Hiermee
wordt de fit van het model ten opzichte van het stabiliteitsmodel significant beter
(p(∆χ) < .). In model  zijn beide typen causale paden tegelijkertijd gemodelleerd,
hetgeen een betere fit geeft dan zowel model  (p(∆χ) < .) als model  (p(∆χ) <
GenO2010-3.indd 202 03-08-2010 14:53:12
Oorzaken en effecten van presenteïsme
203
Gedrag & Organisatie 2010-23, nr. 3
.). In model zijn vervolgens de hoofdeffecten van ‘beroep’ toegevoegd (niet in
figuur  weergegeven). Ook de factor ‘beroep’ draagt significant bij aan de fit van het
model (p(∆χ) < .). Ten slotte zijn in model de interactietermen toegevoegd,
waarmee de modererende invloed van beroep wordt gemodelleerd. Hoewel de toevoe-
ging van deze interactietermen de fit van het model slechts marginaal verbetert (p(∆χ)
< .), brengen we de interacties voor exploratieve doeleinden nader in beeld.
Tabel 2 Goodness-of-fit statistieken van de structurele vergelijkingsmodellen van
werkdruk, presenteïsme, emotionele uitputting, verzuim en beroep,
gecorrigeerd voor geslacht, leeftijd en opleiding (N = 653)
Model χ2
df p
RMSEA NFI PNFI Contrast ∆χ2
df p(
∆χ2)
1Stabiliteitsmodel 152.7 64 .001 .046 .96 .29
2Normale causale
model
140.7 58 .001 .047 .96 .27 M2 vs M1 12.0 6 .06
3Omgekeerde
causale model
127.0 58 .001 .043 .96 .27 M3 vs M1 25.7 6 .001
4Reciproke model 112.4 52 .001 .042 .97 .24 M4 vs M2
M4 vs M3
28.3
14.6
6
6
.001
.02
5Toevoeging hoofd-
effect beroep
(dummy’s)
89.8 44 .001 .040 .98 .20 M5 vs M4 22.6 8 .004
6Toevoeging
interactie-effecten
met beroep
45.3 12 .001 .065 .99 .06 M6 vs M5 44.5 32 .07
RMSEA: Root Mean Square Error of Approximation; NFI: Normed Fit Index; PNFI: Parsimony Normed
Fit Index; df: vrijheidsgraden
In figuur  worden de resultaten van model  samengevat. In dit model wordt
gecorrigeerd voor geslacht, leeftijd, opleiding en beroep, maar deze paden worden
niet getoond. Door de gecentreerde interactietermen betreft het model het ‘gemid-
delde’ beroep (ook de beroepsdummy’s zijn gecentreerd bij het berekenen van de
interactietermen). De stabiliteitspaden zijn niet weergegeven in figuur , maar zijn,
als verwacht, sterk: de werkdruk in  wordt het beste verklaard door de werk-
druk in  (β = +., p < .), presenteïsme in  het beste door presenteïsme
in  (β = +., p < .), en hetzelfde geldt voor emotionele uitputting (β = +.,
p < .) en verzuim (β = +., p < .).
Uit de analyses bleek dat emotionele uitputting in sterkere mate leidt tot presenteïsme
twee jaar later (β = +., p < .), dan dat presenteïsme leidt tot emotionele uitputting
(β = +., n.s.). Evenzo leidt verzuim in sterkere mate tot presenteïsme twee jaar later
(β = +., p < .), dan dat presenteïsme leidt tot verzuim twee jaar later (β = +., n.s.).
Tot slot werd gevonden dat, gecorrigeerd voor alle andere factoren, emotionele uitput-
ting leidt tot een significant verhoogd aantal verzuimdagen twee jaar later (β = +.,
p < .).
GenO2010-3.indd 203 03-08-2010 14:53:12
Gedrag & Organisatie 2010-23, nr. 3
Oorzaken en effecten van presenteïsme
204
In model  werden geen significante hoofdeffecten van de factor ‘beroep’ gevonden,
al was er een tendens dat presenteïsme ook multivariaat meer voorkomt in de con-
tactuele beroepsgroep (β = +., p < .). Daarnaast blijkt de factor ‘beroep’ de invloed
van de overige determinanten significant te modereren; er werden multivariaat vier
significante interactie-effecten gevonden.
Allereerst heeft ‘beroep’ effect op de stabiliteit van presenteïsme (figuur ). In de
‘white collar’- en contactuele beroepen is deze stabiliteit beduidend groter dan in de
‘blue collar’-beroepen. Werkt iemand met een ‘white collar’- of contactueel beroep
ondanks gezondheidsklachten door, dan is de kans groot dat hij of zij dat twee jaar
later ook zal doen. In de blue collar’-beroepen is presenteïsme veel minder voorspel-
lend voor de kans dat hij of zij dat twee jaar later nog steeds zal vertonen.
Het tweede significante interactie-effect wordt geïllustreerd in figuur . Hier zien we
opnieuw dat emotionele uitputting positief samenhangt met presenteïsme twee jaar
later. Het effect van emotionele uitputting op presenteïsme is echter beduidend ster-
ker in de ‘blue collar’-beroepen, dan in de andere twee beroepen.
Het derde significante interactie-effect is dat tussen beroep en verzuim op presente-
isme twee jaar later (figuur ). Eerder zagen we al dat verzuim een voorspeller is van
presenteïsme, hier wordt geïllustreerd dat dat verband beduidend sterker is bij de blue
collar’-beroepen dan bij de andere twee beroepen.
Ten slotte is er een significante interactie tussen ‘beroep’ en ‘werkdruk’ op het aantal
verzuimdagen twee jaar later (figuur ). In de ‘white collar’ beroepen zien we dat
naarmate de werkdruk groter is, er twee jaar later meer wordt verzuimd, terwijl we in
de ‘blue collar’ beroepen zien dat naarmate de werkdruk groter is, er twee jaar later
juist minder wordt verzuimd.
Werkdruk 2002
ß=.05
ß=–. 01
ß=.05
ß= . 11**
ß=–.03
ß=.02
ß=.06
ß=.13***
ß= . 11**
ß=.00
Werkdruk 2004
Presenteïsme 2004
Emotionele
uitputting 2004
Verzuim 2004
Presenteïsme 2002
Emotionele
uitputting 2002
Verzuim 2002
ß=.06
ß=.01
Figuur 1 Eindresultaat longitudinale structurele vergelijkingsmodel met multivariaat
gecorrigeerde en gestandaardiseerde regressiecoëfficiënten (N = 653;
*p < .05; **p < .01; ***p < .001)
GenO2010-3.indd 204 03-08-2010 14:53:12
Oorzaken en effecten van presenteïsme
205
Gedrag & Organisatie 2010-23, nr. 3
Presenteïsme, 2002
Contactueel werk
‘White collar’-werk
‘Blue collar’-werk
25%
Nee Ja
Presenteïsme, 200 4
35%
45%
55%
65%
75%
85%
Figuur 2 Met logistische regressieanalyse multivariaat gecorrigeerde proportie
presenteïsme in 2004, naar presenteïsme in 2002 en naar beroep (N =
653)
Emotionele uitputting (1=nooit – 7=dagelijks), 2002
Contactueel werk
‘White collar’-werk
‘Blue collar’-werk
30%
Presenteïsme, 2004
35%
0,9 1,4 1,9 2,4 2,9 3,4 3,9
45%
55%
65%
75%
40%
50%
60%
70%
80%
Figuur 3 Met logistische regressieanalyse multivariaat gecorrigeerde proportie
presenteïsme in 2004, naar emotionele uitputting in 2002 en naar beroep.
Lijnen lopen van M–1 SD tot M+1 SD van betrokken beroepsgroep op
hun emotionele uitputtingscore in 2002 (N = 653)
GenO2010-3.indd 205 03-08-2010 14:53:12
Gedrag & Organisatie 2010-23, nr. 3
Oorzaken en effecten van presenteïsme
206
Aantal keren verzuim (laatste jaar), 2002
Contactueel werk
‘White collar’-werk
‘Blue collar’-werk
Presenteïsme, 2004
0,0
40%
45%
50%
55%
60%
65%
70%
75%
1,0 2,0
Figuur 4 Met logistische regressieanalyse multivariaat gecorrigeerde proportie
presenteïsme in 2004, naar aantal keer verzuim in 2002 en naar beroep.
Lijnen lopen van 0 tot M+1 SD van betrokken beroepsgroep op verzuim
in 2002 (N = 653)
Werkdruk (1=nooit – 4=altijd), 2002
Contactueel werk
‘White collar’-werk
‘Blue collar’-werk
4,5
Aantal dagen verzuim
(laatste jaar), 2004
5,0
5,5
6,0
6,5
7, 0
7,5
8,0
1,8 2,0 2,2 2,4 2,6 2,8 3,0
Figuur 5 Met lineaire regressieanalyse multivariaat gecorrigeerde aantal
verzuimdagen in 2004, naar werkdruk in 2002 en naar beroep. Lijnen
lopen van M–1 SD tot M+1 SD van betrokken beroepsgroep op hun
werkdrukscore in 2002 (N = 653)
GenO2010-3.indd 206 03-08-2010 14:53:13
Oorzaken en effecten van presenteïsme
207
Gedrag & Organisatie 2010-23, nr. 3
4 Discussie
4.1 Belangrijkste bevindingen
In deze studie zijn de longitudinale relaties onderzocht tussen werkdruk, presente-
isme, emotionele uitputting en ziekteverzuim. Daarbij is gebruikgemaakt van her-
haalde metingen op zowel de determinanten als de uitkomstmaten. Het betreft een
volledig cross-lagged panel onderzoek met twee metingen (Zapf, Dormann & Frese,
).
In de onderzochte groep vertoonde in   en in   presenteïsme (had
in het laatste jaar ondanks gezondheidsklachten doorgewerkt).
Er werden in dit onderzoek geen longitudinale verbanden gevonden tussen de factor
‘werkdruk’ en de andere variabelen (hypothese  niet bevestigd).
Emotionele uitputting leidde als verwacht wel tot presenteïsme twee jaar later (hypo-
these ). Dat is consistent met de redenering dat degenen die emotionele uitputting
vertonen, zullen ervaren dat zij minder productief zijn dan ze zelf zouden willen,
hetgeen extra stress zal genereren. Vervolgens zal men trachten dat te compenseren
door extra werk te verzetten, onder meer door ook te werken terwijl men zich eigen-
lijk ziek voelt (overeenkomstig de Conservation of Resources Theory, Hobfoll, ).
Er werd echter geen reciproke relatie gevonden, emotionele uitputting in  werd
niet verklaard door presenteïsme in .
Emotionele uitputting leidde als verwacht tot verhoogd verzuim twee jaar later
(hypothese ). Dit onderstreept de rol die emotionele uitputting, een belangrijke
component van burnout, speelt bij het ontstaan van verzuim op grond van psychische
klachten, en deze relatie wordt ook elders gevonden (bijvoorbeeld Borritz et al., ).
Mogelijk verhoogt emotionele uitputting de kans op somatische klachten, die aan-
leiding geven tot verzuim; deze relatie wordt echter ook verklaard door de Conservation
of Resources Theory. Hobfoll () beschouwt emotionele uitputting en burnout als
een vorm van stress, die ontstaat als het investeren van tijd en energie niet leidt tot
herstel of vernieuwing van hulpbronnen. In dat perspectief kan ziekteverzuim worden
beschouwd als een strategie om energie te besparen en verdere emotionele uitputting
te voorkomen, respectievelijk daarvan te herstellen (Borritz et al., ; Hobfoll,
).
Verzuim in  bleek een directe determinant te zijn van presenteïsme in 
(hypothese ). Daarbij is gecorrigeerd voor emotionele uitputting in . Degenen
met verhoogd verzuim zullen het ervaren productiviteitsverlies door dat verzuim
gedeeltelijk willen compenseren, en de neiging hebben om later ondanks gezond-
heidsklachten door te werken. Dat kan worden versterkt door interne motivatie,
vanwege loyaliteit met collega’s of door sociale druk van collega’s, en is in overeen-
stemming met de Conservation of Resources Theory (Hobfoll, ). In dit onderzoek
was de relatie tussen presenteïsme en verzuim echter niet reciprook.
Aanvullend vonden we ook in deze studie dat presenteïsme meer voorkomt bij jon-
geren dan bij ouderen, en ook meer bij lager dan bij hoger opgeleiden. Dit bevestigt
dat presenteïsme gedeeltelijk wordt bepaald door sociaaleconomische motieven.
Degenen die bijvoorbeeld vanwege minder scholing twijfels hebben omtrent hun
persoonlijke economische positie en/of minder baanzekerheid hebben, zullen eerder
geneigd zijn om ondanks gezondheidsklachten door te werken.
GenO2010-3.indd 207 03-08-2010 14:53:13
Gedrag & Organisatie 2010-23, nr. 3
Oorzaken en effecten van presenteïsme
208
4.2 De invloed van beroep
Ook in dit onderzoek bleek presenteïsme zich het meeste voor te doen in ‘contactu-
ele’ beroepen (Aronsson et al., ; Hansen & Andersen, ; Pilette, ; Schultz
et al., ), vooral onder leraren en docenten. Mogelijk zijn vervangers hier niet snel
voorhanden of ervaart men zichzelf in sterkere mate onmisbaar.
De verwachting werd bevestigd dat de relaties tussen de onderzochte variabelen niet
in alle beroepsgroepen hetzelfde zijn, en er van moderatie sprake is. Het gebrek aan
verbanden met werkdruk in de hele groep wordt mogelijk veroorzaakt doordat er
rond werkdruk in verschillende beroepsgroepen verschillende processen spelen.
Mogelijk manifesteert de relatie tussen werkdruk en presenteïsme zich daarom eerder
in onderzoek dat zich beperkt tot één homogene beroepsgroep, bijvoorbeeld verpleeg-
kundigen (Demerouti et al., ). Werkdruk kan enerzijds leiden tot emotionele
uitputting, respectievelijk verzuim; maar werkdruk kan tevens leiden tot een toege-
nomen ervaren noodzakelijkheid om juist aan het werk te blijven, bijvoorbeeld om
de collega’s te helpen de werkdruk ‘weg te werken (pressure to attend, Smulders &
Nijhuis, ). Het eerste proces doet zich mogelijk meer voor in ‘white collar’-
beroepen; het tweede mogelijk meer in ‘blue collar’-beroepen. In de hele groep samen
wordt dan geen verband gevonden, in de subgroepen wel. Dit wordt bevestigd door
de multivariate analyse naar de interactie tussen beroep en werkdruk op verzuim
(figuur ). In de contactuele beroepen zien we geen relatie tussen werkdruk en ver-
zuim, in de ‘white collar’-beroepen een positief verband (hoe meer werkdruk hoe
meer verzuim), en in de ‘blue collar’ beroepen een negatief verband (hoe meer werk-
druk hoe minder verzuim). Mogelijk houdt een hoge werkdruk vooral in de ‘blue
collar’-beroepen een hogere ervaren noodzaak in om te blijven werken, en zal men
ondanks gezondheidsklachten in meer gevallen doorwerken en dus in minder geval-
len verzuimen. In de ‘white collar’-beroepen zien we eerder dat werkdruk, mogelijk
via emotionele uitputting, leidt tot verhoogd verzuim.
De tweede interactie (figuur ) duidt erop dat de stabiliteit van presenteïsme in de
‘blue collar’-beroepen beduidend kleiner is dan in de andere beroepen. Dat betekent
dat presenteïsme in de contactuele en in de ‘white collar’-beroepen in opeenvolgende
jaren vooral dezelfde personen betreft, terwijl presenteïsme in de ‘blue collar’-beroe-
pen een meer incidenteel verschijnsel lijkt te zijn, dat zich bij telkens verschillende
personen voordoet, wellicht als reactie op acuut verhoogde werkdruk.
De derde interactie (figuur ) duidt erop dat het effect van emotionele uitputting op
presenteïsme sterker is in de ‘blue collar’-beroepen dan in de andere beroepen, en
hetzelfde geldt voor het effect van verzuim op presenteïsme (figuur ). Dit lijkt erop
te wijzen dat men vooral in de ‘blue collar’-beroepen na een episode van emotionele
uitputting en verzuim de ervaren reductie in productiviteit tracht te compenseren
met presenteïsme. Mogelijk is ziekteverzuim vooral in de ‘blue collar’-beroepen een
activiteit die de waargenomen interne concurrentiepositie in gevaar kan brengen, en
is men in die beroepsgroep eerder geneigd om het met het verzuim genomen ‘risico’
te compenseren door af en toe ondanks gezondheidsklachten door te werken.
4.3 Beperkingen
Deze studie kent enkele beperkingen waarmee bij de interpretatie van de resultaten
rekening moet worden gehouden. Allereerst zijn de gegevens verzameld met behulp
GenO2010-3.indd 208 03-08-2010 14:53:13
Oorzaken en effecten van presenteïsme
209
Gedrag & Organisatie 2010-23, nr. 3
van zelf ingevulde vragenlijsten en de daarmee gepaard gaande sociale wenselijkheid
en andere meetproblemen zoals common method variance (Spector, ). Voor een
deel wordt dat ondervangen door het gebruik van betrouwbare schalen, waarmee
bijvoorbeeld emotionele uitputting indirect wordt geoperationaliseerd. Zou zonder
omwegen worden gevraagd in welke mate men bijvoorbeeld emotionele uitputting
ervaart, dan zou sociale wenselijkheid een grote rol spelen. Door afzonderlijk naar
een aantal concrete aspecten van emotionele uitputting te vragen, wordt het effect
van sociale wenselijkheid kleiner. Ook doordat het om een longitudinaal onderzoek
gaat, is het gevaar dat relaties ontstaan door common method variance kleiner, aangezien
de variabelen in  worden gecorrigeerd voor de common method variance in .
Ook ziekteverzuim is gemeten met behulp van zelfrapportage. Ferrie, Kivimäki, Head,
Shipley, Vahtera et al. () concludeerden echter op grond van een vergelijking
tussen zelfrapportage en geregistreerd verzuim, dat er een relatief grote overeenstem-
ming is tussen zelfgerapporteerd verzuim en geregistreerd verzuim. Zij vonden
bovendien met beide methoden equivalente relaties met andere variabelen. De
Vroome, Koppes, Smulders & Van den Bossche () kwamen op grond van
Nederlandse gegevens tot dezelfde conclusie.
Een andere beperking is dat presenteïsme slechts met één item is gemeten, en de
betrouwbaarheid daarmee niet goed is te evalueren. Ook is door de beperkte vraag-
stelling niet duidelijk hoe vaak en om welke redenen men ondanks ziekte toch is
blijven werken. De gehanteerde maat voor presenteïsme heeft zich echter in eerder
onderzoek bewezen (Aronsson et al., ; Demerouti et al, ; Hansen &
Andersen, ). Bovendien is er een sterke correlatie tussen presenteïsme in 
en in  (r = .), hetgeen een redelijke test-hertestbetrouwbaarheid indiceert. Een
meer gedetailleerde meting van presenteïsme zou echter de voorkeur hebben en zou
mogelijk tot sterkere en beter interpreteerbare relaties leiden.
De tijd tussen de twee metingen besloeg vanwege organisatorische overwegingen
twee jaar. Hiermee is aan een van de noodzakelijke voorwaarden om causaliteit vast
te stellen voldaan: de effecten zijn later gemeten dan de mogelijke oorzaken. Het
causale interval van twee jaar is echter nog steeds relatief kort, gezien de geconsta-
teerde grote mate van stabiliteit in vooral presenteïsme. Om daadwerkelijk verande-
ringen te analyseren zou een langer tijdsinterval zijn te prefereren.
4.4 Conclusie
De betrokken literatuur en dit onderzoek laten zien dat er een wisselwerking is tus-
sen werkdruk, emotionele uitputting, verzuim en presenteïsme. Doorgaan met werken
ondanks gezondheidsklachten (dan wel na verzuim te vroeg aan het werk gaan), lijkt
op korte termijn qua productiviteit gunstig te zijn in vergelijking met volledig ver-
zuim, maar kan uiteindelijk via onder meer emotionele uitputting en gebrek aan
herstelmogelijkheden leiden tot verhoogde gezondheidsklachten en daarmee samen-
gaand toekomstig verzuim. Als de drempel om te verzuimen te hoog wordt gelegd,
dan kan dat in de hand werken dat men ondanks gezondheidsklachten doorwerkt,
en zal de productiviteit uiteindelijk juist lager zijn. Het meest effectief zal zijn om
presenteïsme en verzuim te voorkomen door emotionele uitputting tegen te gaan, een
van de belangrijkste determinanten van zowel presenteïsme als verzuim.
GenO2010-3.indd 209 03-08-2010 14:53:13
Gedrag & Organisatie 2010-23, nr. 3
Oorzaken en effecten van presenteïsme
210
Praktijkbox
Hoewel doorwerken ondanks gezondheidsklachten kan duiden op motivatie en •
loyaliteit aan bedrijf en collega’s, zal dat op de wat langere termijn contraproduc-
tief uitwerken voor de werknemer en de organisatie.
Gezondheidsklachten kunnen leiden tot ziekteverzuim of tot presenteïsme en daar-•
mee tot productiviteitsverlies. Organisaties zouden onder meer met behulp van
gezondheids- en fitness check-ups, adequate verzuimbegeleiding, ergonomisch
verantwoorde arbeidsomstandigheden en het ondersteunen van gezondheids-
bevorderend gedrag op de werkvloer, de gezondheid van werknemers moeten
monitoren en zo nodig op peil houden.
Aangezien emotionele uitputting een van de belangrijkste determinanten is van •
presenteïsme en van verzuim, verdient het aanbeveling om aan emotionele
uitputting speciale aandacht te besteden tijdens het monitoren van de werkne-
mersgezondheid, in gezondheidsbevorderende programma’s en in individuele
voortgangsgesprekken.
Verzuiminterventies en de algemene verzuimcultuur in een organisatie mogen •
niet expliciet of impliciet een te sterke nadruk leggen op het ‘ten koste van alles’
voorkomen van verzuim. Als men serieuze gezondheidsklachten heeft, dan moe-
ten werknemers worden ondersteund en (financieel) in staat worden gesteld om te
verzuimen en ‘uit te zieken’, om daarmee presenteïsme en de negatieve gevolgen
daarvan te ontmoedigen.
Noot
Dit onderzoek werd uitgevoerd in het kader van structureel door de overheid aan TNO 1.
toegekende middelen op het beleidsterrein van het Ministerie van Sociale Zaken en
Werkgelegenheid.
Literatuur
Aiken, L.S. & West, S.G. (). Multiple regression: Testing and interpreting interactions.
Newbury Park: Sage.
Aronsson, G., Gustafsson, K. & Dallner, M. (). Sick but yet at work: An empirical
study of sickness presenteeism. Journal of Epidemiology and Community Health, 54, -
.
Aronsson, G. & Gustafsson, K. (). Sickness presenteeism: Prevalence, attendance-
pressure factors, and an outline of a model for research. Journal of Occupational and
Environmental Medicine, 47, -.
Borritz, M., Rugulies, R., Christensen, K.B., Villadsen, E. & Kristensen, T.S. ().
Burnout as a predictor of self-reported sickness absence among human service workers:
Prospective findings from three year follow up of the PUMA study. Journal of
Occupational and Environmental Medicine, 63, -.
Burton, W.N., Pransky, G., Conti, D.J., Chen, C.-Y. & Edington, D.W. (). The
association of medical conditions and presenteeism. Journal of Occupational and
Environmental Medicine, 46, (Suppl.), S-S.
Burton, W.N., Chen, C.-Y., Conti, D.J., Schultz, A.B. & Edington, D.W. (). The
association between health risk change and presenteeism change. Journal of Occupational
and Environmental Medicine, 48, -.
Demerouti, E., Le Blanc, P.M., Bakker, A.B., Schaufeli, W.B. & Hox, J. (). Present but
sick: A three-wave study on job demands, presenteeism and burnout. Career
Development International, 14, -.
GenO2010-3.indd 210 03-08-2010 14:53:13
Oorzaken en effecten van presenteïsme
211
Gedrag & Organisatie 2010-23, nr. 3
De Vroome, E.M.M., Koppes, L.L.J., Smulders, P.G.W. & Van den Bossche, S.N.J. ().
Verzuimmeting via zelfrapportage en registratie: Verschillen tussen de Nationale
Enquête Arbeidsomstandigheden en de Nationale Verzuim Statistiek. TSG/Tijdschrift
voor Gezondheidswetenschappen, 88, -.
Dew, K., Keefe, V. & Small, K. (). Choosing to work when sick: Workplace
presenteeism. Social Science & Medicine, 60, -.
Ferrie, J.E., Kivimäki, M., Head, J., Shipley, M.J., Vahtera, J. & Marmot, M.G. (). A
comparison of self-reported sickness absence with absences recorded in employers’
registers: Evidence from the Whitehall II study. Occupational and Environmental
Medicine, 62, -.
Grinyer, A. & Singleton, V. (). Sickness absence as risk-taking behaviour: A study of
organisational and cultural factors in the public sector. Health, Risk and Society, 2, -.
Hansen, C.D. & Andersen, J.H. (). Going ill to work: What personal circumstances,
attitudes and work-related factors are associated with sickness presenteeism? Social
Science & Medicine, 67, -.
Hobfoll, S.E. (). The influence of culture, community, and the nested-self in the stress
process: Advancing conservation of resources theory. Applied Psychology, 50, -.
Houtman, I.L.D., Goudswaard, A., Dhondt, S., Van der Grinten, M.P., Hildebrandt, V.H.
& Van der Poel, E.G.T. (). Dutch monitor on stress and physical load: Risk factors,
consequences, and preventive action. Occupational and Environmental Medicine, 55, -.
Johns, G. (). Presenteeism in the workplace: A review and research agenda. Journal of
Organizational Behavior, 31, -.
Jöreskog, K.G. & Sörbom D. (). LISREL 8: User’s Reference Guide. Chicago: Scientific
Software International.
Karasek, R., Brisson, C., Kawakami, N., Houtman, I., Bongers, P. & Amick, B. (). The
Job Content Questionnaire (JCQ): An instrument for internationally comparative
assessments of psychosocial job characteristics. Journal of Occupational Health Psychology,
3, -.
Kivimäki, M., Head, J., Ferrie, J.E., Hemingway, H., Shipley, M.J., Vahtera, J. & Marmot,
M.G. (). Working while ill as a risk factor for serious coronary events: The
Whitehall II study. American Journal of Public Health, 95, -.
Koopman, C., Pelletier, K.R., Murray, J.F., Sharda, C.E., Berger, M.L., Turpin, R.S.,
Hackleman, P., Gibson, P., Holmes, D.M. & Bendel, T. (). Stanford Presenteeism
Scale: Health status and employee productivity. Journal of Occupational and
Environmental Medicine, 44, -.
MacCallum, R.C. & Austin, J.T. (). Applications of Structural Equation Modeling in
psychological research. Annual review of psychology, 51, -.
Pilette, P.C. (). Presenteeism in nursing: A clear and present danger to productivity.
The Journal of Nursing Administration, 35, -.
Schaufeli, W.B. & Van Dierendonck, D. (). The construct validity of two burnout
measures. Journal of Organizational Behavior, 14, -.
Schultz, A., Chen, C.-Y. & Edington, D.W. (). The cost and impact of health
conditions on presenteeism to employers: A review of the literature. Pharmacoeconomics,
27, -.
Smulders, P.G.W. & Nijhuis F.J.N. (). The Job Demands-Job Control Model and
absence behaviour: Results of a -year longitudinal study. Work & Stress, , -.
Smulders, P.G.W., Andries, F. & Otten, F. (). Hoe denken Nederlanders over hun werk…?
Opzet, kwaliteit en eerste resultaten van de TNO Arbeidssituatie Survey. Hoofddorp: TNO
Arbeid.
Spector, P.E. (). Method variance in organizational research: Truth or urban legend?
Organizational Research Methods, 9, -.
Van der Doef, M. & Maes, S. (). The Job Demand-Control(-Support) model and
psychological well-being: A review of  years of empirical research. Work & Stress, 13,
-.
GenO2010-3.indd 211 03-08-2010 14:53:13
Gedrag & Organisatie 2010-23, nr. 3
Oorzaken en effecten van presenteïsme
212
Zapf, D., Dormann, C. & Frese, M. (). Longitudinal studies in organizational stress
research: A review of the literature with reference to methodological issues. Journal of
Occupational Health Psychology, 1, -.
Longitudinal study on the determinants and consequences of
presenteeism
E.M.M. de Vroome, P.G.W. Smulders & I.L.D. Houtman, Gedrag & Organisatie,
volume 23, September 2010, nr. 3, pp.194-212.
In a longitudinal cross-lagged study, the determinants and consequences were
examined of presenteeism (going to work despite feeling unhealthy). All variables
were measured with questionnaires in 2002 and in 2004 among a representative
Dutch sample (N = 653), and these data were individually and longitudinally
matched. In 2002 as well as in 2004, approximately 60% reported presenteeism.
In this study, no effects of job demands were confirmed. Emotional exhaustion
was found to be an important determinant of later sickness absence and later
presenteeism, and sickness absence also had a direct effect on later presenteeism.
However, the relationship between presenteeism and sickness absence was not
found to be reciprocal. This implies that emotional exhaustion lies at the base of
both sickness absence and presenteeism, and emotional exhaustion may serve as
an important target to reduce sickness absence as well as presenteeism.
Key words: job demands, presenteeism, emotional exhaustion, sickness
absence
GenO2010-3.indd 212 03-08-2010 14:53:13
Rollenspelertraining in assessment centers
213
Een andere invalshoek op de
rollenspelertraining in Assessment
Centers
Eveline Schollaert en Filip Lievens*
In de meest recente richtlijnen voor de opzet van assessment centers wordt
benadrukt dat assessment center opdrachten veel dimensiegerelateerd
gedrag dienen uit te lokken bij de kandidaten (International Task Force
on Assessment Center Guidelines, 2009). Nagenoeg nergens wordt echter
vermeld of empirisch onderzocht hoe men dit kan doen. Enkele auteurs
en practici hebben in dit kader de suggestie gedaan om ‘prompts’ in de
rollenspelertraining te implementeren. Prompts zijn voorzetten, die de rol-
lenspeler kan gebruiken om relevant gedrag bij kandidaten uit te lokken.
Dit onderzoek is de eerste empirische studie naar rollenspelers en rollen-
spelertraining en bestudeert enkele mogelijke effecten van prompttraining.
De kandidaten en rollenspelers werden random aan twee condities met
assessment center-opdrachten toegewezen. In de eerste conditie kregen de
rollenspelers (N=9) geen prompttraining (117 kandidaten) en in de tweede
conditie kregen de rollenspelers (N=10) wel een rollenspelertraining met
prompts (116 kandidaten). De resultaten toonden dat rollenspelers na het
volgen van een rollenspelertraining met prompts in staat waren om prompts
te gebruiken. Indien rollenspelers een prompttraining volgden, bleek dit
geen negatieve invloed te hebben op de percepties van kandidaten over de
functiegerelateerdheid van de assessment center-opdracht, de mogelijkheid
tot tweewegscommunicatie, en de behandeling door de rollenspeler. Het
gebruik van prompts lijkt echter ook geen effect te hebben op de interbe-
oordelaarsbetrouwbaarheid van assessoren, wat te wijten kan zijn aan het
feit dat de assessoren niet op de hoogte waren van prompts.
Trefwoorden: Assessment Centers, rollenspelers, rollenspelertraining
* Eveline Schollaert en Filip Lievens zijn verbonden aan de Vakgroep Personeelsbeleid,
Arbeids- en Organisatiepsychologie, Universiteit Gent.
Correspondentieadres: Eveline Schollaert, Universiteit Gent, Faculteit Psychologie
en Pedagogische Wetenschappen, Vakgroep Personeelsbeleid en Arbeids- en
Organisatiepsychologie, Henri Dunantlaan 2, B-9000 Gent, tel. 0032-9-2646459, e-mail:
Eveline.Schollaert@ugent.be.
GenO2010-3.indd 213 03-08-2010 14:53:13
Gedrag & Organisatie 2010-23, nr. 3
Rollenspelertraining in assessment centers
214
1 Inleiding
Rollenspelers zijn een essentieel onderdeel van Assessment Center (AC)-opdrachten.
Ze kunnen optreden in presentaties, fact findings, groepsdiscussies, en uiteraard in
rollenspelen (Thornton & Rupp, ). Rollenspelers hebben een andere opdracht
dan assessoren. Terwijl assessoren zo onopvallend en discreet mogelijk te werk dienen
te gaan, moeten rollenspelers de kandidaten juist zoveel mogelijk in de AC-opdracht
proberen te betrekken en gedrag uit te lokken (Thornton & Mueller-Hanson, ).
Hierbij lonkt het gevaar dat rollenspelers zich verschillend kunnen gedragen over
kandidaten heen. Het is essentieel dat rollenspelers zo consistent mogelijk zijn
( Jansen & De Jongh, ; Thornton & Mueller-Hanson, ; Thornton & Rupp,
). De meest recente richtlijnen voor de opzet van AC’s vermelden dan ook dat
rollenspelers ‘de rol objectief en consistent moeten spelen (International Task Force
on Assessment Center Guidelines, , p. ). Een adequate rollenspelertraining
is dus onontbeerlijk, want een gebrek aan consistentie bij rollenspelers brengt de
standaardisatie van de AC procedure in gevaar. Dit kan op zijn beurt een negatieve
invloed hebben op bijvoorbeeld de objectiviteit van de scoring, de betrouwbaarheid
van de beoordelingen, en de validiteit van de AC-procedure.
In de huidige praktijk van rollenspelertraining wordt de nadruk vooral gelegd op het
inleven in de rol en er wordt aangeraden om consistent en objectief te spelen
(International Task Force on Assessment Center Guidelines, ). Vaak blijft deze
training vrij algemeen, maar enkele auteurs beschreven reeds een specifieke handlei-
ding voor rollenspelers met praktische tips waarin aangeraden wordt om ‘prompts’ te
gebruiken (Jansen & De Jongh, ; Thornton & Mueller-Hanson, ). Prompts
kunnen gedefinieerd worden als vooraf bepaalde en aangeleerde verbale en non-
verbale handelingen tijdens de AC-opdrachten, die door rollenspelers over alle kan-
didaten heen consistent gehanteerd worden, met als doel dimensiegerelateerd gedrag
uit te lokken. Synoniemen die in de praktijk gehanteerd worden om deze prompts te
duiden, zijn platforms, oproepgedrag, en voorzetten. We kunnen de implementatie
van prompts in rollenspelen beargumenteren op basis van de trekactivatietheorie.
Volgens deze theorie wordt gedrag verklaard door de interactie tussen individuen en
de situatie, en meer concreet hun reacties op functierelevante stimuli in de situatie
(Tett & Guterman, ). Prompts kunnen beschouwd worden als de functierele-
vante stimuli in de AC opdracht, die gedrag met betrekking tot dimensies dienen uit
te lokken, opdat de assessoren zich voor het beoordelen daarop zouden kunnen base-
ren. Zonder dergelijke prompts krijgt de assessor mogelijk niet voldoende de kans
om bepaalde dimensies te observeren.
Een voorbeeld van een prompt voor de dimensie interpersoonlijke sensitiviteit kan
zijn ‘Ik voel me niet zo goed bij wat u zegt.’ De assessor krijgt via deze prompt de
kans om de interpersoonlijke capaciteiten van de kandidaten te zien. Sommige kan-
didaten zullen vragen waarom de rollenspeler zich er niet goed bij voelt, andere zul-
len gewoon doorgaan met beargumenteren, of geïrriteerd reageren. Een voorbeeld-
prompt voor de dimensie plannen en organiseren zou kunnen zijn dat de
rollenspeler vraagt hoe de kandidaat van plan is om de voorgestelde oplossing te
implementeren.
Het is van belang om tijdens de rollenspelertraining met prompts (prompttraining)
de rollenspelers aan te leren op subtiele wijze de prompts toe te passen om te vermij-
GenO2010-3.indd 214 03-08-2010 14:53:13
Rollenspelertraining in assessment centers
215
Gedrag & Organisatie 2010-23, nr. 3
den dat de situatie te sterk wordt. In dit geval zouden alle kandidaten op dezelfde
manier reageren op de prompt. We illustreren dit opnieuw aan de hand van een
voorbeeld voor de dimensie interpersoonlijke sensitiviteit. De rollenspeler zou als
prompt kunnen reageren op een opmerking van de kandidaat door zich een verdrie-
tige gezichtsuitdrukking aan te meten, dit is een voldoende zwakke situatie. Sommige
kandidaten zullen troostend vragen wat er scheelt, andere niet. Anderzijds zou de
rollenspeler kunnen beginnen te huilen, wat een sterkere (minder subtiele) situatie is.
Tijdens de prompttraining is het ook van belang om de rollenspelers aan te leren om
per dimensie meerdere prompts aan bod te laten komen. Assessoren kunnen dan hun
oordeel op meer dimensiegerelateerde observaties baseren (Lievens, ).
Kortom, we suggereren dat een rollenspelertraining met prompts aan rollenspelers
de mogelijkheid geeft om consistent te handelen en dimensiegerelateerd gedrag op
te roepen. In de praktijk blijken reeds in sommige rollenspelertrainingen prompts
vervat te zitten. Echter, empirische studies omtrent rollenspelergedrag en rollenspe-
lertraining in het algemeen, of meer concreet naar het gebruik van prompts in de
rollenspelertraining, zijn er niet. Rollenspelen, rollenspelergedrag, en rollenspelertrai-
ning behoren tot de minst wetenschappelijk bestudeerde en onderzochte aspecten
van het AC-proces (Lievens & Klimoski, ). Daarom beogen wij in deze studie
de effecten van rollenspelertraining empirisch te onderzoeken. Daarbij staan drie
vragen centraal. Allereerst gaan we na of de training wel effect heeft op het rollen-
spelergedrag. Met andere woorden: gebruiken rollenspelers, die een rollenspelertrai-
ning met prompts hebben gevolgd, meer gestandaardiseerde prompts in ‘onvoorspel-
bare’ AC-opdrachten dan rollenspelers, die geen dergelijke prompttraining gevolgd
hebben. Vervolgens toetsen we welk effect dit heeft op een ‘harde’ maatstaf, de inter-
beoordelaarsbetrouwbaarheid van assessoren, en tot slot gaan we het effect na op een
‘zachte’ maatstaf, de percepties van de kandidaten. In de volgende paragraaf worden
de drie vragen toegelicht en formuleren we hierover hypothesen.
2 Onderzoeksvragen
De eerste vraag, die we willen onderzoeken, richt zich op de rollenspeler zelf. Het
aanleren van prompts via een prompttraining betekent namelijk nog niet dat de rol-
lenspelers deze prompts ook daadwerkelijk gaan gebruiken in de AC opdrachten. De
prompts zijn meestal in een algemeen raamwerk (‘script’) gegoten, omdat elk gesprek
een andere wending kan nemen. De rollenspeler moet trachten dit script zo goed
mogelijk te volgen ondanks mogelijke vreemde wendingen in het rollenspel. Dit kan
voor een zekere spanning zorgen, aangezien de rollenspeler naast het uitlokken van
gedrag via prompts ook een geloofwaardig gesprek moet neerzetten (Jansen & De
Jongh, ). Indien de rollenspeler bijvoorbeeld gedrag omtrent de dimensie inter-
persoonlijke sensitiviteit wil uitlokken, zou hij/zij als prompt voor deze dimensie plots
de schouders kunnen ophalen en zeggen dat hij/zij zich op het matje geroepen voelt.
Als het gesprek echter eerder planmatig en analytisch georiënteerd was, kan dit the-
atraal en onnatuurlijk overkomen. De rollenspeler kan dus dikwijls een spanning
ondervinden tussen de opdracht om dimensiegerelateerd gedrag uit te lokken (via
prompts) en het voeren van een vlot ogende conversatie. Dit is vooral het geval bij
GenO2010-3.indd 215 03-08-2010 14:53:13
Gedrag & Organisatie 2010-23, nr. 3
Rollenspelertraining in assessment centers
216
rollenspelers die er waarde aan hechten om zich helemaal in te leven in de rol en een
karakter neer te zetten. Bovendien heeft de rollenspeler maar een beperkte tijd waar-
binnen meerdere prompts voor verschillende dimensies gebruikt dienen te worden.
Daarnaast zijn er veel gesprekswendingen mogelijk, en elke kandidaat is anders. Het
is moeilijk te voorspellen hoe de kandidaat zal reageren en de rollenspeler dient de
kandidaat steeds onopvallend terug te brengen naar zijn ‘structuur’. Een kandidaat
die bijvoorbeeld heel mondig is, zou zelf het gesprek in handen kunnen nemen of de
AC-opdracht een onverwachte richting kunnen geven, wat het de rollenspeler moei-
lijk maakt om het gesprek te structureren. Daarnaast mogen de kandidaten niet het
gevoel hebben dat de AC opdracht onrealistisch is, zoals reeds vermeld werd. Het
gevaar bestaat bijvoorbeeld dat de rollenspeler eerst gevoelig reageert om dimensies
zoals interpersoonlijke sensitiviteit uit te lokken en vervolgens zonder overgang plots
koel en zakelijk uit de hoek komt, om te peilen naar probleemoplossend vermogen.
De rollenspeler dient dus met een aanzienlijk aantal, soms tegenstrijdige, aspecten
rekening te houden, waardoor men kan aannemen dat het niet eenvoudig is voor
rollenspelers om een bepaalde structuur met prompts toe te passen. Het zal bijgevolg
van belang zijn om een grondige en degelijk ontwikkelde prompttraining aan de
rollenspelers voor te schotelen. De prompttraining zal naast de theoretische achter-
grond ook uit een uitgebreide praktische oefening dienen te bestaan, waarbij de
rollenspelers aanleren om meerdere prompts per dimensie te gebruiken, op voldoende
subtiele wijze. Ze dienen in de training geconfronteerd te worden met mogelijke
euvelen, zodat ze hier in de praktijk mee kunnen omgaan en leren reageren op onver-
wachte wendingen in de conversatie. We veronderstellen bijgevolg dat, ondanks hun
vaak tegenstrijdige opdracht, rollenspelers, die een grondige prompttraining krijgen
in staat zullen zijn om meer prompts te gebruiken dan rollenspelers, die een rollen-
spelertraining krijgen zonder prompts. We formuleren de volgende hypothese:
Hypothese 1: Rollenspelers, die een prompttraining volgen, zullen meer dimensie-
gerelateerde prompts in AC-opdrachten gebruiken dan rollenspelers, die geen
prompttraining volgen.
Naast het rollenspelergedrag op zich, wordt in dit onderzoek ook het effect van
prompttraining op een psychometrische graadmeter nagegaan, met name de inter-
beoordelaarsbetrouwbaarheid van assessoren. We veronderstellen dat het aanbieden
van prompts tijdens AC opdrachten de observeerbaarheid van relevant gedrag van
kandidaten zal verhogen. Dat kan op zijn beurt een positief effect hebben op de
interbeoordelaarsbetrouwbaarheid van assessoren, omdat deze assessoren mogelijk
meer gedrag zien om de kandidaten te beoordelen. Dit kunnen we op basis van twee
principes beargumenteren. Ten eerste, door meer gedrag bij de kandidaten uit te lok-
ken, wordt de standaardisatie van de opdrachten groter. Ten tweede, gebaseerd op het
principe van aggregatie (Epstein, ), dat stelt dat de som van een set maten sta-
bieler is dan om het even welke maat van de set apart, veronderstellen we dat de
mogelijkheid om meer gedragselementen te observeren en te noteren de betrouwbaar-
heid van de beoordelingen verbetert.
Naast deze argumenten, kunnen we de vergelijking maken met het gestructureerde
interview. Het gebruik van gestandaardiseerde cues over kandidaten heen, is namelijk
GenO2010-3.indd 216 03-08-2010 14:53:13
Rollenspelertraining in assessment centers
217
Gedrag & Organisatie 2010-23, nr. 3
gelijkaardig aan het gebruik van gestandaardiseerde vragen over kandidaten heen.
Voorgaand onderzoek toonde reeds aan dat de interbeoordelaarsbetrouwbaarheid van
het gestructureerde interview hoger is dan de interbeoordelaarsbetrouwbaarheid van
het ongestructureerde interview (Conway, Jako, & Goodman, ). Deze evidentie
en vorige argumenten inachtnemend, verwachten wij hetzelfde effect indien rollen-
spelers een prompttraining volgen. Met andere woorden, we veronderstellen dat er
een hogere overeenkomst zal zijn tussen de scores die de assessoren aan de kandida-
ten geven voor de dimensies probleemanalyse, interpersoonlijke sensitiviteit, plannen
en organiseren, en stressbestendigheid. Dit leidt tot de volgende hypothese:
Hypothese 2: Indien rollenspelers een prompttraining volgen, zal de interbeoorde-
laarsbetrouwbaarheid hoger zijn dan in de conditie waarin rollenspelers een rollen-
spelertraining zonder prompts volgen.
De derde onderzoeksvraag spitst zich tot slot toe op een zachte graadmeter, met name
de invloed van het gebruik van prompts in de rollenspelertraining op de percepties
van de kandidaten over het rollenspelergedrag. Dit is een niet te onderschatten vari-
abele in het licht van het feit dat de percepties van de kandidaten invloed hebben op
het beeld dat ze zich van de organisatie vormen en of ze een functie al dan niet zul-
len aanvaarden (Hausknecht, Day & Thomas, ).
Enerzijds zou het effect van prompts op de percepties van kandidaten positief kunnen
zijn. We kunnen namelijk suggereren dat het gebruik van prompts een positieve
invloed heeft op de percepties van functiegerelateerdheid van de AC-opdracht, omdat
de prompts in feite miniatuur functiesituaties weerspiegelen. Functiegerelateerdheid
werd door Bauer, Truxillo, Sanchez, Craig, Ferrara et al. () beschouwd als de mate
waarin de kandidaat het gevoel heeft dat de inhoud van de AC-opdracht relevant is
voor de beoogde functie. Kandidaten blijken een voorkeur te hebben voor selectie-
procedures die ze als functiegerelateerd ervaren (Hausknecht et al., ) en ook in
het kader van het selectie interview suggereerden sommige auteurs reeds dat een
hogere indruksvaliditeit (‘face validity’) van de vragen positievere percepties bij de
kandidaten in de hand kunnen werken (Posthuma, Morgeson & Campion, ).
Dit alles leidt tot volgende hypothese:
Hypothese 3a: Indien rollenspelers een prompttraining volgen, zullen kandidaten de
functiegerelateerdheid van de AC opdracht hoger beoordelen dan wanneer rollen-
spelers geen prompttraining volgen.
Naast dit positieve effect op de percepties van kandidaten, zou het gebruik van
prompts door rollenspelers anderzijds ook negatieve effecten op de percepties van
kandidaten kunnen hebben. Het risico bestaat dat het gesprek stugger overkomt,
doordat de rollenspeler zich aan een zekere structuur dient te houden. Opnieuw is
een vergelijking met onderzoek over het gestructureerde interview hierbij interessant.
In de context van het selectie interview vonden sommige auteurs immers dat gestruc-
tureerde interviews in minder goede aarde vielen bij kandidaten dan ongestructu-
reerde interviews (Conway & Peneno, ; Posthuma et al., ). Gebaseerd op
deze literatuur zouden we dus kunnen veronderstellen dat het implementeren van
GenO2010-3.indd 217 03-08-2010 14:53:13
Gedrag & Organisatie 2010-23, nr. 3
Rollenspelertraining in assessment centers
218
meer structuur door het gebruik van prompts ook bij AC-opdrachten een negatieve
invloed op de percepties van kandidaten kan hebben. Kandidaten zouden het gevoel
kunnen hebben dat ze minder kans krijgen om hun mening te uiten en dat de rol-
lenspeler ‘kouder’ met hen omgaat. We kunnen bijgevolg suggereren dat het gebruik
van prompts om het rollenspel te structureren, vooral een negatieve impact zou heb-
ben op perceptie van mogelijkheid tot tweewegscommunicatie en op de perceptie
over de interpersoonlijke behandeling door de rollenspeler. Tweewegscommunicatie
wordt beschouwd als de mogelijkheid die kandidaten hebben om tijdens de
AC-opdracht hun eigen mening voldoende naar voren te brengen. Interpersoonlijke
behandeling gaat over de mate waarin de rollenspeler de kandidaat met respect bena-
dert (Bauer et al., ; Gilliland, ). Dit leidt tot de volgende hypothesen:
Hypothese 3b: Indien rollenspelers een prompttraining volgen, zullen de kandidaten
de mogelijkheid tot tweewegscommunicatie als geringer beoordelen dan wanneer
rollenspelers geen prompttraining volgen.
Hypothese 3c: Indien rollenspelers een prompttraining volgen, zullen de kandidaten
de interpersoonlijke behandeling door de rollenspeler minder positief beoordelen dan
wanneer rollenspelers geen prompttraining volgen.
3 Methode
3.1 Steekproef en procedure
De gegevens werden verzameld bij  laatstejaarsstudenten (. vrouwelijke deel-
nemers, gemiddelde leeftijd = . jaar, SD = . jaar). Het merendeel van de partici-
panten volgden de richtingen Rechten of Wetenschappen (Bio-Ingenieur, Fysica,
Bouwkundig Ingenieur enzovoort). Elk van deze opleidingen bestaat uit vier of vijf
jaren.
De participanten werden via een email uitgenodigd voor een voorbereidende sessie
over psychologische testen en assessment. Men legde de participanten uit dat ze
kennis zouden maken met een uitgebreid gamma aan selectietesten. We probeerden
zo goed mogelijk een echte selectiesituatie te simuleren. De gesimuleerde selectie
setting duurde ongeveer een volledige dag. Per dag konden telkens maximaal acht
kandidaten deelnemen. De kandidaten vulden een curriculum vitae in, verschillende
tests en vragenlijsten, en namen deel aan twee AC-opdrachten. We kunnen veron-
derstellen dat de deelnemers de gesimuleerde selectiesetting percipieerden als een
echte selectiesituatie. De participanten rapporteerden bijvoorbeeld dat ze zenuwach-
tig waren en bang om niet te slagen voor de tests en AC-opdrachten. Ze droegen ook
zakelijke kleding, omdat hen was opgedragen om te komen zoals ze naar een echte
selectieprocedure zouden gaan.
Voor deze studie werden alleen de resultaten van de AC-opdrachten gebruikt. De
AC-opdrachten werden ontwikkeld voor startfuncties als manager. Na het doorzoe-
ken van catalogi van verscheidene consultancybedrijven, kochten we een rollenspel
en een presentatie aan. De dimensies waarop de kandidaten werden beoordeeld, waren
GenO2010-3.indd 218 03-08-2010 14:53:13
Rollenspelertraining in assessment centers
219
Gedrag & Organisatie 2010-23, nr. 3
planning en organiseren, interpersoonlijke sensitiviteit, probleemanalyse, en stress-
bestendigheid.
De volgorde van de AC-opdrachten en de verschillende rollenspelers waren counter-
balanced om confounding te voorkomen. De prestaties van de kandidaten tijdens alle
AC-opdrachten werden op video opgenomen.
3.2 Rollenspelers
Ontwikkeling van rollenspelerprompts. Om de rollenspelerprompts te ontwikkelen,
voerden we een voorstudie uit. Deze voorstudie bestond uit drie fasen. Eerst gaven
we een groep van zeven ervaren assessoren de opdracht om prompts te verzamelen
(gemiddelde leeftijd = . jaar, SD = .,  mannen, gemiddelde ervaring in selec-
tie = . jaar, SD = .). Deze assessoren dienden prompts op te sommen, die door
rollenspelers gebruikt zouden kunnen worden om de vier dimensies bij de kandidaten
uit te lokken. Voor het rollenspel rapporteerden ze  unieke prompts en voor de
presentatie . In totaal werden dus  prompts verzameld.
In de tweede fase verfijnden we deze lijst door de prompts te verwijderen die onge-
schikt, te vaag, te concreet, of redundant waren. Na deze procedure bleven voor het
rollenspel en de presentatie respectievelijk  en  unieke prompts over. Voor beide
AC opdrachten waren er echter ook  gedeelde prompts. Tijdens de tweede fase
genereerden we bijgevolg een lijst van  prompts.
In de derde fase legden we deze  prompts voor aan twee andere groepen asses-
soren. De eerste groep bestond uit acht onervaren assessoren met een masterdiploma
in Bedrijfpsychologie ( mannelijk, gemiddelde leeftijd . jaar, SD = .) en de
tweede groep bestond uit twaalf ervaren assessoren ( mannelijk, gemiddelde selec-
tie ervaring = . jaar, SD = .). Deze assessoren hervertaalden de prompts naar de
vier dimensies (planning en organiseren, interpersoonlijke sensitiviteit, probleemana-
lyse, en stressbestendigheid). Met andere woorden, ze dienden de prompts toe te
wijzen aan één van de verschillende dimensies. Per prompt berekenden we de over-
eenkomst tussen de assessoren. Indien de overeenstemming minimaal  was, werd
de prompt beschouwd als een goed platform om de respectievelijke dimensie bij de
kandidaten op te roepen. Op deze wijze reduceerden we het aantal prompts voor het
rollenspel en de presentatie verder tot  prompts ( prompts voor het rollenspel, en
 prompts voor de presentatie). Een voorbeeldprompt was ‘Geef tegenargumenten
om uit te lokken hoe de kandidaat omgaat met tegenspel’ (oproepen van dimensie
stressbestendigheid) of ‘Vermeld dat je je er slecht bij voelt’ (oproepen van dimensie
interpersoonlijke sensitiviteit). Voor de dimensie planning en organiseren is een voor-
beeldprompt ‘Hoe ga je de beschikbare middelen (geld, personeel,…) toewijzen aan
de verschillende voorstellen?’ en voor de dimensie probleemoplossing U heeft nu vele
problemen en moeilijkheden aangehaald, maar wat is nu eigenlijk de kern van het
probleem?’
3.3 Experimentele opzet
We ontwikkelden twee verschillende condities, een training met rollenspelerprompts
en een training zonder rollenspelerprompts. Negentien rollenspelers ( vrouwelijk;
gemiddelde leeftijd = . jaar, SD = . jaar) werden random aan de condities toege-
wezen. Deze rollenspelers waren allen masterstudenten aan Universiteit Gent. In de
GenO2010-3.indd 219 03-08-2010 14:53:13
Gedrag & Organisatie 2010-23, nr. 3
Rollenspelertraining in assessment centers
220
conditie zonder prompts fungeerden negen individuen als rollenspeler (hieraan
namen  van de  kandidaten deel) en in de conditie met prompts tien (hieraan
namen  van de  kandidaten deel). De trainer was een consultant met een mas-
terdiploma in Bedrijfspsychologie, die over vijftien jaar ervaring in personeelsselectie
beschikte. Beide trainingen duurden ongeveer vijf uur en bestonden uit een gelijk-
aardig opzet, die we ontwikkelden op basis van de richtlijnen voor AC’s (International
Task Force on Assessment Center Guidelines, ). Het eerste deel van beide trai-
ningen was identiek. De rollenspelers kregen een rollenspelerhandleiding met infor-
matie over de AC-opdrachten en het karakter dat ze dienden te vertolken. Dit
gedeelte van de training duurde . uur. In het tweede gedeelte van de training werd
een video met rollenspelers getoond. In de training zonder rollenspelerprompts leidde
men deze video (rollenspel zonder prompts) in met het advies om consistent en
objectief te handelen over de kandidaten heen. In de training met rollenspelerprompts
werd de video (rollenspel met prompts) ook ingeleid met het advies om consistent
en objectief te handelen, maar de trainer breidde dit gedeelte uit met een uitleg over
hoe ze dit konden doen. Men lichtte het gebruik van prompts voor de vier dimensies
toe. Dit deel van de training duurde . uur. Het laatste deel van de training was
opnieuw gelijkaardig in beide condities. Dit gedeelte bestond uit het instuderen van
de rol via praktische AC-opdrachten, observatie en feedback van de trainer en discus-
sie. Dit laatste gedeelte duurde in beide condities twee uur.
3.4 Meetinstrumenten
Coderen van prompts. Vier masterstudenten Bedrijfspsychologie ( vrouwen,
gemiddelde leeftijd = ., SD = .) codeerden de videotapes van de kandidaten,
waarbij ze zich concentreerden op het gedrag van de rollenspelers. De codeurs kregen
hiertoe een grondige training, die een halve dag duurde. In functie van het coderen
dienden ze eerst het verbale en non-verbale gedrag van de rollenspelers onafhankelijk
van elkaar op te schrijven. Vervolgens dienden ze deze teksten door te nemen en het
aantal prompts dat gebruikt werd per dimensie en per AC-opdracht op te tellen. Ze
telden ook de interventies, die niet prompt-gerelateerd waren. Na het beoordelen
gingen we de overeenkomst tussen de codeurs na, deze was voldoende voor alle
prompts (kappa’s boven .). Discrepanties werden opgelost via discussie.
AC-beoordelingen. Laatstejaarsstudenten Bedrijfspsychologie fungeerden als asses-
soren (. vrouwelijk; gemiddelde leeftijd = ., SD = .) en kregen hiertoe een
halve dag training. De trainer was in het bezit van een diploma Bedrijfspsychologie
en was een gecertificeerd assessor. Het trainingsprogramma bestond uit drie delen,
(a) een inleiding over de kernelementen van AC’s, (b) een verduidelijking van de vier
dimensies, en (c) een workshop over het observatie- en beoordelingsproces, die opge-
bouwd was uit een theoretische uiteenzetting, oefeningen, en feedback.
Na afloop van het AC gaven de assessoren per kandidaat algemene beoordelingen op
de vier dimensies (probleemanalyse, interpersoonlijke sensitiviteit, plannen en orga-
niseren, en stressbestendigheid) over de AC-opdrachten heen, om de welbekende
betrouwbaarheidsproblemen van dimensiescores binnen de AC-opdrachten te ver-
mijden (Brannick, ; Lance, ). De assessoren gebruikten hiervoor de zoge-
naamde ‘behavior reporting method (Thornton & Byham, ). Nadat de twee
AC-opdrachten afgelopen waren, beoordeelden de assessoren op basis van hun
GenO2010-3.indd 220 03-08-2010 14:53:14
Rollenspelertraining in assessment centers
221
Gedrag & Organisatie 2010-23, nr. 3
gedragsobservaties individueel de kandidaten op elk van de vier dimensies, op een
-puntsschaal. De schaal liep steeds van zwak () tot uitstekend (). Elke kandidaat
werd door twee assessoren beoordeeld.
Kandidaatpercepties. Na elke AC-opdracht kregen de kandidaten een vragenlijst, die
bestond uit enkele schalen van de Selection Procedural Justice Scale (Bauer et al.,
). De eerste subschaal, functiegerelateerdheid (twee items), refereerde naar de
percepties van de kandidaten over de mate waarin de AC-opdracht relevant was voor
de inhoud van de functie. De interne consistentie betrouwbaarheid was . voor de
vragenlijst gerelateerd aan het rollenspel en . voor de vragenlijst gerelateerd aan de
presentatie.
De tweede subschaal, tweewegscommunicatie, ging de perceptie na van kandidaten
over de mogelijkheid tot het geven van hun mening. Deze schaal bestond uit drie
items en de interne consistentie betrouwbaarheid was . (rollenspel) en . (presen-
tatie).
De derde subschaal was interpersoonlijke behandeling en refereerde naar de percep-
tie van kandidaten over de mate waarin ze met respect behandeld werden. De schaal
bestond uit vier items en de interne consistentiebetrouwbaarheid was . (rollenspel)
en . (presentatie).
4 Resultaten
Hypothese stelde dat rollenspelers, die een training volgden waarin ze prompts
aangeleerd kregen, meer dimensiegerelateerde prompts zouden gebruiken dan rol-
lenspelers, die een training zonder prompts volgden. Om de hypothese te toetsen
voerden we een  xx  (prompttraining x AC opdracht x dimensie) mixed MANOVA
uit met repeated measures. In tabel  zijn de gemiddelden, standaarddeviaties, en de
proportieprompts, gebruikt door de rollenspeler, terug te vinden, opgesplitst voor
AC-opdracht en dimensie. AC-opdracht en dimensie zijn binnensubjectfactoren, de
factor prompttraining is een tussensubjectfactor. Opdrachtvolgorde werd opgenomen
als controlevariaat. Deze factor bleek geen significant effect te hebben. De resultaten
toonden een hoofdeffect van prompttraining (F(, ) = ., p < .). Dit onder-
steunt de eerste hypothese. Zoals in tabel  te zien is, zijn de effectgrootten hoog. Ze
variëren van . tot .. Om de praktische betekenis van dit effect na te gaan namen
we het aantal gebruikte prompts onder de loep. De gemiddelden en standaarddevia-
ties werden berekend op basis van de proporties gebruikte prompts per dimensie
(aantal gebruikte prompts per dimensie per AC opdracht / totaal aantal interacties
over beide AC-opdrachten heen). In het rollenspel vonden we voor de conditie zon-
der prompts een proportie gebruikte prompts van . (. prompts). In de conditie
met prompts was de proportie . (. prompts). De proportie gebruikte prompts
was in het rollenspel dus vervijfvoudigd. In de presentatie is de proportie verviervou-
digd, van . (. prompts) naar . (. prompts). De resultaten suggereren dus
enerzijds dat prompts toegepast kunnen worden. Anderzijds dienen we dit echter te
nuanceren. Indien we de som maken van de proporties gebruikte prompts tijdens het
rollenspel, komen we zoals hierboven vermeld tot een gemiddelde proportie van ..
Dit betekent dat  van de interventies van de rollenspeler bestonden uit prompts
GenO2010-3.indd 221 03-08-2010 14:53:14
Gedrag & Organisatie 2010-23, nr. 3
Rollenspelertraining in assessment centers
222
Tabel 1 Gemiddelden, standaarddeviaties, en effectgroottes van het gebruikte aantal prompts per dimensie, opgesplitst per AC-opdracht
Presentatie Rollenspel
Met prompts
(
N
= 100)
Zonder prompts
(
N
= 103)
Totaal
(N
= 203)
Met prompts
(
N
= 100)
Zonder prompts
(
N
= 103)
Totaal
(
N
= 203)
M SD M SD M SD d M SD M SD M SD d
Planning .22a
(4.03)
.08
(1.83)
.10a
(1.36)
.11
(1.32)
.16
(2.67)
.11
(2.07)
1.03 .18a
(4.49)
.06
(1.60)
.05a
(1.16)
.03
(.68)
.12
(2.80)
.08
(2.07)
1.54
Interpersoonlijke
sensitiviteit
.13b
(2.18)
.06
(1.24)
.01b
(.10)
.02
(.39)
.07
(1.12)
.08
(1.38)
1.55 .15a
(3.87)
.08
(1.81)
.02b
(.54)
.03
(.85)
.09
(2.19)
.08
(2.18)
1.54
Probleemanalyse .11b
(2.03)
.05
(.88)
.01b
(.18)
.03
(.48)
.06
(1.09)
.07
(1.61)
1.57 .09b
(2.33)
.05
(1.19)
.02b
(.42)
.02
(.53)
.06
(1.36)
.05
(1.33)
1.36
Omgaan met
stress
.12b
(2.18)
.06
(1.22)
.02b
(.28)
.05
(.63)
.07
(1.21)
.08
(2.36)
1.30 .05c
(1.20)
.03
 (.74)
.00c
 (.04)
.00
 (.24)
.02
 (.61)
.03
 (.80)
1.46
Totaal .59
(10.43)
.11
(3.04)
.14
(1.82)
.12
(1.60)
.36
(6.04)
.25
(4.94)
1.80 .47
(11.88)
.11
(2.93)
.10
(2.13)
.07
(1.60)
.28
(6.94)
.20
(5.41)
1.85
Noot. De gemiddelden en standaarddeviaties werden berekend op basis van de proporties gebruikte prompts per dimensie (aantal gebruikte prompts per
dimensie per AC opdracht/ totaal aantal interacties over beide AC opdrachten heen). N zijn de ruwe aantallen gebruikte prompts per dimensie per AC
opdracht. De d-waarden zijn effectgrootten, die berekend werden via de formule (Mmet prompts – Mzonder prompts) / SD. Positieve effectgrootten beteke-
nen dat de proportie gebruikte aantal prompts hoger was in de conditie met prompts dan in de conditie zonder prompts. Gemiddelden met verticaal ver-
schillende subscripts zijn significant verschillend op .01-niveau. De gemiddelden tussen zijn haakjes zijn de ruwe gemiddelden en standaarddeviaties van het
gebruikte aantal prompts. Wegens technische problemen tijdens de video-opnamen, konden we voor deze tabel slechts gebruikmaken van 203 van de 233
kandidaten. Voor de andere onderzoeksvragen hadden we de video-opnames niet nodig en deed dit probleem zich bijgevolg niet voor.
GenO2010-3.indd 222 03-08-2010 14:53:14
Rollenspelertraining in assessment centers
223
Gedrag & Organisatie 2010-23, nr. 3
en dat er  andere rollenspelerinterventies waren. Voor de presentatie is dit respec-
tievelijk  en . Het gebruik van prompts blijkt dus niet zo eenvoudig als de
resultaten suggereren, aangezien het totaal aantal interventies van de rollenspeler
tijdens de AC opdrachten slechts ongeveer voor de helft uit prompts blijkt te
bestaan.
Exploratief gingen we na of prompttraining misschien effectiever was voor sommige
AC opdrachten of dimensies. Het hoofdeffect van prompts bleek gekwalificeerd te
worden door een driewegsinteractie tussen prompttraining, AC opdracht, en dimen-
sie (F(, ) = ., p < .). Er werd tijdens de twee AC-opdrachten een significant
groter aantal prompts gebruikt wanneer de rollenspelers een prompttraining gevolgd
hadden, maar het verschil in distributie van het gebruikte aantal prompts per dimen-
sie verschilde naargelang de AC opdracht.
Tijdens de presentatie werden voor planning (M = .) significant meer prompts
gebruikt door de rollenspelers dan voor interpersoonlijke sensitiviteit (M = .), pro-
bleemanalyse (M = .), en omgaan met stress (M = .). Tijdens het rollenspel bleek
deze distributie anders, er werden zowel voor planning als voor interpersoonlijke
sensitiviteit significant meer prompts gebruikt door rollenspelers (resp. M = . en M
= .) dan voor de andere twee dimensies.
Hypothese  stelde dat de interbeoordelaarsbetrouwbaarheid hoger zou zijn bij rol-
lenspelers met een prompttraining dan bij rollenspelers met een rollenspelertraining
zonder prompts. We berekenden de intraclass-correlaties ICC (,) tussen de beoor-
delingen van de assessoren op de dimensies (zie tabel ). We vonden geen verschillen
tussen de conditie met prompttraining en de conditie zonder prompttraining.
Hypothese  werd bijgevolg niet bevestigd.
Tabel 2 Intraclass-correlaties tussen de dimensiescores van de assessoren, opgesplitst
per conditie
Training zonder prompts
(
N
= 117)
Training met prompts
(
N
= 116)
1. Probleemoplossing .755 .715
2. Interpersoonlijke sensitiviteit .741 .747
3. Planning .825 .810
4. Stressbestendigheid .663 .732
Noot. De correlaties zijn intraclass-correlaties ICC (2, 2) tussen de assessoren voor de vier dimen-
sies.
Hypothesen a, b, en c beschreven het mogelijke effect van het volgen van een
prompttraining door rollenspelers op de percepties van de kandidaten over de
AC-opdrachten. In tabel  zijn de gemiddelden, standaarddeviaties, en effectgrootten
van de percepties van de kandidaten terug te vinden. Om hypothesen a, b, en c te
toetsen voerden we een  x  x  (prompttraining x AC opdracht x kandidaatpercep-
tie) mixed MANOVA analyse uit met repeated measures op de tweede en derde
factor. Opdrachtvolgorde werd opgenomen als controlevariaat. Deze factor bleek geen
GenO2010-3.indd 223 03-08-2010 14:53:14
Gedrag & Organisatie 2010-23, nr. 3
Rollenspelertraining in assessment centers
224
significant effect te hebben. De resultaten toonden enkel een hoofdeffect van de
prompttraining op de percepties van de kandidaten (F(, ) = ., p < ., parti-
ele η = .). De beoordelingen van de kandidaten over de AC opdrachten waren dus
significant verschillend voor functiegerelateerdheid van de AC opdracht, mogelijk-
heid tot tweewegscommunicatie, en interpersoonlijke behandeling door de rollen-
speler.
We vonden ook een tweewegsinteractie-effect tussen prompttraining en kandidaat-
perceptie (F(, ) = ., p < ., partiële η = .). Er werden geen andere interac-
tie-effecten gevonden. Wanneer we de significante tweewegsinteractie tussen prompt-
training en kandidaatperceptie bekijken per hypothese, komen we tot de volgende
bevindingen. Hypothese a stelde dat wanneer rollenspelers een prompttraining volg-
den, kandidaten de functiegerelateerdheid van de AC-opdracht hoger zouden beoor-
delen dan wanneer rollenspelers geen prompttraining volgden. Er werd geen signi-
ficant effect van prompttraining voor functiegerelateerdheid gevonden (F(, ) =
., p = ., Mzonder prompts = ., SD = . en Mmet prompts = ., SD = ., d = .).
Hypothese a wordt dus niet ondersteund.
Hypothese b hield in dat de mogelijkheid tot tweewegscommunicatie tijdens de
AC-opdracht door kandidaten lager beoordeeld zou worden indien de rollenspelers
een prompttraining volgden, dan wanneer de rollenspelers geen prompttraining volg-
den. Er werd een significant effect van prompttraining voor tweewegscommunicatie
gevonden, (F(, ) = ., p < ., Mzonder prompts = ., SD = . en Mmet prompts = .,
SD = ., d = .). De effectgrootte is positief, dus blijken kandidaten te vinden dat ze
meer kans hebben op tweewegscommunicatie tijdens een AC-opdracht met rollen-
spelers die een prompttraining gevolgd hebben. Deze bevindingen spreken hypo-
these b dus tegen.
Hypothese c stelde dat wanneer rollenspelers een prompttraining volgden, kandi-
daten de interpersoonlijke behandeling door rollenspelers lager zouden beoordelen
dan wanneer de rollenspelers geen prompttraining volgden. Er werd geen significant
effect van prompttraining voor interpersoonlijke behandeling gevonden (F(, ) =
., p = ., Mzonder prompts = ., SD = . en Mmet prompts = ., SD = ., d = –.).
Hypothese c wordt dus niet bevestigd.
5 Discussie
5.1 Belangrijkste bevindingen
Verbazingwekkend genoeg zijn de rol van de rollenspeler en de rollenspelertraining
tot nu toe nog door geen enkel onderzoek empirisch bestudeerd. De rollenspeler heeft
nochtans de sleutel in handen om structuur in de AC-opdrachten te implementeren
door op een consistente wijze relevant gedrag bij kandidaten uit te lokken, wat asses-
soren de kans geeft om het gedrag van kandidaten meer accuraat te beoordelen
( Jansen & De Jongh, ). In de meest recente richtlijnen voor de opzet van AC’s
is terug te vinden dat AC-opdrachten voldoende dimensiegerelateerd gedrag moeten
oproepen, en dat rollenspelers zich consistent en objectief dienen te gedragen. Er
GenO2010-3.indd 224 03-08-2010 14:53:14
Rollenspelertraining in assessment centers
225
Gedrag & Organisatie 2010-23, nr. 3
Tabel 3 Gemiddelden, standaarddeviaties, en effectgrootten van de percepties van de kandidaten per AC-opdracht
Presentatie Rollenspel
Conditie met
prompts
(
N
= 116)
Conditie zonder
prompts
(
N
= 117)
Totaal
(
N
= 233)
Conditie met
prompts
(
N
= 116)
Conditie zonder
prompts
(
N
= 117)
Totaal
(
N
= 233)
M SD M SD M SD d M SD M SD M SD d
Interpersoonlijke
behandeling
4.00a.71 4.16a.58 4.09a.65 –.25 4.10a.69 4.15a.63 4.12 .66 –.08
Tweewegs-
communicatie
4.11a.61 3.92b.66 4.01a.64 .30 4.07a.60 3.97a.56 4.02 .58 .17
Functiegerelateerdheid 3.38b.73 3.34c.66 3.36b.69 .05 3.34b.77 3.35b.82 3.34 .79 –.01
Noot. De d waarden zijn effectgrootten, die berekend werden via de formule (Mmet prompts – Mzonder prompts) / SD. Positieve effectgrootten betekenen dat
de respectievelijke perceptie van de kandidaat hoger was bij de conditie met prompts dan bij de conditie zonder prompts. Negatieve effectgrootten betekenen
dat de respectievelijke perceptie van de kandidaat lager was bij de conditie met prompts dan bij de conditie zonder prompts. Gemiddelden met verticaal ver-
schillende subscripts zijn significant verschillend op .01-niveau.
GenO2010-3.indd 225 03-08-2010 14:53:14
Gedrag & Organisatie 2010-23, nr. 3
Rollenspelertraining in assessment centers
226
wordt echter in deze richtlijnen nergens vermeld hoe men dit uitlokken van dimen-
siegerelateerd gedrag in AC-opdrachten kan implementeren en hoe rollenspelers zich
consistent moeten gedragen. Enkele auteurs gaven hiertoe reeds een aanzet, door aan
te raden om ‘prompts’ aan de rollenspelertraining toe te voegen en de rollenspelers
met andere woorden een prompttraining te geven (Thornton & Mueller-Hanson,
). In de praktijk is dit begrip niet onbekend en worden in sommige rollenspe-
lertrainingen reeds prompts geïmplementeerd. Met dit onderzoek hebben we getracht
om de rollenspeler en de rollenspelertraining voor het eerst empirisch te bestuderen.
We beoogden drie basisvragen te beantwoorden. Eerst hebben we getoetst of de rol-
lenspeler überhaupt in staat is om consistent prompts te gebruiken, ten tweede zijn
we nagegaan welk effect het gebruik van prompttraining heeft op een ‘harde’ graad-
meter, de interbeoordelaarsbetrouwbaarheid, en ten derde onderzochten we de invloed
van prompttraining op de percepties van de kandidaten over AC-opdrachten.
Onze bevindingen aangaande de eerste vraag suggereren dat rollenspelers na het
volgen van een rollenspelertraining met prompts bekwaam zijn om tijdens
AC-opdrachten prompts te gebruiken. Rollenspelers zijn bijgevolg in staat om hun
gedrag aan kandidaten aan te passen en zo via prompts dimensiegerelateerd gedrag
bij kandidaten uit te lokken. De effecten van het bijwonen van een prompttraining
op het gebruik van prompts bleken zelfs behoorlijk groot. We dienen deze positieve
evidentie ook te nuanceren, omdat het toepassen van prompts tijdens AC-opdrachten
waarschijnlijk niet zo eenvoudig is. Na het volgen van een prompttraining bleken
namelijk nog steeds ongeveer de helft van de interacties niet prompt-gerelateerd. De
rollenspelers gingen bijvoorbeeld soms mee in het verhaal van de kandidaten wanneer
deze afweken van het centrale onderwerp. Klaarblijkelijk is het niet eenvoudig voor
rollenspelers om een raamwerk met prompts te volgen. Elke kandidaat reageert name-
lijk verschillend en de gesprekswendingen zijn vaak anders, wat het de rollenspeler
moeilijk maakt om steeds terug te keren naar zijn ‘raamwerk’ en om voldoende
prompts te gebruiken. Bovendien bleek uit de driewegsinteractie dat de invloed van
prompttraining niet uniform was voor elke dimensie en AC-opdracht. Men kon
bijvoorbeeld afleiden dat het voor de rollenspelers het minst evident was om na een
prompttraining prompts te gebruiken voor de dimensie stressbestendigheid. Het
bleek ook iets moeilijker om prompts te gebruiken in de presentatie dan in het rol-
lenspel.
Naast het belastende aspect van het volgen van een raamwerk, dienen de rollenspelers
zich tijdens de AC-opdracht ook steeds bewust te zijn van een ander mogelijk gevaar.
Mischel () wees op het feit dat situaties te sterk kunnen zijn, waardoor er geen
verschillen tussen individuen (of kandidaten) meer te ontwaren zijn. Rollenspelers
mogen de prompts bijgevolg niet ‘te sterk’ formuleren, om te vermijden dat de kan-
didaten een gepaste reactie in de mond gelegd wordt. De rollenspeler dient de prompts
zo te formuleren of te uiten dat ze enerzijds voldoende gerelateerd zijn aan de beoogde
dimensies, maar anderzijds ook voldoende ‘leeg’ en ambigu zijn (Jansen & De Jongh,
). Men zou bijvoorbeeld in de context van de dimensie planning als prompt kun-
nen vragen aan de deelnemers (op het einde van de AC-opdracht) ‘Welke afspraak
maken we nu concreet? Welke dag en om hoe laat spreken we af?’ Hierop zullen haast
alle kandidaten een concrete afspraak maken. De rollenspeler dient dus steeds waak-
zaam te zijn dat de prompts nog voldoende ambigu zijn. Men mag hier echter niet
GenO2010-3.indd 226 03-08-2010 14:53:14
Rollenspelertraining in assessment centers
227
Gedrag & Organisatie 2010-23, nr. 3
te ver in gaan, want volgens Mischel () bestaan er ook te zwakke situaties. De
rollenspeler dient er dus ook rekening mee te houden dat de prompts te vaag kunnen
zijn, waardoor ze het dimensiegerelateerde gedrag niet oproepen. De rollenspeler zou
bijvoorbeeld voor de dimensie planning (op het einde van de AC-opdracht) enkel
‘En?’ kunnen vragen. Dit is waarschijnlijk te weinig gericht op de dimensie planning,
kandidaten kunnen als reactie op deze prompt een ruime waaier aan gedrag in ver-
band met verschillende dimensies vertonen. De rollenspeler heeft dus de veeleisende
taak om tijdens het rollenspel voortdurend te balanceren op de koord tussen te sterke
en te zwakke prompts die hij voor de verschillende dimensies aan de kandidaten
voorschotelt.
Kortom, in verband met onze eerste vraag kunnen we samenvatten dat de resultaten
suggereren dat rollenspelers bekwaam zijn om AC-opdrachten via prompts te struc-
tureren. Dit blijkt echter geen eenvoudige opdracht en we beargumenteren dan ook
dat een voorafgaande grondige prompttraining en instudering belangrijke voorwaar-
den zijn om rollenspelers hierin te laten slagen.
We vonden weinig evidentie aangaande onze tweede vraag over het effect van prompt-
training op de interbeoordelaarsbetrouwbaarheid, de resultaten toonden namelijk
geen verschillen tussen beide condities. We verwachtten een hogere overeenkomst
tussen de beoordelingen van de assessoren in de conditie met prompttraining omdat
de AC-opdracht meer gestandaardiseerd werd en er meer gedrag uitgelokt werd. Het
niet vinden van een effect is waarschijnlijk te wijten aan het feit dat de assessoren
niet op de hoogte waren van het gebruik van prompts. De prompts dienden dus niet
als een ‘hint naar de assessor toe dat een bepaalde dimensie uitgelokt werd. Toekomstig
onderzoek zou er dus goed aan doen prompts ook in de assessorentraining te verwer-
ken.
Onze laatste onderzoeksvraag spitste zich toe op de percepties van de kandidaten. Er
werd enkel een effect gevonden voor de perceptie van de kandidaten over de moge-
lijkheid tot tweewegscommunicatie met de rollenspeler. Dit effect sprak echter onze
vooropgestelde hypothese tegen. Omgekeerd aan onze verwachtingen op basis van
de interviewliteratuur (Posthuma et al., ) kwam het rollenspel juist vlotter over
door het te structureren. Dit zou te verklaren kunnen zijn door het feit dat door het
gebruik van prompts, kandidaten misschien meer het gevoel hebben dat ze in discus-
sie treden. Blijkbaar lukt het de rollenspeler om prompts op een vrij natuurlijke wijze
te gebruiken, waardoor het gesprek mogelijk niet stugger overkomt en de kandidaten
de indruk hebben dat ze de kans krijgen op het tegenspel antwoord te bieden.
Naast de perceptie van de mogelijkheid tot tweewegscommunicatie werden geen
significante effecten gevonden voor de perceptie van functiegerelateerdheid van de
AC-opdracht en voor interpersoonlijke behandeling door de rollenspeler. Het feit
dat prompttraining weinig effect heeft op deze twee kandidaatpercepties, kan moge-
lijk te wijten zijn aan een plafondeffect (Cohen, ). Vorig onderzoek toonde dat
kandidaten heel positief reageerden ten aanzien van AC-opdrachten (Hausknecht et
al., ). In het licht van het feit dat de percepties van de kandidaten reeds heel
positief zijn, wordt de kans kleiner dat deze nog verbeterd kunnen worden. Aangaande
de tweede onderzoeksvraag kunnen we bijgevolg concluderen dat onze resultaten
suggereren dat het gebruik van prompts waarschijnlijk geen risico inhoudt voor nega-
tieve percepties van kandidaten.
GenO2010-3.indd 227 03-08-2010 14:53:14
Gedrag & Organisatie 2010-23, nr. 3
Rollenspelertraining in assessment centers
228
5.2 Beperkingen
In het kader van deze studie is er een aantal beperkingen. Een eerste opmerking
refereert naar de AC-opdrachten. In het kader van dit onderzoek hebben we enkel
prompts ontwikkeld voor de presentatie en het rollenspel. Zou dit ook mogelijk zijn
voor andere AC-opdrachten, zoals de groepsdiscussie met rollenspelers? Zo ja, dan
rijst de vraag of dit dezelfde resultaten zou geven.
Een tweede mogelijk probleem is het feit dat de data verzameld werden in een gesi-
muleerde selectiesituatie. De kandidaten waren laatstejaarsstudenten, die geen erva-
ring hadden met solliciteren of met AC-opdrachten. Ze solliciteerden ook niet voor
een echte functie. Vooral in het kader van de kandidaatpercepties zou dit de scores
beïnvloed kunnen hebben, aangezien Hausknecht et al. () suggereerden dat het
mogelijk is dat meer ervaren sollicitanten of kandidaten, die deelnemen aan een echte
selectieprocedure andere percepties vertonen. De onervaren kandidaten uit onze
steekproef konden de AC-opdrachten bijvoorbeeld niet echt vergelijken met voor-
gaande AC-opdrachten, wat hun percepties ervan beïnvloed kan hebben. Tot slot
dienen we nog aan te geven dat ook de rollenspelers studenten waren, en dus nog vrij
onervaren.
Toekomstig onderzoek is nodig om de impact van prompttraining op andere belang-
rijke graadmeters van AC-opdrachten na te gaan. Allereerst kan worden onderzocht
of prompttraining effectief de observeerbaarheid van gedrag verhoogt. Rollenspelers
leren tijdens de prompttraining om via prompts dimensierelevant gedrag uit te lokken.
We veronderstellen dan ook dat op deze manier de kandidaten meer kansen krijgen
om relevant gedrag te tonen. Mogelijk zullen de assessoren dus ook meer dimensie-
gerelateerd gedrag observeren. Vervolgens kan het effect van het structureren van de
AC-opdrachten via prompts op de begripsvaliditeit (Lievens & Conway, ) nage-
gaan worden. Door prompts wordt de standaardisatie van AC-opdrachten groter en
wordt er gepoogd om meer dimensiegerelateerd gedrag uit te lokken. Dit alles zou
de overeenkomst van de scores van de verschillende dimensies binnen één AC-opdracht
kunnen verlagen en de overeenkomst van de scores van dezelfde dimensie over
AC-opdrachten heen kunnen verhogen. Een andere interessante invalshoek is het
nagaan van het effect van prompttraining op de predictieve validiteit van AC opdrach-
ten. Tijdens de prompttraining worden prompts aangeleerd die relevant zijn voor de
beoogde functie. De overlap tussen de AC-opdracht en de functie wordt bijgevolg
groter, wat een betere voorspelling van functieprestatie in de hand zou kunnen wer-
ken (Tett & Schleicher, ).
5.3 Conclusie
Concluderend kunnen we stellen dat de implementatie van prompttraining een inte-
ressante invalshoek is om bij AC-opdrachten meer relevant gedrag uit te lokken. Het
is bijgevolg van belang om dit empirisch te benaderen. Dit onderzoek poogde dan
ook om een start te geven aan het wetenschappelijk onderzoek omtrent rollenspelers
en de rollenspelertraining door zich toe te spitsen op de prompttraining. De resulta-
ten tonen dat rollenspelers in staat zijn om prompts toe te passen tijdens AC-opdrachten
om op een consistente wijze gedrag bij kandidaten uit te lokken. Daarnaast heeft het
gebruik van prompts weinig effect op de percepties van kandidaten ten aanzien van
de AC-opdrachten. Mogelijke negatieve consequenties, zoals het stugger overkomen
GenO2010-3.indd 228 03-08-2010 14:53:14
Rollenspelertraining in assessment centers
229
Gedrag & Organisatie 2010-23, nr. 3
van de interactie met de rollenspeler, blijken dus niet van belang te zijn. Het gebruik
van prompts scheen echter op de interbeoordelaarsbetrouwbaarheid ook geen effect
te hebben, wat te wijten kan zijn aan het feit dat de assessoren niet op de hoogte
waren van prompts. Toekomstig onderzoek kan nagaan welke impact prompttraining
van rollenspelers heeft indien de assessoren deze prompts ook als een hint aangeleerd
krijgen. Vervolgens kan toekomstig onderzoek de impact van prompttraining op de
validiteit van AC beoordelingen toetsen.
Praktijkbox
Dit onderzoek pleit ervoor om in de huidige praktijk in rollenspelertrainingen •
in het kader van assessment centers prompts te implementeren. Prompts zijn
voorzetten die de rollenspeler kan gebruiken om relevant gedrag bij kandidaten
uit te lokken. Deze studie toont aan dat rollenspelers in staat zijn deze prompts
te gebruiken indien ze een prompttraining gevolgd hebben. De prompttraining
dient op systematische wijze ontwikkeld te worden.
Vooreerst is het van belang om geschikte prompts te genereren via ervaren asses-•
soren. Zo bekomt men per dimensie een set generieke prompts, die naargelang
de functie of de context specifieker gemaakt kunnen worden.
De prompttraining dient er vervolgens op toe te zien dat de rollenspelers aanle-•
ren om meerdere prompts (drie tot vijf) per dimensie te gebruiken tijdens de AC
opdrachten.
Verder moeten de rollenspelers leren om prompts gestandaardiseerd en consistent •
over kandidaten heen te gebruiken.
Door het gebruik van dimensiegerelateerde prompts kunnen rollenspelers op •
consistente wijze functierelevant gedrag uitlokken en assessoren meer gedrag
beoordelen. Het aanleren van prompts aan rollenspelers kan zo de kwaliteit van
AC’s verbeteren en is handig en vrij goedkoop te implementeren.
Literatuur
Bauer, T.N., Truxillo, D.M., Sanchez, R.J., Craig, J., Ferrara, P. & Campion, M.A. ().
Applicant reactions to selection: Development of the selection procedural justice scale.
Personnel Psychology, 54, -.
Brannick, M.T. (). Back to basics of test construction and scoring. Industrial and
Organizational Psychology, 1, -.
Cohen, P.R. (). Empirical methods for artif icial intelligence. Cambridge, MA: MIT Press.
Conway, J.M., Jako, R.A. & Goodman, D.F. (). A meta-analysis of interrater and
internal consistency reliability of selection interviews. Journal of Applied Psychology, 80,
-.
Conway, J.M. & Peneno, G.M. (). Comparing structured interview question types:
Construct validity and applicant reactions. Journal of Business and Psychology, 13, -.
Epstein, S. (). The stability of behavior: I. On predicting most of the people much of
the time. Journal of Personality and Social Psychology, 37, -.
Gilliland, S.W. (). The perceived fairness of selection systems: An organizational
perspective. Academy of Management Review, 18, -.
Hausknecht, J.P., Day, D.V. & Thomas, S.C. (). Applicant reactions to selection
procedures: An updated model and meta-analysis. PersonnelPsychology, 57, -.
GenO2010-3.indd 229 03-08-2010 14:53:14
Gedrag & Organisatie 2010-23, nr. 3
Rollenspelertraining in assessment centers
230
International Taskforce on Assessment Centers Guidelines. (). Guidelines and ethical
considerations for assessment center operations. International Journal of Selection and
Assessment, 17, -.
Jansen, P.G.W. & De Jongh, F. (). Assessment centers: Een open boek. Utrecht: Het
Spectrum.
Lance, C.E. (). Why assessment centers (ACs) don’t work the way they’re supposed to.
Industrial and Organizational Psychology: Perspectives on Science and Practice, 1, -.
Lievens, F. (). Factors which improve the construct validity of assessment centers: A
review. International Journal of Selection and Assessment, 6, -.
Lievens, F. & Conway, J.M. (). Dimension and exercise variance in assessment center
scores: A large-scale evaluation of multitrait-multimethod studies. Journal of Applied
Psychology, 86, -.
Lievens, F. & Klimoski, R.J. (). Understanding the assessment center process: Where
are we now? International Review of Industrial and Organizational Psychology, 16, -
.
Mischel, W. (). Toward a cognitive social learning reconceptualization of personality.
Psychological Review, 80, -.
Posthuma, R.A., Morgeson, F.P. & Campion, M.A. (). Beyond employment interview
validity: A comprehensive narrative review of recent research and trends over time.
Personnel Psychology, 55, -.
Tett, R.P. & Guterman, H.A. (). Situation trait relevance, trait expression, and
crosssituational consistency: Testing a principle of trait activation. Journal of Research in
Personality, 34, -.
Tett, R.P. & Schleicher, D.J. (, April). Assessment center dimensions as ‘traits’: New
concepts in AC design. In M. Born (Chair), Assessment center dimension validation: Are
we asking the wrong questions? Symposium conducted at the Annual Conference of the
Society for Industrial and Organizational Psychology, San Diego, CA.
Thornton, G.C. III, & Byham, W.C. (). Assessment centers and managerial performance.
NY: Academic Press.
Thornton, G.C. III, & Mueller-Hanson, R.A. (). Developing organizational simulations:
A guide for practitioners and students. Mahwah, NJ: Lawrence Erlbaum Associates.
Thornton, G.C. III. & Rupp, D.E. (). Assessment centers in human resource management.
Mahwah, NJ: Lawrence Erlbaum Associates.
A new perspective on role-player training in assessment centres
Eveline Schollaert & Filip Lievens, Gedrag & Organisatie, volume 23, September
2010, nr. 3, pp. 213-231.
The most recent assessment centre guidelines emphasize that exercises should be
designed to evoke a substantial amount of relevant behaviour (International Task
Force on Assessment Center Guidelines, 2009). However, no empirical evidence
exists of how one can manage this. This study aims to fill this gap by suggesting
that role-player training should be extended via the use of ‘prompts’ to evoke
behaviour. Prompts are standardized cues that a role-player consistently mentions
in an AC exercise across candidates to elicit behaviours related to specific job-related
dimensions. In the present study, role players and candidates were randomly
assigned to two experimental conditions. In the first condition, the role players
(N = 9) received no prompt training (117 candidates). In the second condition,
the role players (N = 10) received a training with prompts (116 candidates).
Results reveal that role-players are able to use prompts after attending training
with prompts. When role-players use prompts, candidates also have favourable
perceptions of the job-relatedness, two-way communication, and warmth of the
GenO2010-3.indd 230 03-08-2010 14:53:14
Rollenspelertraining in assessment centers
231
Gedrag & Organisatie 2010-23, nr. 3
assessment centre exercises. In addition, however, the inter-rater reliability of
assessors was not positively affected by the use of prompts. A possible explanation
is that assessors did not acknowledge that prompts had been used.
Key words: assessment centres, role-players, role-player training
GenO2010-3.indd 231 03-08-2010 14:53:14
232
Het beoordelen van mensen voor werkgerelateerde doelen
Reeks ‘Diversiteit in organisaties’
Het beoordelen van mensen voor
werkgerelateerde doelen:
Etniciteit, moraliteit, en
subjectiviteit1
Marise Born*
Dit betoog behandelt de vraag of het beoordelingsproces bij het werven
en selecteren van personeel geschikt is voor een etnisch-cultureel divers
samengestelde kandidatenpool, en of dit proces behulpzaam is bij het
streven van organisaties naar een divers personeelsbestand. In hoeverre
spelen integriteit en morele waarden hierbij een rol? Moreel disengage-
ment is een mogelijke oorzaak voor het feit dat het klakkeloos afwijzen
van allochtone sollicitanten een groot taboe is maar dat het toch gebeurt.
In welke mate dragen bestaande selectiemiddelen bij aan correcte proce-
dures en diversiteit onder het personeel? Het meten van het hele arsenaal
aan capaciteiten, kennis, en vaardigheden blijkt scoreverschillen op tests
tussen groepen te reduceren en diversiteit te bevorderen, met behoud van
het selectierendement. Tot slot, zelfbeoordelingen op een persoonlijkheids-
vragenlijst blijken niet altijd een goed beeld op te leveren van persoonlijk-
heidskenmerken van allochtone kandidaten. Duidelijkheid en transparantie
bij de beoordeling en besluitvorming bevorderen het correct werven en
selecteren voor een diverser personeelsbestand.
Trefwoorden: personeelsselectie, diversiteit, integriteit, moraliteit,
zelfbeoordeling
* M. Born is verbonden aan de afdeling Psychologie van de Erasmus Universiteit Rotterdam
en aan de afdeling Sociale en organisatiepsychologie van de Vrije Universiteit Amsterdam.
Correspondentieadres: Postbus 1738, 3000 DR Rotterdam, e-mail born@fsw.eur.nl.
GenO2010-3.indd 232 03-08-2010 14:53:14
Het beoordelen van mensen voor werkgerelateerde doelen
233
Gedrag & Organisatie 2010-23, nr. 3
1 Inleiding
In dit artikel staat het proces centraal waarin mensen worden beoordeeld voor werk-
gerelateerde doeleinden. Dit beoordelingsproces is een klassieke kerntaak van de
personeelspsychologie, die bestaat uit testontwikkeling, werving, selectie, en assess-
ment van personeel. Hoe staat het met de deskundigheid van de personeelspsycho-
logie in deze taak? Een aantal veranderingen in onze werkelijkheid dwingt deze
toegepaste tak van de psychologie tot nadenken. De arbeidsmarkt van nu is in ver-
gelijking met een halve eeuw geleden veel diverser geworden. Kan het imago van
vakbekwaamheid op dit domein nog altijd worden waargemaakt, of wordt die des-
kundigheid langzamerhand obsoleet? Hoe zit het met adviezen, die aan sollicitatie-
commissies worden gegeven over selectieprocedures in de praktijk van alledag, en die
vaak in handen zijn van onbedreven ad hoc selecteurs? Het is van groot maatschap-
pelijk belang dat beoordelingsprocedures niet alleen voor autochtone groepen geschikt
zijn, maar ook voor de aanzienlijke groepen mensen van etnisch-allochtone afkomst
in ons land, en dat testscores en uitspraken over allochtone Nederlanders dezelfde
betekenis hebben als voor autochtone Nederlanders. Bij een veranderende werkelijk-
heid moet de personeelspsychologie blijven onderzoeken of haar empirisch onder-
bouwde bevindingen nog wel geldig zijn. Alleen op die manier kan ze de aspiratie
waar blijven maken om verantwoorde metingen en voorspellingen te doen.
De etnisch-culturele diversiteit van onze samenleving heeft implicaties voor het
beoordelen van mensen voor werkgerelateerde doeleinden. Het accent in dit betoog
ligt daarbij vooral op beoordelingsaspecten van werving en selectie, dat wil zeggen,
daar waar een differentiatie wordt aangebracht tussen geschikte en minder geschikte
mensen. Bij dit aspect van de personeelspsychologie zijn de invloeden van multicul-
turaliteit bij de beoordeling het sterkst (Andriessen, Dagevos, Nievers & Boog,
).
De twee centrale vragen die aan bod komen zijn de volgende. Verloopt het beoorde-
len van mensen van allerlei afkomst tijdens het werven en selecteren op een onpar-
tijdige manier? Is het bovendien via werving en selectie mogelijk om een zo divers
mogelijk personeelsbestand te verkrijgen, een streven van veel organisaties, niet alleen
voor bedrijfsdoeleinden, maar ook om sociale en ethische redenen (Ployhart & Holtz,
)? Drie hoofdonderwerpen zullen worden behandeld waarin beide vragen een
rol spelen.
Allereerst komt de kwestie van integriteit aan bod. Op welke wijze hangt het beoor-
delen van mensen van allerlei afkomst samen met ethische regels en waarden in ons
land, die betrekking hebben op het beoordelingsproces? Besproken zal worden hoe
het beoordelingsproces en het verkrijgen van een divers personeelsbestand te maken
hebben met integriteit en moreel handelen in arbeidsorganisaties.
Ten tweede wordt een aantal belangrijke onderdelen van het beoordelingsproces in
ogenschouw genomen: hoe gekleurd zijn deze onderdelen? Welke effecten voor een
divers personeelsbestand heeft het gebruik van de beoordelingsmethoden waar we
ons tot nu toe altijd zo behaaglijk bij voelden in een heterogene groep sollicitanten?
Hoe druk moeten we ons maken over de subjectiviteit die altijd deels in het beoor-
delingsproces zit, en de daarmee mogelijk gepaard gaande partijdigheid? Uit selec-
tiepsychologisch onderzoek komt systematisch naar voren dat de test, die werkpres-
taties het best voorspelt, de intelligentietest, tegelijkertijd ook de grootste
GenO2010-3.indd 233 03-08-2010 14:53:14
Gedrag & Organisatie 2010-23, nr. 3
Het beoordelen van mensen voor werkgerelateerde doelen
234
scoreverschillen laat zien tussen de etnisch autochtone en etnisch allochtone groepen.
Deze scoreverschillen nemen overigens af in de tweede generatie allochtonen. Er zijn
enkele concrete strategieën voorhanden, die een oplossing kunnen bieden bij het
streven naar een divers personeelsbestand zonder dat er concessies hoeven te worden
gedaan aan het rendement van personeelsselectie (Ployhart & Holtz, ). Over de
precieze effecten van iemands etnisch-culturele achtergrond op resultaten op een
persoonlijkheidsvragenlijst bestaat tot nu toe echter veel minder duidelijkheid.
Ten derde is er aandacht voor het proces van zelfbeoordeling. Meestal bepalen we de
persoonlijkheidseigenschappen van mensen in de psychologie met behulp van zelf-
beoordelingen. Bij persoonlijkheidsvragenlijsten kan men er niet altijd automatisch
gerust op zijn dat er geen vertekeningen optreden als mensen uit verschillende
etnisch-culturele groepen deze vragenlijsten invullen. Zulke vertekeningen hangen
wellicht samen met cultuurspecifieke formuleringen in dit type tests, zoals typisch
Nederlandse uitdrukkingen en gezegden die niet goed begrepen worden, maar ook
met verschillen in interpretatie van de testvragen (Bochhah, Kort, Seddik & Van de
Vijver, ). Hoe gekleurd is de zelfbeoordeling en wat voor gevolgen zijn er voor de
diversiteit van het personeelsbestand?
2 Integriteit
Hoe integer wordt er gehandeld in het beoordelingsproces? Welke rol hebben waar-
den en normen in het verkrijgen van een divers personeelsbestand? De psychologie
wil het menselijk gedrag kunnen begrijpen en voorspellen. Psychologisch onderzoek
laat zien dat waarden en normen gedrag kunnen voorspellen in vele belangrijke
domeinen, zoals consumentengedrag en politiek stemgedrag (Bardi, Calogero &
Mullen, ).
Wat betreft het werkdomein, kunnen heersende waarden binnen een cultuur een
direct effect hebben bij beslissingen over personeel. De volgende voorbeelden maken
dit duidelijk zichtbaar. Zoals bekend kunnen werknemers worden bevorderd op grond
van hun anciënniteit of op grond van hun individuele werkprestaties. Medewerkers
in het Verenigd Koninkrijk, een land met individualisme en vrijheid als belangrijke
waarden, blijken positiever te staan tegenover beleid voor bevorderingen dat gebaseerd
is op individuele werkprestaties dan hun meer gemeenschapsgeoriënteerde Duitse
collega’s (Fischer & Smith, ). In de samenlevingen van Japan en Taiwan, waar
veel waarde gehecht wordt aan het collectief, hangt de beslissing om sollicitanten aan
te nemen sterker af van de inschatting of deze goed zullen kunnen samenwerken met
de reeds in de organisatie aanwezige werknemers, dan van hun vakbekwaamheid.
Mexico is een maatschappij met een grote machtsongelijkheid, waar de waarde van
gelijkheid een minder prominente rol speelt. Daar vormt het aantal strategisch goede
connecties dat een kandidaat heeft één van de drie belangrijkste criteria om deze aan
te nemen (Huo, Huang & Napier, ). Als laatste voorbeeld kan de strikte hiërar-
chie van de Turkse politie worden genoemd. Turkije is een land met een grote machts-
afstand. Bij de Turkse politie ligt de toekomst van een sollicitant uiteindelijk slechts
in één paar handen, namelijk die van de hoogste officier in de selectiecommissie
(Calgar, ).
GenO2010-3.indd 234 03-08-2010 14:53:14
Het beoordelen van mensen voor werkgerelateerde doelen
235
Gedrag & Organisatie 2010-23, nr. 3
Uit deze voorbeelden komen de gevolgen van waarden en normen bij de werving en
selectie duidelijk naar voren. De meer specifieke vraag is nu welke soms onuitgespro-
ken opvattingen en normen een rol lijken te spelen bij het beoordelen van mensen in
ons eigen multiculturele Nederland? In Nederland is bijna een kwart van de bevolking
allochtoon, en van dat kwart heeft meer dan de helft een niet-westerse afkomst (CBS
Statline, ). Inmiddels wordt er immers een bont gezelschap van mensen van
diverse etnisch-culturele pluimage voor werkgerelateerde doeleinden gekeurd. Ik spits
het betoog daarbij toe op morele waarden en normen. Met andere woorden, hoe
integer wordt er gehandeld in het beoordelingsproces? Is dat handelen in overeen-
stemming met relevante morele normen, gedragscodes en waarden zoals die gelden
in de maatschappij (McFall, )?
2.1 Vroeger en nu
In vervlogen tijden, in september , gingen mijn ouders naar het Instituut van
professor Jan Waterink, het Laboratorium voor Toegepaste Psychologie op de hoek
van de Vossiusstraat en de Van Baerlestraat. Dit laboratorium herbergde sinds 
het psychotechnische, bedrijfspsychologische en beroepskeuzewerk van Waterink,
dat voor die tijd onderdeel was geweest van zijn Psychotechnisch Laboratorium (het
tegenwoordige LTP Advies te Amstelveen). Ze zouden die dag een aantal tests onder-
gaan voor hun uitzending naar Pakistan vanuit de Gereformeerde Kerken en ervoe-
ren dit bezoek als een ware happening. Voor de gelegenheid had mijn moeder een
mooi truitje aan. Het werd voor hen een wonderbaarlijk en magisch bezoek. Langs
een wand met uitstekende knoppen moesten ze een touw leggen over een voorgete-
kend patroon van lijnen. Er werd bekeken of ze dat spoor konden blijven volgen.
Daarna deden ze een rangeertest waarbij ze spoortreintjes op de juiste plaats moesten
manoeuvreren; daarbij werd ook de stopwatch gehanteerd om te zien hoe lang ze
daarover deden. Naast deze praktische tests kregen ze de Rorschachtest, daterend uit
. In deze opmerkelijke test kregen ze een vlek voorgelegd en moesten ze opschrij-
ven wat ze daarin herkenden. Waar zouden ze toen aan gedacht hebben? Ook was er
een gesprek met enkele deskundigen en moesten ze op een serie ethisch-morele
kwesties reageren. Ze hoorden daarna dat ze geschikt werden bevonden en stapten
aan boord van een groot schip naar Pakistan. Hoewel ze recht hadden op een gesprek
over de uitslag, maakten ze geen gebruik van dit recht op informatie in de drukte van
dat moment. Op de integriteit van vooral de Rorschachtest valt inmiddels heel wat
af te dingen. In het testbeoordelingssysteem van het Nederlands Instituut van
Psychologen, het NIP (Evers, Van Vliet-Mulder & Groot, ) wordt de test als
eerste in de categorie persoonlijkheidstests besproken. Daaruit blijkt dat hij werkelijk
van geen kanten deugt.
Het Instituut van Waterink handelde alleszins oprecht naar de maatstaven van een
halve eeuw geleden, maar serieus empirisch onderzoek naar de kwaliteit van tests,
laat staan naar hun geschiktheid voor allerlei etnisch-culturele groepen, speelde toen
nog nauwelijks een rol.
In de huidige tijd komen praktische tests, zoals touwen leggen en spoortreintjes
rangeren, niet meer voor in de standaardgereedschapskist van de psycholoog. De
Rorschachtest is bij de serieuze adviesbureaus gelukkig verdwenen, hoewel het opvalt
dat hij bij onze Belgische buren nog altijd voorkomt in hun lijstje van meest gebruikte
GenO2010-3.indd 235 03-08-2010 14:53:14
Gedrag & Organisatie 2010-23, nr. 3
Het beoordelen van mensen voor werkgerelateerde doelen
236
tests (Muñiz & Bartram, ). Dat deze tests ondertussen bij ons niet meer worden
gebruikt, heeft alles te maken met de strakker geformuleerde rechten van sollicitan-
ten, die af te leiden zijn uit de ethische richtlijnen van de Beroepscode voor psycho-
logen van het NIP (), de Algemene Standaard Testgebruik van het NIP (),
en de sollicitatiecode van de Nederlandse Vereniging voor Personeelsmanagement
en Organisatieontwikkeling, de NVP (). Naast het recht op informatie, op een
vertrouwelijke behandeling van de resultaten, en op het hebben van een eerlijke kans,
hebben sollicitanten ook het recht op een instrumenteel doelmatige procedure, dat
wil zeggen een procedure met relevante selectiemethoden. Het gebruik van weten-
schappelijk niet aanvaardbare en dus ondeugdelijke methoden, zoals de Rorschachtest,
is ondeskundig en getuigt niet van integer handelen. Het is frappant dat nog maar
pasgeleden, in , voor het eerst door het NIP in samenwerking met het Landelijk
Bureau ter bestrijding van Rassendiscriminatie een aantal broodnodige richtlijnen
gepubliceerd is voor het gebruik van diagnostische instrumenten bij etnische min-
derheden (Bochhah, Kort & Seddik, a). Het blijft echter nog altijd een grote
tekortkoming in de Nederlandse situatie dat voor het overgrote deel van de bestaande
Nederlandse tests en vragenlijsten niet of nauwelijks solide empirische informatie
beschikbaar is over de toepasbaarheid bij etnische minderheden (Bochhah, Kort &
Seddik, b). Het is daarom belangrijk dat het systeem ter beoordeling van
Nederlandstalige tests van de Commissie Testaangelegenheden van het Nederlands
Instituut van Psychologen (COTAN), een duidelijke kwaliteitseis over deze toepas-
baarheid opneemt.
Naast aangescherpte ethische richtlijnen, is ook de kandidaat in het huidige
Nederlandse tijdsgewricht veranderd. Deze dwingt de beoordelaar meer dan vroeger
tot verantwoording. Deze verandering wordt beschreven door Bas Kok in zijn in 
verschenen debuutroman Het Lab, waarvoor hij zich heeft laten inspireren door de
geschiedenis van het Instituut van Jan Waterink. Hij schrijft: ‘We zaten niet langer
tegenover onze gesprekspartner, we zaten mét hem aan tafel.’ (p. ). Over een kan-
didaat die duidelijk slecht op de tests had gepresteerd, schrijft hij vervolgens: ‘Toen
ik hem meedeelde dat mijn advies negatief uitviel, trok hij fel van leer. … “Dit is
allemaal onzin, het kost tijd en geld, flauwekul is het.Ik wil dat u het rapport
aanpast.”’ (p. ). Mondiger en meer assertieve kandidaten passen goed in ons egali-
taire land waar men wars is van machtsongelijkheid en waar een kandidaat soms zelfs
een bloemetje meeneemt voor de psycholoog als dank voor een positief uitgebracht
advies aan een organisatie (Kok, , p. ). Kandidaten kunnen bovendien sinds
 hun stem laten horen bij de Commissie Gelijke Behandeling (CGB) en de
antidiscriminatiebureaus (ADB’s), waar ze een klacht kunnen indienen als ze zich
ongelijk behandeld voelen. Hoe snel allochtone kandidaten een klacht zullen indienen
is nog maar de vraag, gezien de gezagsgetrouwheid die in verschillende culturele
groepen sterk aanwezig is. Uit onderzoek van Van den Berg en Evers () blijkt
dat ongeveer driekwart van de ondervraagden zei dat ze door hen ervaren discrimi-
natie op grond van etnische afkomst nooit meldden.
2.2 Ethische problemen en moreel disengagement
Professionele adviesbureaus geven hun aanbevelingen gewoonlijk aan een organisatie.
Deze zal vervolgens, gebaseerd op de ontvangen adviezen, zelf een keuze uit de sol-
GenO2010-3.indd 236 03-08-2010 14:53:14
Het beoordelen van mensen voor werkgerelateerde doelen
237
Gedrag & Organisatie 2010-23, nr. 3
licitanten maken. In taxonomieën van integriteit en ethische problemen in organisa-
ties komen ethische kwesties voor, die te maken hebben met het selecteren van per-
soneel (Geva, ). In de traditie van Kohlbergs () belangrijke theorie van
moreel redeneren, die later door zijn leerling Rest () werd verfijnd, werd onlangs
een test ontwikkeld voor het morele oordeelsvermogen van managers, de zogenaamde
Measure of Managerial Moral Judgment (Loviscky, Trevino & Jacobs, ). Deze
test bevat een scenario over personeelsselectie als één van de zes meest typerende
ethische situaties die een manager kan tegenkomen. De meerderheid van bedrijfsethi-
sche kwesties gaat over eerlijkheid, dat wil zeggen eerlijkheid in procedures en eerlijk-
heid in de verdeling van middelen, bijvoorbeeld wie de baan krijgt. Antwoorden op
deze test worden ondergebracht in Kohlbergs stadia van moreel redeneren. Het kan
gaan om zogeheten conventionele redeneringen, die uitgaan van argumenten van orde
en gezag. Ook kan het gaan om andere, postconventionele redeneringen, die uitgaan
van universele ethische waarden. Degenen die redeneren op het postconventionele
niveau bezitten een sterk ontwikkeld waardesysteem, dat is gebaseerd op het hande-
len naar wat het meest eerlijk is vanuit een sociaal-maatschappelijk perspectief.
Opmerkelijk genoeg blijkt dat het morele redeneerniveau van managers bij beslis-
singen op het werk wat lager uitvalt dan bij beslissingen die ze in het algemene leven
nemen (Weber, ). Hoe komt het dat anders zo gewone personen soms, bijvoor-
beeld in een selectiecommissie, in staat zijn om niet-integer gedrag te vertonen zon-
der dat ze last hebben van enige vorm van schuldgevoel of zelfcensuur? Volgens de
vermaarde psycholoog Bandura () kan dergelijk gedrag worden verklaard door
zogeheten moreel disengagement. Deze term is wat lastig te vertalen en verwijst naar
het ontkoppelen van het eigen gedrag en een moreel oordeel daarover. Het proces
van ontkoppelen gaat via een aantal cognitieve mechanismen. Een voorbeeld van zo’n
mechanisme is mo