Content uploaded by Jacques Grégoire
Author content
All content in this area was uploaded by Jacques Grégoire on Jan 21, 2021
Content may be subject to copyright.
A.N.A.E. ◆ 2020 - 169 - 001-009
A.N.A.E. N° 169 ● DÉCEMBRE 2020 ● 1
Pour citer cet article : Grégoire, J. (2020). Les
différences intellectuelles entre garçons et
lles, 35 ans d’évolution du WISC-R au WISC-V.
A.N.A.E., 169, 000-000.
© copyright ANAE
Université de Louvain, Belgique.
Conits d’intérêts : l’auteur déclare n’avoir
aucun conit d’intérêt.
Les différences intellectuelles entre garçons et
lles, 35 ans d’évolution du WISC-R au WISC-V
J. GréGoire
RÉSUMÉ : Les différences intellectuelles entre garçons et lles,
35 ans d’évolution du WISC-R au WISC-V
De nombreuses représentations circulent à propos des différences de
compétences cognitives en fonction du genre. Ces représentations
sociales inuencent les attitudes des parents et des enseignants, et
peuvent avoir d’importantes conséquences en termes d’orientation
scolaire. La publication du WISC-V nous offre l’opportunité d’exami-
ner ces représentations sur la base des performances d’un important
échantillon de jeunes de six à 16 ans représentatif de la population
française. Les données d’étalonnage du WISC-V ne conrment pas les
stéréotypes qui circulent à propos de compétences intellectuelles des
lles et des garçons. Quelques différences statistiquement signica-
tives subsistent, mais elles sont généralement d’ampleur réduite, sans
implication pratique. La seule différence de taille plus importante est à
l’avantage des lles. Elle concerne les performances dans les tâches de
vitesse de traitement qui demandent un important contrôle de l’atten-
tion et de la coordination oculomotrice.
Mots clés : WISC-V – Intelligence − Genre – Différences − Stéréotypes.
SUMMARY: xxxx
Many representations are circulating on the differences in cognitive skills
according to gender. These social representations inuence the attitudes
of parents and teachers and can have important consequences in terms
of educational guidance. The WISC-V gave us the opportunity to exa-
mine these representations based on the performances of a large sample
of children between 6 to 16, representative of the French population.
WISC-V standardization data did not support the stereotypes that cir-
culate about the intellectual skills of girls and boys. Some statistically si-
gnicant differences were observed, but were generally small with no
practical implications. The only biggest difference was to the advantage
of girls. It concerns performance in speed tasks that require a high control
of attention and oculomotor coordination.
Key words: WISC-V – Intelligence – Gender – Differences − Stereotypes.
RESUMEN: xxx
xxxx
Palabras clave: xxxx.
J. GréGoire
2 ● A.N.A.E. N° 169 ● DÉCEMBRE 2020
© copyright ANAE
Certains préjugés ont la peau dure. C’est
le cas des représentations qui circulent
encore aujourd’hui à propos des diffé-
rences de compétences cognitives en fonction
du genre. Les lles seraient plus « littéraires »
et moins « scientiques » que les garçons. Les
premières seraient moins compétentes que
les seconds dans les tâches numériques et
visuospatiales, et dès lors, moins à même de
réussir dans certains domaines d’étude et
dans certaines professions. Cette représenta-
tion sociale des compétences intellectuelles en
fonction du genre inuence la représentation
de soi et les attitudes des parents et des ensei-
gnants. Elle peut avoir d’importantes consé-
quences en termes d’éducation et d’orienta-
tion scolaire (Gaudron, 2020).
Mais les différences de compétences en fonc-
tion du genre ne sont-elles qu’un construit
social ou reposent-elles sur des différences
objectives ? La publication du WISC-V nous
offre l’opportunité d’examiner ces différences
sur la base des performances d’un important
échantillon de jeunes de six à 16 ans repré-
sentatif de la population française, à une large
gamme d’épreuves cognitives. Après avoir
passé en revue la littérature scientique sur
la question des différences de performances
intellectuelles en fonction du genre, une série
d’hypothèses ont pu être mises à l’épreuve
à l’aide des résultats de l’échantillon d’éta-
lonnage du WISC-V. Ces analyses ont été
confrontées à celles réalisées sur les résultats
des échantillons d’étalonnage de versions
antérieures du WISC dont la récolte s’éche-
lonne sur 35 années.
Que nous dit la littérature
scientique ?
La première approche scientique des dif-
férences intellectuelles entre les hommes et
les femmes remonte à la seconde moitié de
19e siècle avec les travaux du neuroanatomiste
Pierre Broca. Comparant le poids moyen du
cerveau des hommes et des femmes, Broca
(1861) observe une différence de poids d’envi-
ron 10 % à l’avantage des hommes. Bien qu’il
ne dispose alors d’aucune mesure objective
de l’intelligence1, Broca infère une relation
de causalité entre cette petitesse relative du
cerveau des femmes et leur infériorité intellec-
tuelle moyenne.
Les premières mesures objectives de l’intel-
ligence réalisées au début du 20e siècle ne
conrment pas le postulat de Broca d’une
infériorité intellectuelle moyenne des femmes.
Ainsi, Terman (1916), sur la base de son adap-
tation américaine du test d’intelligence de
Binet, constate une légère supériorité du QI
1 ● Le premier test d’intelligence est publié par Binet en 1905.
des lles entre cinq ans et 13 ans ; les garçons
n’étant supérieurs aux lles qu’à l’âge de 14
ans. Un constat similaire est fait par Wechsler
(1944, p. 106) avec son test d’intelligence pour
les adultes : « Comme le montre aujourd’hui
notre échelle, il n’y a aucune différence statis-
tiquement signicative du score total entre les
sexes, bien que les femmes aient tendance à
avoir un résultat moyen supérieur à celui des
hommes dans quasi tous les groupes d’âge. »
Certains auteurs (par exemple, Garcia, 1981)
ont toutefois mis en question les observa-
tions de Terman et Wechsler, les considérant
comme des artefacts, car les deux psycho-
métriciens auraient éliminé de leurs tests
les épreuves désavantageant les femmes,
faisant ainsi disparaître toute différence. Il
est vrai que tant Terman (1916) que Wechsler
(1944) reconnaissent avoir écarté certaines
épreuves qu’ils jugeaient inéquitables pour
l’un ou l’autre sexe. Mais cette sélection
des épreuves est marginale et son impact
doit être relativisé. Pour ce qui concerne les
échelles de Wechsler, il est utile de rappe-
ler que sept de 11 épreuves de sa première
échelle d’intelligence, la Wechsler-Bellevue
Intelligence Scale de 1939, provenaient de
l’armée américaine qui les avait utilisées en
1917 pour sélectionner les soldats envoyés sur
le front lors de la Première Guerre mondiale.
Rien n’indique que l’armée américaine se
soit préoccupée des biais de genre lors de la
création d’épreuves intellectuelles destinées
uniquement à la sélection des hommes de son
contingent. Pour ce qui concerne les versions
les plus récentes des échelles de Wechsler,
nous avons pu nous-mêmes constater, lors
de notre participation à leur développement
américain (WISC-IV, WAIS-IV et WISC-V) et à
leur adaptation française (toutes les échelles
depuis le WISC-III), une absence de volonté
d’écarter des épreuves qui pourraient défavo-
riser les femmes. La seule préoccupation des
développeurs a toujours été de sélectionner
des tâches qui couvrent largement le spectre
des aptitudes intellectuelles et représentent
le mieux possible les grandes composantes
de l’intelligence an que le score total au test
fournisse une mesure valide de l’intelligence
générale. Ce faisant, les échelles de Wechsler
permettent aussi une bonne estimation du
facteur g qui est au cœur de la structure de
l’intelligence. Or, Colom et al. (2000) ont
observé, dans une importante étude portant
sur 4 256 femmes et 6 219 hommes, que la
différence entre les hommes et les femmes sur
le facteur g est quasi nulle.
S’il est aujourd’hui bien établi qu’en moyenne,
les hommes et les femmes ne diffèrent pas
signicativement du point de vue de leur
intelligence générale, certains auteurs ont
attiré l’attention sur de possibles différences
Les différences intellectuelles entre garçons et lles,
35 ans d’évolution du WISC-R au WISC-V
A.N.A.E. N° 169 ● DÉCEMBRE 2020 ● 3
© copyright ANAE
plus subtiles. Feingold (1992) a avancé l’hy-
pothèse que des scores moyens identiques
chez les hommes et les femmes masqueraient
des variances différentes. Une telle hypo-
thèse n’est pas neuve. Elle a été proposée au
19e siècle par Ellis (1894) pour tenter d’expli-
quer la surreprésentation des hommes dans les
institutions pour retardés mentaux et parmi les
personnalités intellectuelles éminentes. Selon
cette hypothèse, la courbe de distribution
des performances intellectuelles des hommes
serait plus étendue que celle des femmes,
ce qui conduirait à la surreprésentation des
hommes aux deux extrémités de cette courbe,
sans mettre en évidence de différence de
moyenne entre les sexes. Quelques études
ont mis cette hypothèse à l’épreuve des faits,
avec des résultats variables. Feingold (1992)
présente des données conrmant cette hypo-
thèse sur la base d’épreuves de raisonnement
quantitatif, d’analyse visuelle, d’orthographe
et de connaissances générales. Larkin (2013)
obtient des résultats allant dans le même sens
avec des épreuves de raisonnement verbal,
non verbal et numérique. Par contre, Johnson
et al. (2008) observent, sur la base des résul-
tats à un test d’intelligence générale, passé
par la quasi-totalité des enfants écossais âgés
de 11 ans, une distribution asymétrique des
performances intellectuelles où les garçons
sont surreprésentés par rapport aux lles prin-
cipalement dans les niveaux les plus faibles.
Lynn (1994), quant à lui, avance l’hypothèse
que l’absence de différence entre les hommes
et les femmes du point de vue de l’intelli-
gence générale masquerait des différences
variant en fonction de l’âge. Aucune diffé-
rence signicative ne serait observée jusqu’à
14-15 ans, car la maturation plus précoce des
lles permettrait de compenser des poten-
tialités différentes en fonction du sexe. Par
contre, au-delà de 14-15 ans, la matura-
tion des garçons se prolongerait et ferait
apparaître une différence d’intelligence géné-
rale à l’avantage de ces derniers. Lynn et
Irwing (2004) ont publié une méta-analyse de
57 études sur les différences de performances
aux Matrices de Raven en fonction du sexe
qui tend à conrmer cette hypothèse. Des
différences signicatives entre les hommes et
les femmes apparaissent en effet à ce test de
raisonnement inductif à partir de 15 ans. Ces
différences restent toutefois modestes, de
l’ordre de 0,25 écart-type.
Par ailleurs, de nombreux auteurs ont observé,
au sein des batteries d’épreuves utilisées pour
mesurer le QI, des différences de résultats
entre les hommes et les femmes en fonction
des tâches, certaines d’entre elles étant mieux
réussies par les garçons et d’autres par les
lles. Wechsler (1944) remarquait déjà que les
femmes étaient souvent meilleures dans les
épreuves de vocabulaire et les hommes dans
celles de raisonnement arithmétique. Par la
suite, les études empiriques se sont multi-
pliées et ont identié diverses épreuves mieux
réussies par l’un ou l’autre sexe. Dans une
importante méta-analyse, Hyde et Lynn (1988)
ont conrmé que les lles sont généralement
meilleures que les garçons dans les épreuves
verbales, du moins dans les études antérieures
à 1973. Après cette date, les différences ne
cessent de décroître pour devenir quasi nulles.
Else-Quest et al. (2010) ont, dans une autre
méta-analyse, mis en évidence de meilleures
performances des garçons dans les épreuves
de mathématiques. Ces différences sont tou-
tefois variables d’un pays à l’autre en fonction
des pratiques éducatives. Beaucoup d’études
se sont également intéressées aux différences
de performances dans les épreuves de raison-
nement visuospatial en fonction du sexe. Voyer
et al. (1995) en ont réalisé une méta-analyse
qui montre que les garçons sont souvent meil-
leurs que les lles dans ce type d’épreuves.
Toutefois, l’importance de cette supériorité est
variable d’une épreuve à l’autre. Elle est parti-
culièrement marquée dans les épreuves chro-
nométrées de rotation mentale (Voyer, 2011).
Enn, plusieurs chercheurs se sont intéressés
aux différences entre les garçons et les lles
aux épreuves de vitesse de traitement. Camara
et Woodcock (2006) et Roivainen (2011) ont
mis en évidence une très nette supériorité des
lles dans ces épreuves. Ces mêmes auteurs
ont souligné qu’une même supériorité est
observée en lecture et en écriture. Roivainen
avance l’hypothèse que la supériorité des lles
dans ces deux derniers domaines pourrait
expliquer leur supériorité dans les épreuves
de vitesse de traitement. L’hypothèse inverse
est toutefois aussi plausible et le lien de
causalité n’a pas pu être prouvé. Il est plus
vraisemblable qu’une compétence commune
intervienne dans l’écriture et les épreuves de
vitesse de traitement et permette d’expliquer
les différences observées dans les deux types
d’activités. Il pourrait s’agir de la motricité ne,
compétence où les lles sont généralement
meilleures (Peyre et al., 2019). Pour notre part
(Grégoire, 2009, 2019), nous avons avancé
l’hypothèse que cette différence pourrait être
due à un meilleur contrôle attentionnel chez
les lles que chez les garçons. Les épreuves de
vitesse de traitement, en particulier, celle de
Code, sont en effet les moins bien réussies par
les enfants souffrant de troubles de l’attention
et de la concentration (Schwean & Saklofske,
2005 ; Mayes & Calhoun, 2006). Or, les études
épidémiologiques montrent que le décit de
l’attention et l’hyperactivité sont plus fréquents
chez les garçons que chez les lles, le taux de
prévalence étant de 2/1 (American Psychiatric
Association, 2015).
J. GréGoire
4 ● A.N.A.E. N° 169 ● DÉCEMBRE 2020
© copyright ANAE
La publication du WISC-V français, étalonné
sur la base d’un échantillon représentatif de
la population française de six à 16 ans, offre
une belle opportunité de tester les hypo-
thèses présentées ci-dessus à propos des
différences intellectuelles entre les hommes
et les femmes. Comme nous disposons des
données récoltées lors de la normalisation
des trois précédentes versions de l’échelle de
Wechsler pour les enfants (WISC-R, WISC-III
et WISC-IV), nous avons jugé intéressant de
les inclure dans cette étude, ce qui permet
de couvrir une période de 35 ans. Il est ainsi
possible de mettre en évidence de possibles
évolutions des différences sur une période
durant laquelle l’éducation des lles et la
place de la femme dans la société ont connu
d’importantes transformations. Sur la base
des données des échantillons d’étalonnage
des quatre échelles d’intelligence de Wechsler
pour les enfants, nous pourrons examiner
l’évolution des différences entre les garçons
et les lles du point de vue de l’intelligence
générale et des différentes facettes de l’intelli-
gence mesurées par les indices et les subtests.
Nous analyserons également les différences
de variabilité des performances des garçons
et des lles pour le QI et les cinq indices du
WISC-V. Enn, sur la base des données de ce
dernier test, nous vérierons si les différences
entre lles et garçons diffèrent en fonction des
groupes d’âge.
Méthode
Tests
Les échelles de Wechsler sont une source
particulièrement intéressante d’informations
pour étudier les différences intellectuelles
entre les garçons et les lles. Elles procurent
non seulement une mesure globale de l’intel-
ligence sous la forme d’un QI, mais aussi des
mesures de plusieurs facettes de l’intelligence
qui nous permettent d’examiner certaines
compétences intellectuelles susceptibles de
fonctionner de manière différenciée en fonc-
tion du sexe des individus. Un autre avantage
des tests de Wechsler est la qualité de leur
construction. Les subtests et échelles compo-
sites (QI et Indices) ont toujours été élaborés
avec soin et procurent des mesures dont la
validité et la délité sont démontrées. Peu
de tests d’intelligence possèdent des qualités
métriques du niveau des échelles de Wechsler.
Depuis leur création en 1939, les échelles
de Wechsler ont évolué lentement. Plusieurs
subtests présents dans la version initiale se
retrouvent dans toutes les versions ultérieures.
Dans certains cas, les items n’ont guère chan-
gé, comme dans les subtests de Code ou de
Cubes. Dans d’autres cas, comme pour les
subtests de Vocabulaire ou d’Arithmétiques,
les items ont été largement modiés pour
prendre en compte les évolutions sociales et
culturelles. Dans ce cas, les constructeurs des
échelles ont veillé à garantir une continuité
du point de vue de la nature des tâches et
de leur difculté. Cette relative stabilité des
subtests et des scores composites permet de
comparer les performances des cohortes au
cours du temps et d’étudier les différences
de résultats des garçons et des lles sur une
longue période.
Dans cet article, les données d’étalonnage aux
quatre échelles de Wechsler pour les enfants
qui se sont succédé sur une période de
35 ans ont été utilisées pour nos analyses. Ces
quatre échelles sont les adaptations françaises
des échelles américaines correspondantes. Il
s’agit des :
● Wechsler Scale for Children-Revised (WISC-R),
publiée en France en 1981. Elle comprend
11 subtests permettant d’obtenir pour chacun
une note standardisée. Sur cette base, trois
notes composites sont calculées : un QI Total,
un QI Verbal et un QI de Performance.
● Wechsler Scale for Children-3rd Edition (WISC-
III), publiée en France en 1996. Elle comprend
13 subtests sur la base desquels un QI Total,
un QI Verbal et un QI de Performance peuvent
être calculés. Comme alternative à ces deux
derniers QI, il est possible de calculer trois
Indices dont la composition est plus homo-
gène : Compréhension verbale, Organisation
perceptive et Vitesse de traitement.
● Wechsler Scale for Children-4th Edition
(WISC-IV), publiée en France en 2005. Elle
comprend 13 subtests qui, en plus du tradi-
tionnel QI Total, permettent de calculer quatre
Indices : Compréhension verbale, Raisonne-
ment perceptif, Mémoire de travail et Vitesse
de traitement.
● Wechsler Scale for Children-5th Edition
(WISC-V), publiée en France en 2016. Elle
comprend 15 subtests permettant de cal-
culer un QI Total et cinq indices corres-
pondant à cinq facteurs de second niveau
dans le modèle de Cattell-Horn-Carroll (CHC
; McGrew, 2009) : Compréhension verbale,
Visuospatial, Raisonnement uide, Mémoire de
travail et Vitesse de traitement.
D’une version du WISC à l’autre, le QI Total
est calculé à partir des résultats à un ensemble
variable de subtests. Cette variation n’em-
pêche toutefois pas de pouvoir comparer les
QI obtenus avec les différentes versions du
test. Dès le moment où les épreuves utilisées
pour calculer le QI sont sufsamment nom-
breuses et variées, les estimations du QI sont
généralement proches et bien corrélées (Gré-
Les différences intellectuelles entre garçons et lles,
35 ans d’évolution du WISC-R au WISC-V
A.N.A.E. N° 169 ● DÉCEMBRE 2020 ● 5
© copyright ANAE
goire, 2019). La situation est, par contre, diffé-
rente dans le cas des indices qui sont calculés
sur la base d’un petit nombre d’épreuves.
Lorsque ces épreuves sont trop différentes,
les Indices ne sont pas comparables d’un
test à l’autre. C’est le cas des Indices Orga-
nisation perceptive (WISC-III), Raisonnement
perceptif (WISC-IV) et Visuospatial (WISC-V)
dont les noms laissent penser qu’il s’agit de
synonymes, alors que ces scores composites
recouvrent de compétences cognitives sen-
siblement différentes. Par conséquent, dans
cette étude, nous avons choisi de ne com-
parer que les scores comparables d’un test à
l’autre, en l’occurrence, le QI Total, les Indices
Compréhension verbale et Vitesse de Traite-
ment et un certain nombre de subtests dont
les caractéristiques générales n’ont guère
changé (Vocabulaire, Similitudes, Compréhen-
sion, Information, Arithmétique, Mémoire de
chiffres, Séquences Lettre-Chiffres, Code et
Symboles). Dans le cas du WISC-R, seules les
notes composites sont encore disponibles.
Nous n’avons dès lors pas pu inclure les notes
aux subtests de cette échelle dans nos ana-
lyses.
Données d’étalonnage
Les analyses ont été réalisées sur la base des
données des étalonnages français des quatre
échelles de Wechsler mentionnées plus haut.
La date de parution, la taille des échantillons
d’étalonnage et l’étendue des âges inclus sont
mentionnées dans le tableau 1. Dans tous les
cas, il s’agit d’un échantillonnage aléatoire
stratié. Les différentes strates et leur taille
ont, à chaque fois, été déterminées sur la base
du recensement général de la population fran-
çaise le plus récent. Les strates tiennent tou-
jours compte de l’âge, du sexe et de la zone
géographique du domicile. Pour le WISC-R, le
WISC-III et le WISC-IV, la catégorie sociopro-
fessionnelle du chef de famille a également
été prise en compte. Pour la WISC-V, cette
variable a été remplacée par le niveau d’étude
des parents. Au vu des variables prises en
compte et du soin pris pour constituer les
échantillons, nous pouvons considérer que
les échantillons d’étalonnage des différentes
versions du WISC nous offrent une bonne
représentation de la population française de
six à 16 ans.
Analyses et résultats
Le tableau 2 présente les QI moyens des gar-
çons et des lles de six à 16 ans aux quatre
versions du WISC analysées. Nous pouvons
constater qu’à la version la plus ancienne,
le WISC-R, le QI moyen des garçons est
signicativement différent de celui des lles
(p < .01). Le même phénomène est observé
au WISC-III, mais le seuil de signication
n’est plus que de « .05 ». À partir du WISC-
IV, les différences entre les deux groupes ne
sont plus statistiquement signicatives. Il est
important de souligner que, même lorsque les
différences sont signicatives, leur ampleur
reste assez réduite. Pour pouvoir apprécier
cette ampleur, nous avons calculé à chaque
fois le d de Cohen qui consiste à diviser la
différence observée par l’écart-type moyen
des deux groupes comparés. Nous pouvons
ainsi constater que la différence la plus élevée
observée au WISC-R correspond à un d de
0,19. En d’autres termes, cette différence est
légèrement inférieure à un cinquième d’écart-
type. Selon Cohen (1988), un d de 0,20 peut
être considéré comme de petite taille.
Le tableau 3 présente les comparaisons des
scores des lles et des garçons aux trois
échelles de Wechsler (WISC-III, WISC-IV et
WISC-V) pour lesquelles nous disposons des
données détaillées. Ces comparaisons ont été
faites pour les Indices et les subtests compa-
rables entre les trois tests.
Au WISC-III, les garçons obtiennent des résul-
tats supérieurs à ceux des lles à l’indice
Compréhension verbale et à trois des quatre
subtests qui font partie de cet Indice (Voca-
bulaire, Compréhension et Information). Dans
le modèle CHC de l’intelligence, cet indice
et ces subtests sont des mesures typiques de
Tableau 1. Étalonnage français des différentes versions du WISC.
Tableau 2. QI moyen des garçons et des lles aux différentes versions du
WISC
Nom Date
de parution
Taille des échantillons
d’étalonnage Étendue d’âges
WISC-R 1981 1 066 6 ans 6 mois à 16 ans 6 mois
WISC-III 1996 1 120 6 ans 6 mois à 16 ans 6 mois
WISC-IV 2005 1 103 6 ans à 16 ans 11 mois
WISC-V 2014 1 049 6 ans à 16 ans 11 mois
Garçons Filles Différence d
WISC-R Moyenne 101,21 98,48 2,73** 0,19
Écart- type 15,25 15,23
N 533 533
WISC-III Moyenne 101,08 98,99 2,09* 0,14
Écart-type 14,59 15,43
N 548 572
WISC-IV Moyenne 99,21 100,78 -1,57 0,10
Écart-type 15,41 14,63
N 554 549
WISC-V Moyenne 99,64 100,47 -0,83 0,06
Écart-type 14,60 14,55
N 517 532
Note : ** = p < .01 et * = p < .05
J. GréGoire
6 ● A.N.A.E. N° 169 ● DÉCEMBRE 2020
© copyright ANAE
l’intelligence cristallisée (Gc) qui est largement
tributaire de l’éducation et de l’acquisition
du langage. Les résultats des garçons sont
également supérieurs au subtest Cubes, qui
est une mesure classique de l’intelligence
visuospatiale (Gv), et au subtest Arithmétique.
La nature de ce que mesure ce dernier subtest
est largement discutée (Grégoire, 2019). Au
cours de l’histoire des échelles de Wechsler,
ce subtest a été inclus dans divers scores
composites. Il implique en effet un ensemble
de capacités cognitives dont le poids a varié
d’une version à l’autre. Les principales capa-
cités qui sous-tendent les performances à
ce subtest sont la compréhension verbale,
les connaissances arithmétiques, le contrôle
attentionnel et la résolution de problème.
Toujours au WISC-III, les lles sont nette-
ment supérieures aux garçons à l’Indice
Vitesse de traitement (Gs dans le modèle
CHC). La différence atteint près d’un écart
type, ce qui est très élevé. Cette différence
s’observe aux deux subtests qui composent
cet indice. Elle est toutefois beaucoup plus
importante au subtest Code (0,38 écart-type)
qu’au subtest Symboles (0,17 écart-type). Ces
deux épreuves mesurent la vitesse d’analyse
visuelle, le contrôle attentionnel, la mémoire
associative et la vitesse graphomotrice. Ces
deux dernières capacités jouent toutefois un
rôle plus important en Code qu’en Symboles.
Au WISC-IV, les résultats supérieurs des gar-
çons disparaissent largement, à l’exception
de ceux aux subtests Information et Arithmé-
tique où les différences restent signicatives
et d’ampleur modérée. Par contre, les per-
formances des lles sont signicativement
supérieures à celles des garçons au nouveau
subtest Matrices qui est une épreuve classique
d’intelligence uide (Gf). Les lles sont égale-
ment très supérieures aux garçons à l’Indice
Vitesse de traitement. Leurs performances
sont les meilleures à l’épreuve de Code. Elles
sont également signicativement supérieures
à celles des garçons au subtest Symboles et
Barrage, mais avec une ampleur moindre.
Barrage est un nouveau subtest introduit dans
le WISC-IV qui fait appel à la vitesse d’analyse
perceptive et demande un grand contrôle
attentionnel.
Au WISC-V, les garçons ne présentent des
performances signicativement supérieures
à celles des lles qu’à deux épreuves de rai-
sonnement uide : Balances et Arithmétique.
Ces subtests demandent de résoudre des
problèmes qui, tous les deux, font appel à
des connaissances numériques. Les lles sont
signicativement supérieures aux garçons
aux subtests Compréhension et Mémoire des
images. Comme dans les versions précédentes
du WISC, elles réalisent des performances très
supérieures à celles des garçons à l’Indice
Vitesse de traitement. Cette supériorité se
retrouve aux trois subtests qui composent cet
Indice avec, comme précédemment, un avan-
tage toujours plus marqué au subtest Code.
Il est intéressant d’observer qu’aux trois ver-
sions du WISC que nous venons d’analyser,
les performances des garçons et des lles sont
quasi identiques aux subtests Similitudes et
Mémoire de chiffres.
Pour tester l’hypothèse de Feingold (1992)
d’une inégalité des variances des scores des
lles et des garçons, nous avons comparé
la variance de leurs scores au QI et aux six
Indices du WISC-V à l’aide du test de Levene.
Les résultats de cette analyse sont présentés
dans le tableau 4. On peut constater que,
contrairement à l’hypothèse de Feingold, la
variance des QI des garçons et des lles est
quasi identique. Pour ce qui concerne les
Indices, les différences de variance restent
faibles et n’atteignent le seuil de signication
de « .05 » que dans le cas de l’Indice Visuos-
patial où la variance des scores des garçons
est supérieure à celle des lles. Même si cette
différence de variance est statistiquement
signicative et va dans le sens de l’hypothèse
de Feingold d’une plus grande étendue des
scores des garçons, elle est d’ampleur réduite
et sans implication pratique.
Pour tester l’hypothèse de Lynn (1994) d’une
modication avec l’âge des différences de
performances intellectuelles en fonction du
sexe, nous avons examiné l’évolution des
différences de scores des lles et des gar-
çons au QI et aux cinq Indices au travers des
11 groupes d’âge de l’échantillon d’étalon-
Tableau 3. Différence entre les scores moyens des garçons et des lles aux
Indices et aux subtests des différentes versions du WISC.
WISC-V WISC-IV WISC-III
Indice Compréhension verbale
● Similitudes
● Vocabulaire
● Compréhension
● Information
-0,83
-0,02
-0,11
-0,45*
0,30
0,05
-0,10
0,21
-0,07
0,74**
2,35**
0,11
0,44*
0,36*
0,68**
Indice Visuospatial
● Cubes
● Puzzles visuels
0,55
-0,03
0,20
-
0,34
-
-
0,41*
-
Indice Raisonnement uide
● Matrices
● Balances
● Arithmétique
1,08
-0,15
0,52**
0,41*
-
-0,44*
-
0,78**
-
-
-
0,55**
Indice Mémoire de travail
● Mémoire de chiffres
● Mémoire des images
● Séquences lettres-chiffres
-1,61
0,00
-0,57**
-0,34
-
-0,02
-
-0,34
-
-0,02
-
-0,13
Indice Vitesse de traitement
● Code
● Symboles
● Barrage
-4,33**
-0,98**
-0,56**
-0,38*
-4,52**
-1,22**
-0,40*
-0,43*
-4,69**
-1,13**
-0,51**
-
Notes : Les valeurs négatives indiquent un score moyen des lles supérieur à celui des garçons ; ** = p < .01 et
* = p < .05.
Les différences intellectuelles entre garçons et lles,
35 ans d’évolution du WISC-R au WISC-V
A.N.A.E. N° 169 ● DÉCEMBRE 2020 ● 7
© copyright ANAE
nage du WISC-V. Les résultats de cette ana-
lyse sont présentés dans le tableau 5. Pour
ce qui concerne le QI, les différences sont
de faible amplitude et n’atteignent le seuil
de signication de « .05 » qu’à 13 ans, où
les performances des lles sont supérieures
à celles des garçons d’un peu plus d’un tiers
d’écart-type. Aucun des résultats observés
ne conrme l’hypothèse de Lynn d’une diffé-
rence qui changerait de sens et deviendrait à
l’avantage des garçons vers 15-16 ans. Pour
ce qui concerne les indices, aucune différence
signicative entre les lles et les garçons n’est
observée dans les 11 groupes d’âge pour les
Indices Compréhension verbale, Visuospatial et
Mémoire de travail. Une différence signica-
tive (.05) à l’avantage des garçons est obser-
vée pour l’Indice Raisonnement uide à l’âge
de 10 ans. Mais il s’agit d’une différence isolée
sans signication développementale appa-
rente. Par contre, une évolution très nette est
observée en fonction de l’âge entre les scores
des lles et ceux des garçons à l’Indice Vitesse
de traitement. Jusqu’à l’âge de neuf ans, les
différences en fonction du sexe sont de faible
amplitude et non signicatives. À partir de
10 ans, la taille de cette différence va crois-
sante. Elle atteint le seuil de signication de
« .05 » à 10 ans et celui de « .01 » à 13 ans.
Des variations aléatoires sont observées d’un
âge à l’autre, mais la tendance est claire : les
lles manifestent des performances nettement
supérieures à celles des garçons à partir de
10 ans à l’Indice Vitesse de traitement. Cette
supériorité s’accentue jusqu’à l’âge de 16 ans.
Une telle courbe d’évolution des différences
à l’Indice Vitesse de traitement est à l’opposé
de celle attendue sur la base de l’hypothèse
de Lynn.
Discussion
Entre le WISC-R (1981) et le WISC-V (2014),
nous pouvons constater que la différence de
QI moyenne entre les garçons et les lles a
totalement disparu. Cette évolution n’a rien
d’étonnant puisque l’absence de différence
entre le QI moyen des hommes et des femmes
est un constat fait de longue date dans les
pays développés. Le phénomène étonnant
est l’existence de différences statistiquement
signicatives au sein des échantillons d’éta-
lonnage français les plus anciens, ceux du
WISC-R et du WISC-III. Ces différences sont
certes de petite taille (d = 0,19 et 0,14),
mais elles sont bien réelles. Nous ne dis-
posons malheureusement plus des résultats
aux subtests de l’échantillon d’étalonnage du
WISC-R pour mieux comprendre la source des
meilleures performances des garçons. Pour
ce qui concerne le WISC-III, nous pouvons
constater que les garçons présentent des
performances supérieures dans trois épreuves
d’intelligence verbale (Information, Vocabu-
laire et Compréhension), dans trois épreuves
d’intelligence visuospatiale (Cubes, Complè-
tement d’images et Assemblages d’objets)
et à l’épreuve d’Arithmétique. Ces bonnes
performances des garçons sont partiellement
compensées par les performances supérieures
des lles dans deux épreuves de vitesse de
traitement (Code et Symboles). L’avantage
des garçons dans les épreuves visuospatiales
et d’arithmétique n’est guère étonnant, car
leur supériorité dans ces deux domaines a été
régulièrement observée dans le passé. Par
contre, les meilleures performances des gar-
çons dans trois épreuves verbales du WISC-III
sont surprenantes, car les lles ont toujours
eu la réputation d’être meilleures dans ce
domaine. Nous pouvons avancer l’hypothèse
que cette différence est liée à des particulari-
tés du système éducatif français. Quoiqu’il en
soit, la supériorité des garçons aux subtests
Vocabulaire et Compréhension disparaît au
WISC-IV et au WISC-V. Et leur supériorité au
subtest Information persiste au WISC-IV pour
nalement disparaître au WISC-V. Quant à
la supériorité des garçons au subtest Cubes,
Tableau 4. Différence de la variance des scores composites
du WISC-V pour les garçons et les lles.
Tableau 5. Différences entre les garçons et les lles des scores composites du
WISC-V pour les onze groupes d’âge de l’échantillon d’étalonnage.
Test de Levene
Écarts-types F p
Indice Compréhension verbale G = 14,798
F = 14,212 0,610 0,44
Indice Visuospatial G = 15,418
F = 14,223 3,834 0,05
Indice Raisonnement uide G = 15,233
F = 14,528 1,201 0,27
Indice Mémoire de travail G = 13,853
F = 14,874 2,794 0,10
Indice Vitesse de traitement G = 13,539
F = 14,354 0,846 0,36
QI Total G = 14,603
F = 14,551 0,004 0,951
QIT ICV IVS IRF IMT IVT
6 ans 2,24 3,82 3,03 1,62 1,94 2,03
7 ans -0,40 -2,82 -1,61 2,19 -1,95 -1,42
8 ans 3,18 2,10 4,58 4,90 -1,04 0,50
9 ans -2,10 -3,86 -0,32 -0,45 0,60 -3,73
10 ans 3,60 2,39 5,67 6,29* 1,35 -6,21*
11 ans -1,47 0,91 -1,60 0,24 -4,70 -4,51
12 ans -0,03 0,25 4,46 2,32 -0,60 -5,22
13 ans -5,94* -4,55 -3,85 -3,23 -5,00 -9,23**
14 ans -1,96 1,06 -2,59 -1,40 -2,98 -8,27**
15 ans -3,44 -0,79 -3,85 -2,58 -4,28 -4,66
16 ans -4,38 -4,46 1,36 0,65 -1,86 -8,50**
Note : * p < .05 ; ** p < .001
J. GréGoire
8 ● A.N.A.E. N° 169 ● DÉCEMBRE 2020
© copyright ANAE
elle disparaît dès le WISC-IV. Les deux autres
subtests mesurant l’intelligence visuospatiale
ont été remplacés par le subtest Puzzles dans
le WISC-V, où la différence entre les garçons
et les lles est nulle. La seule supériorité per-
sistante des garçons au travers des différentes
versions du WISC est observée au subtest
Arithmétique. Bien que statistiquement signi-
cative, la taille des différences à cette épreuve
est petite (d = 0,14 au WISC-V).
L’absence de différence entre le QI moyen
des lles et des garçons s’accompagne d’une
distribution des QI dont la variance est iden-
tique pour les deux sexes. Les données de
l’étalonnage français du WISC-V ne conrme
donc pas l’hypothèse de Feingold (1992)
d’un aplatissement plus important de la dis-
tribution des QI des garçons. Ces mêmes
données d’étalonnage n’ont pas permis non
plus de conrmer l’hypothèse de Lynn (1994)
d’une différence de QI entre les lles et les
garçons qui n’apparaîtrait que vers 15-16 ans
et qui serait alors à l’avantage des garçons.
Les différences observées au WISC-V à 15 et
16 ans sont à l’avantage des lles, mais elles
ne sont pas statistiquement signicatives. La
seule différence observée qui soit statistique-
ment signicative concerne l’Indice Vitesse
de traitement. Elle est de grande ampleur
(d = 0,56) et est à l’avantage des lles.
Si au niveau de la mesure globale de l’in-
telligence, les différences entre lles et gar-
çons ont disparu, la situation est quelque
peu différente pour les grandes facettes de
l’intelligence situées au second niveau du
modèle hiérarchique de Carroll. Au WISC-V,
les indices Compréhension verbale, Visuospa-
tial, Raisonnement uide et Mémoire de travail,
mesurant respectivement Gc, Gv, Gf et Gsm,
ne présentent aucune différence signicative
en fonction du sexe. Des différences signi-
catives, mais de faible ampleur, sont toutefois
observées en faveur des garçons dans deux
épreuves, Balances (d = 0,17) et Arithmétique
(d = 0,14), faisant appel à des compétences
numériques. Et des différences signicatives
en faveur des lles sont observées en Compré-
hension (d = 0,15) et en Mémoire des images
(d = 0,19).
Le phénomène le plus marquant à ce niveau
d’analyse est la différence en faveur des lles
à l’Indice Vitesse de traitement qui est une
mesure de Gs. Cette différence est d’ampleur
modérée (d = 0,29). Les lles sont signicati-
vement meilleures à tous les subtests qui font
partie de cet indice, particulièrement en Code.
Cet avantage des lles dans les épreuves de
vitesse de traitement a été également obser-
vé dans les versions précédentes du WISC,
ce qui rend ce phénomène très robuste.
Plusieurs facteurs permettent d’expliquer les
performances supérieures des lles en vitesse
de traitement. Elles pourraient découler de
meilleures compétences en lecture qui favori-
seraient un traitement plus rapide des stimuli
visuels. Elles pourraient aussi provenir d’une
motricité ne plus précise et d’une meilleure
coordination oculomotrice. Elles pourraient
enn être la conséquence d’un contrôle atten-
tionnel plus efcace. À ce stade, aucun de ces
facteurs ne peut être écarté. Il n’est pas exclu
que les performances supérieures des lles
aux épreuves de vitesse de traitement soient
déterminées par une combinaison de ces dif-
férents facteurs.
Conclusion
Sur la base de l’analyse des données d’éta-
lonnage du WISC-V et des trois versions
précédentes de cette échelle d’intelligence,
nous pouvons constater que les différences
de performances aux épreuves intellectuelles
entre les lles et les garçons se sont largement
estompées au cours du temps. Aujourd’hui,
nous n’observons plus de différence en fonc-
tion du genre, non seulement au niveau du QI,
mais aussi au niveau des principales facettes
de l’intelligence. Les données d’étalonnage
du WISC-V ne conrment pas les stéréotypes
selon lesquels les lles seraient meilleures
dans les tâches verbales et les garçons dans
les tâches visuospatiales. Quelques différences
statistiquement signicatives subsistent, mais
elles sont généralement d’ampleur réduite,
sans implication pratique. La seule différence
de taille plus importante est à l’avantage
des lles. Elle concerne les performances
dans les tâches de vitesse de traitement qui
demandent un important contrôle de l’at-
tention et de la coordination oculomotrice.
Cette différence peut expliquer, en partie, le
comportement scolaire plus appliqué des lles
et leurs performances scolaires supérieures
à celles des garçons à l’adolescence et au
début de l’âge adulte. En dehors de cette dif-
férence, les données d’étalonnage du WISC-V
ne mettent en évidence aucune prédisposi-
tion intellectuelle particulière aux lles ou aux
garçons pour certains apprentissages ni pour
certaines lières de formation.
Les différences intellectuelles entre garçons et lles,
35 ans d’évolution du WISC-R au WISC-V
A.N.A.E. N° 169 ● DÉCEMBRE 2020 ● 9
© copyright ANAE
RéféRences
American Psychiatric Association (2015). Manuel diagnostique et statis-
tique des troubles mentaux, 5e édition (DSM-5). Issy-les-Moulineaux :
Elsevier-Masson.
Broca, P. (1861). Sur le volume et la forme du cerveau suivant les individus
et suivant les races. Bulletins de la Société d’Anthropologie, 139-207.
Colom, R., Juan-Espinosa, M., Abad, F. & Garcia, L.F. (2000). Negligible sex
differences in general intelligence. Intelligence, 28, 57-68.
Else-Quest, N.M., Hyde, J.S. & Linn, M.C. (2010). Cross-national patterns
of gender differences in mathematics: A meta-analysis. Psychological
Bulletin, 136, 103-127.
Feingold, A. (1992). Sex differences in variability in intellectual abilities: A
new look at an old controversy. Review of Educational Research, 62, 61-84.
Garcia, J. (1981). The logical and limits of mental aptitude testing. Ameri-
can Psychologist, 36, 1172-1180.
Gaudron, J.-Ph. (2020). Genre, rapports sociaux et orientation. Orientation
Scolaire et Professionnelle, 49, 193-198.
Grégoire, J. (2009). L’examen clinique de l’intelligence de l’enfant
(2e édition revue et complétée). Bruxelles : Mardaga.
Grégoire, J. (2019). L’examen clinique de l’intelligence de l’enfant. Fonde-
ments et pratique du WISC-V. Bruxelles : Mardaga.
Hyde, J.S. & Linn, M.C. (1988). Gender differences in verbal ability: A
meta-analysis. Psychological Bulletin, 104, 153-169.
Johnson, W., Deary, I.J. & Carothers, A. (2008). Sex differences in variability
in general intelligence: A new look at the old question. Perspective on
Educational Science, 3, 518-531.
Larkin, J.M. (2013). Sex differences in reasoning abilities: Surprising
evidence that male-female ratios in the tails of the quantitative reasoning
distribution have increased. Intelligence, 41, 263-274.
Lynn, R. (2004). Sex differences in intelligence and brain size: A paradox
resolved. Personality and Individual differences, 17, 257-271.
Lynn, R. & Irwing, P. (2004). Sex differences on progressive matrices: A
meta-analysis. Intelligence, 32, 481-498.
Mayes, S.D. & Calhoun, S.L. (2006). WISC-IV and WISC-III proles in child-
ren with ADHD. Journal of Attention Disorders, 9, 486-49.
Peyre, H., Hoertel, N. Bernard, J.Y., Roufgnac, C., Forhan, A., Taine, M.,
Heude, B. & Ramus, F. (2019). Sex differences in psychomotor develop-
ment during the preschool period: A longitudinal study of the effects of
environmental factors and of emotional, behavioral, and social functio-
ning. Journal of Experimental Child Psychology, 178, 369-384.
Roivainen, E. (2011). Gender differences in processing speed: A review of
recent research. Learning and Individual Differences, 21, 145-149.
Schwean, V.L. & Saklofske, D.H. (2005). Assessment of attention decit
hyperactivity disorders with the WISC-IV. In A. Pritera, D.H. Saklofske &
L.G. Weiss (Eds.), WISC-IV. Clinical use and interpretation. San Diego, CA:
Elsevier Academic Press.
Terman, L.M. (1916). The measurement of intelligence. London: George
Harrap & Co.
Voyer, D. (2011). Time limits and gender differences on paper-and-pencil
tests of mental rotation: a meta-analysis. Psychonomic Bulletin & Review,
18, 267-277.
Voyer, D. H., Voyer, S. & Bryden, M.P. (1995). Magnitude of sex differences
in spatial ability: A meta-analysis and consideration of critical variables.
Psychological Bulletin, 117, 250-270.
Wechsler, D. (1944). The measurement of adult intelligence. Baltimore:
Williams & Wilkins Company.