ArticlePDF Available

Segmentation et perception intuitive dans la compréhension de l'action. Quels liens possibles? Proposition d'un niveau intermédiaire de représentation

Authors:

Abstract

The domain of action understanding concerns the investigation of the psychological mechanisms which enables us to make sense of the transformations perceived within the environment. We consider two aspects of action understanding: the segmentation of dynamical sequences, and the intuitive perception of certain causal and intentional components of action. We review founding studies as well as recent studies in both these
Segmentation et perception intuitive dans la
compréhension de l’action. Quels liens
possibles ? Proposition d’un niveau
intermédiaire de représentation
Florent Levillain
et Elisabetta Zibetti
EA 4004 CHArt - Cognitions Humaine et ARTificielle Université de Paris 8
RÉSUMÉ
Le domaine de la compréhension de l’action concerne l’étude des mécan-
ismes psychologiques qui permettent de donner sens aux transformations
perçues dans l’environnement. Nous considérons deux aspects de la
compréhension de l’action : la segmentation de séquences dynamiques, et
la perception intuitive de certaines composantes causales et intentionnelles
de l’action. Nous passons en revue les travaux fondateurs et plus récents de
ces deux domaines et mettons en avant la notion de niveau intermédiaire
de représentation de l’action pour leur unification théorique. À ce
niveau de représentation correspondraient certaines primitives d’action qui
favoriseraient l’accès immédiat à un contenu portant sur les contraintes
physiques ou le caractère intentionnel des déplacements. Ces primitives
d’action auraient à la fois pour rôle de proposer une structuration
hiérarchique ainsi que de permettre le découpage de la scène en unités
d’action.
Segmentation and intuitive perception in the understanding of action.
Possible links? Towards an intermediary level of representation
ABSTRACT
The domain of action understanding concerns the i nvestigation of the psychological
mechanisms which enables us to make sense of the transformations perceived within
the environment. We consider two aspects of action understanding: the segmentation
of dynamical sequences, and the intuitive perception of certain causal and intentional
components of action. We review founding studies as well as recent studies in both these
*Correspondance : Florent Levillain, Laboratoire LUTIN, Cité des Sciences et de l’Industrie de la Villette, 30
avenue Corentin Cariou, 75930 Paris cedex 19. E-mail : flevillain@mac.com
Remerciements. Les auteurs tiennent à remercier Luca Bonatti pour ses commentaires avisés durant l’élaboration
de cet article.
L’année psychologique, 2012, 112, 277-308
278 Florent Levillain
r
Elisabetta Zibetti
domains, and we put forward the concept of intermediary level of action representation
as a way to gather them under a unified theoretical frame. At this specific level, action
primitives would favour an immediate access to certain contents regarding the mechanical
constraints and the intentional aspects of movements. These action primitives would play
a role in providing the perceived movements with a hierarchical structure and in allowing
the segmentation of the scene into action units.
1. INTRODUCTION
Aux yeux d’un être humain, les actes d’autrui font sens, ils sont porteurs
de significations, donnent une indication sur les intentions de la personne,
guident l’interaction en définissant des gestes à imiter, à approuver ou
à vilipender, ils sont aussi l’occasion d’histoires à raconter. Comprendre
l’origine de cette capacité de donner sens au comportement obser vable
d’autrui est l’objectif pr imordial des études regroupées ici sous le terme
de compréhension de l’action. Lorsque nous percevons un geste, une
interaction entre deux personnes, ou tout événement physique qui puisse se
produire autour de nous, ce que nous voyons n’est pas un flux ininterrompu
et indistinct de mouvements disparates. Bien plutôt, nous distinguons
des phases, nous échelonnons des moments selon leur importance, nous
voyons certains actes s’accomplir, d’autres débuter, arriver à terme ou se
répéter. Nous évaluons d’autre part les actes d’autrui selon les buts qu’ils
manifestent. Certaines actions sont fortuites, d’autres sont pleinement
volontaires. Ainsi attraper une tasse de café est volontaire, mais renverser
son contenu ne l’est pas.
Ces simples faits nous indiquent que notre perception de l’action est
éminemment structurée, qu’elle est composée de différentes unités qui
peuvent porter des valeurs différentes du point de vue de la façon dont
une action s’organise dans le temps. Ils nous indiquent également que
nous faisons constamment, et de la manière la plus naturelle qui soit, une
distinction entre les actions qui manifestent une intention et celles qui sont
le simple reflet de contraintes physiques, comme la tendance - malheureuse
-ducaféàrejoindrelesol.
La littérature consacrée à ces phénomènes de compréhension de
l’action se donne pour tâche d’étudier les compétences psychologiques
qui guident la compréhension des mouvements et des transformations
d’objets, ainsi que celles qui conduisent l’observateur à sélectionner le
niveau d’organisation temporelle le plus pertinent p our rendre compte de
l’action en cours. Ces compétences psychologiques sont vraisemblablement
organisées selon trois paramètres cruciaux :
L’année psychologique, 2012, 112, 277-308
Segmentation et perception intuitive de l’action 279
Le type d’objets vers lequel se dirige le processus d’interprétation. S’agit-
il d’un être motivé par des buts, des croyances, des désirs (comme par
exemple un être humain), ou au contraire s’ag it-il d’un objet dépourvu
d’intentions, dont le comportement est essentiellement déterminé par les
propriétés physiques de l’environnement dans lequel il est placé (comme
par exemple la tasse de café qui se renverse) ?
l e fait que l’action soit dirigée ou non vers un but, et par conséquent le
caractère adapté ou non de l’action à ce but (ainsi le but de prendre la
tasse pour boire le café détermine la trajectoire de la main) ;
le niveau de granularité que nous utilisons dans le découpage des
événements que nous cherchons à comprendre et interpréter, c’est-à-dire
le degré de détail que nous prenons en compte dans les situations
dynamiques auxquelles nous faisons face. Par exemple :
« Pierre a
renversé le café par terre » peut également être perçu et décrit en
décomposant l’action : « Pierre a frappé accidentellement la tasse, elle
s’est renversée et le café est tombé par terre ».
L’existence de ces différentes composantes de la compréhension de
l’action favorise une certaine spécialisation des recherches concernant les
bases psychologiques de ce domaine de compétence. Certaines études se
focalisent plutôt sur la nature animée ou inanimée des entités considérées
dans des séquences dynamiques (par ex. Michotte, 1954 ; Scholl &
Tremoulet, 2000), quand d’autres concentrent davantage leurs efforts sur les
règles de décomposition d’une scène animée en hiérarchies d’événements
(par ex. Newtson, 1973 ; Zacks, Tversky, & Iyer, 2001). Les premières vont
mettre en évidence des différences systématiques dans l’interprétation des
objets dont le comportement est régi par des lois physiques, par rapport aux
entités dont le comportement est déterminé par des buts poursuivis. Les
secondes vont chercher à déterminer l’importance respective des propriétés
du stimulus et des connaissances en mémoire sur la décomposition de
la séquence dynamique en segments temporels, et donc sur le niveau de
granularité de l’interprétation.
Jusqu’à présent ces deux perspectives sur la compréhension de l’action
ont été peu traitées simultanément, laissant apparaître un fossé entre deux
pans de littérature qui mér itent pourtant d’êt re reliés pour offrir une vue
synthétique de la recherche concernant la compréhension de l’action, ainsi
que pour dessiner de nouvelles perspectives théoriques fructueuses.
Dans cet article, nous proposons un schéma directeur permettant
d’intégrer ces deux aspects de la compréhension de l’action. Nous
présentons dans un premier temps les résultats d’un ensemble de
travaux concernant la segmentation de l’action en unités de plus ou
L’année psychologique, 2012, 112, 277-308
280 Florent Levillain
r
Elisabetta Zibetti
moins grande échelle temporelle qui composent une séquence d’action.
Nous mettrons ensuite ces recherches en perspective avec les résultats
de travaux issus du domaine de la perception intuitive d’interactions
élémentaires. Notre but est de mettre en évidence, en s’appuyant sur des
faits expérimentaux issus de ces deux domaines, un hypothétique niveau
de représentation intermédiaire dans lequel appar aissent des primitives
d’action. Ces primitives d’action pourraient jouer un rôle important
dans le découpage perceptif et l’organisation conceptuelle d’une séquence
d’actions. Cette proposition, cohérente avec un ensemble de résultats
empiriques et trouvant sa légitimité dans une approche modulaire de
l’architecture cognitive, pourrait être complémentaire des modèles utilisés
classiquement dans le domaine de l’interprétation de l’action. Nous
conclurons ainsi sur la possibilité de concevoir une architecture cognitive
unifiant les domaines de la segmentation perceptive et l’organisation
conceptuelle de schémas d’action, en proposant un certain nombre de
questions expérimentales permettant de la valider.
2. SEGMENTATION ET HIÉRARCHISATION
DE L’ACTION
Dans la compréhension des scènes visuelles interviennent à la fois
l’identification de traits s tatiques, comme la forme ou la taille des objets,
mais également celle de traits dynamiques associés aux déplacements
des objets. Confronté à la complexité et au caractère éphémère de ces
déplacements, une tâche importante pour le système visuel est d’imposer
une structure aux transformations perçues, de déterminer des unités
capables de synthétiser certains aspects des évolutions de la scène. Cette
contrainte pour le traitement des scènes dynamiques fonde le champ
d’étude de la segmentation de l’action.
Lorsque nous évoquons une séquence d’actions, nous décomposons
naturellement celle-ci en plusieurs phases qui mènent à son accomplisse-
ment : le nombre d’étapes à parcourir pour rejoindre un bar à cocktails
(aller d’abord jusqu’à la place principale, puis prendre l’avenue sur la
gauche, enfin monter le perron du vieux bâtiment), le nombre de gestes
pour effectuer un service au tennis (lancer la balle, fléchir les genoux,
déployer son bras, etc.), le nombre d’opér ations à réaliser pour obtenir
une sauce (faire fondre le beurre, ajouter la farine, porter à frémissement,
etc.). Au-delà de cet aspect linguistique et procédural de la segmentation,
L’année psychologique, 2012, 112, 277-308
Segmentation et perception intuitive de l’action 281
des preuves s’accumulent pour reconnaître à celle-ci une véritable réalité
psychologique, à la fois perceptive et cognitive. Il semble ainsi que nous
décomposions spontanément et de façon automatique (voir par exemple
Newtson, 1976 ; Zacks, Speer, Swallow, & Maley, 2010) une action perçue en
plusieurs épisodes discrets, qui eux-mêmes vont déterminer un ensemble
de processus ayant t rait à l’interprétation, la prédiction, la mémorisation,
et éventuellement la verbalisation de cette action (pour une revue de ces
travaux, voir Kurby & Zacks, 2008). Ces épisodes discrets sont généralement
appelés « événements »
1
. Les événements sont définis comme étant des
segments temporels conçus par l’obser vateur comme ayant un début et une
fin (Newton & Engquist, 1976 ; Casati & Varzi, 1996 ; Zacks & Tversky,
2001). Dans cet article nous utiliserons plutôt le terme d’unité d’action
pour décrire ces épisodes discrets, afin de marquer la relation entre la
segmentation d’une scène et l’interprétation en terme de causes et de
buts.
Il existe plusieurs raisons de supposer l’existence d’un processus
perceptivo-cognitif spécifique pour segmenter une séquence d’action en
unités discrètes. De la même façon que, pour la perception des objets,
nous cherchons à extraire des propriétés invariantes afin d’en déterminer
les contours et les identifier, la recherche de structures stables à l’intérieur
de séquences dynamiques semble une condition requise pour le traitement
de propriétés complexes comme le caractère intentionnel d’une ac tion
(voir Baldwin & Baird, 2001). La segmentation d’une ac tion pourr ait être
également un préalable à son imitation par a utrui, en définissant les unités
d’action à reproduire (voir Blakemore & Decety, 2001). Enfin, la définition
d’événements est importante lors de la communication entre individus,
dans la mesure deux interlocuteurs doivent partager dans une certaine
mesure la même décomposition d’une action pour comprendre à quoi
certains concepts réfèrent (voir Zacks & Tversky, 2001).
Alors qu’il existe un vaste corpus de recherche se focalisant sur les
mécanismes perceptivo-cognitifs impliquées dans l’identification et la
reconnaissance d’objets, on trouve comparativement encore peu d’études
consacrées à l’identification et la reconnaissance d’événements. Dans les
sections qui suivent nous commencerons par décrire certains résultats
empiriques de ce champ d’étude, des résultats qui laissent entrevoir une
activité psychologique consacrée au découpage d’événements dans l’analyse
perceptive d’une scène dynamique.
1
Certains auteurs préféreront le terme « action », faisant ici référence à la fois à l’opération de segmentation et à
celle d’attribution cognitive de la part de l’observateur.
L’année psychologique, 2012, 112, 277-308
282 Florent Levillain
r
Elisabetta Zibetti
2.1. Les points de rupture de l’action
Le processus de segmentation de séquences d’action a d’abord été
étudié dans les années 1970 par des psychologues sociaux pour com-
prendre l’importance du niveau de granularité d’une description dans
l’interprétation du comportement d’autr ui. Développée initialement par
Newtson et ses collaborateurs (Newtson, 1973 ; Newtson & Engquist,
1976 ; Newtson, Engquist, & Bois, 1977), la méthode de unit marking
consiste à demander à un observateur de regarder une séquence d’actions
(par exemple un homme qui tend le bras, prends une tasse et bois son
café) et d’indiquer en pressant un bouton chaque fois que, selon lui, un
événement se termine et qu’un autre commence. L’observateur a donc
pourtâchededénircequiluiparaîtladécompositionnaturellede
la séquence en choisissant les
« points de rupture » qui marquent les
frontières des unités d’action. Les moments d’appui et les délais entre
chacun des appuis sont ainsi enregistrés pour être mis en relation avec le
déroulement de la séquence. Les premiers travaux de Newtson et de ses
collaborateurs ont mis en évidence le fait que, lors de la segmentation d’une
séquence présentant des mouvements exécutés par des acteurs humains
2
,
les moments choisis comme points de rupture présentent des propriétés
particulières. Ces propriétés, qui sont par exemple la contiguïté spatiale des
objets, leur vitesse relative ou leur changement de position, déterminent
la possibilité de restituer ultérieurement les détails de la scène. Ainsi par
exemple, en supprimant certaines images des séquences, on se rend compte
que la suppression d’images associées à des points de rupture est mieux
détectée que la suppression d’images situées entre ces points de rupture
(Newtson & Engquist, 1976)
3
. Les points de ruptures sont donc associés à
des moments qui ont une valeur informative particulière en ce qui concerne
la
« concaténation » en mémoire des changements perçus dans la scène.
Dans une autre étude, Newtson, Engquist et Bois (1977), lorsqu’ils
demandent aux observateurs de segmenter une séquence d’action d’un
acteur humain, remarquent que, en particulier pour les segments courts
produits spontanément, les points de rupture correspondent à des
moments dans la scène les gestes de l’acteur sont au maximum de leur
amplitude. Par exemple, dans l’image associée à un point de rupture, la
position des articulations des jambes et des bras d’un acteur change de
plus de 45
par r apport à la position qu’elles occupent dans l’image qui
2
Newtson présentait par exemple une femme découpant des patrons pour une robe, un homme réparant une
moto, ou feuilletant nerveusement un magazine.
3
Des résultats similaires ont été obtenus récemment avec des techniques d’analyse du flux optique (Rui, Rui, &
An, 2000).
L’année psychologique, 2012, 112, 277-308
Segmentation et perception intuitive de l’action 283
précède immédiatement. Ce type de changement brusque dans l’amplitude
des gestes semble une carac téristique associée régulièrement aux points de
rupture dans une séquence. Les transitions associées aux frontières des
événements définis par l’observateur présentent un plus grand nombre
de changements qu’à l’intérieur même des événements, laissant supposer
que ces périodes de changement brutal sont utilisées pour la segmentation
spontanée de la scène.
Cette relation entre définition des points de rupture et changement
dans les paramètres spatio-temporels de la séquence présentée a fait
récemment l’objet d’une étude systématique. En particulier, un effort a
été accompli pour dissocier le rôle des r uptures directement attribuables
aux modifications spatio-temporelles de celles qui pourraient être liées
au mouvement biolog i que (Zacks, Kumar, Abrams, & Mehta, 2009), en
substituant aux entités humaines des figures géométriques abstraites (Hard,
Tversky, & Lang, 2006b ; Zacks, 2004). Dans une expérience de 2004,
Zacks a présenté les déplacements aléatoires d’un cercle et d’un car en
demandant aux participants d’appuyer sur un bouton chaque fois qu’ils
estimaient qu’un segment s’était achevé et qu’un autre commençait, il a
ainsi pu vérifier le degré de corrélation entre les occurrences de certains
attributs de mouvement (la vitesse des objets, leur accélération, leur
distance l’un par rapport à l’autre, leur v itesse relative, etc.) et l’attribution
de points de rupture dans la séquence. Zacks a mont que les attributs
de mouvements peuvent permettre de prédire de manière significative la
position des points de rupture attribués par les observateurs, en particulier
dans les conditions l’on demandait à ceux-ci de déterminer les segments
les plus fins possibles.
De façon similaire, Hard, Tversky et Lang (2006b) ont mis en
évidence le fait que les points de ruptures qui définissent les frontières
des unités d’action correspondent à des changements de propriétés du
mouvement. Les auteurs ont utilisé des séquences de déplacement de figures
géométriques inspirées de celles initialement créées par Heider et Simmel
(1944) dans leur étude paradigmatique de l’attribution d’intentionnalité.
En examinant la relation entre l’occurrence des points de rupture et celle
de types particuliers de mouvement (comme par exemple l’arrêt ou le
changement de direction des objets), grâce à une analyse qualitative des
paramètres de mouvement dans chaque image du film, les auteurs ont
pu remarquer qu’aux points de ruptures correspondent plus souvent des
changements dans le mouvement des objets qu’aux points de non-rupture.
Plus précisément, les types de changement dans le déplacement susceptibles
de susciter l’att ribution d’un point de rupture sont les modifications
rapides telles que l’arrêt complet, le démarrage et le changement de
L’année psychologique, 2012, 112, 277-308
284 Florent Levillain
r
Elisabetta Zibetti
direction des objets. Autant d ’indices cinématiques qui correspondent à
des pauses dans l’action ou à l’initiation d’une nouvelle action. Ce type
de résultat est obser aussi bien lorsque la séquence est présentée dans
sa version originale qu’en sens inverse, l a possibilité d’attribuer des
intentions aux déplacements est perturbée.
En résumé, nous avons vu que lors de la tâche de segmentation d’une
séquence dynamique, des points de rupture sont attribués à des m oments
de la séquence possédant une valeur informationnelle plus importante
que d’autres moments. Cette valeur semble elle-même dépendante de
la quantité et de l’amplitude des mouvements observés. À travers ces
études se dessine un processus de segmentation étroitement dépendant
des car actéristiques perceptives de la scène visuelle. Il est possible à cet
égard que le processus de segmentation intervienne de façon précoce dans
l’analyse perceptive de la scène dynamique.
Néanmoins les études que nous venons d’évoquer sont établies sur l a
base du jugement conscient de l’observateur. Faisant de ce fait appel à des
mesures associées à l’intuition de la personne une notion en elle-même
extrêmement ambiguë dans la mesure elle recouvre un ensemble de
processus cognitifs difficiles à délimiter ces études n’apportent pas de
preuvesdirectesdelactivitéperceptivedesegmentationetnepermettent
pas de valider le caractère automatisé et précoce de ce processus. D’autres
études très récentes, utilisant les possibilités de l’imagerie cérébrale,
semblent cependant appuyer l’existence d’un processus de segmentation
automatisé qui aurait lieu précocement au niveau perceptif
4
pendant la
perception de scènes dynamiques, même en l’absence de consigne explicite
de segmentation.
2.2. Indices physiologiques du processus de
segmentation
Un premier ensemble encore très limité et parfois contradictoire d’études
examinant les mécanismes neuronaux associés à l’activité de segmentation
commence à voir le jour. Des changements dans l’activité cérébrale ont ainsi
pu être mis en évidence lors de la perception de moments particuliers d’une
4
Nous utiliserons le terme de « segmentation perceptive » pour souligner l’impact des indices perceptifs lors du
processus de segmentation et, par contraste, celui de « segmentation conceptuelle » pour souligner l’impact des
connaissances. Nous ne souhaitons pas cependant suggérer une séparation nette entre segmentation perceptive et
segmentation conceptuelle, une dichotomie qui, bien qu’ayant une valeur didactique, peut apparaître légèrement
artificielle tant il est clair que de nombreux processus interagissent pour aboutir à la définition de points de
rupture dans une séquence.
L’année psychologique, 2012, 112, 277-308
Segmentation et perception intuitive de l’action 285
séquence dynamique. Zacks, Braver, Sheridan, Donaldson, Snyder, Ollinger,
Buckner et Raichle (2001a) ont par exemple proposé à leurs participants de
regarder de courtes vidéos présentant des êtres humains réalisant des tâches
quotidiennes, pendant que leur activité cérébrale était enregistrée par un
appareil d’imagerie par résonance magnétique fonctionnelle (IRMf). Dans
une première phase, les participants regardaient un film sans consignes
explicites de segmenter ce qu’ils regardent. Dans un second temps, ils
avaient pour tâche de segmenter ce film en événements. Les résultats
suggèrent que les bornes des événements identifiées par les par ticipants
dans la deuxième phase de l’étude se trouvent associées à des augmentations
d’activité cérébrale dans des zones qui s’activent également lors de la
phase dite de
« visionnage passif ». Ainsi, le cortex postérieur frontal
droit et tout particulièrement la zone MT+, connue pour son implication
dans le traitement du mouvement (Sekuler, Watamaniuk & Blake, 2002),
sont activés sélectivement lors des moments correspondant aux frontières
d’événements. Cette activation de la zone MT+ en réponse à la détection
de points de rupture a été observée également par Speer, Swallow et
Zacks (2003), confirmant l’importance des phases de transitions brusques
associées à des déplacements pour la segmentation.
Cette augmentation d’activité n’est pas seulement liée à la perception de
mouvements biologiques. Des résultats similaires ont été obtenus dans une
autre étude reprenant un paradigme similaire mais présentant cette fois des
figures géométriques à la place des acteurs humains (Zacks, Swallow, Vettel,
& McAvoy, 2006). Dans cette étude comme dans la précédente, l’activation
de certaines zones cérébrales est corrélée à la présence de points de rupture
dans la séquence présentée. En particulier MT+ répond de façon sélective
lorsque les objets se déplacent plus vite.
2.3. Apports des études sur les jeunes enfants
À ces indices d’une activité de segmentation automatique à partir de
données sensorielles, il faudrait ajouter ceux apportés par les études sur
de jeunes enfants. Celles-ci, encore rares, peuvent néanmoins ser vir de
preuves supplémentaires de la réalité psychologique d’un processus de
segmentation précoce et probablement enracinée dans des mécanismes
relativement indépendants de ceux qui gèrent l’activation des connaissances
acquises sur la base de l’expérience vécue. La logique est que les enfants
de bas-âge ne sont pas censés disposer de schémas conceptuels pour
qualifier certaines étapes d’une action en cours. Dès lors, montrer qu’ils
sont néanmoins capables d’identifier des séquences d’action à l’intérieur
L’année psychologique, 2012, 112, 277-308
286 Florent Levillain
r
Elisabetta Zibetti
de séquences dynamiques donne crédit à l’hypothèse d’un processus
automatisé de segmentation. Karen Wynn a été la première à montrer
que des enfants âgés seulement de six mois sont capables d’énumérer
mentalement des séquences d’action (Wynn, 1996 ; Sharon & Wynn, 1998).
Une poupée était présentée aux enfants, qui sautait deux fois ou trois
fois dans une première phase d’habituation. La phase de test consistait
simplement à présenter le même nombre de sauts ou un nombre d ifférent,
avec comme hypothèse celle que les enfants doivent être capables de
distinguer les phases d’habituation et de test s’ils possèdent la capacité à
énumérer les sauts, donc à identifier un saut comme une unité d’action. Les
enfants testés manifestent en effet une attention plus importante lorsque
le nombre de sauts est différent, à la fois lorsque des pauses séparent
les sauts mais aussi lorsque la séquence est continue et qu’aucune pause
ne vient séparer distinctement les phases de mouvement (Wynn, 1996,
expérience 2).
Si cette première étude représentait des mouvements extrêmement
simples, il a depuis été montré que les jeunes enfants peuvent é galement
distinguer des séquences signifiantes dans le comportement complexe
d’êtres humains engagés dans des tâches naturelles. Baldwin, Baird, Saylor
et Clark (2001) ont ainsi présenté à des enfants de 10 mois des séquences
interrompues par un écran figé. La pause de la séquence pouvait intervenir
soit en plein milieu d’une action, soit au moment correspondant à la
complétion d’une action. Il s’est avéré que les enfants manifestaient
une attention plus marquée lorsque la pause venait rompre une action
en cours, suggérant qu’ils perçoivent certaines séquences comme des
unités naturelles
5
dont la rupture artificielle contredit certaines attentes
concernant leur déroulement.
En dépit des preuves que nous venons de présenter en faveur
du caractère automatisé de la seg mentation pendant la perception de
séquences dynamiques, il est juste d’apporter une nuance. On ne saurait
dire en effet que la segmentation est un processus purement guidé par des
informations perceptives. Si tel était le cas, les unités d’actions considérées
dans une séquence seraient les mêmes pour tous, et l’on trouverait un
accord entre les individus concernant la longueur de ces unités. Or,
comme nous allons le voir dans le prochain sous-chapitre, il existe une
variation interindividuelle naturelle dans l’échelle temporelle choisie pour
déterminer les unités d’action.
5
D’autres études montrent par exemple que les enfants, dont les capacités d’attribution de buts et d’intentions
ne sont pas totalement développées, sont néanmoins capables de percevoir des combinaisons de mouvement
biologiques, tel que « attraper un objet », comme une unité discrète (Woodward, 1988).
L’année psychologique, 2012, 112, 277-308
Segmentation et perception intuitive de l’action 287
2.4. L’implication de schémas conceptuels dans la
segmentation
Bien que de nombreuses études aient mis en évidence un large consensus
dans le choix des points de rupture choisis par les observateurs pour
découper une séquence continue, plusieurs évidences expérimentales ont
montré très tôt que les observateurs peuvent adopter différents niveaux
de segmentation (par ex. Newtson, 1973 ; Wilder, 1978a, 1978b ; Massad,
Hubbard, & Newtson, 1979), révélant une grande variation dans la taille
des intervalles sépar ant deux points de rupture. La méthode utilisée dans
ces études consiste en effet à demander de segmenter une séquence en
unités plus ou moins g randes, en produisant de ce fait des interprétations
plus ou moins sémantiquement riches. Ainsi la taille de la séquence choisie
pour déterminer les unités d’action semble être plutôt déterminée par la
structure physique de l’événement lors d’une segmentation en séquences
courtes et inversement plus fortement influencée par une représentation
conceptuelle de l’action (attribution de buts et de causes) lors de la
segmentation en séquences d’action de plus grande échelle temporelle
(Zacks et al., 2009).
La variation dans la taille des intervalles dépend également des
instructions données aux participants dans leur tâche de segmentation.
Lorsque, par exemple, un groupe de participants reçoit pour consigne
de prêter attention aux traits de personnalité manifestés par les gestes
des acteurs du film, tandis qu’on demande à un autre groupe de prêter
attention aux détails des tâches réalisées par ces acteurs, le type de
segmentation peut varier considérablement, et les actions ainsi déterminées
se révèlent qualitativement différentes (Cohen & Ebbesen, 1979). De même,
la présence ou l’absence de verbalisation de la part des participants pendant
la tâche de segmentation (Hard et al., 2006b), ou encore l’insistance sur
le caractère aléatoire ou au contraire intentionnel des actions présentées
(Zacks, 2004 ; Zacks et al., 2009) sont des facteurs pouvant influencer la
taille des unités sélectionnées. La plus ou moins grande familiarité avec les
événements présentés dans les expériences de segmentation est également
un facteur contribuant à la variation de la taille des unités d’actions.
Lorsque les événements sont ambigus ou peu familiers, la segmentation
devient plus fine que lorsqu’il est possible d’insérer les différentes actions
dans des schémas connus (Newtson, 1973 ; Newtson et al., 1977 ; Vallacher
& Wegner, 1987 ; Wilder, 1978a, 1978b ; Zacks et al. 2001, Zacks et al., 2010).
Ces phénomènes indiquent que la segmentation dépend non seulement
de la possibilité d’identifier les points de rupture au niveau perceptif,
mais aussi pour une large part de la capacité à rassembler ces points
L’année psychologique, 2012, 112, 277-308
288 Florent Levillain
r
Elisabetta Zibetti
de rupture s ous des formes plus larges. Le caractère modulable des
unités de segmentation suggère qu’au moins deux niveaux sont impliqués
dans le processus de découpage de la séquence, un niveau perceptif
que nous avons déjà décrit, et un niveau conceptuel résultant de la
mobilisation de connaissances préalables pour organiser les changements
perçus dans l’action. À ce dernier niveau, les bornes de l’action sont
essentiellement dépendantes de la possibilité d’assimiler une action perçue
à un enchaînement familier. Si, par exemple, je vois une personne en
face d’une pile d’assiettes prendre un torchon, je comprends alors qu’elle
s’apprête à faire la vaisselle. Ma connaissance de la séquence typique
« faire la vaisselle » me sert ici à identifier une action particulière
comme une borne dans cette séquence, ou encore une étape vers un
objectif, qui consiste ici à obtenir une pile d’assiettes de nouveau brillantes
et prêtes à être réutilisées (Zacks et al., 2001b). La segmentation des
séquences en événements aux contours définis dépend donc pour une
large part de la possibilité d’utiliser des schémas connus qui représentent
des actions familières ou des actions pouvant être définies par des buts
poursuivis (voir Bartlett, 1995 ; Schank & Abelson, 1977 ; Rumelhart,
1980).
Si la segmentation au niveau conceptuel s’apparente en premier
lieu à la mobilisation de connaissances sur le déroulement typique
d’une action, possiblement à travers l’activation de schémas (Zwaan &
Radvansky, 1998) et de scripts (par ex., Rumelhart, 1980 ; Abelson, 1981 ;
Spector & Grafman, 1994), e lle met en jeu également une activité de
hiérarchisation des événements (Zacks et al., 2001b ; Zibetti, Hamilton,
& Tijus, 1999 ; Hard et al., 2006b). De la même manière que les objets
sont considérés comme des entités composées de certaines parties, les
événements possèdent une structure partonomique, des sous-événements
au grain plus fin s’assemblant pour constituer des événements plus larges
(voir Zacks et Tversky, 2001 ; Zibetti, 2001 ; Kurby & Zacks 2008
pour une revue de questions). Nous avons fréquemment recours à ce
type de str ucture pour expliquer une activité complexe, en la découpant
en différentes composantes qui constituent à la fois des étapes dans le
déroulement temporel et explicitent le mode de réalisation même de
l’activité.
Cette décomposition hiérarchique correspond sans doute à
l’organisation intrinsèque des actions dirigées vers un but. Au niveau
même de l’organisation cérébrale, des st ructures hiérarchiques soutiennent
la mise en oeuvre de gestuelles complexes (Lashle y, 1951), les séquences
motrices fines étant sous la dépendance de structures codant des plans
généraux d’action de plus en plus large jusqu’à l’intention du geste. Il est
L’année psychologique, 2012, 112, 277-308
Segmentation et perception intuitive de l’action 289
possible à cet égard que les schémas que nous utilisons pour interpréter
le déroulement d’une action reflètent cette structure inhérente des
activités intentionnelles. Les modèles de la compréhension de texte et
du r aisonnement (Newell & Simon, 1972 ; Rumelhart, 1980 ; Shanks &
Abelson, 1977) ont très tôt intégré l’organisation hiérarchique des actions
pour rendre compte de l a mémorisation ou de la planification d’actions.
Ainsi les schémas décrits par Rumelhart (1977 ; 1980) sont typiquement
des structures possédant une structure partonomique organisée autour de
buts et de sous-buts.
La nature hiérarchique
6
de la segmentation conceptuelle est également
mise en évidence dans les tâches expérimentales de segmentation que
nous avons déjà décrites. Zacks, Tversky et Iyer (2001b), ainsi que
Hard, Lozano et Tversky (2006a) ont ainsi vérifié l’alignement entre des
unités de segmentation déterminées à différents niveaux de granularité.
En présentant des scènes variant selon leur degré de familiarité, et en
demandant aux participants de segmenter soit au niveau le plus fin, soit au
niveau le plus large, ils ont pu montrer un deg d’alignement important
entre les deux types d’unité. En d’autres termes, les points de rupture
correspondant aux unités fines coïncident souvent avec le début ou la fin
des unités larges, ce qui semble indiquer une organisation hiérarchique de
la segmentation. Les unités fines semblent refléter les étapes de progression
d’une action vers son accomplissement, et sont englobées dans des
unités plus larges qui les résument et reflètent sans doute l a finalité de
l’action.
Ces études nous paraissent intéressantes dans la mesure elles
abordent la question des d ifférents niveaux de représentation de l’action.
La problématique centrale concerne ici le r ôle respectif des unités
d’action définies sur la base d’indices perceptifs et celles qui émergent
de l’application de schémas conceptuels dans l’interprétation globale de
la scène visuelle. L’enjeu est alors de définir l’architecture permettant de
rendre compte de ces deux niveaux et de la réorganisation dynamique dans
des structures hiérarchisées qui semblent avoir lieu de manière spontanée.
À cet égard, il est important de faire place à des travaux non directement
liés au problème de la segmentation mais susceptibles d’indiquer une voie
de liaison entre ces deux niveaux. Nous aborderons ainsi dans le prochain
chapitre l’étude de la perception intuitive de l’action.
6
Notons toutefois qu’un certain nombre de recherches en psychologie du développement (Baldwin & Baird,
1999), en psychologie comparative (Byrne, 2002) et en psychologie cognitive (Hard et al., 2006b) suggérèrent
que des indices perceptifs serait suffisant pour p ercevoir l’organisation hiérarchique de l’action.
L’année psychologique, 2012, 112, 277-308
290 Florent Levillain
r
Elisabetta Zibetti
3. LA PERCEPTION INTUITIVE DE L’ACTION
Parmi les études consacrées à l’interprétation de l’action, u n autre aspect
de la littérature concerne la question de la compréhension intuitive
de l’action. Cette littérature cherche à comprendre la distinction entre
mouvement animé et mouvement provoqué, à mettre en évidence des
formes d’interprétation non inférentielles, et à cerner les principes qui
dirigent la compréhension spontanée de certaines formes d’interactions.
3.1. Perception de la causalité et perception de
l’agentivité
Que se passe-t-il lorsque nous voyons soudainement deux objets
s’entrechoquer, une voiture entrer en collision avec une autre, un livre
sur une étagère entraînant un vase dans sa chute ? Il semble que, dans ce
type d’événements, une énergie particulière soit transmise qui détermine la
direction que prend l’événement. Nous percevons la collision des objets et
cette perception ne semble pas le fruit d’un raisonnement. L’impact et la
transmission de force s’imposent plutôt à nos yeux et nous reconnaissons
dans cette succession d’événements un enchaînement naturel et nécessaire.
De la même façon, les mouvements d’un organisme semblent porter en
eux-mêmes la signature de la nature intentionnelle des opérations mentales
qui les dirigent.
Tout se passe comme si nous étions capables de reconnaître im-
médiatement, simplement en observant le déroulement d’une séquence
visuelle, le car actère causal ou intentionnel d’un mouvement perçu. Le
psychologue Michotte a sans doute été le premier à proposer l’idée que ce
type d’intuitions appartiennent à un répertoire psychologique spécifique et
peuvent être considérés comme des phénomènes perceptifs à part entière
(Michotte, 1954, 1962). Dans les années 1940, Michotte a procédé à une
série d’investigations minutieuses de ces intuitions. À tr avers un dispositif
simple présentant le déplacement isolé de figures bidimensionnelles, lui
et ses collaborateurs ont entrepris de faire l’inventaire systématique des
conditions d’apparition de ce que ces auteurs appellent la
« perception
phénoménale de la causalité ». Une des situations expérimentales typiques
consiste à présenter u n rectangle (A) situé à gauche d’un autre rectangle
(B). A commence à se déplacer horizontalement dans la direction de
B. Lorsqu’il le rencontre, celui-ci entre en mouvement à son tour à la
même vitesse, de sorte que les deux rectangles restent accolés sur une
L’année psychologique, 2012, 112, 277-308
Segmentation et perception intuitive de l’action 291
courte distance jusqu’à leur disparition. Selon Michotte, les observateurs
indiquent quasi-unanimement que l’objet A est venu pousser ou entraîner
lobjetB.Ilsagitlàdel’effet d’entraînement, que vient compléter l’effet
de lancement dans lequel le rectangle A arrête sa course au moment il
contacte B et qui suscite l’impression que A a provoqué le déplacement de B.
À la même époque, une expérience devenue classique s’intéresse
à la perception du comportement intentionnel et aux attributs de
personnalité. Heider et Simmel (1944) présentent une animation contenant
des objets géométr iques, un grand triangle, un petit t riangle et un cercle,
et demandent aux participants de décrire ce qu’ils voient. En dépit
de l’absence totale de contexte pour les mouvements présentés, et de
l’absence de traits reconnaissables des objets, les observateurs réussissent
à produire une histoire détaillée, prêtant intentions et désirs aux figures en
mouvement :
« le cercle veut s’échapper de la maison »,ouencore« le petit
triangle cherche à délivrer sa promise d’un rival particulièrement violent »
7
.
De manière systématique, les déplacements présentés dans cette étude vont
susciter des attributions d’un ordre particulier, les termes utilisés sont
relatifs au domaine de l’agentivité, c’est-à-dire à la capacité pour un objet
de produire son propre mouvement et à prendre en compte les éléments de
l’environnement pour modifier sa trajectoire.
Dans ces dernières expériences et dans celles de Michotte, les conditions
visuelles sont réduites de manière drastique pour ne laisser évidentes que
les caractéristiques des déplacements, les accélérations, les changements
de trajectoire, les collisions, etc. Ce caractère appauvri des scènes sert
d’argument à Michotte pour suggérer l’idée que ce sont les mouvements tels
qu’ils sont perçus, et pas les propriétés, qui peuvent être inférés à partir des
caractéristiques visuelles de l’objet porteur du mouvement, qui provoquent
les impressions de causalité ou d’agentivité. Cet argument est appuyé par le
fait que des variations, parfois t rès subtiles, introduites dans les conditions
expérimentales ont pour conséquence des changements dramatiques dans
l’impression subjective des observateurs. Ainsi par exemple dans l’effet
de lancement (voir Michotte, Thinès, Costall, & Butterworth, 1991), il
existe des variations systématiques de l’impression causale associées à des
modifications du délai entre le moment A parvient à côté de B et
le moment ce dernier commence sa trajectoire. À partir de 50 ms
s’effectue le passage d’un report constant de l ’effet de lancement au
report d’impressions variées indiquant un
« retard », et qui se transforme
7
Zibetti, Poitrenaud et Tijus (2001) ont montré que, simplement en inversant la taille et la forme des trois figures
géométriques, tout en conservant les même déplacements, il est possible d’obtenir des descriptions verbales
les termes utilisés sont relatifs au domaine de l’amabilité (embarrasser, caresser...).
L’année psychologique, 2012, 112, 277-308
292 Florent Levillain
r
Elisabetta Zibetti
finalement en la sensation de voir deux mouvements indépendants quand
le délai dépasse 150 ms.
Cette dép endance des jugements de causalité à l’égard de conditions
spatio-temporelles précises p ousse Michotte à soutenir que la connexion
entre les déplacements est directement perçue, et qu’il y a donc une certaine
captation intuitive des relations de causalité. Le point fort du raisonnement
de Michotte consiste donc à isoler un niveau d ’attribution causale qui
ne dépend pas de connaissances que peuvent mobiliser les observateurs
à l’égard de la réalité physique du phénomène perçu. Au contraire, selon
Michotte, la
« causalité phénoménale » doit se manifester à chaque fois
que certaines structures perceptives bien particulières sont présentes dans le
champ visuel, et conduire à l’impression irrépressible de voir la production
d’un mouvement par un autre mouvement, et ceci indépendamment du
caractère réaliste ou non du dispositif présenté. Le même type d’argument
peut être proposé pour les déplacements suggérant un comportement dirigé
vers un but, une intuition du caractère intentionnel du mouvement aurait
lieu pourvu que certaines conditions perceptives soient réunies (Premack,
1990).
3.2. Innovations méthodologiques dans la perception
de l’action
Il a été souvent reproché à Michotte d’avoir fait intervenir dans ses
expériences de proches collaborateurs au fait des enjeux de l’étude
(Joynson, 1971). Bien que ce choix puisse être justifié par la volonté de
produire les réponses les plus précises (voir Costall, 1991), il est de manière
générale opportun de souligner les limitations du recours aux réponses
verbales pour explorer un phénomène perceptif, de nombreuses sources
de
« contamination » pouvant intervenir entre l’instant de formation du
phénomène perceptif et la réponse produite.
Àcegard,detudesplusrécentessurlaperceptionintuitivede
l’action ont mis l’accent sur la recherche de nouvelles modalités de réponse.
En cherchant par exemple les effets perceptifs collatéraux de la présence
d’un événement causal au sein d’une scène v isuelle (Scholl & Nakayama,
2002), en mesurant l’impact d’un effet de lancement sur la vitesse perçue
des mobiles (Parovel & Casco, 2006), ou encore en évaluant l’influence de la
causalité perçue sur la capacité à prédire la tr ajectoire d’un objet (Levillain,
2008 ; Levillain & B onatti, 2010).
En particulier, un effort a été accompli pour cerner les condi-
tions minimales qui, réunies, provoquent de manière systématique une
L’année psychologique, 2012, 112, 277-308
Segmentation et perception intuitive de l’action 293
attribution intentionnelle. Si Michotte (1954) avait déjà répertorié de façon
extrêmement minutieuse les conditions spatio-temporelles favorables au
percept de causalité, un effor t similaire manquait du côté de la perception
de l’agentivité. Tremoulet et Feldman (2000 ; 2006) ont réparé ce défaut
en prenant le parti de simplifier à l’extrême les scènes présentées, isolant
le déplacement d’une particule lumineuse de tout contexte capable de
renseigner le spectateur sur les sources du mouvement qu’il perçoit. Une
particule se déplaçait sur un fond noir, décrivant une première translation
avant de prendre une nouvelle direction qu’elle maintenait jusqu’à sa sortie
de l’écran. Les participants avaient pour tâche d’indiquer sur une échelle
graduéede1à7silemouvementdelaparticulvoquaitlecomportement
d’un être vivant. La manipulation expérimentale consistait principalement
à modifier la vitesse de la cible (le rapport entre sa vitesse finale et sa vitesse
initiale) et l’angle de son changement de trajectoire. La capacité à rattacher
le mouvement à celui d’un être vivant évolue proportionnellement à
l’accroissement de ces deux facteurs : plus l’accélération de la particule est
importante et plus elle effectue un changement de trajectoire abrupt, plus
elle donne l’impression d’être animée d’un mouvement lui appartenant.
Ces deux études de Tremoulet et Feldman spécifient des conditions
minimales de reconnaissance d’un mouvement autopropulsé. Bien que
la var iation des paramètres cinématiques ne soit pas la seule prise en
compte l’appréciation du caractère agentique de la trajectoire dépend
également de caractéristiques relatives à la forme de l’objet présenté
et à l’alignement de son axe antéro-postérieur sur sa trajectoire de
déplacement elle correspond à des caractéristiques cinématiques de
violation de conservation d’énergie auxquelles le système visuel pourrait
être particulièrement sensible, en vertu de leur capacité à indiquer la
présence d’une source interne d’énergie (Bingham, Schmidt et Rosenblum,
1995 ; Stewart, 1982).
Le type d’expérience que nous venons de décrire a pour principal défaut
de faire encore appel à des jugements subjectifs de la part des observateurs.
De façon similaire à la méthode utilisée par Michotte et la plupart des
études portant sur la perception de l’agentivité, un manque d’évaluation
quantitative, ainsi qu’une difficulté à distinguer les apports propres aux
inférences perceptives par rapport à des inférences de haut niveau, rendent
difficile l’attribution directe des effets observés à des registres perceptifs
spécialisés. Ce défaut a pu récemment être corrigé par Gao, Newman et
Scholl (2009) dans une étude qui illustre en même temps la capacité de
reconnaissance des interactions à distance, autre propriété fondamentale
d’un comportement intentionnel. Dittrich et Lea (1994) avaient déjà
montré dans une séquence de poursuite (un objet en chasse un autre)
L’année psychologique, 2012, 112, 277-308
294 Florent Levillain
r
Elisabetta Zibetti
l’importance de la vitesse de déplacement et de la déviation maximum du
mobile par rapport à sa cible dans l’impression que le mouvement reflète
une intention, c’est-à-dire la poursuite d’un but. Cependant, dans cette
nouvelle étude, Gao et al. (2009) ne cherchent pas à évaluer l’impression
subjective des observateurs mais à mesurer leurs performances visuelles en
terme de capacité à identifier les mobiles impliqués dans une relation de
poursuite. Pour cela, ils font varier la déviation angulaire maximale de la
trajectoire du poursuivant par rapport à celle du poursuivi, déterminant
des conditions où, bien que le « loup » se rapproche progressivement de
l’« agneau », la déviation autorisée est telle que cette relation peut devenir
difficile à détecter pour l’observateur. Les résultats de cette étude indiquent
une relation psychométrique entre la valeur de la déviation autorisée et
les capacités d’identification, avec une chute des performances quand la
déviation est supérieure à 60
.Cecisuggèrequelesystèmevisuelest
précalibré pour des valeurs précises de l’interaction à distance, au-delà
desquelles la relation devient indétectable.
3.3. Nature perceptive de l’attribution causale et
intentionnelle
À travers la mise en év idence de phénomènes de perception de la causalité
et de l’agentivité, il semble que certaines configurations de mouvement
fassent l’objet d’une reconnaissance instantanée et suscitent de manière
privilégiée l’utilisation de descripteurs d’action. Des conditions précises
au niveau des déplacements perçus déterminent ainsi la différenciation
entre un mouvement dont la cause est externe et un mouvement qui porte
en lui-même sa propre énergie et est susceptible de réagir à distance à
l’environnement qui l’entoure. Ces caractéristiques et le caractère spontané
des descriptions associées à ces événements ont suggéré, notamment
à Michotte, que leur nature est en grande partie perceptive, et non
conceptuelle, c’est-à-dire déterminé par des inférences de haut niveau
soutenues par des connaissances en mémoire. Ceci ne veut pas dire que
l’attribution causale ou intentionnelle n’existe qu’au niveau perceptif au
contraire nous avons vu que les schémas conceptuels intègrent les notions
de buts ou de causes mais qu’il existe un type particulier de causalité et un
type particulier d’agentivité, auxquels nous semblons accéder de manière
perceptive, et non par le biais de raisonnements conscients.
Des critiques anciennes, notamment à l’égard des travaux de Michotte,
ont néanmoins contesté le caractère irrésistible de la perception de l’action,
montrant par exemple que l’utilisation de termes causaux pour décrire
L’année psychologique, 2012, 112, 277-308
Segmentation et perception intuitive de l’action 295
verbalement un enchaînement de mouvements varie fortement selon
les individus et semble dépendre de leur expérience passée (Gemelli &
Cappellini, 1952 ; Boyle, 1960 ; Beasley, 1968). La possibilité que les
jugements impliqués dans la perception de l’action soient modelés de
façon massive par le profil des observateurs est sans doute contraire
à l’argumentation principale de Michotte et de ses suiveurs, elle laisse
penser que ce ne sont pas tant les structures imposées par les mécanismes
perceptifs que la disponibilité des concepts dans l’outillage mental qui
détermine ce qui est vu ou non dans telle ou telle configuration de
mouvements.
Il existe à cette critique plusieurs répliques. La première consiste
simplement à mettre en cause la valeur des jugements verbaux, que ce
soit pour prouver ou pour infirmer la thèse michotienne. Comme nous
l’avons vu, il existe d’autres manières d’évaluer la réalité perceptive de
l’attribution causale et intentionnelle que d’avoir recours à l’introspection
(Gao et al., 2009), et celles-ci suggèrent l’existence de mécanismes p erceptifs
impliqués dans le traitement causal et intentionnel du mouvement. Les
suivantes se placent sur le terrain expérimental. Depuis les travaux de
Michotte, il a par exemple été démontré l’existence d’une dissociation
entre causalité inférée, c’est-à-dire un jugement d’attribution causale basé
sur l’observation de relations de covariation entre plusieurs événements,
et causalité perçue, telle que manifestée dans l’effet de lancement
(Schlottmann & Shanks, 1992). Il existe par ailleurs un grand nombre
de travaux abordant le caractère inné de la perception de l’action,
suggérant que des nourrissons sont déjà sensibles à l’asymétrie entre un
agent et un patient dans une interaction mécanique perçue visuellement
(Leslie & Keeble, 1987 ; Oakes & Cohen, 1990 ; Newman, Choi, Wynn
& Scholl, 2008), ou qu’ils reconnaissent le caractère intentionnel d’un
mouvement dirigé vers un but et séparent en conséquence les objets
animés des objets inanimés (Gergely, Nádasdy, Csibra & Biró, 1995 ; Luo
et Baillargeon, 2005 ; Csibra, 2008). Enfin, il est possible d’ajouter que
des travaux en imagerie cérébrale commencent à mettre en évidence des
systèmes neurologiques consacrés au traitement perceptif des interactions
mécaniques et intentionnelles (Castelli, Happé, Frith, & Frith, 2000 ;
Blakemore, Fonlupt, Pachot-Clouard, Darmon, Boyer, Meltzoff, Segebarth,
& Decety, 2001 ; Fugelsang, Roser, Cor ballis, & Michael, 2005).
Dans une remise au goût du jour des travaux de Michotte, Scholl
et Tremoulet (2000) ont suggéré que, de la même façon qu’il recrée
spontanément la structure tridimensionnelle de l’environnement à partir
d’une image en deux dimensions sur la rétine, le système visuel cherche
à retrouver la structure causale et intentionnelle des événements à travers
L’année psychologique, 2012, 112, 277-308
296 Florent Levillain
r
Elisabetta Zibetti
des inférences tout aussi indépendantes d’un contrôle volontaire. Les
phénomènes de perception de la causalité et de l’agentivité possèdent en
effet des propriétés qui permettent de les assimiler à des mécanismes
modulaires, c’est-à-dire à des mécanismes autonomes et spécialisés dans
des routines très spécifiques (Fodor, 1983). Ils sont essentiellement rapides,
l’impression de percevoir une collision ou un changement intentionnel de
trajectoire apparaissant de façon instantanée, et irrésistible dans la mesure
les observateurs, sachant le caractère fictif des scènes présentées, ne
peuvent s’empêcher de donner sens à ces événements. Ce dernier point
souligne par ailleurs le caractère « encapsulé » du phénomène, c’est-à-dire
son indép endance à l’égard d’autres processus perceptifs et cognitifs, et
notamment de processus relatifs à l’organisation conceptuelle de la scène.
À travers ces différents travaux, nous avons montré qu’il est possible
de suggérer un niveau d’attribution causale et intentionnelle étroitement
lié aux sources perceptives de l’action, un niveau dans lequel se for ment
instantanément certaines inférences concernant soit les sources directes
du mouvement, soit les buts immédiats. Nous proposons d’utiliser ces
phénomènes de p erception intuitive de l’action pour enrichir les modèles
de la segmentation et des relations entre sources perceptives et sources
conceptuelles dans l’interprétation de l’action.
4. PROPOSITIONS POUR UN NIVEAU INTERMÉDIAIRE
DE REPRÉSENTATION DE L’ACTION
4.1. Entre segmentation au niveau perceptif et
segmentation au niveau conceptuel
Traditionnellement, les théories de la segmentation de l’action oscillent
entre un accent porté sur les facteurs ascendants (c’est-à-dire les points de
rupture définis sur une base p erceptive) et un accent porté au contraire
sur les facteurs descendants, c’est-à-dire l’ensemble des informations
en mémoire pouvant déterminer la taille des événements considérés
comme pertinents dans une séquence d’action. C’est au sein d’un
schéma binaire que s’organisent la plupart des réflexions et des pratiques
expérimentales, avec une logique de complémentarité dans laquelle la
structure d’événements définie au niveau perceptif est modulée et enrichie
par les informations provenant de schémas mentaux (voir par exemple
Newtson, 1973 ; Neisser, 1976 ; Vallacher & Wegner, 1987 ; Wilder, 1978a,
L’année psychologique, 2012, 112, 277-308
Segmentation et perception intuitive de l’action 297
1978b ; Zacks et al. 2001). Quand la segmentation au niveau perceptif
est essentiellement dépendante de la détection de traits de bas-niveau
appartenant au mouvement (tels que l’accélération ou la décélération),
la segmentation conceptuelle dépend, elle, de la mise en jeu de schémas
implantés en mémoire et définissant l’organisation temporelle typique
d’une action. L’aller-retour entre ces deux niveaux est le cadre principal
des théories sur la segmentation (voir Zacks & Tversky, 2001).
Selon ce schéma binaire, on suppose qu’au niveau perceptif le processus
de segmentation est aveugle au type d’entités impliquées dans l’action
(animé vs inanimé), ou encore au rôle de ces entités dans l’organisation
de l’action (agent vs patient). C’est seulement au niveau de la segmentation
conceptuelle, organisée par les connaissances en mémoire, que sont censés
apparaître des concepts comme les buts ou les intentions. À travers une
catégorisation des entités et du rôle qu’elles ont dans l’action, ainsi qu’à
travers la hiérarchisation des événements, c’est à ce niveau que, selon cette
hypothèse, apparaîtrait la possibilité d’organiser par exemple une séquence
en termes de moyens utilisés pour parvenir à un but.
Des raffinements dans ce modèle ont néanmoins été proposés. Au
contraire d’une opposition franche entre un niveau perceptif et un niveau
conceptuel, Zacks, à travers le modèle EST (Event Seg mentation Theory :
Zacks et al., 2007 ; Zacks et al., 2010) priv ilégie une approche dynamique
dans laquelle les unités d’actions sont définies simultanément à plusieurs
niveaux, et la taille des unités est constamment ajustée en fonction de
l’interaction entre les données perceptives et les apports conceptuels. Selon
Zacks, des
« modèles d’événement », qui correspondent à des schémas,
sont générés constamment pendant la perception d’une action, et c’est leur
capacité prédictive, c’est-à-dire leur capacité à indiquer ce qui va se produire
dans le futur, qui va déterminer quels changements transitoires sont pris
en compte au niveau perceptif pour déterminer les points de rupture.
Les bornes des événements vont ainsi être fonction de l’adéquation d’un
modèle d’événement en cours à la st ructure évaluée au niveau perceptif,
la réussite prédictive de ce modèle déterminant sa continuation, ou en cas
d’échec s on remplacement par un autre, et ainsi la taille des seg ments.
Ce typ e de modèle, bien qu’extrêmement intéressant, laisse néanmoins
encore peu de place à une notion que nous avons voulu mettre en évidence
dans ce texte, celle de la perception intuitive de l’action. Nous l’avons
vu, notre capacité à déterminer les contours de l’ac tion ainsi que le
fait qu’une action soit délibérée ou au contraire causée par une source
extérieure apparaît en effet extrêmement spontanée. Le fait que nous soyons
particulièrement rapides à déchiffrer une action, que nous le faisions sans
effort et avec une grande efficacité peut laisser penser que tout ne se joue
L’année psychologique, 2012, 112, 277-308
298 Florent Levillain
r
Elisabetta Zibetti
pas dans l’assimilation de structures perceptives à des schémas conceptuels,
mais qu’une partie de la compréhension de l’action réside dans la possibilité
d’une lecture immédiate de la structure des actions perçues. Notre apport à
l’égard des théories de l’interprétation de l’action consiste donc à imaginer
à l’intérieur des différents
« niveaux de segmentation » un niveau en
position intermédiaire, entre prise en compte des indices perceptifs et
activation de schémas conceptuels, capable d’intégrer les phénomènes
étudiés dans ce pan de littérature que semblent encore ignorer même les
modèles les plus avancés (Zacks et al., 2007). L’introduction de ce niveau
intermédiaire permettrait essentiellement d’affirmer qu’une représentation
des hiérarchies d’événements est possible indépendamment de l’accès à
des structures de connaissances, et que certaines briques apparaissent
spontanément dans la structure d ’une action perçue, pouvant contraindre
et diriger le processus même de segmentation (voir Figure 1).
Schéma d’agression
« Le triangle veur attraper le cercle.
Il finit par le coincer et lui donne un coup »
Segmentation
au niveau
conceptuel
Segmentation
au niveau
intermédiaire
Segmentation
au niveau
perceptif
Primitives d’action
triangle poursuit cercle
(interaction contingente)
triangle frappe cercle
(interaction mécanique)
Points de rupture
initiation
mouvement
triangle
initiation
mouvement
cercle
initiation
mouvement
triangle
contact fin
mouvement
cercle
Figure 1. Représentation des trois niveaux de segmentation à travers l’exemple
d’une séquence interprétée comme l’agression d’un objet sur un autre
Figure 1. Illustration of the three segmentation levels through the example of a sequence
interpreted as an assault
L’année psychologique, 2012, 112, 277-308
Segmentation et perception intuitive de l’action 299
Au moins deux arguments relatifs à l’architecture du système cognitif
peuvent être proposés pour justifier l’existence d’un niveau intermédiaire
de représentation de l’action. Un premier argument consiste à dire
qu’un niveau intermédiaire permet l’accès à des contenus concernant
le déroulement de l’action à des organismes possédant un système
de connaissances limité. Des expériences s’accumulent pour supporter
l’existence de capacités sophistiquées d’interprétation de l’action chez les
enfants de bas âge (Gergely et al., 1995 ; Kotovsky & Baillargeon, 2001 ;
Newman et al., 2008). Concernant les animaux non-humains, bien que
la réplication des principaux phénomènes de perception de l’action n’ait
pas été tentée l’exception de Ul ler & Nichols, 2000
8
), il existe certains
arguments théoriques pour supposer de telles capacités. L’un d’entre eux est
que la différenciation entre les sources du mouvement dans la scène visuelle
et les contraintes physiques peut constituer un avantage d’importance pour
le repérage des congénères ou des prédateurs.
Un second argument concerne directement la question de la segmen-
tation de l’action. Le niveau intermédiaire aurait un rôle direct dans
la délimitation d’unités d’action en vue de favoriser la compréhension
de la scène et sa mémorisation. Nous pouvons supposer qu’à ce niveau
a lieu une intégration de déplacements qui seraient distingués à un
niveau purement perceptif. Nous l’avons vu dans les expériences de
Michotte (1954), la succession particulière de deux mouvements, associée
à des conditions précises de contiguïté spatio-temporelle, détermine une
impression qui représente davantage que le regroupement des deux
phases du mouvement, mais constitue une véritable entité perceptive
correspondant à la tra nsmission de force. Ceci suggère que, dans les
conditions appropriées, une unité d’action est formée spontanément qui
intègre les différentes composantes du déplacement perçu, une unité
qui commence par le mouvement du premier objet e t se termine avec
celui du deuxième objet, englobant les prémisses de l’action et ses
conséquences.
Un des aspects de la perception de l’agentivité revient à connecter des
trajectoires isolées spatialement sur la base de leur deg de contingence
(Dittrich & Lea, 1994 ; Santos, David, Bente, & Vogeley, 2008 ; Gao
et al., 2009), ce qui semble aboutir à la formation de nouve lles unités
perceptives pouvant être décrites selon des paramètres d’ajustement d’un
des mouvements par rapport à l’autre. Par exemple, l’ajustement de la
position d’un joueur de football avec la tr ajectoire du ballon dans les airs
8
Les résultats de cette étude ont cependant fait l’objet d’une rétractation de la part des auteurs en raison d’erreurs
de codage des observations (Uller, 2001).
L’année psychologique, 2012, 112, 277-308
300 Florent Levillain
r
Elisabetta Zibetti
pourrait, sur la base du degré de contingence entre le mouvement du joueur
et celui du ballon, servir à délimiter une unité d’action (« réception du
ballon »).
Au niveau intermédiaire seraient donc déterminées des unités de
segmentation plus grandes que les unités qui seraient définies sur la base des
seuls indices de changement transitoire, et pourraient servir de première
étape vers une intégration massive des déplacements dans une scène, pour
aboutir à un “tableau” unifié par des schémas conceptuels.
4.2. Modules et primitives d’action
Quels sont les mécanismes qui permettent d’aboutir à la formation d’unités
d’action au niveau intermédiaire ? Nous devons supposer que des processus
sont capables d’agir indépendamment de ressources conceptuelles pour
former des unités qui contiennent néanmoins des informations sur
la structure, causale ou intentionnelle, de l’action. Cette contrainte
d’autonomie est celle qui préside au fonctionnement modulaire. Les
modules sont des structures imaginées pour accomplir cer taines tâches
très spécifiques, routines cognitives qui doivent être exécutées de manière
rapide, automatique, et de telle façon que leur produit soit propulsé
vers d’autres relais de l’architecture cognitive de manière irrésistible, sans
devoir faire l’objet d’une
« délibération » consciente (Fodor, 1983 ; Pinker,
1997 ; Sperber, 2001). Nous supposons alors que des modules consacrés
spécifiquement à certaines interactions entre objets sont activés lors du
processus de segmentation de la scène, prenant pour entrée les changements
transitoires observés et ayant pour sortie des unités d’action contenant
l’ébauche de structures de transmission causale de force ou d’interactions
volontaires entre objets animés.
Cette proposition correspond par exemple à la théorie de Leslie (1994)
qui considère qu’un module est chargé de produire une description de
la répartition des énerg ies, des transmissions de force et des conditions
minimales de production du mouvement. Un module qui serait disponible
à la naissance pour contraindre l’apprentissage de l’enfant sur les
interactions entre objets. D’autres auteurs, tels que Pinker (1997) ou Spelke
(1998) ont également défendu des idées similaires concernant la possibilité
d’intégrer des domaines de connaissances à une architecture modulaire.
Au niveau intermédiaire, des modules auraient donc pour rôle
de former des sortes de briques élémentaires dans la description et
l’interprétation de l’action. Ces unités perceptives correspondraient selon
nous à des primitives d’action dont une liste de propriétés peut commencer
à être élaborée.
L’année psychologique, 2012, 112, 277-308
Segmentation et perception intuitive de l’action 301
Les primitives d’action peuvent être décrites par des conditions ciné-
matiques précises : Nous l’avons vu en ce qui concerne notamment
la perception de la causalité, un petit nombre de paramètres tels que
la contiguïté spatio-temporelle entre les mobiles impliqués dans une
interaction mécanique, leur vitesse relative ou leur direction ont un rôle
considérable dans la formation des impressions concernant l’origine et le
sens de l’action (Michotte, 1954 ; Scholl & Nakayama, 2002). Bien que la
définition des paramètres cruciaux dans la perception de l’agentivité soit
plus complexe, il apparaît que des variations transitoires dans la direction
et la vitesse des déplacements perçus participent de manière cruciale à
l’impression spontanée d’avoir affaire à des mouvements d’êtres animés
(Tremoulet & Felman, 2000).
Les primitives d’action spécifient des rôles aux entités impliquées : Nous
l’avons vu, la distinction entre objets animés et objets inanimés est au
coeur de la compréhension intuitive de certaines interactions, et ceci
peut être considéré comme une amorce de l’identification de buts et de
schémas causaux à un niveau plus élaboré d’interprétation de l’action.
La délimitation d’une séquence d’action coïncide avec la définition de
rôles à l’intérieur de cette séquence. En ce qui concerne la perception de
la causalité, il s’agit essentiellement de déterminer la place qu’occupent
les objets considérés dans le processus de transmission et de réception
d’énergie. Ainsi dans une collision entre deux objets, l’un des objets est
considéré comme celui qui transmet une certaine quantité d’énergie, tandis
que l’autre objet reçoit passivement cette énergie (Michotte, 1954). Pour
la perception de l’agentivité, il s’agit avant tout de reconnaître un ordre
temporel qui va définir une entité initiatrice de l’action, celle qui agit en
premier, et une entité qui manifeste une réaction à cette première action.
Les primitives d’action peuvent faire l’objet d’une description verbale : À
ces briques élémentaires au niveau de la segmentation perceptive d’une
scène pourraient correspondre des briques verbales. Des verbes ayant trait
à la description de l’action, tels que
« lancer », « pousser », « déclencher »,
« poursuivre », etc. sont naturellement utilisés dans les situations
impliquant une action causale directe d’un agent sur un patient, par
contraste avec des expressions composées qui interviennent généralement
lorsqu’un intermédiaire est identifié dans la séquence d’action considérée
(Kemmer & Verhagen, 1994 ; Wolff, 2003). À cet égard, il est possible
que la lexicalisation des descripteurs d’action ait pour racine l’implication
de modules d’analyse perceptive pour la segmentation de primitives
d’action. La possibilité de relier des événements par ce type de mécanismes
constituerait une condition minimale pour qu’une séquence d’action fasse
l’objet d’une verbalisation.
L’année psychologique, 2012, 112, 277-308
302 Florent Levillain
r
Elisabetta Zibetti
À ces primitives d’action fait encore défaut aujourd’hui une typologie
précise qui tenterait d’inventorier les différentes formes d’interaction
susceptibles de faire l’objet d’un traitement modulaire. Nous avons décrit
deux domaines pri ncipaux de recherche sur la perception de l’action
mais, ainsi que l’ont suggéré Gao et al. (2009), il pourrait exister parmi
ces grandes catégories, causalité et agentivité, différentes sous-catégories
(comme combattre, jouer, garder, etc.) obéissant à des traits perceptifs
distincts (Tijus & Zibetti, 2001). En guise de préalable à une telle tentative
de classification des primitives d’ac tion, nous pouvons essayer de distinguer
deux types principaux d’interactions : les interactions mécaniques et les
interactions contingentes.
L’interaction mécanique définit le type de relation causale que peuvent
entretenir plusieurs objets inanimés. Comme dit précédemment, elle
représente la relation de transfert d’énergie entre un objet considéré comme
actif et un autre passif. Son exemple typique est celui d’une boule de billard
entrant en collision avec une autre, avec arrêt instantané de la première
au départ de la seconde, qui correspond à
« leffetdelancement» décrit
par Michotte et qui s’accompagne de l’impression de voir le premier objet
« lancer » le second.
Il semble que la propriété fondamentale qui gouverne la possibilité
de connecter les deux mouvements dans une interaction causale soit
la contiguïté temporelle de l’arrêt du premier mouvement et du
commencement du second. Curieusement, le contact direct ent re les objets
n’est pas nécessaire pour que s’établisse l’impression irrésistible de poussée
de la part d’un objet sur l’autre, bien plutôt la contiguïté temporelle
entre les deux mouvements est la condition nécessaire à la connexion des
déplacements, un retard significatif se traduisant par l’impression de voir
deux mouvements indépendants (Yela, 1952).
L’interaction contingente définit le type de relation causale que peuvent
entretenir plusieurs agents. Le degré de contingence entre les mouvements
considérés est défini par la probabilité plus ou moins grande que le
déplacement de l’objet B coïncide avec le déplacement de l’objet A, ainsi
que la probabilité que les caractéristiques du déplacement de l’objet B
coïncident avec les caractéristiques du déplacement de l’objet A. Ainsi,
le degré de contingence entre deux déplacements sera augmenté si le
mouvement de B est contigu temporellement avec celui de A, et plus encore
si B se déplace dans la même direction, avec la même vitesse que A. Ce
type d’interaction peut être réciproque, lorsque par exemple deux objets
semblent jouer ensemble, ou non réciproque, lorsque par exemple un objet
paraît en poursuivre un autre.
L’année psychologique, 2012, 112, 277-308
Segmentation et perception intuitive de l’action 303
Dans les deux types d’interactions, le « ciment » quipermetdejoindre
plusieurs trajectoires réside dans le caractère causal de l’interaction, par
contact direct ou à distance. Une première définition des rôles apparaît alors
dans la hiérarchie entre un objet qui initie l’interaction (en provoquant
mécaniquement un déplacement ou en suscitant un déplacement) et un
objet qui y répond.
En résumé, le niveau intermédiaire de représentation de l’action tel que
nous le supposons aurait pour rôle de délimiter, sans effort réflexif de la part
de l’observateur, des briques d’action dans lesquelles sont spécifiés certains
rôles e t qui peuvent être lexicalisées. Ces briques ou primitives d’action
permettraient d’organiser la séquence perçue en vue de l’application de
schémas conceptuels, favorisant la reconnaissance immédiate d’événements
pertinents du point de vue de l’organisation causale de la scène, et
définissant des unités d’action intermédiaires entre la perception de points
de rupture et l’engagement de schémas de haut niveau.
5. CONCLUSION
La capacité humaine de donner sens à des séquences complexes d’action
est aussi frappante qu’elle est obscure du point de vue des mécanismes
psychologiques qui la soutiennent. Deux manières d’aborder la com-
préhension de l’action ont déterminé deux approches dans la littérature,
l’une étant consacrée aux mécanismes perceptifs automatisés de détections
d’invariants dans l’analyse de séquences dynamiques d’action, l’autre se
donnant pour objectif de résoudre le problème de la segmentation de
séquences en différentes unités ou é vénements. Ces champs de recherche
fabriquent des paradigmes expérimentaux et des théories qui leur appar-
tiennent en propre. Ce cloisonnement est la marque d’une spécialisation
des méthodes de recherche, bénéfique d’un point de vue pragmatique,
mais potentiellement nuisible dans l’optique d’une unification théorique
du domaine de la compréhension de l’action. Il est ainsi regrettable que
des découvertes effectuées dans l’un de ces champs ne retentissent pas
sur l’autre. Souvent la littérature concernant la segmentation de l’action
semble ignorer l’autre pan de la littérature concernant l’existence possible
de modules dédiés à la perception automatisée de l’action, et vice-versa.
Pourtant, nous l’avons vu, rien n’indique que nous ayons affaire à deux
niveaux d’analyse radicalement indépendants.
Nous avons proposé dans cet article un préambule à l’unification
théorique de ces deux champs, à travers l’hypothèse d’un niveau
L’année psychologique, 2012, 112, 277-308
304 Florent Levillain
r
Elisabetta Zibetti
intermédiaire de représentation de l’action. Ce dernier serait chargé de
structurer les scènes perceptives dynamiques pour favoriser certaines inter-
prétations relatives aux buts poursuivis et aux causes d’un comportement
observé. À travers le traitement automatisé de primitives d’action, le niveau
intermédiaire de représentation favoriserait une lecture quasi-instantanée
des points d’organisation de la scène dynamique pour suggérer certaines
unités d’action, qui elles-mêmes déterminent la compréhension globale de
l’action en cours.
De nombreuses questions expérimentales réclament d’être considérées
pour étayer cette hypothèse. Il s’agit par exemple de vérifier dans quelle
mesure certaines formes d’interaction entre objets ont un impact sur la
compréhension g l obale de la scène. Ceci pourrait être déterminé expéri-
mentalement en évaluant la relation systématique entre des variations des
paramètres spatio-temporels constitutifs de ces interactions et les points
de rupture choisis au sein d’une séquence d’action. Il s’agirait également
de déterminer si la catégorie d’interaction représentée, mécanique ou
contingente, influence le niveau de granularité choisi pour décrire l’action.
On peut imaginer ainsi que la perception d’interactions contingentes
oblige” l’observateur à se situer à un niveau de description plus large que
celles des interactions locales qui règlent les transformations mécaniques
9
.
Il importe enfin de connaître dans quelle mesure le traitement de ce que
nous avons qualifié de primitives d’action est vraiment indépendant du
contexte dans lequel prend place l’action, autrement dit de savoir s’il existe
véritablement des opér ations locales dans le traitement d’une scène visuelle
dynamique.
Bien d’autres questions pourraient être abordées, concernant notam-
ment la nature de l’architecture cognitive qui soutient la possibilité de
donner sens à des phases d’action. Dans quelle mesure les intuitions
de l’action sont-elles isolées des connaissances conceptuelles ? Quelle est
leur relation avec les concepts élaborés appartenant au domaine de la
physique ou à celui de la compréhension des états mentaux d’autrui ?
Pour l’heure, il nous suffit de remarquer que ces formes d’attribution
intuitive que nous avons décrites se d istinguent par de fortes contraintes
perceptives, elles encouragent ainsi à réfléchir à la variété des niveaux de
9
Les d’expériences menées par Hard et ses collaborateurs (Hard et al., 2006b) peuvent suggérer qu’il existe bien
un impact de primitives d’action à la fois sur la segmentation et la hiérarchisation de l’action. Le point critique
dans ces expériences est de présenter des séquences animées dans leur sens normal puis en sens inverse pour
mesurer l’effet de la direction de l’action sur la segmentation et «l’intérprétabilité». Le fait qu’il y ait très peu
de différences dans les frontières d’événement choisies entre les deux conditions suggère que certaines structures
d’événement restent invariantes quelque soit la direction de l’événement, et que les schémas conceptuels ne jouent
pas un rôle fondamental dans la segmentation, mais au contraire pourraient être dépendant de la détection
préalable de ces structures d’événement.
L’année psychologique, 2012, 112, 277-308
Segmentation et perception intuitive de l’action 305
représentation impliqués dans la compréhension de l’action, et à penser
les modèles capables d’accueillir les différentes strates et les différentes
modalités d’interaction qui participent à l’élaboration d’interprétations
cohérentes et partagées de l’action en cours.
Reçu le 14 juin 2010.
Révision acceptée le 22 février 2011.
BIBLIOGRAPHIE
Abelson, R. P. (1981). Psychological status
of the script concept. American Psychologist,
36, 715-729.
Baldwin, D. A., & Baird, J. A. (1999). Action
analysis: A gateway to intentional inference.
In P. Rochat, (Ed.), Early social cognition:
Understanding others in the first months of
life (pp. 215-240). Mahwah, NJ: Erlbaum.
Baldwin, D., & Baird, J. (2001). Discern-
ing intentions in dynamic human action.
Trends in Cognitive Sciences, 5, 171-178.
Baldwin, D., Baird, J., Saylor, M., & Clark,
M. (2001). Infants parse dynamic action.
Child Development, 72, 708-717.
Bartlett, S. (1995). Remembering: A study
in experimental and social psychology. Cam-
bridge University Press.
Bingham, G., Schmidt, R., & Rosenblum,
L. (1995). Dynamics and the orientation
of kinematic forms in visual event recog-
nition. Journal of Experimental Psychology:
Human Perception and Performance, 21,
1473-1493.
Blakemore, S. J., & Decety, J. (2001).
From the perception of action to the un-
derstanding of intention. Nature Reviews:
Neuroscience, 2,1-8.
Blakemore, S., Fonlupt, P., Pachot-Clouard,
M., Darmon, C., Boyer, P., Meltzoff, A.,
Segebarth, C., & Decety, J. (2001). How the
brain p erceives causality: an event-related
fMRI study. NeuroReport, 12, 3741-3746.
Beasley, N. E. (1968). The extent of in-
dividual differences in the perception of
causality. Canadian Journal of Psychology,
22, 399-407.
Boyle, D. G. (1960). A contribution to the
study of phenomenal causality. Quaterly
JournalofExperimentalPsychology, 12,
171-179.
Byrne, R. W. (2002). Seeing actions as
hierarchically organized structures: Great
ape manual skills. In A. N. Meltzoff, & W.
Prinz (Eds.), The imitative mind: Develop-
ment, evolution, and brain bases (pp. 122-
140). Cambridge: Cambridge University
Press.
Casati, R., & Varzi, A. C. (1996). Events.
Aldershot, England ; Brookfield, Vt.: Dart-
mouth.
Castelli,F.,Happé,F.,Frith,U.,&Frith,C.
(2000). Movement and mind: a functional
imaging study of perception and interpre-
tation of complex intentional movement
patterns. Neuroimage, 12, 314-325.
Cohen, C., & Ebbesen, E. (1979). Observa-
tional goals and schema activation: A theo-
retical framework for behavior perception.
Journal of Experimental Social Psychology,
15, 305-329.
Costall, A. (1991). Phenomenal Causal-
ity. In G. Thinès, A. Costall, & G.
Butterworth (Eds.), Michotte’s Experimen-
tal Phenomenology of Perception.Erlbaum.
L’année psychologique, 2012, 112, 277-308
306 Florent Levillain
r
Elisabetta Zibetti
Csibra, G. (2008). Goal attribution to
inanimate agents by 6.5-month-old infants.
Cognition, 107, 705-717.
Dittrich, W., & Lea, S. (1994). Visual per-
ception of intentional motion. Perception,
23, 253-253.
Fodor, J. (1983). The modularity of mind.
Cambridge, MA: MIT press.
Fugelsang, J., Roser, M., Corballis, P.,
& Michael, S. (2005). Brain mechanisms
underlying perceptual causality. Cognitive
brain, 24, 41-47.
Gao, T., Newman, G., & Scholl, B. (2009).
The psychophysics of chasing: A case study
in the perception of animacy. Cognitive
psychology, 59, 154-179.
Gemelli, A., & Cappellini, A. (1958). The
influence of the subject’s attitude in percep-
tion. Acta Psychologica, 14, 12-23.
Gergely, G., Nádasdy, Z., Csibra, G., & Biró,
S. (1995). Taking the intentional stance at
12 months of age. Cognition, 56, 165-193.
Hard, B. A., Lozano, S., & Tversky, B.
(2006a). Hierarchical encoding: A mech-
anism for observational learning. Journal
of Experimental Psychology: General, 135,
588-608.
Hard,B.M.,Tversky,B.,&Lang,D.
(2006b). Making sense of abstract events:
Building event schemas. Memory & Cogni-
tion, 34, 1221-1235.
Heider, F., & Simmel, M. (1944). An
experimental study of apparent behavior.
The American Journal of Psychology, 57,
243-259.
Joynson, R. B. (1971). Michotte’s experi-
mental methods. British Journal of Psychol-
ogy, 62, 293-302.
Kemmer, S., & Verhagen, A. (1994). The
grammar of causatives and the conceptual
structure of events. Cognitive linguistics, 5,
115-156.
Kotovsky, L., & Baillargeon, R. (2001).
Reasoning about collisions involving inert
objects in 7.5-month-old infants. Develop-
mental Science, 3, 344-359.
Kurby, C., & Zacks, J. (2008). Segmen-
tation in the perception and memory of
events. Trends in cognitive sciences, 12,
72-79.
Leslie, A. (1994). ToMM, ToBy, and Agency:
Core architecture and domain specificity.
In L. Hirschfeld, & S. Gelman, Mapping the
mind: Domain specificity in cognition and
culture (pp. 119-148). Cambridge Univer-
sity Press.
Leslie, A. M., & Keeble, S. (1987). Do
six-month-old infants perceive causality?
Cognition, 25
, 265-288.
Levillain, F. (2008). Poursuivre des chimères:
Limitations de l’imagerie dynamique.Thèse
de Doctorat, Université Paris 8.
Levillain, F., & Bonatti, L. L. (2010). On
the limitations of dynamic imagery: A
mental extrapolation task. Proceedings of
the annual conference of the Cog nitive
Science Society.
Luo, Y., & Baillargeon, R. (2005). Can a
self-propelled box have a goal? Psychological
Science, 16, 601.
Massad, C., Hubbard, M., & Newtson,
D. (1979). Selective perception of events.
Journal of Experimental Social Psychology,
15, 513-532.
Michotte, A. (1954). La Perception de la
Causalité. Publications Universitaires de
Louvain.
Michotte, A. (1962). La causalité physique
est-elle une donnée phénoménale? In A.
Michotte, Causalité Permanence et Réalités
Phénoménales : Études de Psychologie Ex-
périmentale.Louvain:PublicationsUniver-
sitaires.
Michotte, A., Thinès, G., Costall, A., & But-
terworth, G. (1991). Michotte’s experimen-
tal phenomenology of perception. Lawrence
Erlbaum Associates.
Neisser, U. (1976). Cognition and reality:
Principles and implications of cognitive psy-
chology. San Francisco: Freeman.
Newman, G. E., Choi, H., Wynn, K., &
Scholl, B. J. (2008). The origins of causal
L’année psychologique, 2012, 112, 277-308
Segmentation et perception intuitive de l’action 307
perception: evidence from postdictive pro-
cessing in infancy. Cognitive Psychology, 57,
262-291.
Newtson, D. (1973). Attribution and the
unit of perception of ongoing behavior.
Journal of Personality and Social Psychology,
28, 28-38.
Newtson, D. (1976). Foundations of attri-
bution: the perception of ongoing behavior,
in J. H. Harvey, W. J. Ickes, and R. F.
Kidd (Eds), New Directions in Attribution
Research Hillsdale, NJ: Lawrence Erlbaum
Associates.
Newtson, D., & Engquist, G. (1976).
The perceptual organization of ongoing
behavior. Journal of Experimental Social
Psychology, 12, 436-450.
Newtson, D., Engquist, G., & Bois, J.
(1977). The objective basis of behavior
units. Journal of Personality and Social
Psychology, 35, 847-862.
Oakes, L., & Cohen, L. (1990). Infant
perception of a causal event. Cognitive
Development, 5, 193-207.
Parovel, G., & Casco, C. (2006). The
psychophysical law of speed estimation in
Michotte’s causal events. Vision Research,
46, 4134-4142.
Pinker, S. (1997). How the mind works.
Norton.
Premack, D. (1990). The infants theory of
self-propelled objects. Cognition, 36, 1-16.
Rumelhart, D. (1980). Schemata: The
building blocks of cognition. In R. J.
Spiro, B. C. Bruce, & W. F. Brewer (Eds.),
Theoretical issues in reading comprehension:
Perspectives from cognitive psychology, lin-
guistics, artificial intelligence, and education.
Hillsdale, NJ: Erlbaum.
Rui, YA., Rui, Y. and An, P., (2000) Seg-
menting Visual Actions Based on Spatio-
Temporal Motion Patterns. In IEEE Con-
ference on Computer Vision and Pattern
Recognition, 111-118.
Santos, N.S., David, N., Bente, G., &
Vogeley, K. (2008). Parametric induction
of animacy experience. Consciousness and
Cognition, 17, 425-437.
Scholl, B. J., & Nakayama, K. (2004).
Illusory causal crescents: misperceived spa-
tial relations due to perceived causality.
Perception, 33, 455-469.
Scholl, B., & Tremoulet, P. (2000). Per-
ceptual causality and animacy. Trends in
Cognitive Sciences, 4, 299-309.
Schlottmann, A., & Shanks, D. R. (1992).
Evidence for a distinction between judged
and perceived causality. Quaterly Journal of
Experimental Psychology, 44A, 321-342.
Sekuler, R., Watamaniuk, S.N.J., &
Blake, R. (2002). Perception of visual
motion. In H. Pashler, & S. Yantis (Eds.),
Stevens’Handbook of Experimental Psy-
chology. New York: J.Wiley Publishers.
Sharon, T., & Wynn, K. (1998). Individu-
ation of actions from continuous motion.
Psychological Science, 9, 357-362.
Spector, L., and Grafman, J. (1994). Plan-
ning, Neuropsychology and Artificial Intel-
ligence: Cross-Fertilization,Vol.9.Amster-
dam: Elsevier.
Speer, N., Swallow, K., & Zacks, J. (2003).
Activation of human motion processing
areas during event perception. Cognitive,
Affective, & Behavioral Neuroscience, 3,
335-345.
Spelke, E. (1998). Nativism, empiricism,
and the origins of knowledge. Infant Behav-
ior and Development, 21, 181-200.
Stewart, J. (1982). Perception of animacy.
PhD Thesis, University of Pennsylvania.
Tijus, C. A., & Zibetti, E. (2001). Le rôle
du but et de l’objet dans la détermination
sémantique des verbes d’action. Journal
des Anthropologues - A. F. A., 85-86,
157-182.
Tremoulet, P., & Feldman, J. (2000). Percep-
tion of animacy from the motion of a single
object. Perception, 29, 943-952.
Tremoulet, P., & Feldman, J. (2006). The
influence of spatial context and the role
of intentionality in the interpretation of
L’année psychologique, 2012, 112, 277-308
308 Florent Levillain
r
Elisabetta Zibetti
animacy from motion. Perception & Psy-
chophysics, 68, 1047-1058.
Uller, C. (2001). Retraction Notice for
the Brief Article “Goal attribution in
chimpanzees” by Claudia Uller and Shaun
Nichols Published in Cognition Volume 76
(2000) pp. B27–B34. Cognition, 80(3), iii.
Uller, C., & Nichols, S. (2000). Goal
attribution in chimpanzees. Cognition, 76,
B27–B34.
Wilder, D. (1978a). Effect of predictability
on units of perception and attribution.
Personality and Social Psychology Bulletin, 4,
281-284.
Wilder, D. (1978b). Predictability of be-
haviors, goals, and unit of perception.
Personality and Social Psychology Bulletin, 4,
604-607.
Wolff, P. (2003). Direct causation in the lin-
guistic coding and individuation of causal
events. Cognition, 8, 1-48.
Wynn, K. (1996). Infants’ individuation
and enumeration of actions. Psychological
Science, 7, 164-169.
Woodward, A. L. (1998). Infants selectively
encodethegoalobjectofanactorsreach.
Cognition, 69, 1-34.
Yela, M. (1952). Phenomenal causation
at a distance. The Quarterly Journal of
Experimental Psychology, 4, 139-154.
Zacks, J. (2004). Using movement and
intentions to understand simple events.
Cognitive Science: A Multidisciplinary Jour-
nal, 28, 979-1008.
Zacks, J. M., Braver, T. S., Sheridan, M. A.,
Donaldson, D. I., Snyder, A. Z., Ollinger,
J. M., Buckner, R. L., & Raichle, M. E.
(2001a). Human brain activity time-locked
to p erceptual event boundaries. Nature
Neuroscience, 4, 651-655.
Zacks, J., Swallow, K., Vettel, J., & McAvoy,
M. (2006). Visual motion and the neural
correlates of event perception. Brain re-
search, 1076, 150-162.
Zacks,J.M.,Speer,N.K.,Swallow,K.M.,
Braver, T. S., & Reynolds, J. R. (2007). Event
perception: A mind/brain perspective. Psy-
chological Bulletin, 133, 273-293.
Zacks, J. M., Speer, N. K., Swallow, K. M.
& Maley, C. J. (2010). The brain’s cuting-
room floor: Segmentation of narrative
cinema. Frontiers in Human Neuroscience,
4, ArtID 168.
Zacks, J. M., Kumar, S., Abrams, R. A.,
& Mehta, R. (2009). Using movement and
intentions to understand human activ ity.
Cognition, 112, 201-216.
Zacks, J. M., Tversky, B., & Iyer, G. (2001b).
Perceiving, remembering, and communi-
cating structure in events. Journal of Exper-
imental Psychology: General,
130, 29-58.
Zacks, J., & Tversky, B. (2001). Event
structureinperceptionandconception.
Psychological Bulletin, 127, 3-21.
Zibetti, E. (2001). Catégorisation con-
textuelle et compréhension d’événements
visuellement perçus et interprétés comme
des actions. Thèse de Doctorat, Université
Paris 8.
Zibetti, E., Hamilton, E., & Tijus, C. A.
(1999). The role of Context in Interpreting
Perceived Events as Action. In V. Akman, P.
Bouquet, R. Thomason, R. Young (Eds.).
Lectures Notes in Artificial Intelligence, vol.
1688, Modeling and Using Context.New-
York: S pr i n g er Verlag.
Zibetti, E., Poitrenaud, S., & Tijus, C. A.
(2001). La construction de la représen-
tation de l’action perçue. Intellectica, 32,
123-153.
Zwaan, R. A., and Radvansky, G. A. (1998).
Situation models in language comprehen-
sion and memory. Psychological Bulletin,
123, 162-185.
L’année psychologique, 2012, 112, 277-308
... The ability to interpret the movements of objects in terms of behavior, action, intention, or personality traits forms the basis of research on action understanding (Baldwin & Baird, 2001;Levillain & Zibetti, 2012;Zacks, Speer, Swallow, Braver, & Reynolds, 2007), and particularly, studies focusing on perception of animacy and agency (Leslie, 1988;Michotte, 1963;Premack, 1990;Scholl & Tremoulet, 2000). What is unique about these studies is that movement is considered as an intrinsic source of information about the causal or intentional origins of behavior (e.g., Choi & Scholl, 2004;Csibra, 2008). ...
... Anthropomorphism is a multi-layered phenomenon (Persson, Laaksolahti, & Lönnqvist, 2000;Ruijten, Bouten, Rouschop, Ham, & Midden, 2014) that encompasses different levels of categorization and cognitive attribution. What we have suggested is that there is a level of interpretation of the behavior that may occur prior to the attribution of mentalistic concepts, which qualifies the organizational complexity of the observed behavior (Levillain & Zibetti, 2012) and determines a type of intuitive relation to behavioral artifacts. ...
Article
Full-text available
A new race of artifacts comes equipped with behavioral properties. Those properties transmute the very nature of the object, granting it a life of its own and a special status that stems from the psychological attributions humans naturally produce when confronted by autonomous movements. This article examines what makes behavioral objects special in terms of the psychological properties they evoke in an observer. We look into the notion of behavior and evaluate to what extent the concept of anthropomorphism is a valid construct when considering the behavior of artificial objects. Based on recent research in cognitive psychology, we propose a framework to conceptualize the way people infer psychological attributes from movement, and the way it applies to behavioral objects.
Chapter
What is the nature of human thought? A long dominant view holds that the mind is a general problem-solving device that approaches all questions in much the same way. Chomsky's theory of language, which revolutionised linguistics, challenged this claim, contending that children are primed to acquire some skills, like language, in a manner largely independent of their ability to solve other sorts of apparently similar mental problems. In recent years researchers in anthropology, psychology, linguistic and neuroscience have examined whether other mental skills are similarly independent. Many have concluded that much of human thought is 'domain-specific'. Thus, the mind is better viewed as a collection of cognitive abilities specialised to handle specific tasks than a general problem solver. This volume introduces a general audience to a domain-specificity perspective, by compiling a collection of essays exploring how several of these cognitive abilities are organised.
Chapter
Imitation guides the behaviour of a range of species. Scientific advances in the study of imitation at multiple levels from neurons to behaviour have far-reaching implications for cognitive science, neuroscience, and evolutionary and developmental psychology. This volume, first published in 2002, provides a summary of the research on imitation in both Europe and America, including work on infants, adults, and nonhuman primates, with speculations about robotics. A special feature of the book is that it provides a concrete instance of the links between developmental psychology, neuroscience, and cognitive science. It showcases how an interdisciplinary approach to imitation can illuminate long-standing problems in the brain sciences, including consciousness, self, perception-action coding, theory of mind, and intersubjectivity. The book addresses what it means to be human and how we get that way.
Article
The authors investigated event dynamics as a determinant of the perceptual significance of forms of motion. Patch-light displays were recorded for 9 simple events selected to represent rigid-body dynamics, biodynamics, hydrodynamics, and aerodynamics. Observers described events in a free-response task or by circling properties in a list. Cluster analyses performed on descriptor frequencies reflected the dynamics. Observers discriminated hydro- versus aerodynamic events and animate versus inanimate events. The latter result was confirmed by using a forced-choice task. Dynamical models of the events led us to consider energy flows as a determinant of kinematic properties that allowed animacy to be distinguished. Orientation was manipulated in 3 viewing conditions. Descriptions varied with absolute display orientation rather than the relative orientation of display and observer.
Book
In 1932, Cambridge University Press published Remembering, by psychologist, Frederic Bartlett. The landmark book described fascinating studies of memory and presented the theory of schema which informs much of cognitive science and psychology today. In Bartlett's most famous experiment, he had subjects read a Native American story about ghosts and had them retell the tale later. Because their background was so different from the cultural context of the story, the subjects changed details in the story that they could not understand. Based on observations like these, Bartlett developed his claim that memory is a process of reconstruction, and that this construction is in important ways a social act. His concerns about the social psychology of memory and the cultural context of remembering were long neglected but are finding an interested and responsive audience today. Now reissued in paperback, Remembering has a new Introduction by Walter Kintsch of the University of Colorado, Boulder.