ArticlePDF Available

Le corpus Per-Fide et ses applications : une étude de cas sur les expressions idiomatiques

Authors:

Abstract and Figures

L’étude dont il est question ici vise précisément à souligner l’impact significatif que la linguistique de corpus peut avoir sur la recherche et l’enseignement dans les domaines touchant à l’étude du langage et à la traduction (Williams, 2005). Nous entendons ici proposer une réflexion sur l’utilité d’un corpus multilingue (tel que le corpus Per-Fide) dans le cadre du travail de traduction, sur la base d’un exemple concret, celui des expressions idiomatiques, dans une perspective contrastive français-portugais.
Content may be subject to copyright.
25
Le corpus Per-Fide et ses applications : une étude de cas sur les
expressions idiomatiques
1. Introduction
L’étude dont il est question ici vise précisément à souligner l’impact signi catif que
la linguistique de corpus peut avoir sur la recherche et l’enseignement dans les domai-
nes touchant à l’étude du langage et à la traduction (Williams, 2005). Nous entendons
ici proposer une ré exion sur l’utilité d’un corpus multilingue (tel que le corpus Per-
Fide) dans le cadre du travail de traduction, sur la base d’un exemple concret, celui
des expressions idiomatiques, dans une perspective contrastive français-portugais.
2. Le corpus multilingue Per-Fide : nouvel outil de traduction
contextuelle en ligne
Les corpus multilingues parallèles sont des outils précieux pour l’analyse contra-
stive, mais ils sont bien souvent limités au niveau des langues mises en regard et/ou
des types de textes considérés. Le projet Per-Fide (Araújo et al., 2010) dont nous vou-
lons rendre compte dans le cadre de cette étude trouve précisément son origine dans
la nécessité de construire, avec des textes appartenant à des domaines plus diversi és
(littéraire, technico-scienti que, journalistique, juridique et religieux), des corpus ali-
gnés à la phrase, qui mettent en parallèle des textes originaux en portugais dans ses
différentes variantes (portugais européen, portugais brésilien, portugais africain) et
leurs traductions dans six autres langues (espagnol, russe, français, italien, allemand
et anglais), ainsi que des textes originaux dans ces six langues étrangères et leurs tra-
ductions vers le portugais.
2.1. Mode de recherche monolingue
Le corpus Per-Fide peut être consulté librement à partir dun concordancier
(http://www.per- de.ilch.uminho.pt/query), qui permet de procéder à différents types
de recherche. Dans cette interface, l’utilisateur peut entrer des crires de recherche
non seulement pour la langue source mais aussi pour la langue cible ou bien pour les
deux à la fois a n de visualiser rapidement l’élément recherché dans différents corpus
simulta nément :
CILPR 2013 – SECTION 16
26
Figure 1 : Interface de recherche du corpus Per-Fide
Pour obtenir la concordance monolingue d’un mot donné, il suf t de taper le
mot en question. Cette concordance af che ligne par ligne chaque occurrence d’une
forme vedette au sein de son contexte d’origine :
Figure 2: Concordance monolingue de chat
ARÁUJO / CORREIA / MARTINEZ
27
Il semblerait que le mot chat soit, dans le corpus Europarl, un excellent catalyseur
d’expressions idiomatiques : appeler un chat un chat / acheter chat en poche.
2.2. Mode de recherche bilingue (simple ou double)
Une recherche bilingue devrait nous permettre de voir si l’homologue portugais
de chat est aussi producteur d’expressions  gées. La  gure qui suit montre les résultats
d’une requête qui permet de visualiser rapidement l’élément recherché dans différents
contextes, mais aussi ses traductions en portugais, qui peuvent différer suivant les cas :
Figure 3 : Concordance bilingue de chat
Si l’on compare les inventaires de structures qui correspondent en portugais à l’ex-
pression idiomatique appeler un chat un chat du fraais, on constate que la redon-
dance sémantique du français (un chat un chat) se perd en portugais et il semblerait
que l’on n’ait plus affaire, dans cette langue, à des chats mais à des bœufs (bois) ou
à des choses (coisas) : chamar os bois pelos nomes / designar as coisas pelos próprios
nomes. En demandant au bi-concordancier de repérer tous les couples de phrases
dans lesquels gato apparaît du côté portugais et chat du côté français, le traducteur
ou le linguiste peut déterminer, assez rapidement, les cas de correspondance directe
entre ces deux termes :
CILPR 2013 – SECTION 16
28
Figure 4 : Concordance bilingue double de chat-gato
Cette recherche bilingue double montre que l’expression portugaise comprar
gato por lebre est réellement l’équivalent de l’expression acheter chat en poche en
français.
2.3. Recherche d’expressions multi-mots
Le corpus Per-Fide devient un outil encore plus précieux pour ceux qui souhai-
tent non seulement traduire des mots simples, mais également des mots plus com-
plexes que l’on peut trouver dans différents contextes, ce qui est très souvent le
cas dans la pratique. Si lon tient à «contrer le trop-plein d’information, à con r-
mer une intuition personnelle ou encore véri er si les équivalents proposés par les
dictionnaires bilingues sont vraiment utilisés» (Langlois, 1996), on peut combiner
plusieurs mots dans la syntaxe d’interrogation (simple ou double), et demander que
le mot-vedette (ici, taureau) soit précédé ou suivi par un mot donné (par exemple
prendre/par les cornes) :
ARÁUJO / CORREIA / MARTINEZ
29
Figure 5 : Concordance autour d’une expression idiomatique
Ce corpus permet donc de traduire des combinaisons de mots, des tournures
idiomatiques et imagées dans leur contexte d’utilisation, en s’appuyant sur une base
de données de traductions existantes, régulièrement mise à jour. L’utilisateur peut
ainsi comparer les alternatives de traduction qui s’af chent et choisir celle(s) qui
convien(nen)t le mieux au contexte de sa traduction.Il est intéressant de voir que
l’expression prendre le taureau par les cornes (dont le sens propre – se lancer dans
l’arène et faire face aux coups de cornes de l’animal – est reconnaissable sous le sens
guré – faire face aux dif cultés – mais son usage en diffère) ne donne pas néces-
sairement lieu à une traduction littérale puisque l’on trouve, à côté de l’équivalent le
plus direct pegar/agarrar o touro pelos cornos, d’autres formes de traduction (tomar
as rédeas da situação / enfrentar corajosa e rapidamente as di culdades / encarar o
problema de frente / meter mãos à obra / dar o braço a torcer, …) qui restituent, cha-
cune à leur manière, le sens (à savoir s’attaquer aux dif cultés de front) de cette
expression.
2.4. Mode de recherche par les dictionnaires probabilistes de traduction
À travers l’interface de recherche du corpus Per-Fide l’utilisateur peut également
activer le dictionnaire probabiliste de traduction (PTD) d’un mot en cliquant (non pas
sur search mais) sur ptd (cf. supra,  g. 1). Voyez ci-dessous un exemple de recherche
simple (le mot chat) par PTD :
CILPR 2013 – SECTION 16
30
Figure 6 : Dictionnaire probabiliste de traduction de chat
L’a f chage en temps réel d’un PTD lorsque l’utilisateur passe la souris sur n’im-
porte quel mot d’une concordance est un véritable atout de ce corpus. Ce PTD est
capable d’identi er (grâce aux méthodes statistiques) les correspondances traduction-
nelles de lexpression recherchée. Dans le sous-corpus Europarl, gato est le meilleur
candidat à la traduction du mot chat mais il est intéressant de voir que, dans le réseau
des autres équivalents de ce mot, on trouve également, bien que dans une moindre
mesure, les mots coisas et nomes (qui gurent, on le rappelle, dans les expressions
idiomatiques chamar os bois pelos nomes / chamar as coisas pelos próprios nomes
signalées plus haut). Plutôt que d’avoir à parcourir de longues listes de concordances
pour examiner les équivalences traductionnelles d’une unité, l’utilisateur peut donc
très rapidement activer le PTD d’un terme pour en déterminer, en un seul clic, les
correspondants les plus directs. Cette approche du lexique est quantitative, mais ne
doit, en aucun cas, négliger le retour à la concordance, qui est la seule à pouvoir offrir
ARÁUJO / CORREIA / MARTINEZ
31
une représentation  dèle et claire du voisinage d’une forme vedette dans une langue
et des différentes manières de la rendre dans une autre langue. Pour assurer ce retour
à la concordance, il suf t de cliquer sur la  èche qui  gure à droite de chaque can-
didat à la traduction (cf. supra,  g. 6) et on a aussitôt accès à la concordance double
chat-gato, chat-coisas, chat-nomes, etc., ce qui nous permet donc de visualiser ces
termes en contexte et de voir qu’ils s’inscrivent, pour la plupart, dans des groupes de
mots reliés par de fortes relations sémantiques et syntaxiques. Pour simpli er notre
appréhension, le PTD opère donc le découpage initial du texte en unités, mais il est
clair que ces unités ne sont pas seulement des mots isolés mais, également des unités
complexes, plus larges, qu’il est nécessaire de retrouver et d’expliciter par le contexte.
Nous verrons, notamment avec la méthode des cooccurrences du programme CooCS,
comment le repérage de ces formes complexes peut se faire automatiquement.
Il faut préciser, par ailleurs, que ces PTDs fonctionnent selon un principe de circu-
larité dans la mesure où ils af chent non seulement les correspondances traduction-
nelles du terme recherché ,mais également les traductions de chacune de ces corre-
spondances, ce qui permet de revenir à la langue de départ de notre requête initiale :
Figure 7 : Circularité des dictionnaires probabilistes de traduction
CILPR 2013 – SECTION 16
32
En effet, en cliquant sur les  èches centrifuges qui se trouvent à gauche de chaque
alternative de traduction, l’utilisateur gère le PTD de chacune de ces alternatives,
ce qui lui permet, par exemple, de conclure, de manière très simple et rapide, que le
pourcentage de correspondance de chat-gato est nettement plus élevé du PT au FR
que l’inverse ( 38,55% contre 61,63%). On remarquera, en effet, que le PTD est
traversé par un gradient chromatique qui mesure le degré de probabilité d’un terme
d’être traduit par un autre. Le rouge pur s’impose lorsque le degré de correspondance
entre deux termes tend vers les 0%, le vert pur lorsque ce degré se rapproche, au con-
traire, des 100% et le jaune pur s’assume comme une couleur intermédiaire qui mar-
que un degré de correspondance de l’ordre des 50%. Il est à noter que plus ce degré
de correspondance baisse, plus l’on aura affaire à des stratégies de traduction indi-
recte. En effet, comme on l’a signalé plus haut, d’autres termes (coisas, bois) entrent
en concurrence avec le terme gato dans la traduction des expressions idiomatiques
fraaises comportant le nom de cet animal et donc la correspondance chat-gato se
situe nécessairement dans un pourcentage inférieur à 50 % (d’où la couleur orange
des 38,55%).
Il est intéressant de remarquer qu’un même terme peut donner lieu à des PTDs
différents en fonction du corpus dans lequel on effectue la reqte. En effet, si lon
calcule, par exemple, le PTD de chat dans un corpus plus technique lié à l’informati-
que, on tombe alors (non plus sur le terme chat mais) sur celui de conversa qui nous
fait entrer, de plein fouet, dans le monde des messages SMS, des chats, des courriers
électroniques très prisés par les jeunes.
Figure 8 : Technicité des corpus (chat = conversa ≠ gato)
C’est justement parce que nous avons conscience de l’impact direct du degré de
technicité des corpus sur les résultats obtenus que nous avons cherché à diversi er au
maximum la typologie de textes qui intègre le corpus Per-Fide.
ARÁUJO / CORREIA / MARTINEZ
33
3. Apports de la textométrie pour l’analyse de corpus
Outre la compilation de corpus, le projet Per-Fide vise également la création
de ressources (e.g. PTDs et mémoires de traduction) qui peuvent être gratuitement
téléchargeables sur http://per- de.ilch.uminho.pt/site.pl/resources.pt.
Les mémoires de traduction, en particulier, peuvent être combinées avec des
méthodes lexicométriques pour faciliter le repérage des attractions ou répulsions
entre des formes et leur analyse ultérieure en tant qu(’anti)cooccurrences par le biais
d’outils de mesure adaptés comme, par exemple, les logiciels Lexico3 et CooCS1 réa-
lisés dans le cadre du laboratoire SYLED de l’Université Paris 3 – Sorbonne Nou-
velle.
Pour cette analyse, nous continuons à travailler sur la mémoire de traduction
Europarl. Après une première étape de dépouillement léxicométrique avec Lexico3,
on obtient un inventaire numérique hors-contexte qui permet d’identi er dé un lexi -
que de base et des champs sémantiques caractéristiques du corpus. Parmi les formes
les plus employées dans Europarl, on constate, bien évidemment, la prédominance de
formes fonctionnelles à faible contenu sémantique (articles, prépositions, etc.) mais
également la prééminence statistique de substantifs renvoyant à des animaux ou des
parties du corps.
3.1. Étude des spéci cités lexicales
En déterminant par la statistique les attractions lexicales remarquables autour
d’une forme-pôle, la méthode des cooccurrences spéci quesproduit par CooCS
fournit des listes de formes associées deux à deux et hiérarchisées par un indice (de
spéci cité) signalant le degré de probabilité de la ‘cooccurrence lexicale’2. Le tableau
ci-après présente les résultats de cette statistique de concomitances lexicales avant ou
après la forme tête au cours de ses 2505 apparitions dans Europarl :
1 Lexico3 est disponible en téléchargement sur www.cavi.univ-paris3.fr/Ilpga/ilpga/tal/lexi-
coWWW. CooCS est téléchargeable sur le site www.cavi.univ-paris3.fr/ilpga/individus/mar-
tinez/accueil.htm.
2 Le signe positif ou négatif indique une attraction ou une répulsion entre mots. Le nombre
(de 2 à 50) indique le degré de surprise par rapport à ce qui est prévu par la statistique. Un
indice de 3 représente 1/100 de chances pour que la rencontre entre deux formes ait lieu, 4
représente 1/1000, etc. Ex. : le mot CHAT attire le mot APPELONS avec un indice de +40 ce
qui signale une attraction qui avait une chance sur 100000000000000000000000000000000
00000000 de se produire.
CILPR 2013 – SECTION 16
34
Figure 9 : Cooccurrents positifs du pôle tête
On calculera ainsi que, dans ses 2505phrases d’occurrence, le pôletête apparaît
plus souvent en co-fréquence avec le nom pelotonqu’avec le nom maux (co-fréq. 41
contre 25). La forme peloton se distingue par un indice de spéci cité maximal (+50)
qui rend compte de ses surprenantes coïncidences avec le pôle tête (41 sur 59, soit
deux tiers de ses occurrences contre 25 sur 291 pour maux). Comme on peut le con-
stater, en dressant un inventaire hiérarchisé des associations répétées autour d’un
pôle donné, la méthode cooccurrentielle dé nit ce que l’on peut appeler sa valence
lexicale, c’est-à-dire sa capacité à attirer d’autres formes de manière récurrente en
contexte (Martinez, 2003).
3.2. Au-delà de la cooccurrence binaire : les poly-cooccurrences
En examinant les systèmes d’attraction lexicale au-delà du lien de cooccurrence
binaire, on peut recenser des attractions multiples et simultanées qui s’opèrent autour
d’une forme pivot et d’identi er, par conséquent, des expressions semi- gées ou idio-
matiques dont le sens ne peut être déduit à partir des mots qui les constituent (Mar-
tinez, 2012). On trouve ci-dessous un extrait du graphe qui re ète une partie du com-
plexe réseau cooccurrentiel élaboré à partir du pôle tête :
ARÁUJO / CORREIA / MARTINEZ
35
Figure 10 : Réseau de cooccurrence du pôle tête
En explorant, avec ce niveau de précision, lenvironnement contextuel du pôle
tête, on découvre à ce dernier un certain nombre de cooccurrents précédemment
mis en avant par la méthode de cooccurrence initiale. Articulés autour des verbes
(casser, garder, placer,  gurer,), qui restent les cooccurrents les plus spéci ques de
tête, apparaissent des prédicats nominaux (sable, peloton, liste, etc.) et adjectivaux
(froide,haute, baissée, etc.). Les cartouches d’information qui jalonnent ce graphe
nous renseignent sur la réalité statistique de ces attractions multiples :
xx [yy] (zz) = co-fréquence [indice de spéci cité] (contextes de rencontre)
L’arbre donne donc pou r chaqueud le nombre exact de rencontres et le nombre
de contextes où ces coïncidences ont lieu. Considérons le chemin de cooccurrence tête
+ sable. Le diagnostic de la dernière cooccurrence avec la forme sable, 47[+50](47),
nous informe sur l’existence de 47 contextes de réalisation pour cette poly-cooccur-
rence. En poursuivant la lecture à droite du chemin, on voit que celui-ci se prolonge
en deux réalisations plus spéci ques intégrant les formes le et dans pour lesquels on
trouvera respectivement 47 et 44 réalisations en contexte. La concordance bilingue
qui suit restitue une partie des contextes de réalisation de cette poly-cooccurrence :
CILPR 2013 – SECTION 16
36
FR PT
(1a) Nous ne pouvons nous enfoncer latête
dans le sableet nier que c’est déjà le cas.
(1b) Não podemos enterrar a cabeça na areia
e negar a realidade do que está a acontecer.
(2a) Il ne sert à rien de s’enfouir latête dans
le sableet d’ af rmer sans cesse le contraire
selon la devise […]
(2b) Não vale a pena enterrar a cabeça na
areia e a rmar continuamente o contrário,
adoptando o lema […]
(3a) Certains mettent leurtête dans le
sable comme des autruches et pensent que
tout ira bien.
(3b) Alguns en am a cabeça na areia e pen-
sam que tudo acabará bem.
(4a) Vous pouvez continuer à vous cacher
latête dans le sablesi bon vous semble.
(4b) Podem continuar a enterrar a cabeça na
areia, se preferirem.
(5a) L’autruche, alors qu’elle est capable de
fourrer satête dans le sable dans certaines
situations, est aussi l’animal qui court le plus
vite sur le sol.
(5b) A avestruz , embora possa em determi-
nado momento en ar a cabeça na areia, é
também o corredor mais veloz em terra.
Tableau 1 : Concordance bilingue de la poly-cooccurrence verbe
+ la tête dans le sable (Europarl/Per-Fide)
Il est intéressant de voir, en effet, que l’association tête dans le sable apparaît bel
et bien dans le sous-corpus Europarl du corpus Per-Fide et on ne peut semcher
de constater les variations du verbe qui affectent cette poly-cooccurrence. En effet,
on trouve aussi bien le verbe s’enfoncer que les verbes se cacher, s’enfouir, s’enterrer,
fourrer, mettre, … la tête dans le sable. Certains auteurs parlent de classes d’équiva-
lences (Gross, 1988) ; de possibilité de paradigme (Gross, 1996) ; de variantes lexica-
les (García, 2011). C’est cette même variation verbale que l’on observe sur la séquence
tête + baissée (cf. supra,  gure 10) :
FR PT
(6a) Je demande donc à la Commission si elle
veut se jetertête baisséedans ce problème?
(6b) Pergunto aqui à Comissão: quer ela
meter-se às cegas neste problema?
(7a) Au lieu de soutenir Israël en ce sens,
d’importants États membres de l’UE se pré-
cipitent tête baisséesur l’État juif.
(7b) Em vez de apoiar Israel nesta questão,
proeminentes Estados-Membros da UE caem
irre ectidamente sobre o Estado judaico.
(8a) Il est regrettable que la Commission ait
préféré foncer têtebaissée, en s’en tenant à
une proposition idéologique qui ne tient pas
compte des opinions de la population.
(8b) É lamentável que a Comissão tenha
optado , em vez disso , por avançar de rom-
pante com a sua proposta ideológica que não
presta atenção às opiniões dos cidadãos .
(9a) La Russie plonge tête baissée dans le
piège et soutient indirectement et sans le
savoir les forces en Géorgie qui pourraient
vouloir utiliser le con it pour satisfaire leurs
propres  ns politiques.
(9b) A Rússia está a cair exactamente nesta
mesma armadilha e apoia mesmo, de modo
indirecto e involuntário, as forças que, na
Geórgia, poderão querer usar o con ito para
obtenção dos seus próprios  ns políticos.
ARÁUJO / CORREIA / MARTINEZ
37
FR PT
(10a) J’espère donc que le Conseil entendra
la voix de la sagesse et que les ministres ne
poursuivront pas tête baisséele scénario de
l’uni cation, qui serait sans issue.
(10b) Espero, portanto, que o Conselho oiça a
voz da sensatez e que os Ministros não pros-
sigam, cabisbaixos, o cenário da uni cação,
que não teria saída .
Tableau 2 : Concordance bilingue de verbe + tête baissée (Europarl/Per-Fide)
Dans le contexte plus immédiat à gauche de te baissée, on trouve également une
grande panoplie de verbes : se jeter, se précipiter, foncer, plonger, poursuivretête
baissée. Outre cette variation d’ordre purement lexical, on ne peut s’empêcher de
souligner la très grande diversité de moyens linguistiques mis en œuvre pour rendre,
en portugais, cette expression idiomatique : meter-se às cegas, avançar de rompante,
cair (irre ectidamente), cabisbaixos, … C’est, au contraire, une traduction littérale
que l’on trouve en portugais (enterrar a cabeça na areia) pour l’expression française
s’enfoncer la tête dans le sable mentionnée auparavant. Il semblerait que la traduction
portugaise de l’expression idiomatique jeter de l’huile sur le feu subisse, en revanche,
d’immenses variations dans notre corpus :
FR PT
(11a) Les institutions européennes auraient
dû y penser en 1991-1992, lorsquelles ont
reconnu, contrairement aux règles en vigueur
en matière de protection des minorités, la
Slovénie d’abord et la Croatie ensuite, et ainsi
jeté de l’huile sur le feu et déclenché la catas-
trophe des Balkans.
(11b) As instituições da UE deveriam ter
pensado neste aspecto em 1991 1992 quando,
contra as regras em vigor relativas à protec-
ção das minorias, se reconheceu primeiro a
Eslovénia e mais tarde a Croácia, tendo assim
postoachas na fogueiraque, mais tarde, se
transformou na catástrofe dos Balcãs.
(12a) Une opération militaire de grande
ampleur dans le nord de l’Iraq ne ferait
qu’ajouter del’huile sur le feudans la région
et pourrait également causer de sérieux pro-
blèmes en Turquie.
(12b) Uma intervenção militar em grande
escala no norte do Iraque seria apenas lançar
mais achas para a fogueira naquele país, além
de que poderia igualmente causar graves pro-
blemas à Turquia.
(13a) Par ailleurs, il faut également faire
comprendre au Président palestinien, M.
Arafat, que son attitude ne favorise pas non
plus le processus de paix. Il ne doit pas mettre
del’huile sur le feuen brandissant la menace
d’une déclaration d’indépendance unilatérale
de l’Etat palestinien.
(13b) De resto, deve ser dito que a atitude do
presidente da Palestina, Arafat, não ajuda em
nada o processo de paz, não devendo este dei-
tar mais achas na fogueira ao ameaçar com a
proclamação unilateral da independência da
Palestina.
(14a) En présentant les villes et villages
arabes comme un «cinquième front », les diri-
geants des partis de droite ont versé de l’huile
sur le feu.
(14b) Apresentando as cidades e as aldeias
árabes como uma “quinta frente”, os diri-
gentes dos partidos de direita atiraramlenha
para a fogueira.
Tableau 3 : Concordance bilingue de verbe + de l’huile sur le feu (Europarl/Per-Fide)
CILPR 2013 – SECTION 16
38
En effet, alors qu’en français, l’expression ne manifeste, une fois encore, qu’une
simple variation du verbe (jeter/mettre/verser de l’huile sur le feu), les alternatives
de traduction proposées, en portugais, pour cette expression française opèrent une
variation aussi bien au niveau du verbe qu’au niveau du nom et même de la prépo-
sition : pôr/atirar/lançar/deitar (verbes) achas/lenha (noms) na/para a (prépositions)
fogueira. Une recherche sur corpus présente donc l’intérêt d’offrir une représentation
dèle des différentes mutations morphosyntaxiques et sémantiques qu’une expres-
sion idiomatique peut subir en contexte. Évidemment, cette variation est rarement
répertoriée dans les dictionnaires. Par exemple, si l’on considère l’expression idioma-
tique dont il vient d’être question, on s’aperçoit qu’elle apparaît sous une forme bien
plus pétri ée dans les dictionnaires portugais Infopédia (http://www.infopedia.pt/)
et Priberam (http://www.priberam.pt/dlpo/) puisque elle y est, respectivement,  xée
comme suit : deitar achas/lenha na fogueira ; deitar lenha na fogueira. Mais un survol
de notre corpus montre que les traductions de cette expression peuvent diverger con-
sidérablement de cette version dictionnarisée. En effet, en contexte, une expression
de ce type peut ne mettre en avant que son sens propre (lançar petróleo/gasolina na
fogueira) (cf. (15a)-(16b)) ou donner, au contraire, à son sens  guré une grande liberté
d’expression (evitar in amar o debate, atear o fogo de um sentimento, alimentar o
próprio monstro, ….) (cf. (17a)-(19b)) :
FR PT
(15a) Saddam jette en effet constamment de
l’huile sur le feu - qui n’a rien de sacré - du
con it israélo-palestinien.
(15b) Com efeito, Saddam Hussein lança
constantemente petróleopara a fogueirapro-
fana do con ito israelo-palestiniano.
(16a) Plusieurs pays de la région peuvent y
prendre part directement car ils jettent sciem-
ment del’huile sur le feuterroriste palestinien
et libanais.
(16b) Esse facto pode preocupar diversos
países da região, porquanto lançam, a torto
e a direito, gasolina na fogueira terrorista da
Palestina e do Líbano.
(17a) Nous devons tous éviter de jeter de
l’huile sur le feu en soulevant des questions
qui pourraient être jugées menaçantes dans
nombre de capitales nationales.
(17b) Todos nós devemos evitar in amar o
debate levantando questões que possam ser
interpretadas como uma ameaça em muitas
capitais nacionais.
(18a) […], des déclarations qui contribuent à
jeter de l’huile sur le feu d’un sentiment anti-
sémite qui se répand et qui est déjà trop vio-
lent en Europe.
(18b) […] declarações essas que contribuem
para atear o fogode um sentimento anti-
-semita que grassa e é já muito violento na
Europa.
(19a) Si nous n’évitons pas les réponses extré-
mistes, nous pourrions bien jeter de l’huile sur
le feu que nous essayons d’éteindre.
(19b) Se não evitarmos reacções extremistas,
podemos acabar por vir a alimentar o próprio
monstroque pretendemos destruir.
Tableau 4 : Concordance bilingue de jeter de l’huile sur le feu (Europarl/Per-Fide)
ARÁUJO / CORREIA / MARTINEZ
39
Ces expressions caractérisées par le  gement constituent un phénomène extrême-
ment complexe du point de vue formel et sémantique (Lamiroy, 2008 ; Mejri, 2008)
qui présente un intérêt certain sur le plan contrastif, puisque, comme nous venons
d’en rendre compte, la plupart d’entre elles échappent à une traduction directe lors de
la recherche d’équivalents ( gés ou non) dans une autre langue.
4. Considérations nales
Il est donc important de motiver l’intégration des corpus et des outils d’analyse
de corpus dans lenseignement de la traduction (outre celui de la linguistique et des
langues) car le recours à ce type de ressources améliore la qualité des traductions
par rapport à la seule utilisation de dictionnaires, notamment au niveau du choix des
termes et de l’utilisation dexpressions idiomatiques (Frérot, 2010). Comme le note,
à juste titre, Kraif (2006), les outils d’alignement et de concordance bilingue sont
encore largement sous-exploités. Familiariser les utilisateurs − traducteurs, étudiants
ou linguistes avec les principaux concepts-clés du domaine et avec les techniques
utilisées pour exploiter des corpus (Araújo et al., 2011) se révèle donc essentiel. Nous
avons tenu à montrer que le corpus multilingue Per-Fide met gratuitement à disposi-
tion une interface qui permet différents modes de recherche (monolingue ou bilingue
simple et double) ; dictionnaire probabiliste de traduction (PTD) dans des langues et
des domaines de spécialité variés. Les corpus parallèles, qui y sont gratuitement con-
sultables en ligne, permettent d’étudier deux langues, en les confrontant et les éclai-
rant réciproquement. Les PTDs sont tout aussi précieux, par exemple pour la traduc-
tion statistique automatique, mais aussi pour assister le travail des lexicographes et
des terminologues en réalisant une partie du travail préliminaire de reconnaissance.
Les textes sont, en effet, des objets complexes qui se construisent sur des relations
d’attraction lexicale que les PTDs ne parviennent qu’à suggérer. Pour mettre à jour
ces phénomènes de cooccurrence binaire ou multiple (notamment les expressions
gées idiosyncrasiques et imprévisibles d’une langue donnée), il est possible, comme
on l’a vu, d’utiliser toutes ces ressources en complémentarité avec d’autres outils pour
mener des études plus textométriques.
Université du Minho Sílvia ARAÚJO
Université du Minho Ana CORREIA
Institut de Linguistique Théorique et Computationnelle William MARTINEZ
CILPR 2013 – SECTION 16
40
Références bibliographiques
Araújo, Sílvia / Almeida, José-João / Dias, Idalete / Simões, Alber to, 2010. «Apresentação do pro-
jecto Per-Fide: Paralelizando o Português com seis outras línguas», Linguamática 2, 71-74.
Araújo, Sílvia / Oliveira, Ana / Dias, Idalete, 2011. «Como pesquisar em corpora», Workshop pré-
senté aux I Journées Internationales Corpora & Traduction, 22 et 23 novembre 2011, Univer-
sité du Minho, Braga - Portugal http://per de.ilch.uminho.pt/site.pl/workshop.pt.
Frérot, Cécile, 2010. «Outils d’aide à la traduction : pour une intégration des corpus et des outils
danalyse de corpus dans l’enseignement de la traduction et la formation des traducteur,
Les Cahiers du GEPE, 2. Outils de traduction - outils du traducteur?
Gross, Maurice, 1988. «Les limites de la phrase  gée», Langages, 90, 7-22.
Gross, Gaston, 1996. Les expressions  gées en français : noms composés et autres locutions,
Paris, Ophrys.
García- Page, Mar io, 2011. « Collo cation s complexes (application à l’espag nol)», Lingvisticae Investi-
gationes, 34, 68-111.
Kraif, Olivier, 2006. «Qu’attendre de l’alignement de corpus multilingues?», Traduire. 4e Journée
de la traduction professionnelle 210, 17-37.
Lamiroy, Béatrice, 2008. «Les expressions  gées: à la recherche d’une dé nition», in : Blumen-
thal, Peter & Mejri, Salah (ed.), Les séquences es : entre langue et discours. Zeitschrift für
Französische Sprache und Literatur, Beihefte36, 85-98.
Langlois, Lucie, 1996. Bitexte, bi-concordance et collocation, Thèse pour l’obtention de la Maî-
trise en Traduction, Université d’Ottawa, Canada.
Martinez, William, 2003. Contribution à une méthodologie de l’analyse des cooccurrences lexi-
cales multiples dans les corpus textuels, Thèse de Doctorat en Sciences du Langage, Univer-
sité de la Sorbonne Nouvelle - Paris 3, France.
Martinez, William, 2012. «Au-delà de la cooccurrence binaire : poly-cooccurrences et trames de
cooccurrence», Corpus 11.
Mejri, Salah, 2008. «Figement et traduction: problématique générale», Meta : journal des traduc-
teurs 53, 244-252.
Williams, Geoffrey (dir.), 2005. La Linguistique de Corpus, Rennes, Presses Universitaires de
Rennes.
ResearchGate has not been able to resolve any citations for this publication.
Article
Les outils informatiques d’aide à la traduction font de plus en plus partie de l’environnement professionnel du traducteur. Une initiation à ces outils est donc devenue incontournable pour toute formation qui se donne comme objectif de former de futurs traducteurs.À côté des mémoires de traduction, dont l’enseignement tend aujourd’hui à se banaliser dans les formations de traducteurs, des outils issus de la linguistique de corpus méritent qu’on leur accorde une place, d’autant que les outils d’aide à la traduction visant à constituer, enrichir et exploiter facilement des corpus sont largement plébiscités par les traducteurs. Ainsi, à travers des activités pédagogiques ciblées, nous montrons comment nous pouvons sensibiliser les apprentis traducteurs à l’apport que représentent les corpus pour la traduction ; nous insistons sur la nécessité d’intégrer dans les cursus des outils de toute dernière génération qui offrent des possibilités puissantes de recherche en corpus.
«Les expressions fi gées: à la recherche d'une défi nition
  • Béatrice Lamiroy
Lamiroy, Béatrice, 2008. «Les expressions fi gées: à la recherche d'une défi nition», in : Blumenthal, Peter & Mejri, Salah (ed.), Les séquences fi gées : entre langue et discours. Zeitschrift für Französische Sprache und Literatur, Beihefte 36, 85-98.
Bitexte, bi-concordance et collocation, Thèse pour l'obtention de la Maîtrise en Traduction
  • Lucie Langlois
Langlois, Lucie, 1996. Bitexte, bi-concordance et collocation, Thèse pour l'obtention de la Maîtrise en Traduction, Université d'Ottawa, Canada.
Contribution à une méthodologie de l'analyse des cooccurrences lexicales multiples dans les corpus textuels
  • William Martinez
Martinez, William, 2003. Contribution à une méthodologie de l'analyse des cooccurrences lexicales multiples dans les corpus textuels, Thèse de Doctorat en Sciences du Langage, Université de la Sorbonne Nouvelle -Paris 3, France.
  • Salah Mejri
Mejri, Salah, 2008. «Figement et traduction: problématique générale», Meta : journal des traducteurs 53, 244-252.