Content uploaded by Marie-Claude L'Homme
Author content
All content in this area was uploaded by Marie-Claude L'Homme on Sep 11, 2014
Content may be subject to copyright.
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
Mettre en bons termes les dictionnaires spécialisés
et les dictionnaires de langue générale
Marie-Claude L’Homme et Alain Polguère
OLST — Département de linguistique et de traduction
Université de Montréal, C.P. 6128, succ. Centre-ville
Montréal (Québec) H3C 3J7 Canada
mc.lhomme, alain.polguere@umontreal.ca
Résumé. La description des termes (unités lexicales associées à des domaines de spécia-
lité) dans les dictionnaires de langue soulève au moins deux problèmes. Tout d’abord, il faut
établir un choix parmi tous les termes de diverses terminologies afin de sélectionner ceux qui
apparaîtront dans la nomenclature. Ensuite, les termes doivent être modélisés de façon à rendre
compte des liens potentiels qu’ils entretiennent avec les unités lexicales « générales » (ULG).
Dans cet article, nous examinons de quelle manière des descriptions terminographiques, réper-
toriées dans une base de données terminologique, peuvent être intégrées à une base lexicale
visant la langue générale. Nous utilisons pour cela deux bases de données lexicales construites
selon les principes de la Lexicologie Explicative et Combinatoire : le DiCo (ULG) et le Di-
CoInfo (termes de l’informatique et de l’Internet). Nous évaluerons le potentiel d’une méthode
fondée sur l’observation des liens entre termes et ULG en langue, d’une part, et en parole,
d’autre part, pour mieux définir les modalités de l’intégration des termes. Nous étudierons sept
types de rapports termes-ULG et verrons de quelle manière des termes relevant de l’un ou l’autre
de ces cas de figure peuvent être ajoutés à une base de données de nature générale.
Abstract. The description of terms (i.e. lexical units linked to specific subject fields)
in general language dictionaries raises at least two questions. First, a selection must be made
among existing terms of various terminologies in order to keep those that will appear in the
dictionary wordlist. Then, terms must be modeled in a way that accounts for their potential
relationship with “general” lexical units (GLUs). This article examines how terminographical
descriptions, previously stored in a terminological database, can be integrated into an existing
lexical database that focuses on general language. Our analysis is based on two databases de-
signed and enriched according to the principles and methods of Explanatory Combinatorial
Lexicology: the DiCo (GLUs) and the DiCoInfo (computing and the Internet). Our approach
consists in studying the relationships between terms and GLUs that can be observed in the
language system and in texts. We study seven types of relationships between terms and GLUs
and make suggestions as to how to take these specific cases into account in general language
dictionaries.
Mots-clés : lexicologie, terminologie, lexicographie, bases de données lexicales, langue
générale, langue de spécialité, Lexicologie Explicative et Combinatoire, DiCo, DiCoInfo.
Keywords: lexicology, terminology, lexical databases, language for general purposes,
language for special purposes, Explanatory Combinatorial Lexicology, DiCo, DiCoInfo.
Marie-Claude L’Homme, Alain Polguère
1 Introduction
Les rapports entre unités lexicales de langue générale, dorénavant ULG, et termes soulèvent une
série de questions pertinentes pour toute personne étudiant les lexiques et, donc, pour les termi-
nologues, les lexicologues et les lexicographes. On peut notamment s’interroger sur la présence
réelle ou supposée de caractéristiques distinctives entre ULG et termes, ou sur les modalités de
la cohabitation en langue de ces deux types d’unités lexicales. La langue générale et les ter-
minologies ne constituent pas des systèmes cloisonnés ; il est bien évident qu’il s’agit plutôt
de codes dont les manifestations cohabitent dans la parole, au sens saussurien. La distinction
entre ULG et termes permet d’opérer un partitionnement utile, mais somme toute relativement
artificiel, des systèmes de règles mis en jeu dans la production linguistique. La cohabitation,
voire l’interconnexion, de ces deux types d’unités lexicales est d’ailleurs à l’origine des diffi-
cultés qu’ont de tout temps éprouvées les lexicologues et les terminologues à faire clairement
la distinction, du moins sur le plan linguistique, entre les unités relevant de la langue générale
et celles relevant de la terminologie.
Au-delà de ces questions à caractère théorique, le rapport entre les deux types d’unités lexicales
est souvent abordé dans la pratique terminologique et lexicographique, notamment lorsqu’il est
question de construire une nomenclature de dictionnaire. Certaines pratiques terminologiques
peuvent faire abstraction des ULG en se focalisant sur un ensemble d’unités préalablement défi-
nies comme termes en fonction d’applications spécifiques. En lexicographie, en revanche, il est
difficile de faire l’impasse sur cette question, puisque les dictionnaires doivent inévitablement
tenir compte de sens spécialisés, ne serait-ce que lorsque ceux-ci correspondent à des acceptions
spécifiques de vocables polysémiques qui, par ailleurs, relèvent de la langue générale.
Dans cet article, nous nous penchons sur la question des rapports entre termes et ULG en nous
interrogeant d’abord sur les différentes manières dont ces deux types d’unités lexicales coha-
bitent en langue et en parole. En tenant pour acquis que les deux types d’unités peuvent être
mis en relation sur les axes de la langue et de la parole, nous verrons de quelles manières se
manifeste leur interaction. Nous tirerons de cet examen un certain nombre d’observations qui
aideront à la modélisation des liens qu’entretiennent termes et ULG, notamment dans des bases
de données lexicales du types de celles que nous développons à l’Observatoire de linguistique
Sens-Texte (OLST). Nous nous concentrerons ici sur le cas des bases du français DiCo (langue
générale) et DiCoInfo (domaine de l’informatique et de l’Internet).
L’article est structuré de la manière suivante. D’abord, dans la section 2, nous faisons quelques
commentaires à caractère théorique sur les notions de termes et d’ULG. Ensuite, dans la sec-
tion 3, nous examinons des cas concrets d’interaction entre termes et ULG. La section 4 est
consacrée aux modalités d’intégration des termes dans une base de données de nature générale ;
après une brève description de nos bases de données lexicale et terminologique (section 4.1),
nous expliquons de quelle manière nous envisageons cette intégration (section 4.2).
2 Remarques préliminaires sur les notions de terme et d’ULG
Les rapports qu’entretiennent termes et ULG préoccupent depuis longtemps terminologues et
lexicographes, et les points de vue sur la question peuvent être associés à trois étapes principales
de l’évolution de la terminologie.
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
Les premiers terminologues, désireux de justifier l’autonomie de la terminologie et de la définir
comme discipline à part entière (notamment, par rapport à la linguistique), ont caractérisé le
terme comme une étiquette servant à dénommer un concept, lui-même défini en fonction des
rapports qu’il entretient avec les autres concepts à l’intérieur d’un domaine de connaissances.
Ce postulat ainsi posé, il n’apparaissait pas opportun de s’interroger sur les éventuelles ressem-
blances et différences entre termes et ULG.
Le problème du rapport entre ces deux types d’unités lexicales n’a toutefois pas tardé à être
posé. (Guilbert, 1973) et (Rey, 1976), entre autres, ont recherché le caractère spécifique du terme
dans sa fonction essentiellement référentielle, son aptitude à dénoter des objets du monde réel.
Selon ces auteurs, la fonction du terme explique une partie de ses caractéristiques linguistiques :
prédominance de termes de nature nominale, de certains modes de désignation « transparents »
(termes complexes, recours aux formants grecs ou latin, emprunts), etc.
Plus récemment, on remarque une tendance à aborder la notion de terme sous l’angle de la
polysémie, point de vue que semble sanctionner la pratique lexicographique. Pour Koˇ
courek,
les termes ne représentent, potentiellement, que certaines acceptions de l’aire sémantique de
l’unité lexicale1, à savoir celles qui sont définies par les spécialistes dans les textes spécialisés
(Koˇ
courek, 1991, 180). Pour (Cabré, 2001), le terme, s’il est envisagé du point de vue de la
linguistique, est le résultat de l’activation d’une valeur spécialisée, lorsque certaines conditions
discursives sont réunies.
(Adelstein & Cabré, 2002), qui déplorent le fait qu’on cherche souvent à distinguer les termes
des unités lexicales, ont mis au point un modèle qui permet de rendre compte du fait que le terme
est porteur d’un sens qui émerge dans le contexte de la communication spécialisée. Selon les
auteures, le caractère spécifique du terme s’explique en fonction de l’une des quatre propriétés
suivantes : (i) les situations communicatives dans lesquelles il est utilisé ; (ii) la spécialisation
de certaines de ses composantes sémantiques ; (iii) les connaissances qu’il représente ; (iv) le
type de signification qu’il porte.
Notre but n’est pas d’alimenter le débat théorique sur la nature linguistique des termes, na-
ture particulière qui les distinguerait des ULG. Ce débat est utile, nécessaire même, mais nous
préférons nous concentrer sur l’interaction entre termes et ULG, en présupposant établie la dis-
tinction conceptuelle terme vs ULG. Notre position sera même assez radicale, puisque nous
partirons du postulat théorique suivant, qui sera pris pour acquis en l’absence d’indices forts
nous poussant à le remettre en question.
Postulat théorique 1. Il n’existe pas de différence de nature fondamentale entre
termes et ULG pour ce qui est de leurs propriétés structurales centrales, qui sont :
(i) leur sémantisme (= leur définition), (ii) leur forme (signifiants linguistiques as-
sociés) et (iii) leur combinatoire lexicale et grammaticale.
Ce postulat n’implique aucunement que la modélisation des termes et des ULG puisse s’acco-
moder exactement des mêmes outils. Il établit simplement que les deux types d’entités, en tant
qu’unités lexicales, peuvent et doivent être étudiés et décrits à la base d’une même approche
lexicologique et lexicographique.
Un second postulat, lié au premier, sera adopté :
1Pour Koˇ
courek, l’unité lexicale correspond à un mot polysémique, que nous appelons vocable ; il sera question
de cette notion plus loin (section 3.1).
Marie-Claude L’Homme, Alain Polguère
Postulat théorique 2. Les termes sont des unités lexicales particulières. Ils se dis-
tinguent des ULG — les unités lexicales non marquées — uniquement par le fait
que leur maîtrise linguistique est associée à la maîtrise d’un domaine de connais-
sance donné (scientifique, technique, etc.).
Le mot uniquement est très important, et c’est surtout lui qui justifie la nature de postulat de
l’énoncé ci-dessus. Il indique que toute distinction que l’on peut trouver dans les descriptions
de termes vs d’ULG sont des conséquences « pragmatiques » de l’association des termes à des
champs disciplinaires, et non des conséquences d’une hypothétique nature linguistique propre.
Il peut sembler un peu trop facile d’établir ce type de postulat, en nous libérant ainsi à bon mar-
ché d’une obligation de « démontrer» nos bases théoriques. Notons cependant deux choses à ce
propos. Premièrement, il est toujours préférable en sciences de partir de postulats lorsque des
notions semblent pouvoir être débattues à l’infini dans un sens ou dans l’autre (nature fonda-
mentalement distincte ou fondamentalement identique des termes et des ULG). Deuxièmement,
ce qui rend un postulat intéressant, c’est sa plausibilité, sont apparente adéquation avec les faits
observés. On verra que nos postulats s’accordent parfaitement avec l’interpénétration, que l’on
constate à tous les niveaux du fonctionnement du lexique, entre termes et ULG. En outre, ces
postulats rejoignent ceux d’autres auteurs qui, comme nous allons le faire ici, abordent le pro-
blème sous l’angle de la polysémie.
L’acceptation des deux postulats présentés ci-dessus a des conséquences non triviales sur la
méthodologie terminologique, notamment :
– Il est nécessaire d’établir une distinction entre les termes qui sont des unités lexicales véri-
tables — lexèmes ou locutions — et ceux qui sont des syntagmes non lexicalisés. Ces derniers
doivent recevoir une description qui reflète leur nature d’expressions construites. Il est à noter
que les dictionnaires de langue générale manipulent déjà des d’entités similaires, notamment
lorsqu’ils introduisent les collocations associées à une unité lexicale donnée. En revanche, la
tradition terminologique, héritée des premières prises de position évoquées au début de cette
section, a mené au recensement de nombreuses expressions complexes (appelées termes com-
plexes) qui sont entièrement compositionnelles.
– Si ce qui définit le terme, en tant qu’unité lexicale, c’est uniquement sont association à un
domaine de connaissance, il n’y a aucune raison de penser que le terme est nécessairement
nominal. On doit envisager la description de termes appartenant à chacune des quatre parties
du discours majeures : noms, verbes, adjectifs et adverbes.
Ces quelques mises au point sur les notions de terme et ULG étant faites, nous passons mainte-
nant au problème de la cohabitation dans la langue et dans les textes de ces deux types d’unités
lexicales.
3 Cohabitation des termes et des ULG dans la langue et dans
les textes
3.1 La polysémie comme approche de la cohabitation en langue
Compte tenu de nos postulats, un bon angle d’approche pour étudier le rapport en langue entre
termes et ULG est d’examiner le fonctionnement des termes dans le contexte de la polysémie
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
(Adelstein & Cabré, 2002; Cabré, 2001; Koˇ
courek, 1991). Suivant la terminologie de la Lexico-
logie Explicative et Combinatoire, nous appelons vocable2l’entité lexicale de niveau supérieur
qui regroupe une ou plusieurs unités lexicales connectées par le lien de polysémie. On peut en-
visager deux types de rapports qu’un terme peut entretenir avec ses copolysèmes au sein d’un
même vocable :
1. le terme est une acception « spécialisée » au sein d’un vocable essentiellement structuré
autour d’une ou plusieurs acceptions de langue générale, c’est-à-dire d’un vocable de
langue générale (VLG) ;
2. le terme est une acception particulière au sein d’un vocable essentiellement terminolo-
gique.
Le premier cas est clairement celui où la cohabitation entre termes et ULG pourra poser le plus
de problèmes de modélisation, mais en même temps celui qui pourra nous donner les éclairages
les plus intéressants sur la relation entre les deux types d’unités lexicales.
Pour ce qui est de la dérivation polysémique elle-même — l’acception source dont semble
dérivée le terme —, on distinguera les trois cas suivants :
1. le terme semble dérivé d’une acception de langue générale (ALG) ;
2. le terme semble dérivé d’une acception de langue spécialisée (ALS) ;
3. on ne perçoit aucune dérivation de ce type.
Même si nous nous situons ici dans une perspective synchronique, il est clair que la perception
de dérivation est normalement liée à une réalité diachronique. Ainsi, nous percevons clairement
que SOURIS 2[Sélectionnez le bon fichier à l’aide de votre souris.]est un copolysème dérivé de SOURIS 1
[La cave est infestée de souris.], notamment parce que la première unité est un terme d’apparition ré-
cente. Bon nombre de locuteurs actuels du français peuvent se souvenir du temps où les souris2
n’avaient pas encore été inventées et où, bien évidemment, le terme correspondant n’existait
pas. Cependant, pour des termes présents depuis longtemps dans la langue, la perception peut
être beaucoup plus fluctuante et, surtout, il convient de décider si l’on se fonde sur l’étymologie
véritable, telle qu’on peut la retracer dans un dictionnaire historique, ou sur la perception intui-
tive du « locuteur lambda ». C’est la seconde approche que nous adoptons ici, car ce qui nous
intéresse, c’est la cohabitation des termes et ULG telle que perçue par le locuteur ordinaire et,
donc, telle qu’elle peut se manifester dans les corpus courants.
3.2 Cohabitation dans les textes
De façon orthogonale au problème de la polysémie, on pourra s’intéresser non plus au contexte
dans lequel le terme apparaît dans le lexique (son vocable d’attache), mais plutôt à son contexte
d’emploi en parole, dans le sens saussurien. On peut distinguer ici deux cas de figure, dont le
premier sera particulièrement intéressant pour nous :
1. le terme apparaît couramment dans des textes non spécialisés et on s’attend à ce qu’il
soit maîtrisé, même partiellement, par les non-spécialistes ; on doit donc considérer qu’il
appartient à des emplois de langue générale (ELG) ;
2Dans cet article, nous utilisons la terminologie de la Lexicologie Explicative et Combinatoire, telle que pré-
sentée dans (Mel’ˇ
cuk et al., 1995).
Marie-Claude L’Homme, Alain Polguère
2. le terme semble être confiné, en parole, à des emplois dans des corpus de textes spéciali-
sés.
Finalement, l’examen véritablement linguistique des corpus de textes spécialisés amène à consi-
dérer sous un angle terminologique des unités lexicales fréquemment ignorées en terminologie :
il s’agit d’unités qui semblent relever d’emplois en contextes techniques ou scientifiques d’ULG
plutôt que de termes véritables. Nous distinguerons donc :
1. les termes « de plein droit » ;
2. les termes qui semblent relever d’usages en contextes spécialisés d’ULG.
3.3 Typologie partielle des termes en fonction de leur rapport aux ULG
au sein d’un même vocable
Les différents paramètres de rapport termes-ULG en langue et en parole que nous venons de
présenter nous permettent de prévoir de multiples types de termes. Nous allons présenter ci-
dessous sept cas de figure qui nous semblent particulièrement intéressants, définis en fonction
des cinq paramètres suivants :
∈VLG le terme appartient à un vocable principalement de langue générale ;
←ALG le terme est dérivé, au sein du vocable, d’une acception de langue générale;
←ALS le terme est dérivé, au sein du vocable, d’une acception de langue de spécialité;
ELG le terme a un emploi non marqué dans les corpus de langue générale ;
ULG le « terme » doit en fait être considéré comme une ULG.
Cas 1 : termes « purs »
Exemple (informatique) ∈VLG ←ALG ←ALS ELG ULG
UNITÉ ARTHMÉTIQUE ET LOGIQUE
[L’unité arithmétique et logique est la zone du proces-
seur central où les opérations arithmétiques et logiques
sont réalisées.]
non non non non non
Commentaires Le terme UNITÉ ARITHMÉTIQUE ET LOGIQUE n’existe que dans le domaine
de l’informatique et s’emploie presque exclusivement dans des textes à caractère technique qui
relèvent de ce domaine.
Cas 2 : termes « purs » dérivés d’un autre terme
Exemple (optique) ∈VLG ←ALG ←ALS ELG ULG
ANAMORPHOSE 2
[Une anamorphose est une image déformée qui retrouve
ses proportions d’origine quand on la regarde sous un
certain angle ou réfléchie dans un miroir adapté.]
non non oui non non
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
Commentaires Comme UNITÉ ARI THMÉTIQUE ET LOGIQUE,ANAMORPHOSE 2est confiné
à un seul domaine : celui de l’optique. Toutefois, il s’agit ici d’un dérivé résultatif de ANA-
MORPHOSE 1[Le terme « anamorphose » désigne d’une façon générale, la transformation qui à un objet fait
correspondre l’objet dont il est l’image virtuelle dans un système optique, pour un observateur donné situé à
distance finie ou infinie.].
Cas 3 : termes dérivés d’une ULG
Exemple (neuro-anatomie) ∈VLG ←ALG ←ALS ELG ULG
TENTE 2
‘repli qui sépare le cerveau du cervelet’
[Le cerveau est situé au-dessus du cervelet, séparé de
celui-ci par la tente (une partie des trois méninges, la
dure-mère, interposée entre le cerveau et le cervelet).]
oui oui non non non
Commentaires L’exemple présente un dérivé métaphorique de TENTE 1[À peine avait-il monté
la tente qu’il se mit à pleuvoir.]. Contrairement à sa source dérivationnelle, cette acception relève de
la langue et des corpus techniques.
Cas 4 : termes « transfuges » en langue générale
Exemple (environnement) ∈VLG ←ALG ←ALS ELG ULG
COUCHE D’OZONE
[Le trou dans la couche d’ozone est apparu cette année
beaucoup plus tôt que les années antérieures.]
non non non oui non
Commentaires Bien que COUCHE D’OZONE ait été créé dans le domaine de l’environnement,
son emploi est largement répandu dans les corpus de langue générale.
Cas 5 : termes dérivés d’un autre et transfuges en langue générale
Exemple (informatique) ∈VLG ←ALG ←ALS ELG ULG
DÉCRYPTER 2
[Pour décrypter un fichier, il faut posséder la clé privée
de celui-ci.]
non non oui oui non
Commentaires Le terme DÉCRYPTER 2, tout comme COUCHE D’OZONE, a été créé dans un
domaine de spécialité et est largement utilisé en langue générale. Toutefois, contrairement à
COUCHE D’OZONE, il est dérivé, par spécification, d’une autre acception spécialisée : DÉCRYP-
TER 1[La répartition des fréquences obtenues peut être utilisée pour décrypter un message codé par un chiffre de
substitution.]. Les cas illustrés par COUCHE D’OZONE et DÉCRYPTER 2relèvent du phénomène
de déterminologisation (Meyer & Mackintosh, 2000), selon lequel des termes migrent vers la
langue générale, parfois en subissant des modulations de sens.
Marie-Claude L’Homme, Alain Polguère
Cas 6 : termes transfuges et dérivés d’une ULG
Exemple (informatique) ∈VLG ←ALG ←ALS ELG ULG
SOURIS 2
[Apple continue de produire des ordinateurs avec des
souris ne comptant qu’un seul bouton, car leurs études
montreraient que les souris à un bouton sont plus effi-
caces à l’usage.]
oui oui non oui non
Commentaires L’exemple présente un dérivé métaphorique de SOURIS 1[J’ai eu une souris
blanche qui adorait qu’on lui gratouille le coté de la mâchoire.].
Cas 7 : termes facettes d’une ULG
Exemple (informatique) ∈VLG ←ALG ←ALS ELG ULG
ROBUST E info
[Enfin, plusieurs sociétés proposent des langages de
scripts qui permettent de développer des applications ro-
bustes avec un haut niveau de productivité.]
oui oui non oui oui
Commentaires L’exemple ne présente pas une unité lexicale différente de l’acception mé-
taphorique, non terminologique, de ROBUSTE [Notre objectif est dès lors de proposer un modèle qui
demeure compatible avec une théorie robuste de la connaissance.]. Il s’agit de ce que l’on peut appeler
une « facette » terminologique, propre au domaine de le l’informatique, de cette même accep-
tion 3. Ce dernier cas de figure est particulièrement intéressant puisqu’il correspond à une fusion
pratiquement complète du « terme » dans une ULG.
Nous n’avons pas épuisé ici toutes les possibilités. Il existe d’autres cas intéressants, notamment
si l’on s’intéresse à la zone grise de la partition entre termes et ULG. On pourrait ainsi considérer
le cas ci-dessous :
Exemple ∈VLG ←ALG ←ALS ELG ULG
VERT 3
‘qui ne porte pas atteinte à la nature’
[Ces entreprises sont parmi les meilleures entreprises
américaines de haute technologie et de technologie
verte.]
oui non oui oui oui
L’unité lexicale VERT 3correspond à un dérivé de langue générale de l’acception métaphorique
spécialisée (domaine de la politique) VERT 2dont le sens est ‘qui défend les politiques écologi-
ques’ [Bravo à toi, te voilà le premier député vert de Bretagne.]. Nous n’introduisons pas ce cas de figure
dans la typologie ci-dessus parce qu’il nous est apparu très diffcile de trouver un autre exemple
que celui de VERT 3.
3Nous employons ici le terme facette dans un sens très proche de celui de (Cruse, 2003).
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
3.4 Remarques sur la typologie présentée
La typologie proposée à la section 3.3 présente quelques phénomènes saillants, mais, comme
nous l’avons déjà souligné, elle n’épuise pas tous les cas figure. Même s’il existe certaines
exclusions logiques, tous les paramètres de caractérisation que nous avons considérés se com-
binent, et peuvent donc donner un nombre important de cas de figure mathématiquement en-
visageables (exactement, 52= 25). Nous nous sommes ici contentés des sept cas de figures
courants que nous avons pu observés dans le contexte des travaux de lexicographie de langue
générale et de terminologie menés à l’OLST. À cette première limitation s’ajoute le fait que
nous n’avons pas considéré la dimension diachronique dans nos analyses.
Nous allons maintenant nous pencher sur la façon dont on peut tenir compte des différentes
modalités de l’interaction entre termes et ULG dans les modélisations des lexiques des langues
naturelles. Même si nous nous inspirons de stratégies mises au point en lexicographie classique,
notre propos sera avant tout centré sur les modélisations formelles de type bases de données, au
détriment des dictionnaires grands publics, puisque c’est dans ce cadre précis que nous avons
mené une réflexion sur la question.
4 Cohabitation dans les descriptions lexicales
De nombreux auteurs s’accordent pour dire que la place des termes dans les dictionnaires géné-
raux est, non seulement incontestable, mais justifiée (Béjoint, 1988; Boulanger, 1996; Josselin-
Leray, 2005; Roberts & Josselin-Leray, 2005) en raison, notamment, des attentes des utilisateurs
(Josselin-Leray, 2005). Dans ce type d’ouvrages, les termes sont parfois distingués formelle-
ment des unités lexicales de sens « général » au moyen d’un système de marques d’usage —
plus spécifiquement, les marques technolectales ou, pour reprendre la terminologie proposée par
(Hausmann, 1989), des marques relevant de l’axe diatechnique). Parfois, cependant, les termes
ne se démarquent pas en tant que tels dans les articles de dictionnaires généraux : il s’agit des
cas où les termes en question sont d’un emploi répandu, non marqué, en langue générale.
La prise en compte d’unités à la fois terminologiques et non terminologiques dans un même
dictionnaire n’est sans doute pas un problème trivial. Ce problème se pose avec la même acuité
dans le cadre de l’élaboration d’une base de données lexicale générale. Cependant, on atteint
un niveau de difficulté supplémentaire lorsque l’on doit connecter deux bases distinctes dé-
veloppées en parallèle, dont l’une est de nature générale — le DiCo — et l’autre de nature
terminologique — le DiCoInfo (domaine de l’informatique et de l’Internet). Dans ce qui suit,
nous ferons tout d’abord une description très succincte de ces deux bases (4.1). Nous verrons
par la suite de quelle manière nous envisageons de traiter les liens entre termes et ULG et exa-
minerons si certains mécanismes utilisés dans les dictionnaires classiques peuvent être repris
dans le contexte de la construction de bases de données lexicales (4.2).
4.1 Les bases de données DiCo et DiCoInfo
Les deux bases de données lexicales à l’origine de cette réflexion, le DiCo et le DiCoInfo,
reposent sur les principes théoriques et méthodologiques de la Lexicologie Explicative et Com-
binatoire (Mel’ˇ
cuk et al., 1995; Mel’ˇ
cuk et al., 1999), composante lexicale de la Théorie Sens-
Texte. En particulier, elles adhèrent toutes deux aux principes énoncés ci-dessous :
Marie-Claude L’Homme, Alain Polguère
– L’unité de base de la description lexicographique est l’unité lexicale — appelée aussi lexie —,
à savoir une forme lexicale prise dans une acception spécifique. Les lexies peuvent être mo-
nolexémiques (DiCo : ABEILLE,BAGAGE I.1,BAGAGE II [de connaissances]; DiCoInfo : ORDI-
NATEUR,FORMATER 1[un disque],FORMATER 2[un fichier]) ou multilexémiques (DiCo : BOÎTE
AUX LETTRES,CORPS À CORPS ; DiCoInfo : À LA VOLÉE 1,TRAITEMENT DE TEXTE 1).
– Les acceptions sont distinguées au moyen d’une série de critères servant à baliser les in-
tuitions des lexicographes quant à la polysémie des vocables. Parmi ceux-ci, nous pouvons
citer la cooccurrence compatible et différentielle, la dérivation morphologique différentielle
et l’observation d’autres liens paradigmatiques différentiels (synonymie, antonymie, liens ac-
tanciels, etc.).
– Toutes les composantes de la description lexicographique s’appuient sur une définition de
la structure actancielle des lexies. Les actants apparaissent dans la forme propositionnelle et
dans la représentation du régime syntaxique des lexies. En outre, les actants sont nécessaires
à la formalisation des liens lexicaux (voir ci-dessous).
– On décrit de la manière la plus complète possible les liens paradigmatiques (dérivations
sémantiques) et syntagmatiques (collocations) unissant la lexie décrite à d’autres lexies.
Ces liens sont décrits au moyen du système des fonctions lexicales.
Il importe à ce stade de souligner que, bien que les deux bases de données DiCo et DiCoInfo
reposent sur le même cadre théorique, elles ont été mises au point et sont enrichies de ma-
nière complètement séparée. Cet état de fait explique les différences existant entre les deux res-
sources, notamment sur le plan de l’encodage des données.
Le DiCo est développé depuis 1992 à partir d’un modèle descriptif élaboré pour le Dictionnaire
explicatif et combinatoire, ou DEC — voir (Mel’ˇ
cuk et al., 1999) pour le dernier volume paru.
Le DiCo décrit l’ensemble des sens rattachés à un vocable. Ces sens sont hiérarchisés selon
des critères de « complexité sémantique » et représentés au moyen d’un système de numé-
rotation rigoureux. Les rubriques apparaissant dans une fiche du DiCo sont grosso modo les
suivantes : identification du mot-vedette, caractéristiques grammaticales, étiquette sémantique,
forme propositionnelle (structure actancielle), régime, liens lexicaux (rubrique dans laquelle ap-
paraissent les liens paradigmatiques et syntagmatiques représentés au moyen de fonctions lexi-
cales), exemples d’emplois et énumération des locutions construites à partir du mot-vedette.
L’encodage des données dans le DiCo se fait dans une base de données FileMaker Pro. Les
articles de statut 0 et 1 (c’est-à-dire dont la rédaction est entièrement ou partiellement validées)
sont ensuite compilés sous forme de tables SQL interrogeables en ligne à l’adresse suivante :
http://olst.ling.umontreal.ca/dicouebe.
Le lecteur trouvera plus d’informations sur le DiCo et sur l’interface d’accès à sa version SQL
dans la documentation téléchargeable à cette même adresse. Il existe de plus de nombreuses
publications traitant d’aspects spécifiques du travail mené sur le DiCo, comme par exemple
(Polguère, 2000; Polguère, 2003; Mel’ˇ
cuk & Polguère, 2006).
Le DiCoInfo, dictionnaire fondamental de l’informatique et de l’Internet, a pris naissance dans
la foulée de travaux portant sur les verbes spécialisés (L’Homme, 1998). Le travail de rédaction
des articles à proprement parler a débuté en 2003. Le DiCoInfo se distingue de la plupart des
dictionnaires spécialisés en ce sens qu’il se focalise (en accord avec la Lexicologie Explicative
et Combinatoire) sur les propriétés lexico-sémantiques des termes plutôt que sur le lien que ces
termes ont avec l’organisation des connaissances dans un domaine.
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
Le DiCoInfo retient les sens spécialisés, c’est-à-dire ceux qui sont liés aux domaines de l’in-
formatique et de l’Internet ; il fait abstraction des copolysèmes éventuels ne relevant pas ces
domaines. Bien que les acceptions multiples d’une forme polysémique soient distinguées, les
liens de polysémie ne sont pas mis en évidence, contrairement à ce qui se pratique dans le DiCo.
Sur le plan méthodologique, la rédaction du DiCoInfo repose principalement sur des observa-
tions faites dans des corpus textuels. De manière générale, les terminologues ne possèdent pas
a priori les connaissances spécialisées nécessaires à la compréhension de sens scientifiques ou
techniques et s’appuient d’abord sur les explications données dans les textes pour les acquérir.
Les rubriques apparaissant dans le DiCoInfo sont les suivantes : identification du terme, infor-
mations grammaticales, structure actancielle (dont la forme diffère de celle du DiCo), réalisa-
tions linguistiques des actants, régime, définition, liens lexicaux (rubrique dans laquelle appa-
raissent les liens paradigmatiques et syntagmatiques représentés au moyen de fonctions lexi-
cales) et contextes.
L’encodage des données dans le DiCoInfo se fait au moyen d’un éditeur XML4. Les articles de
statut 0 (c’est-à-dire les articles dont la rédaction est terminée), de statut 1 (dont la rédaction est
très avancée) et de statut 2 (dont les caractérisations sémantiques sont satisfaisantes, mais où la
liste de liens lexicaux n’est pas complète) sont exportées dans un format HTML (pour affichage
dans le web) et vers un format d’impression en PDF. La version HML courante du DiCoInfo
est disponible sur le web à l’adresse suivante : http://olst.ling.umontreal.ca/dicoinfo/.
Pour des détails sur le DiCoInfo et la méthodologie présidant à son élaboration, le lecteur peut
se référer à (L’Homme & Bae, 2006).
4.2 Le rapport termes-ULG dans le DiCo et le DiCoInfo
Cette section examine comment les termes peuvent être intégrés à une base de données lexicale
qui, non seulement tient compte des modalités d’interaction entre termes et ULG identifiées aux
sections 3.3 et 3.4, mais les met en évidence.
Soulignons auparavant que nous tenons pour acquis que tous les termes font partie du lexique
d’une langue et devraient être décrits dans tout dictionnaire ou base de données lexicale qui pré-
tend décrire l’ensemble du lexique. Les choix quant à leur inclusion ou non dépendent, non pas
de leur appartenance à un lexique dit général, mais plutôt à des considérations liées aux publics
cibles. Par exemple, un lexicographe pourra décider de ne pas répertorier UNITÉ ARITHMÉ-
TIQUE ET LOGIQUE,ANAMORPHOSE 1/2ou TENTE 2en tenant pour acquis que les utilisateurs
ne chercheront pas à se documenter sur ce type d’unités lexicales dans un dictionnaire destiné
au grand public.
Cela étant dit, voyons comment les termes peuvent être intégrés à la base de données lexicale
DiCo. L’intégration est envisagée ici en tenant pour acquis que les ULG sont présentes dans la
base générale et que les termes sont décrits dans des bases de données terminologiques.
Six scénarios sont possibles.
1. Vocable terminologique Cas illustré par UNITÉ ARITHMÉTIQUE ET LOGIQUE et COUCHE
D’OZONE. Les vocables terminologiques, puisqu’aucun lien préalable avec une ULG n’est
4La version XML (ainsi que ses versions dérivées PDF et HTML) ont été conçues en collaboration avec Guy
Lapalme, Benoît Alain et Vincent St-Amour.
Marie-Claude L’Homme, Alain Polguère
identifié, sont simplement ajoutés à la nomenclature donnant lieu à des fiches additionnelles
dans une base de données lexicale. Ainsi, outre UNITÉ ARITHMÉTIQUE ET LOGIQUE, de nom-
breux vocables décrits dans le DiCoInfo — notamment, BAVARDOIR,BLOGUE,HEXADÉCI-
MAL,JOYSTICK,OCTET,ORDINATEUR,SYSTÈME D’EXPLOITATION,USB,WEBMESTRE —
seraient simplement ajoutés à la nomenclature du DiCo. Nous n’aurions pas à tenir compte
d’éventuels liens de polysémie avec des lexies déjà répertoriées dans la base lexicale. Toutefois,
la description de ces termes devrait comporter une marque d’usage si leur emploi est confiné
aux textes spécialisés (cf. point 4).
2. Dérivé d’une acception spécialisée Cas illustré par ANAMORPHOSE 1/2. Ce cas de figure
donnera lieu à l’ajout d’un vocable polysémique à la nomenclature de la base de données lexi-
cale. Ici, se posera le problème des liens à établir entre les acceptions spécialisées. De plus,
si les deux acceptions spécialisées sont elles-mêmes liées à une acception générale, se posera
le problème de la prise en compte de ce lien (cf. point 3). En ce qui concerne les termes ré-
pertoriés dans le DiCoInfo, l’établissement de liens de polysémie entre deux sens spécialisés
se posera, par exemple, pour les termes ADRESSE 1(‘identifiant d’un emplacement du disque
ou de la mémoire’), ADRESSE 2(‘identifiant d’un site’) et ADRESSE 3(‘identifiant d’un uti-
lisateur du courrier électronique’) ou, encore, NUMÉRIQUE 1(‘qui concerne les nombres’) et
NUMÉRIQUE 2(‘qui concerne un mode de représentation sous forme binaire’). Dans tous les
exemples cités ci-dessus, les liens sont observés à l’intérieur du domaine de l’informatique. Un
autre exemple intéressant est celui de SCRIPT où, cette fois, le lien sémantique serait à établir
avec une acception du domaine du cinéma.
3. Acception spécialisée au sein d’un vocable général Cas illustré par SOURIS 2,TENTE 2
et VERT 2. L’acception spécialisée sera ajoutée sous forme de fiche additionnelle à la liste d’ac-
ceptions déjà décrites pour l’ULG. (Dans un dictionnaire de facture plus classique, l’acception
spécialisée sera ajoutée à un article existant.) Ici, comme dans le cas précédent, se posera le
problème des liens à établir entre les acceptions. Toutefois, il faudra rendre compte des liens
existant entre les acceptions présentes — par défaut, de nature générale — et la nouvelle ac-
ception spécialisée. Par exemple, pour SOURIS 2, il faudra rendre compte du lien métaphorique
ayant donné naissance à l’acception spécialisée. Outre SOURIS 2, de nombreux termes prove-
nant du DiCoInfo subiront ce traitement, par exemple : HÉBERGER,INTERPRÉTER,MÉMOIRE,
NAVIG UER,PORTAIL,RÉPERTOIRE,ROBOT,SYNTAXE,VIRUS.
Les cas 1, 2 et 3 peuvent être subdivisés en deux catégories en fonction du domaine d’emploi
des unités lexicales impliquées : emploi exclusivement lié à un domaine spécialisé ou emploi
dans un domaine spécialisé et en langue générale.
4. Emploi confiné aux discours spécialisés Cas illustré par ANAMORPHOSE 1/2et TENTE 2.
Lorsque l’emploi d’un terme reste confiné à des discours spécialisés, la description de la com-
binatoire de cette acception devra comporter une marque d’usage (Inform.,Phys.,Ling., etc.).
Par exemple, les termes BOUCLE,HEXADÉCIMAL,INCRÉMENTER,OCTET,UNITÉ ARITHMÉ-
TIQUE ET LOGIQUE,USB présents dans le DiCoInfo se verraient associer une marque d’usage
dans le DiCo.
5. Emploi dans les discours spécialisés et en langue générale Cas illustré par SOURIS 2
et COUCHE D’OZONE. Lorsque l’emploi d’un terme est observé aussi bien dans des discours
spécialisés que dans des textes ne relevant pas de thématiques spécialisées, la marque d’usage
est superflue. Ainsi, il ne semble pas opportun d’indiquer l’appartenance des termes COURRIEL
et ORDINATEUR au domaine de l’informatique au moment de les intégrer au DiCo.
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
Le dernier scénario envisageable, que nous allons maintenant présenter, concerne les cas plus
difficiles où une ULG a un statut particulier dans un domaine spécialisé, mais où le terme ainsi
identifié ne donne pas lieu à une acception spécifique. Nous dirons que le statut terminologique
réside dans l’attribution d’une facette terminologique à une ULG.
6. Fonctionnement comme facette terminologique d’une ULG Cas illustré par ROBUSTE.
Contrairement aux autres scénarios décrits jusqu’ici, celui-ci ne donne pas lieu à l’ajout d’un
vocable à la nomenclature de la base de données ou d’une acception à un ensemble d’accep-
tions existantes. On peut tenir pour acquis que la description donnée pour l’acception générale
est également valable pour les emplois spécialisés. Toutefois, la prise en compte des emplois
spécialisés pourrait donner lieu à une révision de la description existante (modification de la
caractérisation sémantique, révision et nouvelle organisation des liens lexicaux). Ce problème
se pose pour de nombreux termes répertoriés dans le DiCoInfo, notamment ANNULER,CA-
RACTÈRE,MOT DE PASSE,PUISSANT,VALIDER,ZOOMER. Certains de ces termes présentent
une difficulté additionnelle : bien qu’il ne s’agisse pas d’acceptions différentes des ULG, on
remarque qu’ils peuvent donner lieu à des liens lexicaux différents dans un domaine spécialisé.
Par exemple, MOT DE PASSE est associé en informatique aux collocations suivantes : générer
un mot de passe,entrer un mot de passe, [un site,un ordinateur]demande un mot de passe,
décrypter un mot de passe,activer/initialiser un mot de passe. Il est permis de se demander si
tous ces liens sont pertinents du point de vue de la description d’une acception « générale ».
On trouvera un exemple intéressant de description explicite d’une facette spécialisée d’une
ULG dans le DiCo : il s’agit du cas de l’unité lexicale ABEILLE. Celle-ci est avant tout décrite
comme dénotant un ‘insecte volant’, mais une section spéciale de l’article de DiCo la présente
comme dénotant aussi un ‘animal d’élevage’ [Même si les abeilles ont plus de liberté de mouvement que
n’importe quel autre animal d’élevage, une exploitation apicole commerciale ressemble plus à une cité HLM qu’à
un pré campagnard.]. Cette facette conditionne une structure actancielle spécifique, dans laquelle
une position actancielle est réservée au X éleveur d’abeilles (Des abeilles en tant qu’insectes
élevés par l’individu X). De plus, c’est ici que sont introduits tous les liens paradigmatiques
et syntagmatiques contrôlés par cette facette spécique : éleveur d’abeilles,apiculteur,ruche,
rucher,élever des abeilles. Cette partition « à facette » de l’article de ABEILLE se retrouve
dans le Lexique actif du français ou LAF (Mel’ˇ
cuk & Polguère, 2007), ouvrage à caractère
pédagogique dérivé du DiCo.
5 Conclusion
Dans la présente étude, nous avons d’abord élaboré une typologie des modalités d’interaction
entre unités de langue générale (ULG) et termes. Nous avons identifié sept cas principaux d’in-
teraction entre ces deux types d’unités lexicales. Ces cas ont été caractérisés en fonction de cinq
paramètres : les trois premiers concernent la cohabitation des ULG et des termes en langue, plus
particulièrement, la cohabitation en tant qu’acceptions distinctes d’un vocable polysémique ; les
deux derniers concernent la cohabitation des deux types d’unités dans les textes. Les critères qui
ont présidé à l’élaboration de la typologie ont ensuite permis de définir des stratégies d’inclusion
des termes dans une base de données lexicale de nature générale.
Notons que nous avons adopté dans cette étude une perspective strictement synchronique sur le
rapport entre termes et ULG et ce choix, bien qu’il se justifie sur le plan méthodologique, ne
nous permet bien entendu pas d’étudier le jeu complexe de l’évolution des sens dans le temps.
Marie-Claude L’Homme, Alain Polguère
Remerciements
Le travail décrit dans cet article a bénéficié du soutien financier de Fondsquébécois de recherche
sur la société et la culture (FQRSC) et du Conseil de recherche en sciences humaines (CRSH)
du Canada. Nous remercions les membres de l’OLST qui ont participé à nos réunions de travail :
Iveth Carreño, Isabelle Carrière, Daniel Labonia, Sara-Anne Leblanc, Elizabeth Marshman et
Caroline Poudrier.
Références
ADELSTEIN A. & CABRÉ M. T. (2002). The specificity of units with specialized meaning:
polysemy as explanatory factor. D.E.L.T.A.,18, 1–25.
BOULANGER J.-C. (1996). Les dictionnaires généraux monolingues, une voie royale pour les
technolectes. TradTerm,3, 137–151.
BÉJOINT H. (1988). Scientific and technical words in general dictionaries. International
Journal of Lexicography,1(4), 344–368.
CABRÉ M. T. (2001). Terminologie et linguistique : la théorie des portes. Terminologie
nouvelles,21, 10–15.
CRUSE A. (2003). Aux frontières de la polysémie : les micro-sens. In S. RÉMI-GIRAUD & L.
PANIER, Eds., La polysémie ou l’empire des sens. Lexique, discours, représentations. Lyon :
Presses Universitaires de Lyon.
GUILBERT L. (1973). La spécificité du terme scientifique et technique. Langue française,17,
5–17.
HAUSMANN F. J. (1989). Die Markierung im allgemeinen einsprachigen Wörterbuch: eine
Übersicht. In F. J. H. ET AL., Ed., Wörterbücher: ein internationales Hanbuch zur Lexi-
cographie / Dictionaries: An International Encyclopaedia of Lexicography / Dictionnaires :
Encyclopédie internationale de lexicographie, p. 649–657. Berlin : Walter de Gruyter.
JOSSELIN-LERAY A. (2005). Place et rôle des terminologies dans les dictionnaires unilingues
et bilingues. Étude d’un domaine de spécialité : vulcanologie. Thèse de doctorat, Université
Lumière Lyon 2, Lyon.
KOˇ
COUREK R. (1991). La langue française de la technique et de la science. Vers une linguis-
tique de la langue savante. Wiesbaden : Oscar Brandstetter.
L’HOMME M.-C. (1998). Définition du statut du verbe en langue de spécialité et sa description
lexicographique. Cahiers de lexicologie,73(2), 61–84.
L’HOMME M.-C. & BAE H.-S. (2006). A Methodology for Developing Multilingual Re-
sources for Terminology. In Proceedings of Language Resources and Evaluation Conference
(LREC), Gênes, Italie.
MEL’ˇ
CUK I., ARBATCHEWSKY-JUMARIE N., IORDANSKAJA L., MANTHA S. & POL-
GUÈRE A. (1999). Dictionnaire explicatif et combinatoire du français contemporain : re-
cherches lexico-sémantiques IV. Montréal : Les Presses de l’Université de Montréal.
MEL’ˇ
CUK I., CLAS A. & POLGUÈRE A. (1995). Introduction à la lexicologie explicative et
combinatoire. Paris/Louvain-la-Neuve : Duculot.
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
MEL’ˇ
CUK I. & POLGUÈRE A. (2007). Lexique actif du français. L’apprentissage du vo-
cabulaire fondé sur 20 000 dérivations sémantiques et collocations du français. Champs
linguistiques. Bruxelles : De Boeck & Larcier.
MEL’ˇ
CUK I. & POLGUÈRE A. (2006). Dérivations sémantiques et collocations dans le
DiCo/LAF. Langue française,150, 66–83. Numéro spécial sur la collocation Collocations,
corpus, dictionnaires, sous la direction de P. Blumenthal et F. J. Hausmann.
MEYER I. & MACKINTOSH K. (2000). When terms move into our everyday lives: An over-
view of de-terminologization. Terminology,6(1), 111–138.
POLGUÈRE A. (2000). Une base de données lexicales du français et ses applications possibles
en didactique. Revue de Linguistique et de Didactique des Langues (LIDIL),21, 75–97.
POLGUÈRE A. (2003). Étiquetage sémantique des lexies dans la base de données DiCo. T.A.L.,
44(2), 39–68.
REY A. (1976). Noms et notions. Paris : Presses Universitaires de France.
ROBERTS R. P. & JOSSELIN-LERAY A. (2005). Le traitement des termes dans les diction-
naires généraux. In H. BÉJOINT & F. MANIEZ, Eds., De la mesure dans les termes. Hommage
à Philippe Thoiron, Travaux du CRTT, p. 324–348. Lyon : Presses Universitaires de Lyon.