ChapterPDF Available

Mettre en bons termes les dictionnaires spécialisés et les dictionnaires de langue générale

Authors:

Abstract

The description of terms (i.e. lexical units linked to specific subject fields) in general language dictionaries raises at least two questions. First, a selection must be made among existing terms of various terminologies in order to keep those that will appear in the dictionary wordlist. Then, terms must be modeled in a way that accounts for their potential relationship with "general" lexical units (GLUs). This article examines how terminographical descriptions, previously stored in a terminological database, can be integrated into an existing lexical database that focuses on general language. Our analysis is based on two databases de- signed and enriched according to the principles and methods of Explanatory Combinatorial Lexicology: the DiCo (GLUs) and the DiCoInfo (computing and the Internet). Our approach consists in studying the relationships between terms and GLUs that can be observed in the language system and in texts. We study seven types of relationships between terms and GLUs and make suggestions as to how to take these specific cases into account in general language
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
Mettre en bons termes les dictionnaires spécialisés
et les dictionnaires de langue générale
Marie-Claude L’Homme et Alain Polguère
OLST — Département de linguistique et de traduction
Université de Montréal, C.P. 6128, succ. Centre-ville
Montréal (Québec) H3C 3J7 Canada
mc.lhomme, alain.polguere@umontreal.ca
Résumé. La description des termes (unités lexicales associées à des domaines de spécia-
lité) dans les dictionnaires de langue soulève au moins deux problèmes. Tout d’abord, il faut
établir un choix parmi tous les termes de diverses terminologies afin de sélectionner ceux qui
apparaîtront dans la nomenclature. Ensuite, les termes doivent être modélisés de façon à rendre
compte des liens potentiels qu’ils entretiennent avec les unités lexicales « générales » (ULG).
Dans cet article, nous examinons de quelle manière des descriptions terminographiques, réper-
toriées dans une base de données terminologique, peuvent être intégrées à une base lexicale
visant la langue générale. Nous utilisons pour cela deux bases de données lexicales construites
selon les principes de la Lexicologie Explicative et Combinatoire : le DiCo (ULG) et le Di-
CoInfo (termes de l’informatique et de l’Internet). Nous évaluerons le potentiel d’une méthode
fondée sur l’observation des liens entre termes et ULG en langue, d’une part, et en parole,
d’autre part, pour mieux définir les modalités de l’intégration des termes. Nous étudierons sept
types de rapports termes-ULG et verrons de quelle manière des termes relevant de l’un ou l’autre
de ces cas de figure peuvent être ajoutés à une base de données de nature générale.
Abstract. The description of terms (i.e. lexical units linked to specific subject fields)
in general language dictionaries raises at least two questions. First, a selection must be made
among existing terms of various terminologies in order to keep those that will appear in the
dictionary wordlist. Then, terms must be modeled in a way that accounts for their potential
relationship with “general” lexical units (GLUs). This article examines how terminographical
descriptions, previously stored in a terminological database, can be integrated into an existing
lexical database that focuses on general language. Our analysis is based on two databases de-
signed and enriched according to the principles and methods of Explanatory Combinatorial
Lexicology: the DiCo (GLUs) and the DiCoInfo (computing and the Internet). Our approach
consists in studying the relationships between terms and GLUs that can be observed in the
language system and in texts. We study seven types of relationships between terms and GLUs
and make suggestions as to how to take these specific cases into account in general language
dictionaries.
Mots-clés : lexicologie, terminologie, lexicographie, bases de données lexicales, langue
générale, langue de spécialité, Lexicologie Explicative et Combinatoire, DiCo, DiCoInfo.
Keywords: lexicology, terminology, lexical databases, language for general purposes,
language for special purposes, Explanatory Combinatorial Lexicology, DiCo, DiCoInfo.
Marie-Claude L’Homme, Alain Polguère
1 Introduction
Les rapports entre unités lexicales de langue générale, dorénavant ULG, et termes soulèvent une
série de questions pertinentes pour toute personne étudiant les lexiques et, donc, pour les termi-
nologues, les lexicologues et les lexicographes. On peut notamment s’interroger sur la présence
réelle ou supposée de caractéristiques distinctives entre ULG et termes, ou sur les modalités de
la cohabitation en langue de ces deux types d’unités lexicales. La langue générale et les ter-
minologies ne constituent pas des systèmes cloisonnés ; il est bien évident qu’il s’agit plutôt
de codes dont les manifestations cohabitent dans la parole, au sens saussurien. La distinction
entre ULG et termes permet d’opérer un partitionnement utile, mais somme toute relativement
artificiel, des systèmes de règles mis en jeu dans la production linguistique. La cohabitation,
voire l’interconnexion, de ces deux types d’unités lexicales est d’ailleurs à l’origine des diffi-
cultés qu’ont de tout temps éprouvées les lexicologues et les terminologues à faire clairement
la distinction, du moins sur le plan linguistique, entre les unités relevant de la langue générale
et celles relevant de la terminologie.
Au-delà de ces questions à caractère théorique, le rapport entre les deux types d’unités lexicales
est souvent abordé dans la pratique terminologique et lexicographique, notamment lorsqu’il est
question de construire une nomenclature de dictionnaire. Certaines pratiques terminologiques
peuvent faire abstraction des ULG en se focalisant sur un ensemble d’unités préalablement défi-
nies comme termes en fonction d’applications spécifiques. En lexicographie, en revanche, il est
difficile de faire l’impasse sur cette question, puisque les dictionnaires doivent inévitablement
tenir compte de sens spécialisés, ne serait-ce que lorsque ceux-ci correspondent à des acceptions
spécifiques de vocables polysémiques qui, par ailleurs, relèvent de la langue générale.
Dans cet article, nous nous penchons sur la question des rapports entre termes et ULG en nous
interrogeant d’abord sur les différentes manières dont ces deux types d’unités lexicales coha-
bitent en langue et en parole. En tenant pour acquis que les deux types d’unités peuvent être
mis en relation sur les axes de la langue et de la parole, nous verrons de quelles manières se
manifeste leur interaction. Nous tirerons de cet examen un certain nombre d’observations qui
aideront à la modélisation des liens qu’entretiennent termes et ULG, notamment dans des bases
de données lexicales du types de celles que nous développons à l’Observatoire de linguistique
Sens-Texte (OLST). Nous nous concentrerons ici sur le cas des bases du français DiCo (langue
générale) et DiCoInfo (domaine de l’informatique et de l’Internet).
L’article est structuré de la manière suivante. D’abord, dans la section 2, nous faisons quelques
commentaires à caractère théorique sur les notions de termes et d’ULG. Ensuite, dans la sec-
tion 3, nous examinons des cas concrets d’interaction entre termes et ULG. La section 4 est
consacrée aux modalités d’intégration des termes dans une base de données de nature générale ;
après une brève description de nos bases de données lexicale et terminologique (section 4.1),
nous expliquons de quelle manière nous envisageons cette intégration (section 4.2).
2 Remarques préliminaires sur les notions de terme et d’ULG
Les rapports qu’entretiennent termes et ULG préoccupent depuis longtemps terminologues et
lexicographes, et les points de vue sur la question peuvent être associés à trois étapes principales
de l’évolution de la terminologie.
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
Les premiers terminologues, désireux de justifier l’autonomie de la terminologie et de la définir
comme discipline à part entière (notamment, par rapport à la linguistique), ont caractérisé le
terme comme une étiquette servant à dénommer un concept, lui-même défini en fonction des
rapports qu’il entretient avec les autres concepts à l’intérieur d’un domaine de connaissances.
Ce postulat ainsi posé, il n’apparaissait pas opportun de s’interroger sur les éventuelles ressem-
blances et différences entre termes et ULG.
Le problème du rapport entre ces deux types d’unités lexicales n’a toutefois pas tardé à être
posé. (Guilbert, 1973) et (Rey, 1976), entre autres, ont recherché le caractère spécifique du terme
dans sa fonction essentiellement référentielle, son aptitude à dénoter des objets du monde réel.
Selon ces auteurs, la fonction du terme explique une partie de ses caractéristiques linguistiques :
prédominance de termes de nature nominale, de certains modes de désignation « transparents »
(termes complexes, recours aux formants grecs ou latin, emprunts), etc.
Plus récemment, on remarque une tendance à aborder la notion de terme sous l’angle de la
polysémie, point de vue que semble sanctionner la pratique lexicographique. Pour Koˇ
courek,
les termes ne représentent, potentiellement, que certaines acceptions de l’aire sémantique de
l’unité lexicale1, à savoir celles qui sont définies par les spécialistes dans les textes spécialisés
(Koˇ
courek, 1991, 180). Pour (Cabré, 2001), le terme, s’il est envisagé du point de vue de la
linguistique, est le résultat de l’activation d’une valeur spécialisée, lorsque certaines conditions
discursives sont réunies.
(Adelstein & Cabré, 2002), qui déplorent le fait qu’on cherche souvent à distinguer les termes
des unités lexicales, ont mis au point un modèle qui permet de rendre compte du fait que le terme
est porteur d’un sens qui émerge dans le contexte de la communication spécialisée. Selon les
auteures, le caractère spécifique du terme s’explique en fonction de l’une des quatre propriétés
suivantes : (i) les situations communicatives dans lesquelles il est utilisé ; (ii) la spécialisation
de certaines de ses composantes sémantiques ; (iii) les connaissances qu’il représente ; (iv) le
type de signification qu’il porte.
Notre but n’est pas d’alimenter le débat théorique sur la nature linguistique des termes, na-
ture particulière qui les distinguerait des ULG. Ce débat est utile, nécessaire même, mais nous
préférons nous concentrer sur l’interaction entre termes et ULG, en présupposant établie la dis-
tinction conceptuelle terme vs ULG. Notre position sera même assez radicale, puisque nous
partirons du postulat théorique suivant, qui sera pris pour acquis en l’absence d’indices forts
nous poussant à le remettre en question.
Postulat théorique 1. Il n’existe pas de différence de nature fondamentale entre
termes et ULG pour ce qui est de leurs propriétés structurales centrales, qui sont :
(i) leur sémantisme (= leur définition), (ii) leur forme (signifiants linguistiques as-
sociés) et (iii) leur combinatoire lexicale et grammaticale.
Ce postulat n’implique aucunement que la modélisation des termes et des ULG puisse s’acco-
moder exactement des mêmes outils. Il établit simplement que les deux types d’entités, en tant
qu’unités lexicales, peuvent et doivent être étudiés et décrits à la base d’une même approche
lexicologique et lexicographique.
Un second postulat, lié au premier, sera adopté :
1Pour Koˇ
courek, l’unité lexicale correspond à un mot polysémique, que nous appelons vocable ; il sera question
de cette notion plus loin (section 3.1).
Marie-Claude L’Homme, Alain Polguère
Postulat théorique 2. Les termes sont des unités lexicales particulières. Ils se dis-
tinguent des ULG — les unités lexicales non marquées — uniquement par le fait
que leur maîtrise linguistique est associée à la maîtrise d’un domaine de connais-
sance donné (scientifique, technique, etc.).
Le mot uniquement est très important, et c’est surtout lui qui justifie la nature de postulat de
l’énoncé ci-dessus. Il indique que toute distinction que l’on peut trouver dans les descriptions
de termes vs d’ULG sont des conséquences « pragmatiques » de l’association des termes à des
champs disciplinaires, et non des conséquences d’une hypothétique nature linguistique propre.
Il peut sembler un peu trop facile d’établir ce type de postulat, en nous libérant ainsi à bon mar-
ché d’une obligation de « démontrer» nos bases théoriques. Notons cependant deux choses à ce
propos. Premièrement, il est toujours préférable en sciences de partir de postulats lorsque des
notions semblent pouvoir être débattues à l’infini dans un sens ou dans l’autre (nature fonda-
mentalement distincte ou fondamentalement identique des termes et des ULG). Deuxièmement,
ce qui rend un postulat intéressant, c’est sa plausibilité, sont apparente adéquation avec les faits
observés. On verra que nos postulats s’accordent parfaitement avec l’interpénétration, que l’on
constate à tous les niveaux du fonctionnement du lexique, entre termes et ULG. En outre, ces
postulats rejoignent ceux d’autres auteurs qui, comme nous allons le faire ici, abordent le pro-
blème sous l’angle de la polysémie.
L’acceptation des deux postulats présentés ci-dessus a des conséquences non triviales sur la
méthodologie terminologique, notamment :
Il est nécessaire d’établir une distinction entre les termes qui sont des unités lexicales véri-
tables — lexèmes ou locutions — et ceux qui sont des syntagmes non lexicalisés. Ces derniers
doivent recevoir une description qui reflète leur nature d’expressions construites. Il est à noter
que les dictionnaires de langue générale manipulent déjà des d’entités similaires, notamment
lorsqu’ils introduisent les collocations associées à une unité lexicale donnée. En revanche, la
tradition terminologique, héritée des premières prises de position évoquées au début de cette
section, a mené au recensement de nombreuses expressions complexes (appelées termes com-
plexes) qui sont entièrement compositionnelles.
Si ce qui définit le terme, en tant qu’unité lexicale, c’est uniquement sont association à un
domaine de connaissance, il n’y a aucune raison de penser que le terme est nécessairement
nominal. On doit envisager la description de termes appartenant à chacune des quatre parties
du discours majeures : noms, verbes, adjectifs et adverbes.
Ces quelques mises au point sur les notions de terme et ULG étant faites, nous passons mainte-
nant au problème de la cohabitation dans la langue et dans les textes de ces deux types d’unités
lexicales.
3 Cohabitation des termes et des ULG dans la langue et dans
les textes
3.1 La polysémie comme approche de la cohabitation en langue
Compte tenu de nos postulats, un bon angle d’approche pour étudier le rapport en langue entre
termes et ULG est d’examiner le fonctionnement des termes dans le contexte de la polysémie
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
(Adelstein & Cabré, 2002; Cabré, 2001; Koˇ
courek, 1991). Suivant la terminologie de la Lexico-
logie Explicative et Combinatoire, nous appelons vocable2l’entité lexicale de niveau supérieur
qui regroupe une ou plusieurs unités lexicales connectées par le lien de polysémie. On peut en-
visager deux types de rapports qu’un terme peut entretenir avec ses copolysèmes au sein d’un
même vocable :
1. le terme est une acception « spécialisée » au sein d’un vocable essentiellement structuré
autour d’une ou plusieurs acceptions de langue générale, c’est-à-dire d’un vocable de
langue générale (VLG) ;
2. le terme est une acception particulière au sein d’un vocable essentiellement terminolo-
gique.
Le premier cas est clairement celui où la cohabitation entre termes et ULG pourra poser le plus
de problèmes de modélisation, mais en même temps celui qui pourra nous donner les éclairages
les plus intéressants sur la relation entre les deux types d’unités lexicales.
Pour ce qui est de la dérivation polysémique elle-même — l’acception source dont semble
dérivée le terme —, on distinguera les trois cas suivants :
1. le terme semble dérivé d’une acception de langue générale (ALG) ;
2. le terme semble dérivé d’une acception de langue spécialisée (ALS) ;
3. on ne perçoit aucune dérivation de ce type.
Même si nous nous situons ici dans une perspective synchronique, il est clair que la perception
de dérivation est normalement liée à une réalité diachronique. Ainsi, nous percevons clairement
que SOURIS 2[Sélectionnez le bon fichier à l’aide de votre souris.]est un copolysème dérivé de SOURIS 1
[La cave est infestée de souris.], notamment parce que la première unité est un terme d’apparition ré-
cente. Bon nombre de locuteurs actuels du français peuvent se souvenir du temps où les souris2
n’avaient pas encore été inventées et où, bien évidemment, le terme correspondant n’existait
pas. Cependant, pour des termes présents depuis longtemps dans la langue, la perception peut
être beaucoup plus fluctuante et, surtout, il convient de décider si l’on se fonde sur l’étymologie
véritable, telle qu’on peut la retracer dans un dictionnaire historique, ou sur la perception intui-
tive du « locuteur lambda ». C’est la seconde approche que nous adoptons ici, car ce qui nous
intéresse, c’est la cohabitation des termes et ULG telle que perçue par le locuteur ordinaire et,
donc, telle qu’elle peut se manifester dans les corpus courants.
3.2 Cohabitation dans les textes
De façon orthogonale au problème de la polysémie, on pourra s’intéresser non plus au contexte
dans lequel le terme apparaît dans le lexique (son vocable d’attache), mais plutôt à son contexte
d’emploi en parole, dans le sens saussurien. On peut distinguer ici deux cas de figure, dont le
premier sera particulièrement intéressant pour nous :
1. le terme apparaît couramment dans des textes non spécialisés et on s’attend à ce qu’il
soit maîtrisé, même partiellement, par les non-spécialistes ; on doit donc considérer qu’il
appartient à des emplois de langue générale (ELG) ;
2Dans cet article, nous utilisons la terminologie de la Lexicologie Explicative et Combinatoire, telle que pré-
sentée dans (Mel’ˇ
cuk et al., 1995).
Marie-Claude L’Homme, Alain Polguère
2. le terme semble être confiné, en parole, à des emplois dans des corpus de textes spéciali-
sés.
Finalement, l’examen véritablement linguistique des corpus de textes spécialisés amène à consi-
dérer sous un angle terminologique des unités lexicales fréquemment ignorées en terminologie :
il s’agit d’unités qui semblent relever d’emplois en contextes techniques ou scientifiques d’ULG
plutôt que de termes véritables. Nous distinguerons donc :
1. les termes « de plein droit » ;
2. les termes qui semblent relever d’usages en contextes spécialisés d’ULG.
3.3 Typologie partielle des termes en fonction de leur rapport aux ULG
au sein d’un même vocable
Les différents paramètres de rapport termes-ULG en langue et en parole que nous venons de
présenter nous permettent de prévoir de multiples types de termes. Nous allons présenter ci-
dessous sept cas de figure qui nous semblent particulièrement intéressants, définis en fonction
des cinq paramètres suivants :
VLG le terme appartient à un vocable principalement de langue générale ;
ALG le terme est dérivé, au sein du vocable, d’une acception de langue générale;
ALS le terme est dérivé, au sein du vocable, d’une acception de langue de spécialité;
ELG le terme a un emploi non marqué dans les corpus de langue générale ;
ULG le « terme » doit en fait être considéré comme une ULG.
Cas 1 : termes « purs »
Exemple (informatique) VLG ALG ALS ELG ULG
UNITÉ ARTHMÉTIQUE ET LOGIQUE
[L’unité arithmétique et logique est la zone du proces-
seur central où les opérations arithmétiques et logiques
sont réalisées.]
non non non non non
Commentaires Le terme UNITÉ ARITHMÉTIQUE ET LOGIQUE n’existe que dans le domaine
de l’informatique et s’emploie presque exclusivement dans des textes à caractère technique qui
relèvent de ce domaine.
Cas 2 : termes « purs » dérivés d’un autre terme
Exemple (optique) VLG ALG ALS ELG ULG
ANAMORPHOSE 2
[Une anamorphose est une image déformée qui retrouve
ses proportions d’origine quand on la regarde sous un
certain angle ou réfléchie dans un miroir adapté.]
non non oui non non
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
Commentaires Comme UNITÉ ARI THTIQUE ET LOGIQUE,ANAMORPHOSE 2est confiné
à un seul domaine : celui de l’optique. Toutefois, il s’agit ici d’un dérivé résultatif de ANA-
MORPHOSE 1[Le terme « anamorphose » désigne d’une façon générale, la transformation qui à un objet fait
correspondre l’objet dont il est l’image virtuelle dans un système optique, pour un observateur donné situé à
distance finie ou infinie.].
Cas 3 : termes dérivés d’une ULG
Exemple (neuro-anatomie) VLG ALG ALS ELG ULG
TENTE 2
‘repli qui sépare le cerveau du cervelet’
[Le cerveau est situé au-dessus du cervelet, séparé de
celui-ci par la tente (une partie des trois méninges, la
dure-mère, interposée entre le cerveau et le cervelet).]
oui oui non non non
Commentaires L’exemple présente un dérivé métaphorique de TENTE 1[À peine avait-il monté
la tente qu’il se mit à pleuvoir.]. Contrairement à sa source dérivationnelle, cette acception relève de
la langue et des corpus techniques.
Cas 4 : termes « transfuges » en langue générale
Exemple (environnement) VLG ALG ALS ELG ULG
COUCHE DOZONE
[Le trou dans la couche d’ozone est apparu cette année
beaucoup plus tôt que les années antérieures.]
non non non oui non
Commentaires Bien que COUCHE DOZONE ait été créé dans le domaine de l’environnement,
son emploi est largement répandu dans les corpus de langue générale.
Cas 5 : termes dérivés d’un autre et transfuges en langue générale
Exemple (informatique) VLG ALG ALS ELG ULG
CRYPTER 2
[Pour décrypter un fichier, il faut posséder la clé privée
de celui-ci.]
non non oui oui non
Commentaires Le terme CRYPTER 2, tout comme COUCHE DOZONE, a été créé dans un
domaine de spécialité et est largement utilisé en langue générale. Toutefois, contrairement à
COUCHE DOZONE, il est dérivé, par spécification, d’une autre acception spécialisée : CRYP-
TER 1[La répartition des fréquences obtenues peut être utilisée pour décrypter un message codé par un chiffre de
substitution.]. Les cas illustrés par COUCHE DOZONE et DÉCRYPTER 2relèvent du phénomène
de déterminologisation (Meyer & Mackintosh, 2000), selon lequel des termes migrent vers la
langue générale, parfois en subissant des modulations de sens.
Marie-Claude L’Homme, Alain Polguère
Cas 6 : termes transfuges et dérivés d’une ULG
Exemple (informatique) VLG ALG ALS ELG ULG
SOURIS 2
[Apple continue de produire des ordinateurs avec des
souris ne comptant qu’un seul bouton, car leurs études
montreraient que les souris à un bouton sont plus effi-
caces à l’usage.]
oui oui non oui non
Commentaires L’exemple présente un dérivé métaphorique de SOURIS 1[J’ai eu une souris
blanche qui adorait qu’on lui gratouille le coté de la mâchoire.].
Cas 7 : termes facettes d’une ULG
Exemple (informatique) VLG ALG ALS ELG ULG
ROBUST E info
[Enfin, plusieurs sociétés proposent des langages de
scripts qui permettent de développer des applications ro-
bustes avec un haut niveau de productivité.]
oui oui non oui oui
Commentaires L’exemple ne présente pas une unité lexicale différente de l’acception mé-
taphorique, non terminologique, de ROBUSTE [Notre objectif est dès lors de proposer un modèle qui
demeure compatible avec une théorie robuste de la connaissance.]. Il s’agit de ce que l’on peut appeler
une « facette » terminologique, propre au domaine de le l’informatique, de cette même accep-
tion 3. Ce dernier cas de figure est particulièrement intéressant puisqu’il correspond à une fusion
pratiquement complète du « terme » dans une ULG.
Nous n’avons pas épuisé ici toutes les possibilités. Il existe d’autres cas intéressants, notamment
si l’on s’intéresse à la zone grise de la partition entre termes et ULG. On pourrait ainsi considérer
le cas ci-dessous :
Exemple VLG ALG ALS ELG ULG
VERT 3
‘qui ne porte pas atteinte à la nature’
[Ces entreprises sont parmi les meilleures entreprises
américaines de haute technologie et de technologie
verte.]
oui non oui oui oui
L’unité lexicale VERT 3correspond à un dérivé de langue générale de l’acception métaphorique
spécialisée (domaine de la politique) VERT 2dont le sens est ‘qui défend les politiques écologi-
ques’ [Bravo à toi, te voilà le premier député vert de Bretagne.]. Nous n’introduisons pas ce cas de figure
dans la typologie ci-dessus parce qu’il nous est apparu très diffcile de trouver un autre exemple
que celui de VERT 3.
3Nous employons ici le terme facette dans un sens très proche de celui de (Cruse, 2003).
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
3.4 Remarques sur la typologie présentée
La typologie proposée à la section 3.3 présente quelques phénomènes saillants, mais, comme
nous l’avons déjà souligné, elle n’épuise pas tous les cas figure. Même s’il existe certaines
exclusions logiques, tous les paramètres de caractérisation que nous avons considérés se com-
binent, et peuvent donc donner un nombre important de cas de figure mathématiquement en-
visageables (exactement, 52= 25). Nous nous sommes ici contentés des sept cas de figures
courants que nous avons pu observés dans le contexte des travaux de lexicographie de langue
générale et de terminologie menés à l’OLST. À cette première limitation s’ajoute le fait que
nous n’avons pas considéré la dimension diachronique dans nos analyses.
Nous allons maintenant nous pencher sur la façon dont on peut tenir compte des différentes
modalités de l’interaction entre termes et ULG dans les modélisations des lexiques des langues
naturelles. Même si nous nous inspirons de stratégies mises au point en lexicographie classique,
notre propos sera avant tout centré sur les modélisations formelles de type bases de données, au
détriment des dictionnaires grands publics, puisque c’est dans ce cadre précis que nous avons
mené une réflexion sur la question.
4 Cohabitation dans les descriptions lexicales
De nombreux auteurs s’accordent pour dire que la place des termes dans les dictionnaires géné-
raux est, non seulement incontestable, mais justifiée (Béjoint, 1988; Boulanger, 1996; Josselin-
Leray, 2005; Roberts & Josselin-Leray, 2005) en raison, notamment, des attentes des utilisateurs
(Josselin-Leray, 2005). Dans ce type d’ouvrages, les termes sont parfois distingués formelle-
ment des unités lexicales de sens « général » au moyen d’un système de marques d’usage —
plus spécifiquement, les marques technolectales ou, pour reprendre la terminologie proposée par
(Hausmann, 1989), des marques relevant de l’axe diatechnique). Parfois, cependant, les termes
ne se démarquent pas en tant que tels dans les articles de dictionnaires généraux : il s’agit des
cas où les termes en question sont d’un emploi répandu, non marqué, en langue générale.
La prise en compte d’unités à la fois terminologiques et non terminologiques dans un même
dictionnaire n’est sans doute pas un problème trivial. Ce problème se pose avec la même acuité
dans le cadre de l’élaboration d’une base de données lexicale générale. Cependant, on atteint
un niveau de difficulté supplémentaire lorsque l’on doit connecter deux bases distinctes dé-
veloppées en parallèle, dont l’une est de nature générale — le DiCo — et l’autre de nature
terminologique — le DiCoInfo (domaine de l’informatique et de l’Internet). Dans ce qui suit,
nous ferons tout d’abord une description très succincte de ces deux bases (4.1). Nous verrons
par la suite de quelle manière nous envisageons de traiter les liens entre termes et ULG et exa-
minerons si certains mécanismes utilisés dans les dictionnaires classiques peuvent être repris
dans le contexte de la construction de bases de données lexicales (4.2).
4.1 Les bases de données DiCo et DiCoInfo
Les deux bases de données lexicales à l’origine de cette réflexion, le DiCo et le DiCoInfo,
reposent sur les principes théoriques et méthodologiques de la Lexicologie Explicative et Com-
binatoire (Mel’ˇ
cuk et al., 1995; Mel’ˇ
cuk et al., 1999), composante lexicale de la Théorie Sens-
Texte. En particulier, elles adhèrent toutes deux aux principes énoncés ci-dessous :
Marie-Claude L’Homme, Alain Polguère
L’unité de base de la description lexicographique est l’unité lexicale — appelée aussi lexie —,
à savoir une forme lexicale prise dans une acception spécifique. Les lexies peuvent être mo-
nolexémiques (DiCo : ABEILLE,BAGAGE I.1,BAGAGE II [de connaissances]; DiCoInfo : ORDI-
NATEUR,FORMATER 1[un disque],FORMATER 2[un fichier]) ou multilexémiques (DiCo : BOÎTE
AUX LETTRES,CORPS À CORPS ; DiCoInfo : À LA VOLÉE 1,TRAITEMENT DE TEXTE 1).
Les acceptions sont distinguées au moyen d’une série de critères servant à baliser les in-
tuitions des lexicographes quant à la polysémie des vocables. Parmi ceux-ci, nous pouvons
citer la cooccurrence compatible et différentielle, la dérivation morphologique différentielle
et l’observation d’autres liens paradigmatiques différentiels (synonymie, antonymie, liens ac-
tanciels, etc.).
Toutes les composantes de la description lexicographique s’appuient sur une définition de
la structure actancielle des lexies. Les actants apparaissent dans la forme propositionnelle et
dans la représentation du régime syntaxique des lexies. En outre, les actants sont nécessaires
à la formalisation des liens lexicaux (voir ci-dessous).
On décrit de la manière la plus complète possible les liens paradigmatiques (dérivations
sémantiques) et syntagmatiques (collocations) unissant la lexie décrite à d’autres lexies.
Ces liens sont décrits au moyen du système des fonctions lexicales.
Il importe à ce stade de souligner que, bien que les deux bases de données DiCo et DiCoInfo
reposent sur le même cadre théorique, elles ont été mises au point et sont enrichies de ma-
nière complètement séparée. Cet état de fait explique les différences existant entre les deux res-
sources, notamment sur le plan de l’encodage des données.
Le DiCo est développé depuis 1992 à partir d’un modèle descriptif élaboré pour le Dictionnaire
explicatif et combinatoire, ou DEC — voir (Mel’ˇ
cuk et al., 1999) pour le dernier volume paru.
Le DiCo décrit l’ensemble des sens rattachés à un vocable. Ces sens sont hiérarchisés selon
des critères de « complexité sémantique » et représentés au moyen d’un système de numé-
rotation rigoureux. Les rubriques apparaissant dans une fiche du DiCo sont grosso modo les
suivantes : identification du mot-vedette, caractéristiques grammaticales, étiquette sémantique,
forme propositionnelle (structure actancielle), régime, liens lexicaux (rubrique dans laquelle ap-
paraissent les liens paradigmatiques et syntagmatiques représentés au moyen de fonctions lexi-
cales), exemples d’emplois et énumération des locutions construites à partir du mot-vedette.
L’encodage des données dans le DiCo se fait dans une base de données FileMaker Pro. Les
articles de statut 0 et 1 (c’est-à-dire dont la rédaction est entièrement ou partiellement validées)
sont ensuite compilés sous forme de tables SQL interrogeables en ligne à l’adresse suivante :
http://olst.ling.umontreal.ca/dicouebe.
Le lecteur trouvera plus d’informations sur le DiCo et sur l’interface d’accès à sa version SQL
dans la documentation téléchargeable à cette même adresse. Il existe de plus de nombreuses
publications traitant d’aspects spécifiques du travail mené sur le DiCo, comme par exemple
(Polguère, 2000; Polguère, 2003; Mel’ˇ
cuk & Polguère, 2006).
Le DiCoInfo, dictionnaire fondamental de l’informatique et de l’Internet, a pris naissance dans
la foulée de travaux portant sur les verbes spécialisés (L’Homme, 1998). Le travail de rédaction
des articles à proprement parler a débuté en 2003. Le DiCoInfo se distingue de la plupart des
dictionnaires spécialisés en ce sens qu’il se focalise (en accord avec la Lexicologie Explicative
et Combinatoire) sur les propriétés lexico-sémantiques des termes plutôt que sur le lien que ces
termes ont avec l’organisation des connaissances dans un domaine.
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
Le DiCoInfo retient les sens spécialisés, c’est-à-dire ceux qui sont liés aux domaines de l’in-
formatique et de l’Internet ; il fait abstraction des copolysèmes éventuels ne relevant pas ces
domaines. Bien que les acceptions multiples d’une forme polysémique soient distinguées, les
liens de polysémie ne sont pas mis en évidence, contrairement à ce qui se pratique dans le DiCo.
Sur le plan méthodologique, la rédaction du DiCoInfo repose principalement sur des observa-
tions faites dans des corpus textuels. De manière générale, les terminologues ne possèdent pas
a priori les connaissances spécialisées nécessaires à la compréhension de sens scientifiques ou
techniques et s’appuient d’abord sur les explications données dans les textes pour les acquérir.
Les rubriques apparaissant dans le DiCoInfo sont les suivantes : identification du terme, infor-
mations grammaticales, structure actancielle (dont la forme diffère de celle du DiCo), réalisa-
tions linguistiques des actants, régime, définition, liens lexicaux (rubrique dans laquelle appa-
raissent les liens paradigmatiques et syntagmatiques représentés au moyen de fonctions lexi-
cales) et contextes.
L’encodage des données dans le DiCoInfo se fait au moyen d’un éditeur XML4. Les articles de
statut 0 (c’est-à-dire les articles dont la rédaction est terminée), de statut 1 (dont la rédaction est
très avancée) et de statut 2 (dont les caractérisations sémantiques sont satisfaisantes, mais où la
liste de liens lexicaux n’est pas complète) sont exportées dans un format HTML (pour affichage
dans le web) et vers un format d’impression en PDF. La version HML courante du DiCoInfo
est disponible sur le web à l’adresse suivante : http://olst.ling.umontreal.ca/dicoinfo/.
Pour des détails sur le DiCoInfo et la méthodologie présidant à son élaboration, le lecteur peut
se référer à (L’Homme & Bae, 2006).
4.2 Le rapport termes-ULG dans le DiCo et le DiCoInfo
Cette section examine comment les termes peuvent être intégrés à une base de données lexicale
qui, non seulement tient compte des modalités d’interaction entre termes et ULG identifiées aux
sections 3.3 et 3.4, mais les met en évidence.
Soulignons auparavant que nous tenons pour acquis que tous les termes font partie du lexique
d’une langue et devraient être décrits dans tout dictionnaire ou base de données lexicale qui pré-
tend décrire l’ensemble du lexique. Les choix quant à leur inclusion ou non dépendent, non pas
de leur appartenance à un lexique dit général, mais plutôt à des considérations liées aux publics
cibles. Par exemple, un lexicographe pourra décider de ne pas répertorier UNITÉ ARITHMÉ-
TIQUE ET LOGIQUE,ANAMORPHOSE 1/2ou TENTE 2en tenant pour acquis que les utilisateurs
ne chercheront pas à se documenter sur ce type d’unités lexicales dans un dictionnaire destiné
au grand public.
Cela étant dit, voyons comment les termes peuvent être intégrés à la base de données lexicale
DiCo. L’intégration est envisagée ici en tenant pour acquis que les ULG sont présentes dans la
base générale et que les termes sont décrits dans des bases de données terminologiques.
Six scénarios sont possibles.
1. Vocable terminologique Cas illustré par UNITÉ ARITHMÉTIQUE ET LOGIQUE et COUCHE
DOZONE. Les vocables terminologiques, puisqu’aucun lien préalable avec une ULG n’est
4La version XML (ainsi que ses versions dérivées PDF et HTML) ont été conçues en collaboration avec Guy
Lapalme, Benoît Alain et Vincent St-Amour.
Marie-Claude L’Homme, Alain Polguère
identifié, sont simplement ajoutés à la nomenclature donnant lieu à des fiches additionnelles
dans une base de données lexicale. Ainsi, outre UNITÉ ARITHMÉTIQUE ET LOGIQUE, de nom-
breux vocables décrits dans le DiCoInfo — notamment, BAVARDOIR,BLOGUE,HEXADÉCI-
MAL,JOYSTICK,OCTET,ORDINATEUR,SYSTÈME DEXPLOITATION,USB,WEBMESTRE
seraient simplement ajoutés à la nomenclature du DiCo. Nous n’aurions pas à tenir compte
d’éventuels liens de polysémie avec des lexies déjà répertoriées dans la base lexicale. Toutefois,
la description de ces termes devrait comporter une marque d’usage si leur emploi est confiné
aux textes spécialisés (cf. point 4).
2. Dérivé d’une acception spécialisée Cas illustré par ANAMORPHOSE 1/2. Ce cas de figure
donnera lieu à l’ajout d’un vocable polysémique à la nomenclature de la base de données lexi-
cale. Ici, se posera le problème des liens à établir entre les acceptions spécialisées. De plus,
si les deux acceptions spécialisées sont elles-mêmes liées à une acception générale, se posera
le problème de la prise en compte de ce lien (cf. point 3). En ce qui concerne les termes ré-
pertoriés dans le DiCoInfo, l’établissement de liens de polysémie entre deux sens spécialisés
se posera, par exemple, pour les termes ADRESSE 1(‘identifiant d’un emplacement du disque
ou de la mémoire’), ADRESSE 2(‘identifiant d’un site’) et ADRESSE 3(‘identifiant d’un uti-
lisateur du courrier électronique’) ou, encore, NUMÉRIQUE 1(‘qui concerne les nombres’) et
NUMÉRIQUE 2(‘qui concerne un mode de représentation sous forme binaire’). Dans tous les
exemples cités ci-dessus, les liens sont observés à l’intérieur du domaine de l’informatique. Un
autre exemple intéressant est celui de SCRIPT où, cette fois, le lien sémantique serait à établir
avec une acception du domaine du cinéma.
3. Acception spécialisée au sein d’un vocable général Cas illustré par SOURIS 2,TENTE 2
et VERT 2. L’acception spécialisée sera ajoutée sous forme de fiche additionnelle à la liste d’ac-
ceptions déjà décrites pour l’ULG. (Dans un dictionnaire de facture plus classique, l’acception
spécialisée sera ajoutée à un article existant.) Ici, comme dans le cas précédent, se posera le
problème des liens à établir entre les acceptions. Toutefois, il faudra rendre compte des liens
existant entre les acceptions présentes — par défaut, de nature générale — et la nouvelle ac-
ception spécialisée. Par exemple, pour SOURIS 2, il faudra rendre compte du lien métaphorique
ayant donné naissance à l’acception spécialisée. Outre SOURIS 2, de nombreux termes prove-
nant du DiCoInfo subiront ce traitement, par exemple : BERGER,INTERPRÉTER,MÉMOIRE,
NAVIG UER,PORTAIL,PERTOIRE,ROBOT,SYNTAXE,VIRUS.
Les cas 1, 2 et 3 peuvent être subdivisés en deux catégories en fonction du domaine d’emploi
des unités lexicales impliquées : emploi exclusivement lié à un domaine spécialisé ou emploi
dans un domaine spécialisé et en langue générale.
4. Emploi confiné aux discours spécialisés Cas illustré par ANAMORPHOSE 1/2et TENTE 2.
Lorsque l’emploi d’un terme reste confiné à des discours spécialisés, la description de la com-
binatoire de cette acception devra comporter une marque d’usage (Inform.,Phys.,Ling., etc.).
Par exemple, les termes BOUCLE,HEXADÉCIMAL,INCRÉMENTER,OCTET,UNITÉ ARITH-
TIQUE ET LOGIQUE,USB présents dans le DiCoInfo se verraient associer une marque d’usage
dans le DiCo.
5. Emploi dans les discours spécialisés et en langue générale Cas illustré par SOURIS 2
et COUCHE DOZONE. Lorsque l’emploi d’un terme est observé aussi bien dans des discours
spécialisés que dans des textes ne relevant pas de thématiques spécialisées, la marque d’usage
est superflue. Ainsi, il ne semble pas opportun d’indiquer l’appartenance des termes COURRIEL
et ORDINATEUR au domaine de l’informatique au moment de les intégrer au DiCo.
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
Le dernier scénario envisageable, que nous allons maintenant présenter, concerne les cas plus
difficiles où une ULG a un statut particulier dans un domaine spécialisé, mais où le terme ainsi
identifié ne donne pas lieu à une acception spécifique. Nous dirons que le statut terminologique
réside dans l’attribution d’une facette terminologique à une ULG.
6. Fonctionnement comme facette terminologique d’une ULG Cas illustré par ROBUSTE.
Contrairement aux autres scénarios décrits jusqu’ici, celui-ci ne donne pas lieu à l’ajout d’un
vocable à la nomenclature de la base de données ou d’une acception à un ensemble d’accep-
tions existantes. On peut tenir pour acquis que la description donnée pour l’acception générale
est également valable pour les emplois spécialisés. Toutefois, la prise en compte des emplois
spécialisés pourrait donner lieu à une révision de la description existante (modification de la
caractérisation sémantique, révision et nouvelle organisation des liens lexicaux). Ce problème
se pose pour de nombreux termes répertoriés dans le DiCoInfo, notamment ANNULER,CA-
RACTÈRE,MOT DE PASSE,PUISSANT,VALIDER,ZOOMER. Certains de ces termes présentent
une difficulté additionnelle : bien qu’il ne s’agisse pas d’acceptions différentes des ULG, on
remarque qu’ils peuvent donner lieu à des liens lexicaux différents dans un domaine spécialisé.
Par exemple, MOT DE PASSE est associé en informatique aux collocations suivantes : générer
un mot de passe,entrer un mot de passe, [un site,un ordinateur]demande un mot de passe,
décrypter un mot de passe,activer/initialiser un mot de passe. Il est permis de se demander si
tous ces liens sont pertinents du point de vue de la description d’une acception « générale ».
On trouvera un exemple intéressant de description explicite d’une facette spécialisée d’une
ULG dans le DiCo : il s’agit du cas de l’unité lexicale ABEILLE. Celle-ci est avant tout décrite
comme dénotant un ‘insecte volant’, mais une section spéciale de l’article de DiCo la présente
comme dénotant aussi un ‘animal d’élevage’ [Même si les abeilles ont plus de liberté de mouvement que
n’importe quel autre animal d’élevage, une exploitation apicole commerciale ressemble plus à une cité HLM qu’à
un pré campagnard.]. Cette facette conditionne une structure actancielle spécifique, dans laquelle
une position actancielle est réservée au X éleveur d’abeilles (Des abeilles en tant qu’insectes
élevés par l’individu X). De plus, c’est ici que sont introduits tous les liens paradigmatiques
et syntagmatiques contrôlés par cette facette spécique : éleveur d’abeilles,apiculteur,ruche,
rucher,élever des abeilles. Cette partition « à facette » de l’article de ABEILLE se retrouve
dans le Lexique actif du français ou LAF (Mel’ˇ
cuk & Polguère, 2007), ouvrage à caractère
pédagogique dérivé du DiCo.
5 Conclusion
Dans la présente étude, nous avons d’abord élaboré une typologie des modalités d’interaction
entre unités de langue générale (ULG) et termes. Nous avons identifié sept cas principaux d’in-
teraction entre ces deux types d’unités lexicales. Ces cas ont été caractérisés en fonction de cinq
paramètres : les trois premiers concernent la cohabitation des ULG et des termes en langue, plus
particulièrement, la cohabitation en tant qu’acceptions distinctes d’un vocable polysémique ; les
deux derniers concernent la cohabitation des deux types d’unités dans les textes. Les critères qui
ont présidé à l’élaboration de la typologie ont ensuite permis de définir des stratégies d’inclusion
des termes dans une base de données lexicale de nature générale.
Notons que nous avons adopté dans cette étude une perspective strictement synchronique sur le
rapport entre termes et ULG et ce choix, bien qu’il se justifie sur le plan méthodologique, ne
nous permet bien entendu pas d’étudier le jeu complexe de l’évolution des sens dans le temps.
Marie-Claude L’Homme, Alain Polguère
Remerciements
Le travail décrit dans cet article a bénéficié du soutien financier de Fondsquébécois de recherche
sur la société et la culture (FQRSC) et du Conseil de recherche en sciences humaines (CRSH)
du Canada. Nous remercions les membres de l’OLST qui ont participé à nos réunions de travail :
Iveth Carreño, Isabelle Carrière, Daniel Labonia, Sara-Anne Leblanc, Elizabeth Marshman et
Caroline Poudrier.
Références
ADELSTEIN A. & CABRÉ M. T. (2002). The specificity of units with specialized meaning:
polysemy as explanatory factor. D.E.L.T.A.,18, 1–25.
BOULANGER J.-C. (1996). Les dictionnaires généraux monolingues, une voie royale pour les
technolectes. TradTerm,3, 137–151.
BÉJOINT H. (1988). Scientific and technical words in general dictionaries. International
Journal of Lexicography,1(4), 344–368.
CABRÉ M. T. (2001). Terminologie et linguistique : la théorie des portes. Terminologie
nouvelles,21, 10–15.
CRUSE A. (2003). Aux frontières de la polysémie : les micro-sens. In S. RÉMI-GIRAUD & L.
PANIER, Eds., La polysémie ou l’empire des sens. Lexique, discours, représentations. Lyon :
Presses Universitaires de Lyon.
GUILBERT L. (1973). La spécificité du terme scientifique et technique. Langue française,17,
5–17.
HAUSMANN F. J. (1989). Die Markierung im allgemeinen einsprachigen Wörterbuch: eine
Übersicht. In F. J. H. ET AL., Ed., Wörterbücher: ein internationales Hanbuch zur Lexi-
cographie / Dictionaries: An International Encyclopaedia of Lexicography / Dictionnaires :
Encyclopédie internationale de lexicographie, p. 649–657. Berlin : Walter de Gruyter.
JOSSELIN-LERAY A. (2005). Place et rôle des terminologies dans les dictionnaires unilingues
et bilingues. Étude d’un domaine de spécialité : vulcanologie. Thèse de doctorat, Université
Lumière Lyon 2, Lyon.
KOˇ
COUREK R. (1991). La langue française de la technique et de la science. Vers une linguis-
tique de la langue savante. Wiesbaden : Oscar Brandstetter.
L’HOMME M.-C. (1998). Définition du statut du verbe en langue de spécialité et sa description
lexicographique. Cahiers de lexicologie,73(2), 61–84.
L’HOMME M.-C. & BAE H.-S. (2006). A Methodology for Developing Multilingual Re-
sources for Terminology. In Proceedings of Language Resources and Evaluation Conference
(LREC), Gênes, Italie.
MELˇ
CUK I., ARBATCHEWSKY-JUMARIE N., IORDANSKAJA L., MANTHA S. & POL-
GUÈRE A. (1999). Dictionnaire explicatif et combinatoire du français contemporain : re-
cherches lexico-sémantiques IV. Montréal : Les Presses de l’Université de Montréal.
MELˇ
CUK I., CLAS A. & POLGUÈRE A. (1995). Introduction à la lexicologie explicative et
combinatoire. Paris/Louvain-la-Neuve : Duculot.
Colloque en l’honneur d’Henri Béjoint, Lyon, 27–29 septembre 2007
MELˇ
CUK I. & POLGUÈRE A. (2007). Lexique actif du français. L’apprentissage du vo-
cabulaire fondé sur 20 000 dérivations sémantiques et collocations du français. Champs
linguistiques. Bruxelles : De Boeck & Larcier.
MELˇ
CUK I. & POLGUÈRE A. (2006). Dérivations sémantiques et collocations dans le
DiCo/LAF. Langue française,150, 66–83. Numéro spécial sur la collocation Collocations,
corpus, dictionnaires, sous la direction de P. Blumenthal et F. J. Hausmann.
MEYER I. & MACKINTOSH K. (2000). When terms move into our everyday lives: An over-
view of de-terminologization. Terminology,6(1), 111–138.
POLGUÈRE A. (2000). Une base de données lexicales du français et ses applications possibles
en didactique. Revue de Linguistique et de Didactique des Langues (LIDIL),21, 75–97.
POLGUÈRE A. (2003). Étiquetage sémantique des lexies dans la base de données DiCo. T.A.L.,
44(2), 39–68.
REY A. (1976). Noms et notions. Paris : Presses Universitaires de France.
ROBERTS R. P. & JOSSELIN-LERAY A. (2005). Le traitement des termes dans les diction-
naires généraux. In H. BÉJOINT & F. MANIEZ, Eds., De la mesure dans les termes. Hommage
à Philippe Thoiron, Travaux du CRTT, p. 324–348. Lyon : Presses Universitaires de Lyon.
... 1.1.1.2 Le terme est un signe linguistique, le résultat d'une association entre un sens et une forme Les dicultés imposées par la TGT ont conduit à des approches alternatives (Cabré Castellví, 2003;L'Homme, 2005; L'Homme et Polguère, 2008;Van Campenhoudt, 2010) qui rejettent complètement ou partiellement la nature conceptuelle du terme : ...
... L'Homme et Polguère (2008), à leur tour, cherchent à démontrer que les termes n'ont pas de nature linguistique propre comparés à des unités lexicales générales (ULG), c'est-à-dire, les mots de la langue générale par opposition à celle de spécialité. Pour cela, ils avancent deux postulats théoriques : Ces principes ont une inuence directe sur la façon d'organiser les ressources. ...
... Ainsi, Van Campenhoudt (2010) insiste sur le besoin d'un dégroupement homonymique des entrées monolexicales dans les dictionnaires qui était jadis fondé par le souci d'économie d'espace sur le support papier. Quant aux syntagmes terminologiques non lexicalisés, L'Homme et Polguère (2008) se réfèrent à la pratique des dictionnaires de langue générale où les collocations sont fournies sous l'entrée du terme phare. ...
Thesis
Full-text available
Cette thèse propose une méthode pour alimenter une ontologie, une structure de concepts liés par des relations sémantiques, par des termes français, anglais et allemands à partir de corpus spécialisés comparables. Son apport principal est le développement des méthodes d'extraction utilisant des ressources endogènes apprises à partir de corpus et d'ontologie. Exploitant des ngrammes de caractères, elles sont disponibles et indépendantes vis-à-vis à la langue et au domaine. La première contribution porte sur l'utilisation des ressources morphologiques et morphosyntaxiques endogènes pour extraire des termes mono- et polylexicaux à partir de corpus. La deuxième contribution vise à exploiter des ressources endogènes pour identifier leurs traductions. La troisième contribution concerne la construction des familles morphologiques endogènes servant à alimenter l'ontologie.
... Dans ce cas, le terme est entendu comme un mot qui a un sens spécialisé dans un domaine particulier, qui fonctionne comme toute autre unité de la langue et qui s'insère donc dans des discours variés (Rondeau, 1981 : 21 ;Depecker, 2002 : Partie 1, §15 ; L'Homme, 2004 : Chapitre1, §2 ; Gaudin, 2005 : 82 ;Ungureanu, 2006 : 70 ;Cabré, 2016 : 78). De ce point de vue, si les termes sont considérés comme des termes, c'est « uniquement par le fait que leur maîtrise linguistique est associée à la maîtrise d'un domaine de connaissance donné » et non en raison « d'une hypothétique nature linguistique propre » (L'Homme et Polguère, 2007). ...
... Dans un second temps, nous relevons plusieurs cas où la notion de déterminologisation est invoquée pour contribuer à l'interprétation de certains phénomènes linguistiques constatés dans des données (Resche, 2004 ;L'Homme et Polguère, 2007 ;Bertaccini et al., 2008 ;Botta, 2013 ;Peynaud, 2016 ;Sajous et al., 2018 ;Vogh et Courbon, 2018 ). Dans ces cas, la déterminologisation ne semble pas être l'objet principal, ou du moins pas le seul objet, de ces travaux. ...
Thesis
Full-text available
Cette thèse porte sur la déterminologisation dans le domaine de la physique des particules. Face au manque de travaux traitant spécifiquement le processus, notre travail vise à combler cette lacune en abordant cette question de manière systématique et approfondie. Par la description des phénomènes sémantiques qui se produisent au cours du processus, nous cherchons à mieux cerner la notion de déterminologisation et ses manifestations dans les textes.Nous avons développé une méthode de linguistique outillée pour l’analyse des termes dans des textes représentant différentes étapes du processus de déterminologisation. Les données sont organisées en cinq sous-corpus, constitués de textes de différents genres et degrés de spécialisation. Ils sont sélectionnés afin d’approcher le continuum entre langue de spécialité et langue générale. Afin de caractériser les différents fonctionnements des termes dans le corpus, deux indices basés sur les contextes distributionnels des termes sont définis.L’exploration des indices révèle la diversité des fonctionnements des termes dans la presse, en comparaison avec les textes spécialisés. Les phénomènes repérés permettent d’alimenter la réflexion sur la nature des changements sémantiques résultant de la déterminologisation et montrent qu’ils reflètent des différences de points de vue, inhérents à la multidimensionnalité des concepts. Les données mettent aussi en lumière les mécanismes à l’œuvre dans la création des emplois métaphoriques des termes, qui se fondent sur les usages des termes dans la presse, lorsque de nouvelles connotations sont véhiculées, et sur la coexistence dans la langue générale des composants du terme ou d’unités de la même famille morphologique.Nos observations contribuent ainsi à définir la déterminologisation comme un processus non linéaire de passage de termes dans la langue générale, qui fait intervenir de nombreux intermédiaires et qui est influencé par au moins cinq facteurs, linguistiques et extralinguistiques. Plus largement, nous montrons l’ampleur des questions liées au fonctionnement des termes dans la langue générale. En ce sens, notre thèse participe à reconnaitre la transversalité de la déterminologisation dans les questions de circulation des termes, de diffusion des connaissances et de néologie.
... Terminology literature often mentions the fact that many terms are created on the basis of other more established meanings. Adding new meanings to existing lexical items is a productive method for term creation terms (Sager 1990;Kocourek 1991;Aldestein and Cabré 2002;L'Homme and Polguère 2008). Unusual or unknown meanings also capture terminologists' attention, since they can become clues for identifying potential terms. ...
Article
Full-text available
Polysemy, even when it is considered within specialized domains, is a recurrent phenomenon and the topic is debated from time to time in terminology literature. Part of this literature still advocates ways to prevent polysemy. Another portion recognizes the prevalence of polysemy, especially in specialized corpora, but considers it from the perspective of other phenomena, such as ambiguity, indeterminacy, categorization or variation. Although the number of perspectives on meaning have increased over the years, the treatment of polysemy in terminological resources is still unsatisfactory. This article first shows that polysemy is an integral part of specialized communication and that there are different kinds of domain-specific polysemy. Then, it reviews selected perspectives that have been taken on polysemy in terminology literature. The treatment of 45 polysemous lexical items in four specialized resources is then analysed. Finally, different methods based on lexical semantics are proposed to account for polysemy in terminological resources.
... Adding new meanings to existing lexical items is a commonly used method for creating terms (Sager 1990;Kocourek 1991;Aldestein & Cabré 2002;L'Homme & Polguère 2008). The addition can be the result of a metaphorical extension. ...
Conference Paper
Full-text available
For many, the success of specialized communication is achieved when it is devoid of ambiguity. However, polysemy is quite common in specialized corpora and needs to be managed when compiling domain-specific resources. In this paper, we show that polysemy affects many lexical items in specialized texts and review specific cases of polysemy, some of which are seldom discussed in terminology literature. We also show how different types of polysemy can be handled in terminological resources.Methods include: 1. accounting for meaning distinctions using well known tests in lexical semantics; 2. representing links and differences between meanings with lexical relations and labelled argument structures. We also explain how Frame Semantics (Fillmore (1982) and the methodology used in the FrameNet project (Ruppenhofer et al. 2016) can provide a broader perspective on meaning distinctions in specialized fields. Methods are applied to examples found in the English versions of two terminological dictionaries in the fields of computing and the environment.
... Dictionnaire fondamental de l' environnement 2018). Some authors have studied the possible combination of general language resources with specialized ones that apply the principles of ECL (Ingrosso & Polguère 2015;L'Homme & Polguère 2008). ...
Book
Lexical Semantics for Terminology: An introduction explores the interconnections between lexical semantics and terminology. More specifically, it shows how principles borrowed from lexico-semantic frameworks and methodologies derived from them can help understand terms and describe them in resources. It also explains how lexical analysis complements perspectives entirely focused on knowledge. Topics such as term identification, meaning, polysemy, relations between terms, and equivalence are discussed thoroughly and illustrated with various examples taken from different fields of knowledge. This book is an indispensable companion for those who are interested in words and need to handle specialized terms as part of their activities, i.e. terminologists, translators, lexicographers, corpus linguists. A background in terminology or lexical semantics is not required since all notions are defined and explained. This book should complement other textbooks on terminology that do not focus on lexical semantics per se.
... Statuer sur la nature « terminologique » de certaines expressions linguistiques ou de certains sens implique qu'il faut fixer les contours d'acceptions dites spécialisées et, ce faisant, ériger des balises entre acceptions spécialisées et autres acceptions. Pour Kocourek (point de vue partagé notamment par Cabré, 2001, et L'Homme & Polguère, 2008, les termes « ne représentent, potentiellement, que certaines acceptions de l'aire sémantique de l'unité lexicale 1 , à savoir celles qui sont définies par les spécialistes dans les textes spécialisés » (1991, p. 180). ...
Article
Full-text available
Research has shown that links between polysemic senses (sense links) can and should be used to facilitate the acquisition of polysemy. However, sense links have received little attention in specialized lexicography because the concern about domain specificity has considerably reduced the number of polysemic senses that can be entered in specialized dictionaries. The descriptive shift in terminology research and the implications of cognitive semantics for learner's dictionaries have paved the way for dealing with sense links further in specialized dictionaries for learners (SDLs). Using computing-related lexical items as examples, this article proposes three guidelines for treating polysemy in SDLs with the aim of entering polysemic senses that do not belong to a given subject field while maintaining the focus on the subject field. It also presents four models for describing sense links in bilingual specialized dictionaries for ESP learners (BSDLs). Depending on the magnitude of overlap between the target language (TL) equivalents of the source and target senses as well as the effects of other factors, sense links are represented by ordering senses logically, appending the source sense 1 , combining logical ordering with a short explanation, or providing both the source sense and a short explanation. The guidelines and models can help address the major situations that lexicographers encounter when describing sense links in BSDLs and hopefully contribute to learners' acquisition of technical senses. Opsomming: Die oorbrugging van polisemiese betekenisse in tweetalige gespesialiseerde woordeboeke vir ESD-leerders. Navorsing het getoon dat polise-miese betekenisse (betekenisskakels) gebruik kan en moet word om die aanleer van polisemie te vergemaklik. Betekenisskakels het egter min aandag in gespesialiseerde leksikografie ontvang aan-gesien die fokus op domeinspesifiekheid die aantal polisemiese betekenisse wat in gespesialiseerde woordeboeke opgeneem kan word, aansienlik verminder het. Die deskriptiewe skuif in terminolo-gienavorsing en die implikasies wat die kognitiewe semantiek vir aanleerderwoordeboeke inhou, het die weg gebaan vir die verdere hantering van betekenisskakels in gespesialiseerde woorde-boeke vir leerders (GWL's). Deur rekenaarverwante leksikale items as voorbeelde te gebruik, word
Article
Full-text available
Il s’agit de rappeler les principales caractéristiques du dictionnaire qui nous servira de corpus de travail. Après quoi, nous traiterons des réseaux conceptuels et des réseaux phraséologiques dans le dictionnaire choisi. Comme il est question d’un dictionnaire de sciences de gestion dont l’objectif est de fournir la trame conceptuelle des domaines en arabe, nous vérifierons si les trames réticulaires et phraséologiques élaborées dans la langue d’origine sont transférées dans la langue d’arrivée.
Conference Paper
Full-text available
The Bible has always attracted the interest of scholars from different fields, specifically, Jesus’ paths taken out from the writings are at the centre of an ongoing discussion in the literature. In this short paper, we study the relationship between Jesus and other biblical characters and places via a text mining network-based approach. from the World english Bible, we take the Gospel of Matthew, Mark, luke, John, and Acts of the Apostles and analyse the resulting corpus. Namely, people and places’ names are collected using a poStagger on the corpus and manually checked for finalising the pre-processing. Then, the selected names’ co occurrences are searched in each verse. It results in an adjacency matrix containing the frequencies of names’ co-occurrences and a set of nodes’ attributes. The strength of links between a couple of names is defined as the sum of times that the couple appears in all verses. Such a network is used to explore communities of names around Jesus. To do so, we use the louvain community detection method for each subnetwork referring to every book.
Article
Full-text available
According to Frame-Based Terminology (Faber et al. 2005, 2006, 2007), a crucial issue in terminology management is how specialized concepts should be represented within the knowledge structure of a scientific domain. This paper proposes a model of specialized concept representation based on conceptual frames (Faber et al. 2006, 2007; Faber 2011) and blends (Fauconnier 1999; Fauconnier and Turner 1998, 2002). Although frame-blending has been documented in general language (cf. Coulson 2005), it has not as yet been studied in specialized language. In this paper, we show how it can be applied to harmful algal bloom in the field of marine biology.
Article
Full-text available
In linguistics and terminology, few are the works that describe, in an integrated manner, terminological units and words. Neither are there models explicitly including, in their lexical representation, specialized meanings. We start from the hypothesis which states that the lexical unit (LU) is not per se either word or term, but a lexical form associated to all information relative to the different modules of the grammar in which it participates (Cabré 1999d, 2000). According to the communicational situation in which it is used, it either activates or not a specialized value. These values maintain a polysemic relationship with each other. The goals of this paper are to establish some elements that allow for an empirical foundation for the stated hypothesis on the LU, and to describe the kinds of features that compose semantic information and the configurations activated in specialized meanings.
Article
This article provides an overview of what can happen to a term when it transcends the boundaries of expert language and starts to be used by the general public - a process we call de-terminologization. First, we analyze the semantic, grammatical, and pragmatic changes that terms undergo when they start to be used by laypersons. Second, we discuss the reasons why de-terminologization occurs. Third, we examine its lexical impact on general and specialized language. Finally, we discuss the practical implications of de-terminologization for the day-to-day work of a terminographer.
Article
Once the nomenclatures of general dictionaries have reached a certain dimension, all the ‘new’ words that are added to them are specialized, and most of those are scientific and technical. Then lexicographers come up against difficulties of a different nature altogether, even though the limit between the various kinds of words is not precise: the problems of polysemy, of sense division, of syntax and of co-occurrence, associated with the more common words, become less and less acute. But the selection of words becomes more difficult, and the definition of specialized words requires the help of specialists of each domain. Thus, scientific and technical words constitute a ‘threat’ to the homogeneity of the macrostructure and of the microstructure of general dictionaries.
Dérivations sémantiques et collocations dans le DiCo/LAF. Langue française Numéro spécial sur la collocation Collocations, corpus, dictionnaires
  • Mel 'ˇ Cuk I Polguère A
MEL' ˇ CUK I. & POLGUÈRE A. (2006). Dérivations sémantiques et collocations dans le DiCo/LAF. Langue française, 150, 66-83. Numéro spécial sur la collocation Collocations, corpus, dictionnaires, sous la direction de P. Blumenthal et F. J. Hausmann.