Article

Thésaurus Larousse. Des idées aux mots, des mots aux idées

http://lst-iiep.iiep-unesco.org/cgi-bin/wwwi32.exe/[in=epidoc1.in]/?t2000=001525/(100) 01/1991;

ABSTRACT

Index pp. 631-1146

0 Followers
 · 
10 Reads
  • Source
    • "A Semantic vector is built by projecting one or many terms on a close space vector of 873 concepts. Concepts are taken out of an ontology defined in the French Larousse Thesaurus [Larousse, 1992], a Roget-based dictionary indexing all language entries with one or several items taken from the 873 concepts ontology. For instance, the French verb " brandir " (to brandish) is associated with the concept of " agitation " and the noun " drapeau " (flag) is indexed by the concepts of " paix (peace), armée (army), funérailles (funerals), signe (sign) " , and " cirque (circus) " . "
    [Show abstract] [Hide abstract]
    ABSTRACT: In this paper, different approaches of building and expanding conceptual classes are presented. Classes are built using syntactic and semantic information provided by a corpus. Then, expansion is addressed by two different methods. The first method deals with the objects of syntactic relations found in the corpus. Relations between classes are thus designed. They are called induced relations. Then we use objects of induced syntactic relations (called complementary objects) to expand conceptual classes. We propose an automatic experimental protocol to measure the relevance of the provided concepts. The protocol helps alleviating the judgment effort of a human expert. The second method expands concepts with more global terms by using Web knowledge associated with the existing concepts. Both methods are evaluated and mixed in order to provide the most reliable technique in expanding conceptual classes.
    Full-text · Article · Oct 2010
  • Source
    • "For English, the lexical vector space dimension was originally 1043: Its most up-to-date version has shrank this number down to 1000. For French, the language with which we chiefly work, lexicologists have defined a family of 873 concepts, hierarchised in four levels (Larousse, 1992). This leads to a space which dimension is 873. "
    [Show abstract] [Hide abstract]
    ABSTRACT: This paper presents a study in text classification through semantic and syntactic natural language processing. The authors have used a parser for French, SYGFRAN, and applied it to a real project of press articles classification. The results of this research on a corpus of 4, 843 texts containing more than 76, 000 sentences are described. Classification into 37 categories has been obtained through meaning discrimination by semantic filtering techniques, explained in the document.
    Full-text · Article · Oct 2007
  • Source
    [Show abstract] [Hide abstract]
    ABSTRACT: Utilisée à la fois pour l'apprentissage et l'exploitation des vecteurs conceptuels, l'analyse sémantique de texte est centrale à nos recherches. L'amélioration qualitative du processus d'analyse entraîne celle des vecteurs. En retour, cette meilleure pertinence a un effet positif sur l'analyse. Parmi les différentes voies à explorer pour obtenir ce cercle vertueux, l'une des pistes les plus intéressantes semble être la découverte puis l'exploitation des relations lexicales entre les mots du texte. Ces relations, parmi lesquelles la synonymie, l'antonymie, l'hyperonymie, la bonification ou l'intensification, sont modélisables sous la forme de fonctions lexicales. Énoncées essentiellement dans un cadre de production par Igor Mel'čuk, nous cherchons, dans cette thèse, à les adapter à un cadre d'analyse. Nous introduisons ici deux classes de Fonctions Lexicales d'Analyse. Les premières, les FLA de construction permettent de fabriquer un vecteur conceptuel à partir des informations lexicales disponibles. Les secondes, les FLA d'évaluation permettent de mesurer la pertinence d'une relation lexicale entre plusieurs termes. Ces dernières sont modélisables grâce à des informations thématiques (vecteurs conceptuels) et/ou grâce à des informations lexicales (relations symboliques entre les objets lexicaux). Les informations lexicales sont issues de la base lexicale sémantique dont nous introduisons l'architecture à trois niveaux d'objets lexicaux (item lexical, acception, lexie). Elles sont matérialisées sous la forme de Relations Lexicales Valuées qui traduisent la probabilité d'existence de la relation entre les objets. L'utilité de ces relations a pu être mis en évidence pour l'analyse sémantique grâce à l'utilisation du paradigme des algorithmes à fourmis. Le modèle introduit dans cette thèse, utilise à la fois les vecteurs conceptuels et les relations du réseau lexical pour résoudre une partie des problèmes posés lors d'une analyse sémantique. Tous nos outils ont été implémentés en Java. Ils reposent sur Blexisma (Base LEXIcale Sémantique Multi-Agent) une architecture multi-agent élaborée au cours de cette thèse dont l'objectif est d'intégrer tout élément lui permettant de créer, d'améliorer et d'exploiter une ou plusieurs Bases Lexicales Sémantiques. Les expériences menées ont montré la faisabilité de cette approche, sa pertinence en termes d'amélioration globale de l'analyse et ouvert des perspectives de recherches fort intéressantes.
    Full-text · Article ·
Show more