Sabine Ploux

Sungkyunkwan University, Seoul, Seoul, South Korea

Are you Sabine Ploux?

Claim your profile

Publications (5)2.12 Total impact

  • Source
    Article: Du corpus au dictionnaire
    Bernard Jacquemin, Sabine Ploux
    [show abstract] [hide abstract]
    ABSTRACT: In this article, we propose an automatic process to build multi-lingual lexico-semantic resources. The goal of these resources is to browse semantically textual information contained in texts of different languages. This method uses a mathematical model called Atlas s\'emantiques in order to represent the different senses of each word. It uses the linguistic relations between words to create graphs that are projected into a semantic space. These projections constitute semantic maps that denote the sense trends of each given word. This model is fed with syntactic relations between words extracted from a corpus. Therefore, the lexico-semantic resource produced describes all the words and all their meanings observed in the corpus. The sense trends are expressed by syntactic contexts, typical for a given meaning. The link between each sense trend and the utterances used to build the sense trend are also stored in an index. Thus all the instances of a word in a particular sense are linked and can be browsed easily. And by using several corpora of different languages, several resources are built that correspond with each other through languages. It makes it possible to browse information through languages thanks to syntactic contexts translations (even if some of them are partial).
    02/2009;
  • Article: Testing the cognitive relevance of a geometric model on a word association task: a comparison of humans, ACOM, and LSA.
    [show abstract] [hide abstract]
    ABSTRACT: The general aim of this study is to validate the cognitive relevance of the geometric model used in the semantic atlases (SA). With this goal in mind, we compare the results obtained by the automatic contexonym organizing model (ACOM)--an SA-derived model for word sense representation based on contextual links--with human subjects' responses on a word association task. We begin by positioning the geometric paradigm with respect to the hierarchical paradigm (WordNet) and the vector paradigm (latent semantic analysis [LSA] and the hyperspace analogue to language model). Then we compare ACOM's responses with Hirsh and Tree's (2001) word association norms based on the responses of two groups of subjects. The results showed that words associated by 50% or more of the Hirsh and Tree subjects were also proposed by ACOM (e.g., 71% of the words in the norms were also given by ACOM). Finally, we compare ACOM and LSA on the basis of the same association norms. The results indicate better performance for the geometric model.
    Behavior Research Methods 12/2008; 40(4):926-34. · 2.12 Impact Factor
  • Source
    Article: Corpus sp\'ecialis\'e et ressource de sp\'ecialit\'e
    Bernard Jacquemin, Sabine Ploux
    [show abstract] [hide abstract]
    ABSTRACT: "Semantic Atlas" is a mathematic and statistic model to visualise word senses according to relations between words. The model, that has been applied to proximity relations from a corpus, has shown its ability to distinguish word senses as the corpus' contributors comprehend them. We propose to use the model and a specialised corpus in order to create automatically a specialised dictionary relative to the corpus' domain. A morpho-syntactic analysis performed on the corpus makes it possible to create the dictionary from syntactic relations between lexical units. The semantic resource can be used to navigate semantically - and not only lexically - through the corpus, to create classical dictionaries or for diachronic studies of the language.
    02/2008;
  • Source
    Article: Corpus spécialisé et ressource de spécialité: l'information forme le sens
    Bernard Jacquemin, Sabine Ploux
    [show abstract] [hide abstract]
    ABSTRACT: Résumé Les Atlas sémantiques sont unmo ele mathématique et statistique de représentation vi-suelle de la sémantique lexicale basé sur l'examen des relations entre les mots. Une ap-plication de cemo elè a des relations de proximité contextuelle dans un corpus a permis de montrer que lemo elé etait capable de dénoter le sens des unités lexicales tel qu'il est perçu par les rédacteurs du corpus. Nous nous appuyons sur ce constat pour proposer d'-exploiter lemo ele afin de construire automatiquement un dictionnaire spécialisé dans un domaine précis par l'analyse d'un corpus représentatif de ce domaine. Tout en conservant le mo ele, nous modifions son application en faisant intervenir une analyse morphologique et syntaxique pou etablir la réalité des unités lexicales ainsi que les liens entre elles, qui sont es lors de nature syntaxique. Nous proposon egalement d'utiliser la ressource produite pour naviguer dans le corpus utilisé considéré comme une base d'information en suivant le sens plutôt que le mot. Enfin, nous proposons d'exploiter cette approche pour aide a la réalisation de dictionnaires plus classiques ou pou etudier la langue en diachronie. Mots-clefs : Corpus spécialisé, dictionnaire spécialisé, gestion de l'information, clique, analyse factorielle des correspondances, sémantique lexicale, approche mixte, linguistique, statistique.
    02/2008;
  • Article: Corpus spécialisé et ressource de spécialité
    Bernard Jacquemin, Sabine Ploux
    [show abstract] [hide abstract]
    ABSTRACT: Les Atlas sémantiques sont un modèle mathématique et statistique de représentation visuelle de la sémantique lexicale basé sur l’examen des relations entre les mots. Une application de ce modèle à des relations de proximité contextuelle dans un corpus a permis de montrer que le modèle était capable de dénoter le sens des unités lexicales tel qu’il est perçu par les rédacteurs du corpus. Nous nous appuyons sur ce constat pour proposer d’exploiter le modèle afin de construire automatiquement un dictionnaire spécialisé dans un domaine précis par l’analyse d’un corpus représentatif de ce domaine. Tout en conservant le modèle, nous modifions son application en faisant intervenir une analyse morphologique et syntaxique pour établir la réalité des unités lexicales ainsi que les liens entre elles, qui sont dès lors de nature syntaxique. Nous proposons également d’utiliser la ressource produite pour naviguer dans le corpus utilisé considéré comme une base d’information en suivant le sens plutôt que le mot. Enfin, nous proposons d’exploiter cette approche pour aider à la réalisation de dictionnaires plus classiques ou pour étudier la langue en diachronie.

Top Journals

Institutions

  • 2008
    • Sungkyunkwan University
      Seoul, Seoul, South Korea
    • Université Claude Bernard Lyon 1
      Villeurbanne, Rhone-Alpes, France