Denis Vigier’s research while affiliated with Lumière University Lyon 2 and other places

What is this page?


This page lists works of an author who doesn't have a ResearchGate profile or hasn't added the works to their profile yet. It is automatically generated from public (personal) data to further our legitimate goal of comprehensive and accurate scientific recordkeeping. If you are this author and want this page removed, please let us know.

Publications (11)


Vers l’automatisation du classement des séquences candidates à la catégorie des prépositions complexes en français
  • Article
  • Full-text available

June 2024

·

30 Reads

SHS Web of Conferences

·

Denis Vigier

·

La présente contribution propose de nouvelles avancées dans le but de relever l’un des défis majeurs posé par la classe des prépositions complexes à la communauté des chercheurs en linguistique : la possibilité d’en dresser une liste. En vue du développement d’une méthode entièrement automatisée pour extraire des candidats appartenant à cette classe, nous proposons une étude expérimentale où sont croisées deux approches pour caractériser les prépositions complexes : d’une part, l’application d’une grille multicritère proposée par Vigier & Kahng (2022) (suite à Stosic & Fagard (2019)) qui nécessite de combiner des tests manuels avec des mesures statistiques extraites de corpus ; d’autre part l’extraction automatisée d’une série d’indices textométriques, dont certains sont originaux, comme le taux d’insertion ou une mesure de dispersion composite. Nos observations montrent que sur une liste de candidats comportant de nombreux intrus, quelques indices peuvent se révéler discriminants, tels que le taux d’insertion, la dispersion par année ou par fichier, ainsi que, dans une moindre mesure, des mesures d’association statistique comme le t-score et log rapport de vraisemblance. Mais nous montrons également, en étudiant une liste de candidats construits avec la préposition « en », que ces observations sont à nuancer et dépendent notamment du comportement syntaxique des prépositions mises en jeu.

Download


C’est le cas de et prendre le cas de dans l’opération d’exemplification

May 2024

·

9 Reads

Langue française

Cet article a pour objectif d’analyser les emplois c’est le cas de et prendre le cas de dans leur fonction de marqueur de la relation d’exemplification. Pour ce faire, une première partie est consacrée à l’exploration lexicographique et cooccurrentielle de cas et exemple , afin d’identifier des éléments permettant de caractériser les emplois d’exemplification. L’examen de c’est le cas de montre que l’expression n’est pas toujours exemplifiante (elle peut être également généralisante), et si prendre le cas de est un marqueur d’exemplification, celle-ci peut avoir pour objet la non-observation de la propriété générale en jeu dans l’énoncé.


Identification of Writing Preferences in Wikipedia

February 2024

·

9 Reads

Studies in Computational Intelligence

In this paper, we investigate whether there is a standardized writing composition for articles in Wikipedia and, if so, what it entails. By employing a Neural Gas approximation to the topology of our dataset, we generate a graph that represents various prevalent textual compositions adopted by the texts in our dataset. Subsequently, we examine significantly attractive regions within our graph by tracking the evolution of articles over time. Our observations reveal the coexistence of different stable compositions and the emergence and disappearance of certain unstable compositions over time.



Les articles de géographie dans le Dictionnaire Universel de Trévoux et l’Encyclopédie de Diderot et d’Alembert

June 2022

·

23 Reads

·

2 Citations

Langue française

Denis Vigier

·

·

Isabelle Lefort

·

[...]

·

Katherine Mac Donough

Cette contribution traite des articles de géographie dans deux œuvres majeures de diffusion des savoirs au xviii e siècle : le Dictionnaire Universel de Trévoux et l’ Encyclopédie de Diderot et d’Alembert. L’étude est conduite sur un corpus échantillonné de cent huit articles présents dans les deux nomenclatures et traitant de la France. Les caractéristiques discursives les plus saillantes de ce corpus sont d’abord isolées pour chaque œuvre, puis comparées entre elles et avec celles observables dans plusieurs dictionnaires plus anciens qui furent souvent utilisés comme sources par les auteurs.


Fig. 6. Courbes des valeurs t-score calculées pour quatre séquences autres qu'à noyau nominal candidates à la catégorie PrepComp Si les expressions en ce qui concerne, en dehors de et hors de présentent des valeurs qui font d'elles de bonnes candidates pour la catégorie des PrepComp (note 0/4), la séquence au plus profond de apparaît moins prototypique (note 2/4).
Catégoriser les prépositions complexes en français

May 2022

·

49 Reads

·

1 Citation

SHS Web of Conferences

Cet article propose une analyse critique de la grille multicritères proposée par Stosic & Fagard (2019) et destinée à guider la catégorisation des prépositions complexes du français en permettant de positionner les séquences candidates à cette sous-classe suivant un continuum entre les PrepComp les plus typiques ( à l’instar de, à l’égard de, en ce qui concerne , …) et les agencements libres. L’objectif, après avoir discuté et amendé certains des critères syntaxiques, sémantiques, fréquentiels et statistiques présentés par les auteurs, est de formuler une grille alternative dont on montre que le pouvoir discriminant est plus élevé.



Fig. 1. Schéma du processus d'amélioration de l'annotation des EN dans EDDA.
Fig. 2. Annotation au format XML-TEI simplifié produit par PERDIDO.
Fig. 3. Transducteur implémenté avec Unitex pour la reconnaissance du motif 1
Fig. 4. Transducteur implémenté avec Unitex pour la reconnaissance des motifs 2 à 5
Classification des entités nommées dans l'Encyclopédie ou dictionnaire raisonné des sciences des arts et des métiers par une société de gens de lettres (1751-1772)

July 2020

·

512 Reads

·

2 Citations

Nous présentons la méthode que nous avons suivie pour améliorer notre annotation automatique des entités nommées dans l’Encyclopédie de Diderot et d’Alembert. L’outil d’annotation sémantique PERDIDO que nous utilisons a été initialement développé pour l’annotation d’informations géographiques et la reconstruction d’itinéraire. Nous proposons d’y implémenter de nouvelles règles élaborées manuellement à partir d’une étude des cotextes co-occurrentiels des noms propres du corpus accomplie au moyen d’une plateforme automatique d’exploration et de calcul.


Fig. 1. Schéma du processus d'amélioration de l'annotation des EN dans EDDA.
Fig. 2. Annotation au format XML-TEI simplifié produit par PERDIDO.
Fig. 3. Transducteur implémenté avec Unitex pour la reconnaissance du motif 1
Classification des entités nommées dans l’Encyclopédie ou dictionnaire raisonné des sciences des arts et des métiers par une société de gens de lettres (1751-1772)

January 2020

·

225 Reads

·

3 Citations

SHS Web of Conferences

Nous présentons la méthode que nous avons suivie pour améliorer notre annotation automatique des entités nommées dans l’Encyclopédie de Diderot et d’Alembert. L’outil d’annotation sémantique PERDIDO que nous utilisons a été initialement développé pour l’annotation d’informations géographiques et la reconstruction d’itinéraire. Nous proposons d’y implémenter de nouvelles règles élaborées manuellement à partir d’une étude des cotextes co-occurrentiels des noms propres du corpus accomplie au moyen d’une plateforme automatique d’exploration et de calcul.


Citations (2)


... They did not link the strings to unique identifiers such as those in Wikidata. Vigier et al. (2022) sampled 108 geographical entries of the Encyclopédie and compared them manually to equivalent entries from another French encyclopedia of the same time: The Trévoux dictionary. They identified the sources the authors used to write their entries and outlined the disparate structure of the entries in the Encyclopédie. ...

Reference:

Linking Named Entities in Diderot's \textit{Encyclop\'edie} to Wikidata
Les articles de géographie dans le Dictionnaire Universel de Trévoux et l’Encyclopédie de Diderot et d’Alembert
  • Citing Article
  • June 2022

Langue française

... Some researchers have also investigated TD issues from historical datasets by linking historical geospatial information in text to real-world locations. The datasets for these researches include digitized news articles in Dutch and German published between the years of 1800 and 1995 [46], an eighteenth-century French encyclopedia [47], and a historical British newspaper as well as GB1900 which is a complete gazetteer of Ordnance Survey maps of Great Britain within 1888-1914 [48]. ...

Toponym disambiguation in historical documents using network analysis of qualitative relationships