Topics (22) View all

Skills (25)

Research experience

    • Jan 2010–
      Dec 2013
      Research: Université de Strasbourg
      Université de Strasbourg
      Strasbourg · France
  • Mar 2012–
    present
    Research: Consortium Corpus écrit (IR-Corpus)
    Université de Strasbourg · Linguistique, Langue, Parole (LiLPa)
    France · Strasbourg
    groupe 8 "Annotation de plus haut niveau : syntaxe, sémantique, référence, annotations collaboratives" (http://www.corpus-ir.fr/index.php?page=corpus-ecrits)
  • Oct 2011–
    present
    Teaching: ATER (Attachée Temporaire d'Enseignement et de Recherche)
    Université de Strasbourg · Département d'informatique, UFR LSHA (Lettres et Sciences Humaines Appliquées) · Linguistique, Langues, Parole (LiLPa)
    France · Strasbourg
    - Electronic resources in humanities (corpora, web portal, dictionary...) - advanced use of Open Office Library (Writer, Base) - Web research - Web site creation
  • Jul 2011–
    present
    Research: MC4 : "Modélisation Contrastive et Computationnelle des Chaînes de Coréférence"
    Université de Strasbourg · Linguistique, Langues, Parole (LiLPa)
    France · Strasbourg
    Study of reference chains and repetition in non narrative corpora : public reports, european laws (http://www.cnrs.fr/inshs/recherche/reference.htm)
  • Jun 2011–
    present
    Research: Colloque International Jeunes Chercheurs " Les classifications en Linguistique : problèmes, méthodologies, enjeux"
    Université de Strasbourg · Faculté de Lettres · Linguistique, Langues, Parole (LiLPa)
    France · Strasbourg
    Colloque organisé par les doctorants de l'équipe LiLPa, UR 1339 (Université de Strasbourg), les doctorants de l'Institut de Philologie Romane (Université de Bochum, Allemagne) et l’unité mixte de recherche ATILF (Université Nancy 2).
  • Jun 2011–
    present
    Research: Procope N-Huma « Les noms d’entités humaines entre lexique et grammaire »
    Université de Strasbourg · Linguistique, Langues, Parole (LiLPa)
    France · Strasbourg
    http://lilpa.misha.fr/sites/8/File/projet_procop201113052010.pdf
  • Nov 2009–
    May 2011
    Teaching: Vacataire d'enseignement (204 heures de TD)
    Université de Strasbourg · département d'informatique, UFR LSHA · Linguistique, Langues, Parole (LiLPa)
    France · Strasbourg
    - Advanced use of Microsoft Office 2003 - 2010 (Word, Excel, Access, Powerpoint) - Electronic resources for humanities - web site creation
  • Sep 2009–
    Jun 2011
    Research: « chaînes de coréférence », dans l’opération « Identification des Référents et Transitions Référentielles »
    Université de Strasbourg · Linguistique, Langues, Parole (LiLPa)
    France · Strasbourg
    http://www.lattice.cnrs.fr/Groupe-de-travail-chaines-de
  • Feb 2008–
    present
    Research: CLARIN : "CAP, une fonction lexicale hiérarchique liée aux noms propres"
    Université de Strasbourg · Linguistique, Langues, Parole (LiLPa)
    France · Strasbourg
    Etude multilingue des contextes des noms de fonction dans les corpus constitués. Mise en place de patrons pour identifier les noms propres de personne et d’organisation liés par des relations hiérarchiques. (http://lilpa.misha.fr/sites/8/File/clarin.pdf)

Education

  • Jan 2008
    University of Strasbourg
    PhD
    France · Strasbourg
  • Sep 2001–
    Jul 2007
    Aix-Marseille Université
    Master (research and professional), License
    France · Aix en Provence

Other

  • Languages
    french (native), english, italian, portuguese, spanish, romanian
  • Scientific Memberships
    ATALA
  • Other Interests
    plagiarism detection, associative activities

Publications (10) View all

  • Source
    Article: UNE ÉTUDE DE CORPUS POUR LA DÉTECTION AUTOMATIQUE DE THÈMES
    Laurence Longo, Amalia Todiraşcu
    [show abstract] [hide abstract]
    ABSTRACT: RÉSUMÉ Nous présentons un outil de détection automatique de thèmes, paramétrable selon le genre textuel des documents à traiter (rapports, articles de journal, fiches produits). Cet outil sera utilisé pour optimiser l'indexation et la recherche des documents dans une archive de documents internes à une organisation. Le système hybride de détection de thèmes que nous mettons en place combine des méthodes statistiques et linguistiques pour dégager les thèmes de chaque document. En particulier, pour la détection de thèmes, nous exploitons une catégorie spécifique de marqueurs de cohérence : les chaînes de référence. Dans cet article, nous présentons l'étude d'un corpus composé de divers genres textuels permettant de construire les ressources linguistiques nécessaires à l'identification automatique de ces chaînes de référence.
    revue électronique Texte et corpus. 01/2013; 4:143-155.
  • Source
    Conference Proceeding: Impact des genres sur la composition des chaînes de référence : le cas des faits divers
    Catherine Schnedecker, Laurence Longo
    Congrès Mondial de Linguistique Française (CMLF); 07/2012
  • Source
    Conference Proceeding: Chaînes de référence et genre textuel pour la détection automatique de thèmes
    Laurence Longo, Amalia Todirascu
    Journée ATALA; 05/2012
  • Source
    Chapter: RefGen: Identifying Reference Chains to Detect Topics
    Laurence Longo, Amalia Todirascu
    [show abstract] [hide abstract]
    ABSTRACT: In this paper, we present RefGen, the main module of a topic detection system used to improve a search engine by topic indexing. RefGen identifies reference chains and it uses genre specific properties of reference chains and (Ariel 1990)’s accessibility theory. RefGen checks several strong and weak constraints (lexical, morphosyntactic and semantic filters) to automatically identify coreference relations between referential expressions. We present the first results obtained by RefGen from a public reports corpus.
    01/2011: pages 27-40; , ISBN: 978-3-642-21383-0
  • Source
    Conference Proceeding: RefGen, outil d’identification automatique des chaînes de référence en français
    Laurence Longo, Amalia Todirascu
    [show abstract] [hide abstract]
    ABSTRACT: Nous présentons RefGen, un outil d’identification automatique des chaînes de référence (CR) en français. Les CR sont composées d'au moins trois expressions référentielles (Schnedecker, 1997). Développé dans un cadre industriel, RefGen est un prototype (développé en Perl et en Java) pouvant être intégré dans un système de détection automatique de thèmes. L'architecture de RefGen est modulaire et composée d’un étiquetage fin, d’un module d'annotation des expressions référentielles (groupes nominaux simples et complexes, entités nommées) et d’un module de calcul de la référence. RefGen utilise aussi une série de paramètres spécifiques au genre textuel pour calculer les relations de référence (distance entre les maillons d’une CR, nombre de maillons d’une CR, etc).
    TALN (demo session), Montpellier; 01/2011

About

I'm working on a tool for automatic topic detection to improve search engine documents categorization. The method uses statistical algorithm to segment texts in topically homogeneous segments and linguistic markers as framing adverbials, anaphora and coreference chains to detect topics in various genre (newspapers, public reports, European laws, editorials, novel).

Following (28) See all

Followers (28) See all