Définition d'un agent conversationnel assistant d'applications internet à partir d'un corpus de requêtes.


RÉSUMÉ. Les Agents Conversationnels Assistants sont une sous-classe des Agents Conversationnels Animés, dédiée à la Fonction d'Assistance pour les applications et services du grand public. Les nouvelles applications Internet sont un domaine particulièrement intéressant pour étudier les agents assistants pour le grand public. Nous avons donc développé un logiciel orienté Web, appelé le « toolkit DIVA », où la Fonction d'Assistance est une question clé et où la Langue Naturelle joue un rôle essentiel. C'est la raison pour laquelle le toolkit DIVA repose sur une chaîne de Traitement Automatique de la Langue Naturelle (TALN) qui est chargée de traiter des requêtes d'assistance. Dans ce contexte, les outils de TALN ainsi que les outils d'assistance devraient être simples et faciles à déployer pour chaque nouvelle application Web assistée par un agent DIVA. Notre proposition repose sur le recueil d'un corpus de requêtes d'assistance qui permet d'une part de circonscrire le domaine de langue concerné et d'autre part d'éliciter les principaux phénomènes linguistiques qui occurrent effectivement. Sur cette base, nous avons défini une architecture de chaîne de traitement qui a été implémentée dans le toolkit DIVA ; elle a ensuite été mise à l'épreuve sur plusieurs applications test. ABSTRACT. Assisting Conversational Agents are Embodied Conversational Agents dedicated to the Function of Assistance for applications and services to the general public. Assisting agents for the general public are more and more required on the Internet-based new applications. We have developed a web-based framework to experiment with assisting agents, called the DIVA toolkit, where the Function of Assistance is a key issue, and the Natural Language modality is a primary concern. This is why the DIVA toolkit is based on a Natural Language Processing chain (NLP-chain) handling the users' textual help requests. In this context, both the NLP-chain tools and the assistance tools should be simple and easy to deploy for each new Web application assisted by the DIVA agents. Our proposition relies on the collection of a corpus of assisting requests which firstly enables us to circumscribe the domain of assistance and secondly makes it possible to exhibit the main occurring linguistic phenomena. On this basis, the architecture of a NLP-chain has been defined and implemented in the DIVA toolkit; then it has been put to test on several small applications.
