PresentationPDF Available

Modelacion de actos de dialogo a partir de etiquetaciones de partes del habla de dialogos practicos en español de Mexico

Authors:

Abstract

Se presenta una metodologia para modelar actos de dialogo en lenguaje hablado, con posibilidades de ser implementada en software para manejar la comunicacion humano-computadora o humano-robot.
Modelación de Actos de
Diálogo a partir de
Etiquetaciones de Partes del
Habla de Diálogos Prácticos
en Español de México
Sergio R. Coria y Luis A. Pineda
Marzo, 2010
Resumen
Se presenta una metodología
desarrollada por los autores para
modelar actos de diálogo en lenguaje
hablado, con posibilidades de ser
implementada en software para manejar
la comunicación humano-computadora o
humano-robot.
2
Trabajo presentado en el 1st. Mexican
Workshop on Pattern Recognition
(MWPR) , Nov. 2009
IPN-CINVESTAV, Guadalajara, Jal.
Publicado en el journal arbitrado
Research in Computing Science (ISSN:
1870-4079). México, 2009
3
Contenido
1. Introducción
2. Acto de diálogo
3. Partes del habla
4. Metodología de modelación
5. Uso de datos empíricos
6. Resultados de un ejemplo
7. Conclusiones y trabajo futuro
4
Introducción
En Inteligencia Artificial, el área del
Procesamiento del Lenguaje Natural intenta
analizar y modelar el lenguaje escrito y hablado
5
Introducción
En Inteligencia Artificial, el área del
Procesamiento del Lenguaje Natural intenta
analizar y modelar el lenguaje escrito y hablado
La investigación en lenguaje hablado incluye:
Reconocimiento automático del habla (RAH)
Reconocimiento del hablante
Sistemas de administración de diálogo (SAD)
6
Introducción
SAD: software para controlar la comunicación
humano-computadora (o humano-robot)
mediante lenguaje hablado en conversaciones
orientadas a tareas
7
Introducción
SAD: software para controlar la comunicación
humano-computadora (o humano-robot)
mediante lenguaje hablado en conversaciones
orientadas a tareas
Conversación orientada a tareas: aquella en
que los hablantes colaboran para lograr una
meta común. Ej. comprar una hamburguesa
8
Introducción
SAD: software para controlar la comunicación
humano-computadora (o humano-robot)
mediante lenguaje hablado en conversaciones
orientadas a tareas
Conversación orientada a tareas: aquella en
que los hablantes colaboran para lograr una
meta común. Ej. comprar una hamburguesa
Los SAD generalmente se programan usando
modelos de diálogo hablado 9
Introducción
Ver video de un diálogo orientado a
tareas
10
1. Acto de diálogo (AD)
Acto de habla: unidad mínima de
comunicación lingüística (Searle),
generalmente emitida como enunciado
11
1. Acto de diálogo (AD)
Acto de habla: unidad mínima de
comunicación lingüística (Searle),
generalmente emitida como enunciado
AD: caracterización de un acto de habla
en el contexto de una conversación
orientada a tareas
12
1. Acto de diálogo (AD)
Los tipos de AD pueden clasificarse
usando el esquema DIME-DAMSL
(Pineda et al., 2006)
13
1. Acto de diálogo (AD)
Esquema DIME-DAMSL (Pineda et al.,
2006)
Los AD ocurren en dos planos de
comunicación:
Obligaciones (obligations)
14
1. Acto de diálogo (AD)
Esquema DIME-DAMSL (Pineda et al.,
2006)
Los AD ocurren en dos planos de
comunicación:
Obligaciones (obligations)
y
Piso común (common ground)
15
1. Acto de diálogo (AD)
Esquema DIME-DAMSL (Pineda et al.,
2006)
AD de obligations: el hablante crea
una obligación sobre sí mismo o en su
interlocutor para realizar una acción,
ya sea verbal o de otra modalidad.
Ejemplos: prometer algo, preguntar
16
1. Acto de diálogo (AD)
Esquema DIME-DAMSL (Pineda et al.,
2006)
AD de common ground: establecen o
re-establecen el conocimiento o las
suposiciones compartidos entre los
interlocutores. También sirven para
administrar el canal comunicativo
Ejemplos: afirmar, aceptar, etc.
17
1. Acto de diálogo (AD)
18
OBLIGATIONS
info-request answer
action-dir commit offer
info-request_answer
action-dir_answer
info-request_offer
action-dir_offer
Tipos de AD en DIME-DAMSL
1. Acto de diálogo (AD)
19
COMMON GROUND
accept affirm reaffirm
open-option hold accept-part
reject reject-part maybe ack
repeat-rephrase
non-understanding-signal
conv-open conv-close
Tipos de AD en DIME-DAMSL
2. Partes del habla (POS)
PH: Part of Speech (POS)
20
Moreno and Pineda, 2006
2. Partes del habla (POS)
PH: Part of Speech (POS)
PH: caracterización de una palabra
de acuerdo a la función que realiza
en un enunciado
21
Moreno and Pineda, 2006
2. Partes del habla (POS)
Etiquetas (símbolos, tags) de las POS
22
Tag
POS Tag POS
Tag
POS
Tag
POS
A
Adjetivo
AD
Adjetivo
demostrativo
C
Conjunción
N
Sustant
.
P
Pronom
-
bre
PC
Pronombre
clítico
PI
Pronombre
interrog
.
PR
Pron
.
relativo
R
Adverbio
RA
Adverbio de
aceptación
RI
Adverbio
interrog
.
RN
Adv
. de
negación
RR
Adverbio
relativo
S
Preposición
TD
Artículo
determinad
TI
Artículo
indeterm.
V
Verbo
VAM
Verbo auxiliar
modal
VC
Verbo con
clítico
Moreno and Pineda, 2006
2. Partes del habla (POS)
Estructura POS: concatenación de
etiquetas POS correspondientes a las
palabras de un enunciado particular. Se
usa un símbolo especial (p. ej. guión
bajo) como separador de las etiquetas
23
2. Partes del habla (POS)
Estructura POS: concatenación de
etiquetas POS correspondientes a las
palabras de un enunciado particular. Se
usa un símbolo especial (p. ej. guión
bajo) como separador de las etiquetas
Ejemplos de estructuras POS:
R_V_R RI_V_C_PC_V V_TI_N
RI_V_R PI_N_V_PD V_C_V_TI_N
24
3. La metodología propuesta
1. Crear estructuras POS a partir de secuencias
de etiquetas POS
25
3. La metodología propuesta
1. Crear estructuras POS a partir de secuencias
de etiquetas POS
2. Análisis de Pareto de las estructuras POS
26
3. La metodología propuesta
1. Crear estructuras POS a partir de secuencias
de etiquetas POS
2. Análisis de Pareto de las estructuras POS
3. Análisis estadístico de tipos de AD para cada
una de las estructuras POS más frecuentes
en obligations y en common ground
27
3. La metodología propuesta
1. Crear estructuras POS a partir de secuencias
de etiquetas POS
2. Análisis de Pareto de las estructuras POS
3. Análisis estadístico de tipos de AD para cada
una de las estructuras POS más frecuentes
en obligations y en common ground
4. Análisis estadístico de las estructuras POS
más frecuentes para cada tipo de AD
28
3. La metodología propuesta
1. Crear estructuras POS a partir de secuencias
de etiquetas POS
2. Análisis de Pareto de las estructuras POS
3. Análisis estadístico de tipos de AD para cada
una de las estructuras POS más frecuentes
en obligations y en common ground
4. Análisis estadístico de las estructuras POS
más frecuentes para cada tipo de AD
5. Implementación de dos modelos para
reconocimiento de AD: uno para obligations y
uno para common ground 29
4. Uso de datos empíricos
El Corpus DIME (Villaseñor et al., 2001)
es el recurso empírico usado para ilustrar
esta metodología
30
4. Uso de datos empíricos
El Corpus DIME (Villaseñor et al., 2001)
es el recurso empírico usado para ilustrar
esta metodología
26 videos de pantalla y audios de
diálogos prácticos de 2 hablantes c/uno
31
4. Uso de datos empíricos
El Corpus DIME (Villaseñor et al., 2001)
es el recurso empírico usado para ilustrar
esta metodología
26 videos de pantalla y audios de
diálogos prácticos de 2 hablantes c/uno
En cada diálogo: un hablante realiza el rol
de Sistema, el otro hablante el de Usuario
32
4. Uso de datos empíricos
El Corpus DIME (Villaseñor et al., 2001)
es el recurso empírico usado para ilustrar
esta metodología
26 videos de pantalla y audios de
diálogos prácticos de 2 hablantes c/uno
En cada diálogo: un hablante realiza el rol
de Sistema, el otro hablante el de Usuario
Muestra aleatoria para análisis:
851 enunciados de 12 diálogos
33
5. Resultados de un ejemplo
34
Estruct. POS
%
(umbral=0.6
%)
Acum.
%
RA
20.0
20.0
R_V_R
13.5
33.5
R
2.4
35.8
PD
1.6
37.5
RN
1.5
39.0
RI_V_C_PC_V
1.1
40.1
V_TI_N
0.8
40.9
RI_V_R
0.7
41.6
Otras estructs
.
(c/
una <= 0.6%)
58.4
100.0
Total
Estructuras POS y sus frecuencias en el conjunto de datos
5. Resultados de un ejemplo
35
Estruct. POS
% del
dataset
(umbral
=0.6)
Tag de
Obligations
% de
estructura
POS
(umbral
=30.0)
RA
20.0
answer
52.4
Otras
47.6
R_V_R
13.5
info-request
82.6
Otras
17.4
R
2.4
no-tag
40.0
answer
35.0
Otras
25.0
PD
1.6
info-request
71.4
Otras
28.6
answer
53.8
RN
1.5
no-tag
30.8
Otras
15.4
RI_V_C_PC_V
1.1
info-request
100.0
V_TI_N
0.8
no-tag
42.9
Otras
57.1
RI_V_R
0.7
info-request
100.0
Otras
estructs.
(c/una<=
0.6%)
58.4
Etiquetas de Obligations de las estructuras POS más frecuentes
5. Resultados de un ejemplo
36
Estruct.POS
%del dataset
(umbral=0.6)
Tag de
Common ground
% de
(umbral
RA
20.0
accept
Otras
R_V_R
13.5
no-tag
Otras
R
2.4
accept
Otras
PD
1.6
hold_repeat-rephr
Otras
RN
1.5
reject
Otras
RI_V_C_PC_V
1.1
no-tag
accept
Otras
V_TI_N
0.8
no-tag
Otras
RI_V_R
0.7
****
Otras
estruct.
(c/una<=
0.6%)
58.4
Tags de Common ground de las estruct. POS más frecuentes
5. Resultados de un ejemplo
37
Tags de
Obligations
(simples o
compuestas
)
Frecuencia
%Estruct
.
POS más
frecuente
%
de
tags de
Obligs.
(umbral
=35.0)
info-request
262
30.8 R_V_R
36.3
Otras
63.7
answer
213
25.0 RA
41.8
Otras
58.2
commit
34
4.0 RA
91.2
Otras
8.8
info-
request_answer
16
1.9 R_V_R
43.8
Otras
56.2
Estructs. POS más frecuentes para AD de Obligations
6. Conclusiones y trabajo futuro
Se propuso una metodología para modelar
actos de diálogo en lenguaje hablado a
partir de las partes del habla
38
6. Conclusiones y trabajo futuro
La metodología sugiere que ciertas
estructuras POS son usadas más
frecuentemente que otras para expresar
AD específicos en los diálogos prácticos.
39
6. Conclusiones y trabajo futuro
La metodología sugiere que ciertas
estructuras POS son usadas más
frecuentemente que otras para expresar
AD específicos en los diálogos prácticos.
Por ejemplo:
94% de las RA expresan accept
91% de los commit se expresan con RA
82% de las R_V_R expresan info-request
40
6. Conclusiones y trabajo futuro
El uso de umbrales para los tipos de AD o
para las estructuras POS más frecuentes
es un modo de identificar los patrones más
significativos en el fenómeno
41
6. Conclusiones y trabajo futuro
El uso de umbrales para los tipos de AD o
para las estructuras POS más frecuentes
es un modo de identificar los patrones más
significativos en el fenómeno
Aunque los patrones hallados en un
corpus específico no pueden usarse para
mejorar SAD en general, la metodología
puede usarse para dominios particulares
42
6. Conclusiones y trabajo futuro
Para implementar SAD robustos tendría
que usarse información adicional
proveniente del habla, p. ej. palabras guía
(cue words), entonación, etc.
43
6. Conclusiones y trabajo futuro
Para implementar SAD robustos tendría
que usarse información adicional
proveniente del habla, p. ej. palabras guía
(cue words), entonación, etc.
Trabajo a futuro: implementar más
modelos de reconocimiento como tablas o
árboles de clasificación y evaluarlos
usando las métricas típicas: accuracy,
recall, precision, etc. 44
Sergio R. Coria
www.unsis.edu.mx/~coria
45
F I N
46
ResearchGate has not been able to resolve any citations for this publication.
ResearchGate has not been able to resolve any references for this publication.