Content uploaded by Sergio Rafael Coria
Author content
All content in this area was uploaded by Sergio Rafael Coria on Jul 13, 2022
Content may be subject to copyright.
Modelación de Actos de
Diálogo a partir de
Etiquetaciones de Partes del
Habla de Diálogos Prácticos
en Español de México
Sergio R. Coria y Luis A. Pineda
Marzo, 2010
Resumen
Se presenta una metodología
desarrollada por los autores para
modelar actos de diálogo en lenguaje
hablado, con posibilidades de ser
implementada en software para manejar
la comunicación humano-computadora o
humano-robot.
2
• Trabajo presentado en el 1st. Mexican
Workshop on Pattern Recognition
(MWPR) , Nov. 2009
IPN-CINVESTAV, Guadalajara, Jal.
• Publicado en el journal arbitrado
Research in Computing Science (ISSN:
1870-4079). México, 2009
3
Contenido
1. Introducción
2. Acto de diálogo
3. Partes del habla
4. Metodología de modelación
5. Uso de datos empíricos
6. Resultados de un ejemplo
7. Conclusiones y trabajo futuro
4
Introducción
• En Inteligencia Artificial, el área del
Procesamiento del Lenguaje Natural intenta
analizar y modelar el lenguaje escrito y hablado
5
Introducción
• En Inteligencia Artificial, el área del
Procesamiento del Lenguaje Natural intenta
analizar y modelar el lenguaje escrito y hablado
• La investigación en lenguaje hablado incluye:
– Reconocimiento automático del habla (RAH)
– Reconocimiento del hablante
– Sistemas de administración de diálogo (SAD)
6
Introducción
• SAD: software para controlar la comunicación
humano-computadora (o humano-robot)
mediante lenguaje hablado en conversaciones
orientadas a tareas
7
Introducción
• SAD: software para controlar la comunicación
humano-computadora (o humano-robot)
mediante lenguaje hablado en conversaciones
orientadas a tareas
• Conversación orientada a tareas: aquella en
que los hablantes colaboran para lograr una
meta común. Ej. comprar una hamburguesa
8
Introducción
• SAD: software para controlar la comunicación
humano-computadora (o humano-robot)
mediante lenguaje hablado en conversaciones
orientadas a tareas
• Conversación orientada a tareas: aquella en
que los hablantes colaboran para lograr una
meta común. Ej. comprar una hamburguesa
• Los SAD generalmente se programan usando
modelos de diálogo hablado 9
Introducción
• Ver video de un diálogo orientado a
tareas
10
1. Acto de diálogo (AD)
• Acto de habla: unidad mínima de
comunicación lingüística (Searle),
generalmente emitida como enunciado
11
1. Acto de diálogo (AD)
• Acto de habla: unidad mínima de
comunicación lingüística (Searle),
generalmente emitida como enunciado
• AD: caracterización de un acto de habla
en el contexto de una conversación
orientada a tareas
12
1. Acto de diálogo (AD)
• Los tipos de AD pueden clasificarse
usando el esquema DIME-DAMSL
(Pineda et al., 2006)
13
1. Acto de diálogo (AD)
• Esquema DIME-DAMSL (Pineda et al.,
2006)
Los AD ocurren en dos planos de
comunicación:
Obligaciones (obligations)
14
1. Acto de diálogo (AD)
• Esquema DIME-DAMSL (Pineda et al.,
2006)
Los AD ocurren en dos planos de
comunicación:
Obligaciones (obligations)
y
Piso común (common ground)
15
1. Acto de diálogo (AD)
• Esquema DIME-DAMSL (Pineda et al.,
2006)
–AD de obligations: el hablante crea
una obligación sobre sí mismo o en su
interlocutor para realizar una acción,
ya sea verbal o de otra modalidad.
Ejemplos: prometer algo, preguntar
16
1. Acto de diálogo (AD)
• Esquema DIME-DAMSL (Pineda et al.,
2006)
–AD de common ground: establecen o
re-establecen el conocimiento o las
suposiciones compartidos entre los
interlocutores. También sirven para
administrar el canal comunicativo
Ejemplos: afirmar, aceptar, etc.
17
1. Acto de diálogo (AD)
18
OBLIGATIONS
info-request answer
action-dir commit offer
info-request_answer
action-dir_answer
info-request_offer
action-dir_offer
Tipos de AD en DIME-DAMSL
1. Acto de diálogo (AD)
19
COMMON GROUND
accept affirm reaffirm
open-option hold accept-part
reject reject-part maybe ack
repeat-rephrase
non-understanding-signal
conv-open conv-close
Tipos de AD en DIME-DAMSL
2. Partes del habla (POS)
• PH: Part of Speech (POS)
20
Moreno and Pineda, 2006
2. Partes del habla (POS)
• PH: Part of Speech (POS)
• PH: caracterización de una palabra
de acuerdo a la función que realiza
en un enunciado
21
Moreno and Pineda, 2006
2. Partes del habla (POS)
Etiquetas (símbolos, tags) de las POS
22
Tag
POS Tag POS
Tag
POS
Tag
POS
A
Adjetivo
AD
Adjetivo
demostrativo
C
Conjunción
N
Sustant
.
P
Pronom
-
bre
PC
Pronombre
clítico
PI
Pronombre
interrog
.
PR
Pron
.
relativo
R
Adverbio
RA
Adverbio de
aceptación
RI
Adverbio
interrog
.
RN
Adv
. de
negación
RR
Adverbio
relativo
S
Preposición
TD
Artículo
determinad
TI
Artículo
indeterm.
V
Verbo
VAM
Verbo auxiliar
modal
VC
Verbo con
clítico
Moreno and Pineda, 2006
2. Partes del habla (POS)
• Estructura POS: concatenación de
etiquetas POS correspondientes a las
palabras de un enunciado particular. Se
usa un símbolo especial (p. ej. guión
bajo) como separador de las etiquetas
23
2. Partes del habla (POS)
• Estructura POS: concatenación de
etiquetas POS correspondientes a las
palabras de un enunciado particular. Se
usa un símbolo especial (p. ej. guión
bajo) como separador de las etiquetas
• Ejemplos de estructuras POS:
R_V_R RI_V_C_PC_V V_TI_N
RI_V_R PI_N_V_PD V_C_V_TI_N
24
3. La metodología propuesta
1. Crear estructuras POS a partir de secuencias
de etiquetas POS
25
3. La metodología propuesta
1. Crear estructuras POS a partir de secuencias
de etiquetas POS
2. Análisis de Pareto de las estructuras POS
26
3. La metodología propuesta
1. Crear estructuras POS a partir de secuencias
de etiquetas POS
2. Análisis de Pareto de las estructuras POS
3. Análisis estadístico de tipos de AD para cada
una de las estructuras POS más frecuentes
en obligations y en common ground
27
3. La metodología propuesta
1. Crear estructuras POS a partir de secuencias
de etiquetas POS
2. Análisis de Pareto de las estructuras POS
3. Análisis estadístico de tipos de AD para cada
una de las estructuras POS más frecuentes
en obligations y en common ground
4. Análisis estadístico de las estructuras POS
más frecuentes para cada tipo de AD
28
3. La metodología propuesta
1. Crear estructuras POS a partir de secuencias
de etiquetas POS
2. Análisis de Pareto de las estructuras POS
3. Análisis estadístico de tipos de AD para cada
una de las estructuras POS más frecuentes
en obligations y en common ground
4. Análisis estadístico de las estructuras POS
más frecuentes para cada tipo de AD
5. Implementación de dos modelos para
reconocimiento de AD: uno para obligations y
uno para common ground 29
4. Uso de datos empíricos
• El Corpus DIME (Villaseñor et al., 2001)
es el recurso empírico usado para ilustrar
esta metodología
30
4. Uso de datos empíricos
• El Corpus DIME (Villaseñor et al., 2001)
es el recurso empírico usado para ilustrar
esta metodología
• 26 videos de pantalla y audios de
diálogos prácticos de 2 hablantes c/uno
31
4. Uso de datos empíricos
• El Corpus DIME (Villaseñor et al., 2001)
es el recurso empírico usado para ilustrar
esta metodología
• 26 videos de pantalla y audios de
diálogos prácticos de 2 hablantes c/uno
• En cada diálogo: un hablante realiza el rol
de Sistema, el otro hablante el de Usuario
32
4. Uso de datos empíricos
• El Corpus DIME (Villaseñor et al., 2001)
es el recurso empírico usado para ilustrar
esta metodología
• 26 videos de pantalla y audios de
diálogos prácticos de 2 hablantes c/uno
• En cada diálogo: un hablante realiza el rol
de Sistema, el otro hablante el de Usuario
• Muestra aleatoria para análisis:
851 enunciados de 12 diálogos
33
5. Resultados de un ejemplo
34
Estruct. POS
Frecuencia
%
(umbral=0.6
%)
Acum.
%
RA
170
20.0
20.0
R_V_R
115
13.5
33.5
R
20
2.4
35.8
PD
14
1.6
37.5
RN
13
1.5
39.0
RI_V_C_PC_V
9
1.1
40.1
V_TI_N
7
0.8
40.9
RI_V_R
6
0.7
41.6
Otras estructs
.
(c/
una <= 0.6%)
497
58.4
100.0
Total
851
Estructuras POS y sus frecuencias en el conjunto de datos
5. Resultados de un ejemplo
35
Estruct. POS
% del
dataset
(umbral
=0.6)
Tag de
Obligations
% de
estructura
POS
(umbral
=30.0)
RA
20.0
answer
52.4
Otras
47.6
R_V_R
13.5
info-request
82.6
Otras
17.4
R
2.4
no-tag
40.0
answer
35.0
Otras
25.0
PD
1.6
info-request
71.4
Otras
28.6
answer
53.8
RN
1.5
no-tag
30.8
Otras
15.4
RI_V_C_PC_V
1.1
info-request
100.0
V_TI_N
0.8
no-tag
42.9
Otras
57.1
RI_V_R
0.7
info-request
100.0
Otras
estructs.
(c/una<=
0.6%)
58.4
Etiquetas de Obligations de las estructuras POS más frecuentes
5. Resultados de un ejemplo
36
Estruct.POS
%del dataset
(umbral=0.6)
Tag de
Common ground
% de
estruct.
POS
(umbral
=30.0)
RA
20.0
accept
94.1
Otras
5.9
R_V_R
13.5
no-tag
86.1
Otras
6.2
R
2.4
accept
40.0
Otras
60.0
PD
1.6
hold_repeat-rephr
64.3
Otras
35.7
RN
1.5
reject
46.2
Otras
53.8
RI_V_C_PC_V
1.1
no-tag
55.6
accept
33.3
Otras
11.1
V_TI_N
0.8
no-tag
42.9
Otras
57.1
RI_V_R
0.7
****
****
Otras
estruct.
(c/una<=
0.6%)
58.4
Tags de Common ground de las estruct. POS más frecuentes
5. Resultados de un ejemplo
37
Tags de
Obligations
(simples o
compuestas
)
Frecuencia
%Estruct
.
POS más
frecuente
%
de
tags de
Obligs.
(umbral
=35.0)
info-request
262
30.8 R_V_R
36.3
Otras
63.7
answer
213
25.0 RA
41.8
Otras
58.2
commit
34
4.0 RA
91.2
Otras
8.8
info-
request_answer
16
1.9 R_V_R
43.8
Otras
56.2
Estructs. POS más frecuentes para AD de Obligations
6. Conclusiones y trabajo futuro
• Se propuso una metodología para modelar
actos de diálogo en lenguaje hablado a
partir de las partes del habla
38
6. Conclusiones y trabajo futuro
• La metodología sugiere que ciertas
estructuras POS son usadas más
frecuentemente que otras para expresar
AD específicos en los diálogos prácticos.
39
6. Conclusiones y trabajo futuro
• La metodología sugiere que ciertas
estructuras POS son usadas más
frecuentemente que otras para expresar
AD específicos en los diálogos prácticos.
Por ejemplo:
94% de las RA expresan accept
91% de los commit se expresan con RA
82% de las R_V_R expresan info-request
40
6. Conclusiones y trabajo futuro
• El uso de umbrales para los tipos de AD o
para las estructuras POS más frecuentes
es un modo de identificar los patrones más
significativos en el fenómeno
41
6. Conclusiones y trabajo futuro
• El uso de umbrales para los tipos de AD o
para las estructuras POS más frecuentes
es un modo de identificar los patrones más
significativos en el fenómeno
• Aunque los patrones hallados en un
corpus específico no pueden usarse para
mejorar SAD en general, la metodología
puede usarse para dominios particulares
42
6. Conclusiones y trabajo futuro
• Para implementar SAD robustos tendría
que usarse información adicional
proveniente del habla, p. ej. palabras guía
(cue words), entonación, etc.
43
6. Conclusiones y trabajo futuro
• Para implementar SAD robustos tendría
que usarse información adicional
proveniente del habla, p. ej. palabras guía
(cue words), entonación, etc.
• Trabajo a futuro: implementar más
modelos de reconocimiento como tablas o
árboles de clasificación y evaluarlos
usando las métricas típicas: accuracy,
recall, precision, etc. 44
Sergio R. Coria
www.unsis.edu.mx/~coria
45
F I N
46