Conference PaperPDF Available

Paradigma Semiótico y Reconocimiento Facial

Authors:

Abstract and Figures

El reconocimiento facial es uno de los pocos métodos biométricos que poseen los méritos de alta precisión y baja tendencia a la intrusión. Tiene la precisión de un enfoque fisiológico sin ser intrusivo. Por esta razón, desde los años setenta el reconocimiento facial ha llamado la atención de los investigadores en los campos de seguridad, psicología, procesamiento de imágenes, hasta la visión por computadora. Debido a que el índice delincuencial en los medios de trasporte es uno de los más comunes en la ciudad de Guayaquil se presenta el desarrollo de un aplicativo que usa una herramienta a nivel de usuario, mediante una técnica de reconocimiento facial previo de una persona “x”, con la que se podría presentar un historial sospechoso, y un control generará una alerta antes de que el siniestro ocurra
Content may be subject to copyright.
Universidad Politécnica Salesiana, Guayaquil, GIIAR, Paradigma Semiótico en Reconocimiento Facial 1
Aplicación del paradigma semiótico en una implementación de reconocimiento facial
Estado del Arte Galo Valverde
gvalverde@ups.edu.ec
Ronald Criollo
rcriollo@ups.edu.ec
Mónica Gómez
mgomezr@ups.edu.ec,
Daniel Plua
dplua@ups.edu.ec
Paola Quinche
pquinche@ups.edu.ec
Miguel Quiroz
mquiroz@ups.edu.ec
Grupo Investigación Inteligencia Artificial y Reconocimiento facial, Ingeniería de Sistemas,
UPS, Sede Guayaquil
I. Introducción
La disciplina denominada Interacción entre Humanos y Computadoras (HCI, Human-Computer
Interaction por sus siglas en inglés):
Investiga y trata todos los aspectos relacionados con el diseño y la implementación de las interfaces entre los
humanos y las computadoras. Dada la naturaleza y objetivos, la HCI en forma innata involucra múltiples disciplinas
relacionadas con la ciencia de la computación, (procesamiento de imágenes, visión computarizada, lenguajes de
programación y otras similares), así como disciplinas relacionadas con las ciencias humanas (ergonomía, factores
humanos, psicología cognitiva, y otras similares) (Montuschi et al., 2014).
Figura 1 Relación entre ciencias cognitivas y sociales
Fuente: Autores
Una interface natural, intuitiva, eficiente, robusta y configurable puede reducir fuertemente el espacio entre los
modelos mentales humanos y la forma en que las computadoras, máquinas o robots, desarrollan sus tareas. Estudios
sobre HCI, que se remontan a 1975 y avances tecnológicos recientes en electrónica de consumo, han abierto nuevos
escenarios excitantes: gestos, posturas corporales de manos, vocalizaciones y miradas son solo algunas de los
nuevos modos de interacción que se pueden utilizar para diseñar interfaces de usuario naturales (NUIs) (Montuschi
et al., 2014).
Universidad Politécnica Salesiana, Guayaquil, GIIAR, Paradigma Semiótico en Reconocimiento Facial 2
Nuevas formas de HCI pueden cambiar significativamente nuestras vidas. Nuevos paradigmas de interacción
ofrecen el cambio para la mejora de la calidad de vida para la gente que no puede sacarle ventaja a las interfaces
actuales, debido a limitaciones físicas, por ejemplo. Por otra parte, nuevos problemas aparecerán, particularmente
relacionados con la privacidad, la seguridad y la ética, lo cual puede potencialmente enlentecer la difusión de los
nuevos productos de hardware y software basados en dispositivos usables (e invisibles) (Montuschi et al., 2014).
Figura 2 La naturaleza de la Interacción Hombre-Máquina
MÁQUINA
INTERPRETACIÓN/
DECISIÓN
HOMBRE
MECANISMO DE
CONTROL
INDICADOR
PERCEPCIÓN
MANDO
AMBIENTE
Fuente: Currícula de Association for Computing Machinery, SIGCHI
El reconocimiento facial es uno de los pocos métodos biométricos que poseen los méritos de alta
precisión y baja tendencia a la intrusión. Tiene la precisión de un enfoque fisiológico sin ser intrusivo.
Por esta razón, desde los años setenta el reconocimiento facial ha llamado la atención de los
investigadores en los campos de seguridad, psicología, procesamiento de imágenes, hasta la visión por
computadora. En la mayoría de los casos, un algoritmo de reconocimiento facial puede dividirse en los
siguientes módulos funcionales: un detector de imagen cara que encuentra las ubicaciones de caras
humanas en un cuadro normal con trasfondos simples o complejos, y un reconocedor de cara que
determina quién es esta persona. Tanto el detector de caras como el reconocedor de cara siguen el
mismo marco; ambos tienen un extractor de características que transforma los píxeles de la imagen
facial en una representación vectorial útil y un reconocedor de patrón que busca en la base de datos
para encontrar la mejor coincidencia a la imagen de rostro ingresado (Lin, 2000).
Figura 3 Proceso de Reconocimiento Facial
Fuente: (Lin, 2000)
Universidad Politécnica Salesiana, Sede Centenario, Guayaquil 3
II. Antecedentes
Hoy en día los avances tecnológicos son un aporte al desarrollo de nuevas herramientas para la
industria, sociedad y educación. La importancia de prevenir la delincuencia es uno de los factores de
interés más importantes en la sociedad, ya que los mismos causan daños no solo físicos sino
psicológicos a personas que han sido víctimas del mismo.
Debido a que el índice delincuencial en los medios de trasporte es uno de los más comunes en
la ciudad de Guayaquil (Fuente: Estadísticas de Delitos en Guayaquil, ICM-ESPOL,
http://www.icm.espol.edu.ec/delitos/), esta investigación presenta el desarrollo de un aplicativo que usa
una herramienta a nivel de usuario, mediante una técnica de reconocimiento facial previo de una
persona “x”, con la que se podría presentar un historial sospechoso, y un control generará una alerta al
conductor antes de que el siniestro ocurra.
A futuro, se puede extender esta técnica de reconocimiento facial para identificar a la persona
que abre la caja registradora en intentos de robo a un supermercado o en un establecimiento pequeño;
o en un caso más extremo, puede ser utilizado en los cajeros automáticos donde se puede usar para
poder validar por reconocimiento facial en vez del actual PIN.
III. Desarrollo
A mediados del 2005, luego de la Conferencia de la IEEE sobre Visión por Computador y Reconocimiento de
Patrones, se desarrollaron evaluaciones de los últimos algoritmos de reconocimiento facial, utilizando escáneres
faciales 3D, imágenes de rostros de alta definición y del iris. Los nuevos algoritmos tienen 10 veces más exactitud
que los algoritmos con fecha anterior a 2002, y 100 veces más que los de 1995; son tan precisos que ya son capaces
de diferenciar y reconocer a dos gemelos idénticos (Face Recognition Grand Challenge FRGC-, 2005).
“Es importante entender cómo hacemos esta tarea, cómo percibimos a los seres humanos(Tagiuri,
1954). Muchas investigaciones han tratado de entender cómo los seres humanos pueden reconocer
caras, la mayoría de ellos cuando surgió el problema de reconocimiento facial automático, buscando
inspiración en el diseño; pues este conocimiento se podría aplicar en sistemas de reconocimiento facial
automático.
Sin embargo, muchos algoritmos no utilizan esta información, pues utilizan sólo herramientas
matemáticas. “A través de estos años han surgido algunas dudas: ¿son las características relevantes a
nuestros ojos importantes para el reconocimiento facial automático? ¿Pueden los sistemas de visión
humano enseñar algo útil a este respecto? ¿Pueden los estudios psicológicos aportar a este problema de
alguna manera? ¿En definitiva, la capacidad humana de reconocimiento de rostro puede ayudar a
desarrollar un sistema no-humano de reconocimiento facial?” (Marqués, 2010).
Durante mucho tiempo ciertas ramas de las ciencias ingenieriles o técnicas, especialmente del
área de sistemas y computación (tales como la Ingeniería de Software, Interacción Hombre-Ordenador
o actualmente la Robótica), se han centrado en el dualismo de la representación de contenidos para la
relación entre el usuario y el computador por medio principalmente de las denominadas interfaces de
usuario (pantallas, ventanas, iconos, combinaciones de teclas, mouse), y con los adelantos de los
multimedios y sistemas biométricos por medio de la voz, sonidos, gestos e imágenes.
Sobre esta dualidad, también se ha trabajado desde ciertas ramas de las ciencias cognitivas o
sociales (semiótica, hermenéutica), en la reflexión de la dualidad que supone lo abstracto y concreto
desde un punto de vista epistemológico identificándose una necesidad de la búsqueda del conocimiento
de esa realidad. La Semiótica como la ciencia que estudia los signos, parte de una relación diádica a
una recombinación metafórica n-adica, que en todos sus modos pueden ser llevados a tres o más
elementos, de entre ellos (signo, objeto, interpretante).
Universidad Politécnica Salesiana, Guayaquil, GIIAR, Paradigma Semiótico en Reconocimiento Facial 4
Figura 4 Esquema tríadico de signo Peirciano
Objeto
Dinámico
Interpretante
en si
SIGNO
Objeto
Dinámico
Intérprete
Inmediato
Interprete
Dinámico
(Intérprete)
Fuente: Semiótica y literatura. Deslindes y aproximaciones. Gomez, F. V. (2001)
Pero la realidad se nos muestra efímera, plural y cambiante; por lo que nos toca discriminar entre
apariencia y realidad, y al mismo tiempo establecer estados de la misma para poder inferir y definir
modelos para interpretarla en sus diferentes estados, que para nuestro caso puede ser una representación
de la relación del computador con el cerebro, y de la Inteligencia Artificial como unión de la
fenomenología y las neurociencias. Nos tocaría crear una representación de la representación.
Platón y Aristóteles nos plantean un reto filosófico, que es “como conocer la realidad y poder
aprenderla”, para tener presente la necesidad de considerar las características que determinan estas
relaciones en toda su complejidad, y con los avances de las teorías y los sistemas actuales, tanto
tecnológicos como sociales.
En el Discurso del Método se menciona “Hube de arreglarme una moral provisional, que no
consistía sino en tres o cuatro máximas” (Descartes, 2009). Ya en los años 1940 los autores de ciencia
ficción Isaac Asimov y John Campbell nos presentaban en sus escritos las tres leyes de la robótica,
entendiéndose a estos entes como los máximos representantes de la Inteligencia Artificial.
Según el propio Asimov, “la concepción de las leyes de la robótica quería contrarrestar un
supuesto “complejo de Frankenstein”, es decir, un temor que el ser humano desarrollaría frente a unas
máquinas que hipotéticamente pudieran rebelarse y alzarse contra sus creadores. A un primer nivel no
presenta ningún problema dotar a los robots con tales leyes, a fin de cuentas, son máquinas creadas por
el hombre para su servicio. La complejidad reside en que el robot pueda distinguir cuáles son todas las
situaciones que abarcan las tres leyes, o sea poder deducirlas en el momento. Por ejemplo saber en
determinada situación si una persona está corriendo peligro o no, y deducir cuál es la fuente del daño”
(Wikipedia, 2014).
En la última década, la detección de rostros ha sido uno de los temas más estudiados del área
de visión por computadora, lo que ha generado la publicación de destacados algoritmos, siendo hasta
el momento el más reconocido el algoritmo propuesto por Paul Viola y Michael Jones en 2001 (C.
Zhang y Z. Zhang, 2010). Lo destacado de este algoritmo es que permite que la detección facial pueda
realizarse en tiempo real, siendo capaz de procesar imágenes de forma rápida, alcanzando altos índices
de detección, y esto es debido a que está basado en tres aspectos fundamentales, los cuales son: el uso
de una imagen integral, rasgos de clasificación y organización en cascada de los clasificadores (Wang,
2014). A partir de este algoritmo es posible la implementación de un sistema de reconocimiento facial
el cual está basado en tres módulos principales, los cuales son: la detección, alineación y el
reconocimiento del rostro (H. Li, 2010).
Universidad Politécnica Salesiana, Sede Centenario, Guayaquil 5
La aplicación del reconocimiento facial ha sido destacada en el área de la Biometría, Seguridad
de la información, Control de acceso y últimamente en la detección de delincuentes como es el caso
del FBI (2014) y la policía de Brasil que utiliza gafas de reconocimiento facial (M2SYS Blog, 2014).
También podemos ver que Facebook está utilizando este concepto para el etiquetado de fotos con su
algoritmo llamado DeepFace (FBI, 2014).
Las imágenes no se representan en forma directa por medio de objetos sino por medio de operaciones materiales,
perceptivas y reglas gráficas y tecnológicas. Pero la materialidad ha de tenerse en cuenta en su relación directa con
la representación. Para la semiótica la imagen puede representase como función semiótica, esta función establece
la correlación entre las sustancias de la expresión (colores y espacios) y las formas de expresión (la configuración
iconográfica de cosas o personas) y se relacionan con las sustancias del contenido (contenido cultural propiamente
dicho) y formas de contenido (las estructuras semánticas de la imagen). La imagen como función semiótica se
manifiesta en forma de textualidad dentro de un contexto comunicativo (Vilches, 1997)
“El productor propone una percepción visual y el intérprete percibe una propuesta visual cuya relación
de representación consiste en la actualización de los rasgos socialmente asignados para la comunicación
de determinadas estructuras y procesos conceptuales o hábitos y valores ideológicos(Morentin, 2014).
En definitiva, no hay pura experiencia perceptual, ni analogía existencial, que sean suficientes para
comprender el carácter representativo de la imagen material visual que se designa. Para llegar a
comprenderlo se requiere además y “predominantemente el conocimiento de determinada convención
y de aquellas leyes o normas que la actualizan en la configuración propuesta. Esto reafirma el carácter
simbólico o “conceptual” de estas imágenes materiales visuales y su dependencia de un determinado
sistema interpretativo, temporal y/o espacialmente delimitado” (Morentin, 2014).
En resumen, las interfaces hombre-máquina, utilizando los mecanismos del reconocimiento
facial, son dispositivos semióticos tríadicos por excelencia, y permiten recién ahora ser expresados bajo
los paradigmas cognitivistas más avanzados, por medio de algoritmos de la Inteligencia Artificial.
Esta relación triádica nos permite integrar la importancia del contexto (entendiendo como los
antecedentes criminales) en los procesos de interpretación de objetos dinámicos (personas delincuentes
potenciales); y nos abre el camino para poder desarrollar usos prácticos, entre ellos el tema de
seguridad, que permitirá identificar mediante el reconocimiento dinámico del rostro a las personas que
tengan antecedentes sospechosos, como un contexto interpretativo.
IV. Conclusión
Una alternativa de solución con los delitos violentos contra las personas será poder detectar de manera
automática personas sospechosas o peligrosas en los medios de transporte público.
Esta relación “triádicapermitirá identificar de manera dinámica mediante el reconocimiento
de rostro a las personas que tengan antecedentes penales y que utilicen los transportes públicos.
La relación algorítmica al identificar a un sospechoso y emitir alertas, dará garantías necesarias
para acceder a un servicio de transporte público más seguro.
Con esta propuesta de implementación, y al trabajar con redes neuronales e inteligencia artificial
en el proyecto, bajo el paradigma semiótico presentado, se promueve un mecanismo nuevo para reducir
los índices de delincuencia en robo agravado en las ciudades.
Universidad Politécnica Salesiana, Guayaquil, GIIAR, Paradigma Semiótico en Reconocimiento Facial 6
Bibliografía
Descartes (2009). El discurso del método. Barcelona: Brontes S.L.
Facebook (2014). DeepFace: Closing the Gap tu Human-Level Performance in Face Verification.
Obtenido en: https://www.facebook.com/publications/546316888800776/
Face Recognition Grand Challenge (FRGC). (2005). Visión por Computador y Reconocimiento de
Patrones, 2005 CVPR 2005 IEEE. Overview of the face recognition grand challenge 1, 947-954. San
Diego, CA: IEEE.
FBI (2014, Septiembre 4). FBI onLine. Obtenido en:
http://www.fbi.gov/news/stories/2014/august/long-time-fugitive-neil-stammer-captured/long-time-
fugitive-neil-stammer-captured
Gomez, F. V. (2001). Semiótica y literatura. Deslindes y aproximaciones. Cuaderno de la Facultad de
Humanidades y Ciencias Sociales, 1,21. Universidad Nacional de Jujuy.
H. Li, P. W. (2010). “Robust Face Recognition via Accurate Face Alignment and Sparse
Representation”. International Conference on Digital Image Computing: Techniques and Applications
(DICTA), (pp. 262-269).
Lin, S.-H. (2000). An Introduction to Face Recognition Technology. Multimedia Informing
Technologies, 3, 1.
Marqués, I. (2010, Junio). Face Recognition Algorithms. Universidad del País Vasco.
M2SYS Blog. (2014). Brazil Using facial Recognition Tech at 2014 World Cup. Obtenido en: M2SYS
Blog on Biometric Technology: http://blog.m2sys.com/biometric-hardware/brazil-using-facial-
recognition-biometrics-2014-world-cup/
Montuschi, P., Sanna, A., Lamberti, F. & Paravati, G. (2014, Septiembre). Human-Computer
Interaction: Present and Future Trends. Computing Now, vol. 7, no. 9. Obtenido en:
http://www.computer.org/portal/web/computingnow/archive/september2014
Morentin, J. M. (2014). La Semiótica de la imagen visual. Obtenido en: La Semiótica de la imagen
visual: http://www.archivo-semiotica.com.ar/vision.html
Tagiuri, J. S. (1954). The perception of people. Handbook of Social Psychology, 2-17.
Vilches, L. (1997). La lectura de la imagen. Prensa, cine, televisión. España: Paidos.
Wang, Y.-Q. (jun. 2014). An Analysis of the Viola-Jones Face Detection Algorithm. Image Processing
On Line, 4, 128-148.
Wikipedia (2014, mayo 6). Wikipedia. Obtenido en: Tres Leyes de Robótica:
http://es.wikipedia.org/wiki/Tres_leyes_de_la_rob%C3%B3tica
Zhang, C. Zhang & Zhang, Z. (2010). A Survey of Recent Advances in Face detection. Microsoft
Research
ResearchGate has not been able to resolve any citations for this publication.
Article
Full-text available
n this article, we decipher the Viola-Jones algorithm, the first ever real-time face detection system. There are three ingredients working in concert to enable a fast and accurate detection: the integral image for feature computation, Adaboost for feature selection and an attentional cascade for efficient computational resource allocation. Here we propose a complete algorithmic description, a learning code and a learned face detector that can be applied to any color image. Since the Viola-Jones algorithm typically gives multiple detections, a post-processing step is also proposed to reduce detection redundancy using a robustness argument.
Book
Full-text available
Face detection has been one of the most studied topics in the computer vision literature. In this technical report, we survey the recent advances in face detection for the past decade. The seminal Viola-Jones face detector is first reviewed. We then survey the various techniques according to how they extract features and what learning algorithms are adopted. It is our hope that by reviewing the many existing algorithms, we will see even better algorithms developed to solve this fundamental computer vision problem.
Conference Paper
Full-text available
Due to its potential applications, face recognition has been receiving more and more research attention recently. In this paper, we present a robust real-time facial recognition system. The system comprises three functional components, which are face detection, eye alignment and face recognition, respectively. Within the context of computer vision, there are lots of candidate algorithms to accomplish the above tasks. Having compared the performance of a few state-of-the-art candidates, robust and efficient algorithms are implemented. As for face detection, we have proposed a new approach termed Boosted Greedy Sparse Linear Discriminant Analysis (BGSLDA) that produces better performances than most reported face detectors. Since face misalignment significantly deteriorates the recognition accuracy, we advocate a new cascade framework including two different methods for eye detection and face alignment. We have adopted a recent algorithm termed Sparse Representation-based Classification (SRC) for the face recognition component. Experiments demonstrate that the whole system is highly qualified for efficiency as well as accuracy.
Article
Full-text available
Recently face recognition is attracting much attention in the society of network multimedia information access. Areas such as network security, content indexing and retrieval, and video compression benefits from face recognition technology because "people" are the center of attention in a lot of video. Network access control via face recognition not only makes hackers virtually impossible to steal one's "password", but also increases the user-friendliness in human-computer interaction. Indexing and/or retrieving video data based on the appearances of particular persons will be useful for users such as news reporters, political scientists, and moviegoers. For the applications of videophone and teleconferencing, the assistance of face recognition also provides a more efficient coding scheme. In this paper, we give an introductory course of this new information processing technology. The paper shows the readers the generic framework for the face recognition system, and the variants that are frequently encountered by the face recognizer. Several famous face recognition algorithms, such as eigenfaces and neural networks, will also be explained.
DeepFace: Closing the Gap tu Human-Level Performance in Face Verification
  • Facebook
Facebook (2014). DeepFace: Closing the Gap tu Human-Level Performance in Face Verification. Obtenido en: https://www.facebook.com/publications/546316888800776/
Semiótica y literatura. Deslindes y aproximaciones. Cuaderno de la Facultad de Humanidades y Ciencias Sociales, 1,21
  • F V Gomez
Gomez, F. V. (2001). Semiótica y literatura. Deslindes y aproximaciones. Cuaderno de la Facultad de Humanidades y Ciencias Sociales, 1,21. Universidad Nacional de Jujuy.
Brazil Using facial Recognition Tech at 2014 World Cup. Obtenido en: M2SYS Blog on Biometric Technology: http://blog.m2sys.com/biometric-hardware/brazil-using-facial- recognition-biometrics-2014-world-cup
  • M2sys Blog
M2SYS Blog. (2014). Brazil Using facial Recognition Tech at 2014 World Cup. Obtenido en: M2SYS Blog on Biometric Technology: http://blog.m2sys.com/biometric-hardware/brazil-using-facial- recognition-biometrics-2014-world-cup/