ArticlePDF Available

Localización y reconocimiento de señales de tráfico del Ecuador: Casos Pare y Ceda el Paso

Authors:

Abstract and Figures

En el mundo y en el Ecuador, las altas tasas de accidentes de tráfico son generadas, principalmente, por la falta de respeto a la normativa vial por parte de los usuarios viales, generando costos humanos y materiales de importancia. En este sentido, la localización y el reconocimiento de las señales de tráfico es esencial para la construcción de dispositivos capaces de prevenir situaciones que puedan generar accidentes de tráfico. Por lo tanto, en este trabajo se presenta un nuevo enfoque para la construcción de un sistema para la detección de señales de tráfico, usando las siguientes innovaciones, i) un método de segmentación por color para la generación de regiones de interés (ROIs) basado en los algoritmos 𝑘−𝑁𝑁, con 𝐾𝑚−𝑚𝑒𝑎𝑛𝑠, ii) una nueva versión del descriptor HOG (Histograms of oriented gradients) para la extracción de características, y iii) el entrenamiento del algoritmo SVM no-lineal para multi-clasificación. El enfoque propuesto ha sido probado sobre las señales de tráfico ecuatorianas de Pare y Ceda el Paso. Un sinnúmero de experimentos han sido desarrollados sobre varias secuencias de videos capturadas con vehículo experimental en condiciones reales de conducción en varias ciudades ecuatorianas, bajo diferentes condiciones de iluminación como son normal, soleado y nublado. Este sistema ha mostrado un rendimiento de 98.7% para la segmentación, 99.49% para la clasificación y una precisión del 96% para la detección.
Content may be subject to copyright.
10(16), 146 – 159
Editado por /
Edited by:
Diego F. Cisneros -
Heredia
Recibido /
Received:
12/12/2017
Aceptado /
Accepted:
10/05/2018
Publicado en línea /
Published online:
25/12/2018
146 147
doi: http://dx.doi.org/10.18272/aci.v10i1.1012
Artículo/Article
Sección/Section B
Localización y reconocimiento de señales de tráfico del
Ecuador: Casos Pare y Ceda el Paso
Marco Flores-Calero1,2,*, Cristian Conlago3, Jhonny Yunda3, Milton Aldas4, Carlos Flores5
1Departamento de Eléctrica y Electrónica, Universidad de las Fuerzas Armadas-ESPE, Av. Gral.
Rumiñahui s/n, PBX 171-5-231B, Sangolquí, Pichincha, Ecuador.
2Departamento de Sistemas Inteligentes, Tecnologías I&H. Latacunga-Cotopaxi, Ecuador.
3Carrera de Ingeniería en Electrónica, Automatización y Control, Universidad de las Fuerzas Armadas-
ESPE, Av. Gral. Rumiñahui s/n, PBX 171-5-231B, Sangolquí, Pichincha, Ecuador,
4Facultad de Ingeniería Civil y Mecánica, Universidad Técnica de Ambato campus Huachi,
Avenida Los Chasquis y Calle Rio Payamino, Ambato, Tungurahua, Ecuador.
5Servicio de Investigación de Accidentes de Tránsito (SIAT) de Cotopaxi, Policía Nacional del Ecuador,
Latacunga, Cotopaxi, Ecuador
*Autor principal / Corresponding author, e-mail: mjflores@espe.edu.ec
Ecuadorian traffic sign localization and recognition:
Stop and Yield cases
Resumen
En el mundo y en el Ecuador, las altas tasas de accidentes de tráfico son generadas,
principalmente, por la falta de respeto a la normativa vial por parte de los usuarios viales,
generando costos humanos y materiales de importancia. En este sentido, la localización y
el reconocimiento de las señales de tráfico es esencial para la construcción de dispositivos
capaces de prevenir situaciones que puedan generar accidentes de tráfico. Por lo tanto,
en este trabajo se presenta un nuevo enfoque para la construcción de un sistema para
la detección de señales de tráfico, usando las siguientes innovaciones, i) un método de
segmentación por color para la generación de regiones de interés (ROIs) basado en los
algoritmos k – NN con Km – means, ii) una nueva versión del descriptor HOG (Histograms
of oriented gradients) para la extracción de características, y iii) el entrenamiento del
algoritmo SVM no-lineal para multi-clasificación. El enfoque propuesto ha sido probado
sobre las señales de tráfico ecuatorianas de Pare y Ceda el Paso. Un sin número de
experimentos han sido desarrollados sobre varias secuencias de videos capturadas
con un vehículo experimental en condiciones reales de conducción en varias ciudades
ecuatorianas, bajo diferentes condiciones de iluminación como son normal, soleado y
nublado. Este sistema ha mostrado un rendimiento global de 98.7% para la segmentación,
99.49% para la clasificación y una precisión del 96% para la detección.
Palabras clave: Señales de tráfico, Ecuador, accidentes, Km – means, K – NN, SVM, HOG.
Abstract
In the world and in Ecuador, the high-rise rates of traffic accidents are caused by the lack
of respect for regulations by road users, by generating important human and material
costs. In this sense, the localization and recognition of traffic signs is essential for building
devices capable of preventing situations that can generate traffic accidents. Therefore,
in this work a new system for traffic signs detection is presented using the following
innovations: i) color segmentation for regions of interest (ROIs) generation based on k –
NN with Km – means, ii) a new version of the HOG descriptor for feature extraction and iii)
SVM training for stage multi-classification. The proposed approach has been specialized
and tested on Ecuadorian Stop and Yield (Give-way) signs. Many experiments have been
carried out over an experimental vehicle in real driving conditions, under different lighting
changes such as normal, sunny and cloudy. This system has showed a global performance
of 98.7% for segmentation, 99.49% for classification and an accuracy of 96% for detection.
Keywords: Traffic sign, Ecuador, accidents, Km – means, K – NN, SVM, HOG
INTRODUCCIÓN
Actualmente, el Ecuador dispone de la mejor red vial de Suramérica [1], sobre ésta se
ubican las señales de tráfico reglamentarias de Pare y Ceda el Paso, preferentemente,
en las intersecciones viales, redondeles y aproximaciones por vías secundarias. A pesar
de esta importante infraestructura, durante en el año 2015, el 13.75% de todos los
accidentes de tráfico sucedieron en las intersecciones viales [2] generando el 8.14% de
las personas fallecidas bajo este percance.
Por ello los sistemas de detección de señales de tráfico (SDST) toman cada vez mayor
importancia [3], [31] para reducir los accidentes de tráfico [4]. Sin embargo, estos sistemas
aún están lejos de ser perfectos, y deben ser especializados por países, adaptados a las
particularidades del diseño de la señalética de tráfico de cada nación [5].
Por lo tanto, en esta investigación se presenta un SDST especializado en dos tipos de
señales del Ecuador como son Pare y Ceda el Paso. Para su implementación se han
utilizado modernas técnicas de visión por computador e inteligencia artificial con el fin
de cubrir todos los casos que se presentan en la conducción durante el día, como son:
variabilidad de la iluminación, oclusión parcial y deterioro de las señales.
Este documento está organizado de la siguiente manera. La primera sección
corresponde a la motivación que ha generado esta investigación, donde además
se incluyen los trabajos previos en la detección de señales de tráfico presentes en la
literatura. A continuación, el apartado dos describe un nuevo sistema para la detección
de señales de tráfico para el caso de las señales de tráfico ecuatorianas de Pare y Ceda
el Paso. La siguiente sección exhibe los resultados experimentales en condiciones
reales de conducción. Finalmente, la última parte está dedicada a las conclusiones y los
trabajos futuros.
Para la detección automática de las señales de tráfico se suele dividir al problema en dos
partes, segmentación/detección y reconocimiento/clasificación [6]. En el primer caso,
una de las características predominantes, en el espectro visible, es el color, donde se han
utilizado espacios de color y distintas técnicas de visión por computador para generar
regiones con alta posibilidad de contener una señal de tráfico. En el segundo escenario,
148 149
doi: http://dx.doi.org/10.18272/aci.v10i1.1012
Localización y reconocimiento de señales de tráco del Ecuador: Casos Pare y Ceda el Paso Flores-Calero et al. (2018)
Artículo/Article
Sección/Section B
10(16), 146 – 159
se han utilizado algunos métodos para la extracción de características en conjunto con
un algoritmo de aprendizaje-máquina [7–9], para así clasificar y reconocer las señales.
Segmentación para la generación de ROIs: La mayoría de las técnicas basadas en
color buscan ser robustas frente a las variaciones de iluminación. Así Salti et al. [10] han
utilizado tres espacios de color derivados de RGB, el primero para resaltar las señales de
tráfico con predominancia de los colores azules y rojos, el segundo es para las señales
con rojo intenso y el tercero para los azules vivos. Li et al. [11] han construido un espacio
donde resaltan los objetos dominados por los colores azul-amarillo y verde-rojo, sobre
el cual, utilizando el algoritmo de agrupamiento K-means [12] construyen un método
de clasificación por color para la generación de ROIs. Nguyen et al. [3] han utilizado el
espacio HSV con varios umbrales para generar un conjunto de ROIs buscando colores
rojos y azules. Lillo et al. [13] han utilizado los espacios L*a*b* y HSI para detectar señales
donde predominan los colores rojo, blanco y amarillo, usando las componentes a* y
b* han construido un clasificador para estos colores. Chen and Lu. [14] han utilizado
multi-resolución y técnicas AdaBoost para fusionar dos fuentes de información, visual
y localización espacial; en la visual construyen dos espacios de color basados en RGB
denominados mapas salientes de color, en la espacial han usado el gradiente con
distintas orientaciones. Finalmente, Han et al. [15] han usado la componente H del
espacio HSI, donde han generado un intervalo, donde resaltan las señales de tráfico,
para construir una imagen en grises donde se localizan las ROIs.
Clasificación/Reconocimiento: Esta etapa se divide en dos partes: i) método de
extracción de características y, ii) elección del algoritmo de clasificación.
En el primer caso se tiene una amplia variedad de propuestas. Así Salti et al. [10],
Huang et al. [16], Shi and Li [35] han utilizado el descriptor HOG [17] con tres variantes
especializadas en señales de tráfico. Li et al. [11] han usado el descriptor PHOG, que es
una variación de HOG. Lillo et al. [13] han implementado la extracción de características
usando la transformada discreta de Fourier. Han et al. [15] utilizaron el método SURF
(Speeded Up Robust Features) [18]. Chen and Lu. [14] han utilizado DSC (Discrimiative
Codeword Selection) iterativo para la generación de características. Mongoose et al.
[5] han implementado ICF (Integral Channel Features) and ACF (Aggregate Channel
Features). Pérez et al. [6] usaron PCA (Principal Component Analysis) para la reducción
de la dimensión y la elección de características. Finalmente, Lau et al. [19] usaron una
ponderación de los píxeles vecinos.
En la segunda cuestión, los algoritmos preferidos son: SVM [9], [12], usado en los trabajos
de Salti et al. [10], Li et al. [11], Lillo et al. [13] y Shi and Li [35]. SVR en Chen and Lu [14],
k – NN [12] implementado en las investigaciones de Han et al. [15]. Redes neuronales
artificiales, empleadas por Huang et al. [16] con el caso ELM (Extrem Learning Machine)
y Pérez et al. [6] con la implementación MLP (Multi-Layer Perceptron). Adaboots con
árboles de decisión utilizados en el trabajo de Mogelmose et al. [5].
En los últimos años, las técnicas basadas en aprendizaje profundo van ganando mayor
importancia, tanto es así que CNN (Convolutional Neural Network) y sus variaciones
están siendo utilizadas para la clasificación automática, donde el vector de características
se extrae sin intervención humana, en este caso están Lau et al. [19] y Zhu et al. [20]. Zuo
et al. [32].
Bases de datos: Cada país tiene sus propias normativas en cuanto a la señalética de
tráfico, divida en las categorías de informativas, obligatorias, prohibitivas y advertencia
[5], [10], [13], [14], [20]. En la actualidad, las principales bases de datos corresponden a
países como Alemania [6], [10], [16], Italia [10], España [13], Japón [3], Estados Unidos [5],
Suecia [20] o Malaysian [19]. Esto demuestra que no existe información de los países
en desarrollo, como es el caso del Ecuador, en lo que respecta a las señales de tráfico
ni de la infraestructura vial; esto genera un reto para levantar este tipo de información
relevante para la seguridad vial.
Sistemas comerciales: Las empresas del sector automotriz están desarrollado
prototipos para la detección de señales de tráfico, dos de ellas son Mobileye [33], y
Continental [34]. Con estos sistemas, estas empresas están incursionando en el campo
de la conducción autónoma y los vehículos inteligentes.
MATERIALES Y MÉTODOS
El esquema del sistema propuesto se presenta en la Figura 1, donde están las etapas
de segmentación (localización) y reconocimiento (clasificación). En el proceso
de segmentación se genera un conjunto de ROIs, que será enviado a la etapa de
clasificación para su reconocimiento. En esta propuesta únicamente se trabaja en el
caso restringido de las señales de tráfico Pare y Ceda el Paso que forman parte de las
señales de prohibición.
Figura 1. Esquema propuesto para la localización y reconocimiento de señales de tráfico en intersecciones viales
en el Ecuador, para los casos Pare y Ceda el Paso.
A. Segmentación y generación de ROIs
La segmentación se realiza discriminando el color rojo del fondo, es decir, del resto de
colores. Experimentalmente se ha elegido el espacio de color RGB Normalizado (RGBN)
porque presenta una distribución más compacta en los canales Bn y Gn, cuyos valores se
encuentran en los intervalos y respectivamente. La Figura 2(a) muestra las distribuciones
de las clases, donde el rojo representa la clase de interés y el azul identifica la clase de
150 151
doi: http://dx.doi.org/10.18272/aci.v10i1.1012
Localización y reconocimiento de señales de tráco del Ecuador: Casos Pare y Ceda el Paso Flores-Calero et al. (2018)
Artículo/Article
Sección/Section B
10(16), 146 – 159
no interés. La Figura 1 (izquierda) muestra el esquema de segmentación que se describe
a continuación.
1. Puntos representativos: Para generar un número reducido de puntos
representativos de cada clase se utiliza el algoritmo de agrupación Km – means [8];
de esta manera, se obtienen Km centroides para cada una de las clases.
(a) (b)
Figura 2. Distribución del color en el espacio RGB normalizado, (a) clases de interés y no interés, (b) centroides
generadas con Kmmeans.
Utilizando los métodos de Calinski- Harabasz [21], Davies-Bouldin [22], Gap [23]
y Silhouettes [24] se ha llegado a determinar el valor eficiente de Km, obteniendo
los valores de y para las clases rojo y no rojo (otros colores), respectivamente. La
Figura 2(b) muestra los centroides de las dos clases. Para generar esta figura se han
utilizado muestras en tres condiciones de iluminación: soleado, normal y obscuro.
2. Diseño clasificador k – NN: Para diseñar este clasificador es importante elegir un
valor de k adecuado usando el valor del área bajo la curva (AUC) de la curva ROC
[25] generada para cada valor entre 1 y 8. La Tabla 1 muestra los resultados para
elegir el mejor valor de k.
Tabla 1: Elección del parámetro K en K – NN.
k12345678
AUC 0.985 0.931 0.986 0.987 0.985 0.983 0.982 0.983
3. Post-procesamiento de cuerpos: Posteriormente, utilizando los operadores
morfológicos de dilatación y erosión [26] se eliminan los cuerpos que no cumplen
con características específicas de tamaño para ser candidatos a señales de tráfico.
4. Restricciones geométricas: Finalmente se eliminan los cuerpos que no cumplen
la relación alto/ancho, usando umbrales determinados experimentalmente, ver
Tabla 2.
Tabla 2: Características geométricas que debe cumplir una ROI en una imagen de tamaño 640x480.
Característica Valor
mínimo
Valor
máximo
Área 400 pixeles 10000 pixeles
Relación ancho / alto 0.6 1.4
Distancia de referencia 20 metros 5 metros
B. Reconocimiento
En esta etapa se clasifican las ROIs provenientes de la etapa de segmentación, para
determinar si corresponden a una señal de Pare, Ceda el Paso u otro objeto.
La Figura 1 (derecha) muestra el esquema de reconocimiento, que consta de las
siguientes partes:
1. Pre-procesamiento de los candidatos: Se transforma las imágenes
correspondientes a las ROIs a escala de grises, después se normalizan al tamaño
32 x 32 píxeles y se realiza la ecualización del histograma para obtener una imagen
con una distribución uniforme de los niveles de gris y así aumentar el contraste.
2. Extracción de características: Se utiliza una nueva versión del descriptor HOG
[27] para encontrar las características representativas de una señal de tráfico. La
innovación desarrollada sobre este descriptor se centra en variar el tamaño de las
celdas y las orientaciones, y encontrar la mejor combinación. En este sentido, las
celdas toman valores de 2 x 2, 4 x 4, 8 x 8, 16 x 16 píxeles como se muestra en la
Figura 3. La orientación se obtiene dividiendo al rango de orientación sin signo de
[-90° ; 90°] ó [ ] en 3, 6, 9, 12 y 15 intervalos. Sobre esta gama de parámetros se
escoge la mejor opción usando el AUC [25].
3. Entrenamiento del clasificador: Se utiliza SVM [7]–[9] con tres núcleos
diferentes: lineal, polinómico y RBF. Para el entrenamiento se usan tres conjuntos
de datos que corresponden a las señales Pare, Ceda el Paso y otros elementos que
no pertenecen a los casos anteriores.
(a) (b) (c) (d)
Figura 3: Variación del tamaño de celda sobre imágenes de tamaño 32x32 pixeles:
(a) 2x2, (b) 4x4, (c) 8x8 (d) 16x16.
En total se evalúan 60 casos combinando los puntos 2 y 3, de los cuales se extraen los
que generan mejores resultados en la siguiente sección.
4
152 153
doi: http://dx.doi.org/10.18272/aci.v10i1.1012
Localización y reconocimiento de señales de tráco del Ecuador: Casos Pare y Ceda el Paso Flores-Calero et al. (2018)
Artículo/Article
Sección/Section B
10(16), 146 – 159
RESULTADOS
A. Sistema de percepción y procesamiento
El sistema de detección de señales de tráfico total se presenta en la Figura 4, el mismo
que está compuesto por una cámara USB (1), una pantalla de visualización (2) y una
computador de procesamiento (3), todo esto, montado sobre el vehículo experimental
ViiA, que incorpora una fuente de poder 12V-120AC (4), para alimentar el sistema.
Figura 4: Sistema de detección de señales de tráfico del Ecuador, en los casos Pare y Ceda el paso.
Actualmente, este sistema es de fácil instalación en cualquier tipo de vehículo y no
interfiere con las labores de conducción, debido a su reducido tamaño.
B. Base de datos de entrenamiento, validación y experimentación
Las bases de datos de entrenamiento y de validación han sido construidas con imágenes
de señales de tráfico del Ecuador, tomadas en las ciudades de Latacunga, Quito y
Sangolquí, en distintas condiciones de iluminación durante el día. Estas condiciones
corresponden a los casos de normal, soleado y nublado. En la Tabla 3 se indica el tamaño
de los conjuntos de entrenamiento y de validación obtenidos por medio del método de
Holdout [28] y en la Figura 5 se observan varios ejemplos positivos y negativos.
Tabla 3. Tamaño de los conjuntos de entrenamiento y validación por tipos de señal.
Número de muestras Total
Pare Ceda el Paso Negativas
Entrenamiento 700 700 2800 4200
Validación 300 300 1200 1800
Total 1000 1000 4000 6000
Para incrementar el tamaño del conjunto de entrenamiento se rotaron aleatoriamente
las imágenes hasta obtener un total de cinco veces el tamaño original. De esta manera
se incrementa la variabilidad de la base de datos.
(a)
(b)
(c)
Figura 5: Ejemplos de la base de datos de señales de tráfico del Ecuador en distintas condiciones de iluminación
y de estado, (a) Pare, (b) Ceda el Paso, y (c) ejemplos negativos.
Posteriormente para verificar el funcionamiento del sistema se construyó una base de
datos con vídeos en situaciones reales de conducción, en el espectro visible. Esta base
está constituida por cinco ejemplares en diferentes condiciones de iluminación, donde
las señales han sido localizadas manualmente con fines de evaluación [25].
C. Análisis de resultados
Para el caso de la segmentación por color, el algoritmo de clasificación genera un
AUC de 0.986, con k = 4 y Km= 30 para la clase de color rojo y k = 3 y Km= 40 para la
clase otros colores.
Para el caso de la clasificación, los mejores parámetros del descriptor HOG son: celdas
de 8 x 8 píxeles, bloques de 2 x 2 celdas con solapamiento simple, orientaciones
sin signo y SVM polinomial de parámetros C = 215, r = 0, d = 3, γ = 1⁄m, con m es el
tamaño del vector de características. En la Tabla 4 se presentan los resultados para el
caso de 8 x 8 píxeles, donde el mejor resultado se encuentra resaltado.
Tabla 4. Resultados de clasificación con características HOG con celdas de 8x8 píxeles en todas las orientaciones.
Orientaciones Tipo de núcleo
Lineal Polinómico RBF
30.9603 0.9913 0.9755
60.9784 0.9947 0.9834
90.9798 0.9949 0.9784
12 0.9762 0.9921 0.9827
15 0.9834 0.9971 0.9819
Para medir la capacidad de detección, la curva DET [30], que gráfica la tasa de falsos
negativos (taza de pérdida) versus la tasa de falsos positivos, en escala logarítmica en el
rango de 0.01-1, se presenta en la Figura 6, en ella se observa que el mejor desempeño
se realiza en días normales con una tasa de pérdidas del 13 y la peor ejecución es en días
soleados con una taza de pérdidas del 28, esto se puede observar en la Tabla V.
154 155
doi: http://dx.doi.org/10.18272/aci.v10i1.1012
Localización y reconocimiento de señales de tráco del Ecuador: Casos Pare y Ceda el Paso Flores-Calero et al. (2018)
Artículo/Article
Sección/Section B
10(16), 146 – 159
Figura 6. Curva DET del sistema de detección de señales de tráfico.
El sistema tiene un excelente desempeño, con una precisión del 96. Varios ejemplos
generados por el sistema se lo observan en la Figura 7 y la Figura 8.
Tabla 5. Resultados del sistema de detección de señales de tráfico en diferentes escenarios de iluminación
durante el día.
TRPaTFNbTRNcTFPdExactitud Precisión
Día normal
Día soleado
Día nublado
0.87
0.72
0.79
0.13
0.28
0.21
0.997
0.995
0.997
0.003
0.005
0.003
0.98
0.97
0.97
0.97
0.90
0.96
Sistema total 0.81 0.19 0.997 0.003 0.98 0.96
a Tasa de Reales Positivos, b Tasa de Falsos Negativos
c Tasa de Reales Negativos, d Tasa de Falsos Positivos
(a)
(b)
(c)
Figura 7: Resultados del sistema de detección de señales de tráfico en los casos Pare y Ceda el Paso, durante un
día soleado; (a) imagen de entrada, (b) ROIs y (c) detecciones.
(a)
(b)
(c)
Figura 8: Resultados del sistema de detección de señales de tráfico en los casos Pare y Ceda el Paso, durante un
día obscuro; (a) imagen de entrada, (b) ROIs y (c) detecciones.
D. Tiempos de cómputo
En la Tabla 6 se presenta el tiempo de cómputo del sistema total. Estos resultados son los
valores promedios del procesamiento de 37185 (distribuidos de la siguiente manera 9999
en soleado, 14744 en normal y 12442 en nublado) imágenes de tamaño 640 × 480 píxeles.
Tabla 6. Tiempos de cómputo total del sistema de detección de señales de tráfico del
Ecuador en los casos Pare y Ceda el Paso.
Etapa Tiempo promedio (ms)
Captura 1.75
Segmentación 28.79
Reconocimiento 14.05
Visualización 1.75
Tiempo total 46.34
156 157
doi: http://dx.doi.org/10.18272/aci.v10i1.1012
Localización y reconocimiento de señales de tráco del Ecuador: Casos Pare y Ceda el Paso Flores-Calero et al. (2018)
Artículo/Article
Sección/Section B
10(16), 146 – 159
Esto demuestra que el sistema es capaz de trabajar en tiempo cuasi-real, es decir, puede
procesar aproximadamente 21 imágenes por segundo.
DISCUSIÓN
En este trabajo de investigación se aportó con la construcción de una nueva base datos
para el reconocimiento de señales de tráfico del Ecuador, en los casos Pare y Ceda el
Paso. Esta información está disponible para el libre uso de la comunidad científica en
https://gitlab.com/mjflores/Ecuadorian_Traffic_Sign_Stop_and_Yield. De igual forma,
hemos presentado el desarrollo de un nuevo método de segmentación por color
para la generación de ROIs utilizando el clasificador k – NN junto con el algoritmo de
agrupamiento Km – means. Esta implementación cubre eficientemente los escenarios
de iluminación normal, soleado y obscuro, durante el día. Se incluye la distancia como
un parámetro de referencia para la preselección de ROIs, en el rango de 5 a 20 metros
de distancia. Así, esta propuesta alcanza una tasa de clasificación del 98,7%en la
discriminación entre los píxeles de interés y el fondo. También hemos implementado una
nueva versión del descriptor HOG que consiste en celdas de 8 × 8 píxeles, bloques de 2
× 2 celdas con solapamiento simple y orientaciones sin signo. La tasa de clasificación es
del 99,49% usando SVM con núcleo polinómico.
Dos aspectos clave de este trabajo son la construcción de un sistema de detección de
las señales de tráfico del Ecuador, especializado en los casos Pare y Ceda el Paso. La curva
DET indica que su desempeño es del 96%, de manera que es competitivo respecto a las
propuestas presentes en el estado del arte. La construcción de un asistente de ayuda a la
conducción que trabaja en tiempo cuasi-real, es decir, a 21.58 fotogramas por segundo,
de fácil instalación en un vehículo de uso cotidiano.
A futuro se extenderá esta metodología a los siguientes casos:
Manejo de oclusiones para detectar señales parcialmente visibles bajo las distintas
condiciones de iluminación.
Para la detección de las señales de límites de velocidad del Ecuador.
AGRADECIMIENTOS
Los equipos utilizados en para el desarrollo de este proyecto han sido financiados por la
empresa Tecnologías I&H. Además, agradecemos a los revisores anónimos por su valioso
aporte ya que han contribuido significativamente en la mejora de este manuscrito.
REFERENCIAS
[1] World Economic Forum. (2016). Global competitiveness report 2015-2016. Competitiveness rankings. A. transport
infrastructure. Recuperado el 12 de noviembre de 2017 de: http://reports.weforum.org/global-competitiveness-
report-2015-2016/competitiveness-rankings/#indicatorId=GCI.A.02.01
[2] Agencia Nacional de Tránsito del Ecuador. (2015) Siniestros octubre 2015. Recuperado el 12 de diciembre de 2017 de:
http://www.ant.gob.ec/index.php/descargable/file/3265-siniestros-octubre-2015
[3] Nguyen, B. T., Ryong, S. J., & Kyu, K. J. (2014, Julio). Fast traffic sign detection under challenging conditions. InAudio,
Language and Image Processing (ICALIP), 2014 International Conference on(pp. 749-752). IEEE.
[4] Shaout, A., Colella, D., & Awad, S. (2011, Diciembre). Advanced driver assistance systems-past, present and future.
InComputer Engineering Conference (ICENCO), 2011 Seventh International(pp. 72-82). IEEE.
[5] Møgelmose, A., Liu, D., & Trivedi, M. M. (2015). Detection of US traffic signs.IEEE Transactions on Intelligent Transportation
Systems,16(6), 3116-3125.
[6] Perez-Perez, S. E., Gonzalez-Reyna, S. E., Ledesma-Orozco, S. E., & Avina-Cervantes, J. G. (2013, November). Principal
component analysis for speed limit Traffic Sign Recognition. InPower, Electronics and Computing (ROPEC), 2013 IEEE
International Autumn Meeting on(pp. 1-5). IEEE.
[7] Cortes, C., & Vapnik, V. (1995). Support-vector networks.Machine learning,20(3), 273-297.
[8] R. Duda, P. Hart, and D. Stork. (2001). Pattern Classification, 2nd ed., 2001.
[9] Cristianini, N., & Shawe-Taylor, J. (2000).An introduction to support vector machines and other kernel-based learning
methods. Cambridge university press.
[10] Salti, S., Petrelli, A., Tombari, F., Fioraio, N., & Di Stefano, L. (2015). Traffic sign detection via interest region
extraction.Pattern Recognition,48(4), 1039-1049.
[11] Li, H., Sun, F., Liu, L., & Wang, L. (2015). A novel traffic sign detection method via color segmentation and robust shape
matching.Neurocomputing,169, 77-88.
[12] Hastie, T., Tibshirani, R., & Friedman, J. (2009). Unsupervised learning. InThe elements of statistical learning(pp. 485-
585). Springer, New York, NY.
[13] Lillo-Castellano, J. M., Mora-Jiménez, I., Figuera-Pozuelo, C., & Rojo-Álvarez, J. L. (2015). Traffic sign segmentation and
classification using statistical learning methods.Neurocomputing,153, 286-299.
[14] Chen, T., & Lu, S. (2016). Accurate and Efficient Traffic Sign Detection Using Discriminative AdaBoost and Support Vector
Regression.IEEE Trans. Vehicular Technology,65(6), 4006-4015.
[15] Han, Y., Virupakshappa, K., & Oruklu, E. (2015, Mayo). Robust traffic sign recognition with feature extraction and k-NN
classification methods. InElectro/Information Technology (EIT), 2015 IEEE International Conference on(pp. 484-488).
IEEE.
[16] Huang, Z., Yu, Y., & Gu, J. (2014, Junio). A novel method for traffic sign recognition based on extreme learning machine.
InIntelligent Control and Automation (WCICA), 2014 11th World Congress on(pp. 1451-1456). IEEE.
[17] Dalal, N. (2006). Finding people in images and videos (Doctoral dissertation, Institut National Polytechnique de
Grenoble-INPG).
[18] Bay, H., Ess, A., Tuytelaars, T., & Van Gool, L. (2008). Speeded-up robust features (SURF).Computer vision and image
understanding,110(3), 346-359.
[19] Lau, M. M., Lim, K. H., & Gopalai, A. A. (2015, Julio). Malaysia traffic sign recognition with convolutional neural network.
In2015 IEEE International Conference on Digital Signal Processing (DSP)(pp. 1006-1010). IEEE.
[20] Zhu, Y., Zhang, C., Zhou, D., Wang, X., Bai, X., & Liu, W. (2016). Traffic sign detection and recognition using fully
convolutional network guided proposals.Neurocomputing,214, 758-766.
[21] Caliński, T., & Harabasz, J. (1974). A dendrite method for cluster analysis.Communications in Statistics-theory and
Methods,3(1), 1-27.
[22] Davies, D. L., & Bouldin, D. W. (1979). A cluster separation measure.IEEE transactions on pattern analysis and machine
intelligence, (2), 224-227.
158 159
doi: http://dx.doi.org/10.18272/aci.v10i1.1012
Localización y reconocimiento de señales de tráco del Ecuador: Casos Pare y Ceda el Paso Flores-Calero et al. (2018)
Artículo/Article
Sección/Section B
10(16), 146 – 159
[23] Tibshirani, R., Walther, G., & Hastie, T. (2001). Estimating the number of clusters in a data set via the gap statistic.Journal
of the Royal Statistical Society: Series B (Statistical Methodology),63(2), 411-42
[24] Rousseeuw, P. J. (1987). Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of
computational and applied mathematics,20, 53-65.
[25] T. Fawcett. (2004). “Roc graphs: Notes and practical considerations for researchers,” Machine learning, vol. 31, no. 1,
pp. 1–38.
[26] Pajares Martinsanz, G., García, C., & Jesús, M. (2002). Visión por computador: Imágenes digitales y aplicaciones.
[27] Dalal, N., & Triggs, B. (2005, Junio). Histograms of oriented gradients for human detection. InComputer Vision and
Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on(Vol. 1, pp. 886-893). IEEE.
[28] Kohavi, R. (1995, Agosto). A study of cross-validation and bootstrap for accuracy estimation and model selection.
InIjcai(Vol. 14, No. 2, pp. 1137-1145).
[30] Martin, A., Doddington, G., Kamm, T., Ordowski, M., & Przybocki, M. (1997).The DET curve in assessment of detection
task performance. National Inst of Standards and Technology Gaithersburg MD.
[31] Gómez-Moreno, H., Maldonado-Bascón, S., Gil-Jiménez, P., & Lafuente-Arroyo, S. (2010). Goal evaluation of
segmentation algorithms for traffic sign recognition.IEEE Transactions on Intelligent Transportation Systems,11(4),
917-930.
[32] Zuo, Z., Yu, K., Zhou, Q., Wang, X., & Li, T. (2017, June). Traffic signs detection based on faster R-CNN. In Distributed
Computing Systems Workshops (ICDCSW), 2017 IEEE 37th International Conference on(pp. 286-288). IEEE.
[33] Mobileye. (2018).ADAS - Mobileye. Recuperado el 12 de noviembre de 2017 de: https://www.mobileye.com/our-
technology/adas/
[34]Continental-automotive.com. (2018).Continental Automotive. Recuperado el 12 de noviembre de 2017 de: https://
www.continental-automotive.com/en-gl/Passenger-Cars/Chassis-Safety/Advanced-Driver-Assistance-Systems/
Driving-Functions/Traffic-Sign-Assist
[35] Shi, J. H., & Lin, H. Y. (2017, Junio). A vision system for traffic sign detection and recognition. InIndustrial Electronics
(ISIE), 2017 IEEE 26th International Symposium on(pp. 1596-1601). IEEE.
CONTRIBUCIÓN DE LOS AUTORES
El diseño de la investigación, el desarrollo y la implementación del software, la
supervisión y el análisis de los resultados experimentales corresponden a M. Flores.
La implementación del software y el desarrollo de los experimentos pertenecen
a C. Conlago y J. Yunda. La redacción y revisión del manuscrito y contrastación de la
información recaen en M. Aldas y C. Flores.
... This method consists of a pixel-classifier based on k-NN with k-means clustering [34] to generate a mask (M RGBn ) with the most representative color pixels [35], one for red and one for yellow. ...
... Subsequently, several morphological operations and geometric restrictions are employed to eliminate the noise and to result in a set of valid ROIs [35]. ...
Conference Paper
We study the question of feature sets for robust visual object recognition, adopting linear SVM based human detection as a test case. After reviewing existing edge and gradient based descriptors, we show experimentally that grids of Histograms of Oriented Gradient (HOG) descriptors significantly outperform existing feature sets for human detection. We study the influence of each stage of the computation on performance, concluding that fine-scale gradients, fine orientation binning, relatively coarse spatial binning, and high-quality local contrast normalization in overlapping descriptor blocks are all important for good results. The new approach gives near-perfect separation on the original MIT pedestrian database, so we introduce a more challenging dataset containing over 1800 annotated human images with a large range of pose variations and backgrounds.
Article
Thesupport-vector network is a new learning machine for two-group classification problems. The machine conceptually implements the following idea: input vectors are non-linearly mapped to a very high-dimension feature space. In this feature space a linear decision surface is constructed. Special properties of the decision surface ensures high generalization ability of the learning machine. The idea behind the support-vector network was previously implemented for the restricted case where the training data can be separated without errors. We here extend this result to non-separable training data.High generalization ability of support-vector networks utilizing polynomial input transformations is demonstrated. We also compare the performance of the support-vector network to various classical learning algorithms that all took part in a benchmark study of Optical Character Recognition.
Article
Detecting and recognizing traffic signs is a hot topic in the field of computer vision with lots of applications, e.g., safe driving, path planning, robot navigation etc. We propose a novel framework with two deep learning components including fully convolutional network (FCN) guided traffic sign proposals and deep convolutional neural network (CNN) for object classification. Our core idea is to use CNN to classify traffic sign proposals to perform fast and accurate traffic sign detection and recognition. Due to the complexity of the traffic scene, we improve the state-of-the-art object proposal method, EdgeBox, by incorporating with a trained FCN. The FCN guided object proposals can produce more discriminative candidates, which help to make the whole detection system fast and accurate. In the experiments, we have evaluated the proposed method on publicly available traffic sign benchmark, Swedish Traffic Signs Dataset (STSD), and achieved the state-of-the-art results.