Content uploaded by Luis Alberto Morales Rosales
Author content
All content in this area was uploaded by Luis Alberto Morales Rosales on Apr 14, 2018
Content may be subject to copyright.
Pron´ostico a corto plazo de velocidad del viento
a partir de datos incompletos
Hector Rodriguez Rangel1, Noel A. Garcia Carrillo1, Juan J. Flores2,
Luis A. Morales Rosales3, Giovanni Manjarrez Montelongo1
1Instituto Tecnol´ogico de Culiac´an, Divisi´on de Estudios de Posgrado e Investigaci´on,
Culiacan, M´exico
2Divisi´on de Estudios de Postgrado, Facultad de Ingenier´ıa El´ectrica,
Universidad Michoacana de San Nicol´as de Hidalgo, Morelia, Michoac´an, M´exico
3Facultad de Ingenier´ıa Civil,
CONACYT-Universidad Michoacana de San Nicol´as de Hidalgo,
Morelia, Michoac´an, M´exico
hrodriguez@itculiacan.edu.mx, noelandresg@gmail.com, juanf@umich.mx,
amorales@conacyt.mx, gmanjarrez@itculiacan.edu.mx
Resumen. En este art´ıculo se presenta un estudio realizado a la pre-
dicci´on a corto plazo de la velocidad del viento en series de tiempo
incompletas. Se ha propuesto realizar este estudio dado el incremento
en el inter´es hacia la transici´on global de la producci´on de energ´ıas
limpias. Siendo el pron´ostico de dicha variable de suma importancia
para las etapas de planeaci´on, administraci´on y producci´on. El proceso
de pron´ostico implica el uso de observaciones pasadas de la variable a
pronosticar (velocidad del viento). Para medir la velocidad del viento, las
estaciones meteorol´ogicas utilizan dispositivos llamados anem´ometros,
pero debido a un mal mantenimiento, errores de conexi´on o desgaste
natural, pueden presentar datos falsos o faltantes. En este trabajo, se
explora la reconstrui´on la serie de tiempo mediante Redes Neuronales
Artificiales, para posteriormente realizar el pron´ostico a corto plazo de
la serie de tiempo de la velocidad del viento utilizando el m´etodo de k
Vecinos m´as Cercanos. Para probar la metodolog´ıa propuesta, se utiliza-
ron datos recolectados de diferentes locaciones del estado de Michoac´an.
Palabras clave: pron´ostico de la velocidad del viento, recostrucci´on
de series de tiempo, RNA, kNN.
Wind Speed Short-term Forecasting
from Incomplete Data
Abstract. This paper presents a wind speed short-term forecasting
from incomplete time series. This study has been proposed given the in-
terest increasing in a global transition of clean energy production. Being
81
ISSN 1870-4069
Research in Computing Science 139 (2017)pp. 81–95; rec. 2017-03-12; acc. 2017-05-06
the forecast of interest variable an important process for the planning,
administration and production stages. The forecasting process involves
the use of historical data of the variable to be forecast (wind speed).
Measuring the wind speed, weather stations use devices called anemo-
meters, but due poor maintenance, connection errors or natural wear,
they may present false or missing data. In this work, the reconstruction of
the time series using Artificial Neural Networks is explored, and then the
short-term forecast of the time series of the wind speed using the method
of k Nearest Neighbors is presented. To test the proposed methodology,
we used data collected from different locations in the state of Michoacan.
Keywords: wind speed forecast, time series reconstruction, ANN, kNN.
1. Introducci´on
La energ´ıa desempe˜na un papel de suma importancia en las actividades
humanas. As´ı, la producci´on de energ´ıa se ha convertido en una de las principales
cuestiones econ´omicas y medioambientales en todo el mundo [15]. Adem´as, la
demanda de energ´ıa ha aumentado constantemente con el tiempo, causando
da˜nos al medio ambiente al producirla. Seg´un el censo realizado por Observ’ER &
Foundation ´
Energies pour le Monde en 2012, la producci´on de energ´ıa dominante
es la producida a trav´es de combustibles f´osiles, la cual abarca m´as de dos tercios
de la producci´on total de energ´ıa (68,1 %) [15]. Este tipo de energ´ıa, adem´as de
ser no renovable, genera da˜nos ambientales irreversibles a nuestro planeta, debido
a las grandes cantidades de di´oxido de carbono (CO2) emitidas a la atm´osfera,
lo que aumenta los gases de efecto invernadero.
Un mecanismo que busca contrarrestar los da˜nos ambientales y reducir los
costos de producci´on de energ´ıa es el uso de energ´ıa renovable, tambi´en llamada
energ´ıa limpia. Se encuentra una amplia gama de opciones dentro de las energ´ıas
renovables como: solar, e´olica, biomasa, geot´ermica, residuos no renovables e
hidroel´ectrica, entre otras. De lo anterior, la energ´ıa solar y e´olica han presentado
un crecimiento anual global entre 2002 y 2012 de 50.6 % y 26.1 %, respectiva-
mente [15].
Teniendo en cuenta el gran y continuo crecimiento de estas energ´ıas reno-
vables, se han encontrado muchos desaf´ıos (satisfacer la demanda, reducir los
costes de producci´on, mejorar la planificaci´on de las plantas energ´eticas, etc.).
Para llegar a una plena adopci´on de este tipo de energ´ıa es necesario encontrar
soluciones eficaces a estos desaf´ıos. Una de las necesidades principales es hacer
predicciones de las variables involucradas en la producci´on de energ´ıa. Es decir,
tener una estimaci´on de la cantidad de energ´ıa que se producir´a en los pr´oximos
minutos, horas, d´ıas o meses [18]. Algunas de las variables involucradas en la
producci´on de energ´ıa limpia podr´ıan ser las siguientes: velocidad del viento,
temperatura, humedad, presi´on atmosferica, niveles de presas, causales de rios,
etc. En este trabajo, se trata espec´ıficamente en el pron´ostico de velocidad del
viento. La predicci´on de estas variables puede realizarse a corto, mediano y largo
plazo. No hay un marco de tiempo definido para cada uno de los per´ıodos [10].
82
Hector Rodriguez Rangel, Noel A. Garcia Carrillo, Juan J. Flores, Luis A. Morales Rosales, et al.
Research in Computing Science 139 (2017) ISSN 1870-4069
Sin embargo, regularmente se utilizan previsiones a mediano y largo plazo para la
planificaci´on t´actica y estrat´egica, respectivamente. La predicci´on a corto plazo
se utiliza a nivel operativo y su periodicidad puede ser en escala de tiempo de
minutos, horas, o d´ıas [10,5].
La capacidad de predecir la velocidad del viento es esencial para la integraci´on
correcta de la energ´ıa e´olica en los sistemas el´ectricos. Seg´un Barber et al. [2],
la importancia de los pron´osticos de viento para la industria de energ´ıa e´olica se
deriva de tres hechos: 1) La potencia agregada producida y consumida en todo el
sistema el´ectrico debe estar casi en equilibrio en todo momento para garantizar
la fiabilidad y la seguridad del suministro. 2) La potencia de un parque e´olico es
muy variable ya que depende fuertemente de la velocidad y direcci´on del viento.
y 3) No existe un mecanismo eficiente y rentable de almacenamiento de energ´ıa
el´ectrica.
Recientemente, una estimaci´on para el a˜no 2030 menciona que un pron´ostico
perfecto ser´a valorado en 3 billones de d´olares anuales [16], para el sistema de
energ´ıa de Estados Unidos. La estimaci´on fue realizada por el Departamento de
Energ´ıa [2]. Por lo tanto, la previsi´on de la velocidad del viento sigue desem-
pe˜nando un papel importante en la tarea de suministro de energ´ıa [5].
En la literatura se encontr´o que han habido diferentes enfoques utilizados
para esta tarea [4,13,9,1]. Chang presenta [5] un estudio que categoriza diferentes
enfoques que se ocupan del problema de pron´ostico que establece la Persistencia,
F´ısica, Estad´ıstica, Correlaciones Espaciales, Inteligencia Artificial y M´etodos
H´ıbridos. El m´etodo Persistence (o Na¨ıve) es un m´etodo de pron´ostico b´asico,
donde Yt+∆=Yt[20]. Este m´etodo particular se utiliza a menudo como un
m´etodo basal. Los m´etodos f´ısicos son predicciones num´ericas del tiempo desa-
rrolladas por los meteor´ologos para una predicci´on del tiempo a gran escala [12].
Los m´etodos estad´ısticos (ME) utilizan datos hist´oricos para encontrar relaciones
dentro de la serie de tiempo de velocidad del viento. Dentro de los m´etodos
estad´ısticos, tenemos el Auto Regresivo (AR), Auto Regresivo de Media M´ovil
(ARMA), y el Auto Regresivo Integrado de Media M´ovil (ARIMA), entre otros
[8,7,6]. Los m´etodos de Inteligencia Artificial (MIA) utilizan Redes Neuronales
Artificiales (RNA) [7,3], M´aquinas de Soporte Vectorial (MSV) [21], k-Vecinos
M´as Cercanos (kNN) [19], entre otros como m´etodos de predicci´on. Los MIA me-
joran en algunos casos los resultados obtenidos utilizando m´etodos estad´ısticos.
Los m´etodos h´ıbridos son una combinaci´on de m´etodos de predicci´on [7] (por
ejemplo, la combinaci´on de m´etodos estad´ısticos y de inteligencia artificial).
Los ME o MIA usualmente realizan el pron´ostico usando datos hist´oricos.
Pero, si el conjunto de datos presenta huecos en la representaci´on de sus obser-
vaciones, el ME puede tener problemas para realizar un pron´ostico adecuado.
En realidad, las series de tiempo de viento presentan datos faltantes debido a
problemas con los sensores (por ejemplo, problemas de comunicaci´on, desgaste
natural, falta de mantenimiento, etc.). La velocidad del viento es irregular e in-
termitente [11], lo que sumado al hecho de que las series temporales se encuentran
incompletas, la tarea de pron´ostico a corto plazo es a´un m´as dif´ıcil.
En este art´ıculo, enfrenta del problema de la reconstrucci´on de la series de
83
Pronóstico a corto plazo de velocidad del viento a partir de datos incompletos
Research in Computing Science 139 (2017)ISSN 1870-4069
tiempo de la velocidad del viento. Se propone una metodolog´ıa que se ocupa
de este problema, la cual puede trabajar fuera de l´ınea y en tiempo real. La
propuesta presentada comienza caracterizando el comportamiento temporal de
la serie de tiempo, creando una base de datos de patrones. A continuaci´on, se
modela la serie de tiempo utilizando un m´etodo h´ıbrido. Este m´etodo utiliza
una RNA como un enfoque de predicci´on y Algoritmos Gen´eticos (AG) para
definir la mejor topolog´ıa de la RNA. Una vez entrenada a la RNA, se procede a
reconstruir la serie de tiempo de velocidad del viento. Con estas series de tiempo
reconstru´ıdas se procede a realizar pron´ostico a corto plazo de la velocidad del
viento utilizando el algoritmo de k-Vecinos M´as Cercanos (kNN). El resto del
trabajo est´a organizado de la siguiente manera: La Secci´on 2 describe la meto-
dolog´ıa propuesta para la realizaci´on de la predicci´on a corto plazo, en donde
uno de los pasos previos al pron´ostico es el de reconstruir una serie temporal
de velocidad del viento, la Secci´on 3 presenta los experimentos realizados con
nuestra propuesta y finalmente las conclusiones de este trabajo se presentan en
la Secci´on 4.
2. Predicci´on de la velocidad del viento
El problema del pron´ostico de series de tiempo de la velocidad del viento no es
algo nuevo. Es una tarea complicada ya que hay una amplia gama de patrones de
comportamiento diferentes en los datos a modelar. Cada serie de tiempo cumple
con distintas caracter´ısticas y al modelar series de tiempo de viento se observa
distintos comportamientos, por lo que es necesario modelar cada una de ellas.
Con anterioridad, distintos m´etodos de pron´ostico se han implementado con el
objetivo de realizar pron´osticos [5]. De estos m´etodos sobresalen los que emplean
t´ecnicas de inteligencia artificial como las RNA [7,3], dado que en muchos de los
casos este m´etodo de pron´ostico proporciona mejores resultados que los obtenidos
mediante los ME.
Aunado a que el problema de realizar pron´osticos de series de tiempo es
naturalmente complicado; si a˜nade el problema de que la serie temporal podr´ıa
encontrarse incompleta, el problema incrementa su complejidad, aunque, hoy en
d´ıa hay una serie de algoritmos y t´ecnicas que ofrece una pron´ostico eficaz [5,20].
Sin embargo, en la mayor parte de la literatura, el problema de la predicci´on de
la velocidad del viento se aborda suponiendo que la serie temporal est´a completa
(sin ning´un hueco). Sin embargo, este no es el caso en realidad. Regularmente,
hay problemas con sensores que dan como resultado datos faltantes dentro de
la serie de tiempo de velocidad del viento. Para hacer frente a este problema
utilizando m´etodos estad´ısticos como ARIMA o Holt-Winters se convierte en
un trabajo no muy sencillo de realizar, o incluso imposible. Por lo tanto, en
este art´ıculo trata el problema de la reconstrucci´on de las series de tiempo de
velocidad del viento como una subtarea previa a la realizaci´on del pron´ostico a
corto plazo y realiza una comparaci´on entre los pron´osticos obtenidos con series
de tiempo reconstru´ıdas y los obtenidos con las series de tiempo sin reconstru´ır.
El proceso completo de pron´ostico se observar en la Figura 1.
84
Hector Rodriguez Rangel, Noel A. Garcia Carrillo, Juan J. Flores, Luis A. Morales Rosales, et al.
Research in Computing Science 139 (2017) ISSN 1870-4069
Serie%de%Tiempo%
Incompleta
Reconstru cción
Con%RNA
Pronóstico%
Con%kNN 𝑦"+ 1
Serie%de%Tiempo%
Reconstru ida
Fig. 1. Proceso de reconstrucci´on y pron´ostico de la serie de tiempo de la velocidad
del viento.
2.1. Reconstrucci´on de series de tiempo
Como ha sido mencionado con anterioridad, nos hemos visto en la necesidad
de reconstruir las observaciones faltantes en la serie de tiempo. Para lograr esto
es necesario realizar una serie de pasos los cuales se pueden observar en la Figura
2. Una vez completada la reconstrucci´on de datos se obtiene una nueva serie de
tiempo; esta nueva serie de tiempo reconstru´ıda es utilizada para la realizaci´on
del pron´ostico. Un ejemplo de reconstrucci´on de datos se puede observar en la
figura 3.
Serie%de%Tiempo%
Incompleta
Eliminación%de
Tem po ra lid ad
Construcción%del
Modelo%de%ST
Serie%de%Tiempo
Reconstrui da
Base%de%Datos
Fig. 2. Diagrama de flujo del proceso de reconstrucci´on de la serie de tiempo de la
velocidad del viento
Para hacerle frente a los huecos dentro de la serie de tiempo, se propone
la remoci´on de la temporalidad. En lugar de tener una ventana deslizante de
tama˜no m, el proceso de eliminaci´on de temporalidad crea una base de datos
en la que se registran mcaracter´ısticas de las series temporales, asociadas con
su respectivo valor de pron´ostico. Con la base de datos creada, se comienza
a construir el modelo de serie de tiempo (CTME). Este proceso utiliza una
RNA para modelar la serie de tiempo y Algoritmos Gen´eticos para definir la
arquitectura de la RNA [8,7,6]. Una vez definida la estructura ´optima y realizado
el proceso de entrenamiento de RNA, se comienza el proceso de reconstrucci´on
85
Pronóstico a corto plazo de velocidad del viento a partir de datos incompletos
Research in Computing Science 139 (2017)ISSN 1870-4069
de datos. La Figura 2 muestra el diagrama de flujo del proceso de reconstrucci´on
de la serie temporal de velocidad del viento.
950 1000 1050 Time
0.2
0.4
0.6
0.8
Magnitude
Fig. 3. Ejemplo de reconstrucci´on de datos en serie de tiempo.
2.1.1 Proceso de eliminaci´on de la temporalidad
Para tratar el problema de los huecos producidos por datos faltantes en las series
de tiempo, se propone la creaci´on de una base de datos. Regularmente, para el
problema de pron´ostico, hay una ventana de tama˜no mque se desliza a trav´es
de la serie de tiempo. Pero debido a los agujeros dentro de la serie de tiempo,
esta ventana ya no puede ser utilizada de la misma manera. Es por ello que se
propone crear una base de datos con los patrones temporales dentro de la serie
de tiempo de velocidad del viento. La base de datos registra las caracter´ısticas
de m(lecturas anteriores de la serie de tiempo) y las asocia con sus respectivos
valores de pron´ostico. Despu´es de crear la base de datos, se eliminan todos los
registros donde se encuentra ausencia de datos. Al convertir la serie de tiempo
a una base de datos, se puede dejar de lado la dimensi´on de tiempo.
La Tabla 1 muestra el resultado de crear la base de datos y extraer las w
caracter´ısticas asociadas con una salida esperada. Cada registro dentro de la
base de datos representa las ´ultimas mobservaciones en un tiempo definido (t),
asociado a la salida esperada yt+1 (para prop´ositos de entrenamiento). De la
Tabla 1 se observa que los registros m+ 2, m+ 3, m+ 4, m+ 5, m+ 6, m+ 7
presentan un hueco (φ) en su interior. Estos registros se eliminan. Con la base
de datos definida (sin los huecos), se puede comenzar a buscar una RNA que
modela el comportamiento de la serie del tiempo de la velocidad del viento.
2.1.2 Construcci´on del modelo de series de tiempo
86
Hector Rodriguez Rangel, Noel A. Garcia Carrillo, Juan J. Flores, Luis A. Morales Rosales, et al.
Research in Computing Science 139 (2017) ISSN 1870-4069
Tabla 1. Transformaci´on de la serie temporal en un problema de clasificaci´on.
entradas (Wt) ˆyt+1 =P(Wt)
m y1,y2,a3, . . . ymym+1
m+ 1 y2,y3,y4, . . . ym+1 ym+2
m+ 2 y3,y4,y5, . . . ym+2 φ
m+ 3 y4,y5,y6, . . . φ ym+4
m+ 4 y5,y6,y7, . . . ym+4 ym+5
m+ 5 y6,y7,φ, . . . ym+5 ym+6
m+ 6 y7,φ,y9, . . . ym+6 ym+7
m+ 7 φ,y9,y10 , . . . ym+7 ym+8
m+ 8 y9,y10,y11 , . . . ym+8 ym+9
m+ 9 y10,y11 ,y12, . . . ym+9,ym+10 ,
. . . . . .
n−1yn−m,yn−m+1,yn−m+2 , . . . yn−1yn
En trabajos recientes, se ha demostrado que las RNA presentan grandes cua-
lidades de clasificaci´on [5]. Una vez definida la base de datos, se aborda el
problema de regresi´on que permite crear un modelo capaz de representar el
comportamiento de la serie de tiempo de la velocidad del viento.
En este art´ıculo, la arquitectura propuesta de la RNA es un Feedforward
Multilayer Perceptron, entrenado por m´etodos basados en gradiente. La Figura
4 muestra la arquitectura de la RNA propuesta en este trabajo. Una RNA, como
un aproximador universal puede aprender cualquier funci´on dada. Un conjunto
de mobservaciones pasadas se consideran como los datos de entrada, la capa
oculta consta de hneuronas ocultas, la capa de salida corresponde al valor de
pron´ostico ˆyt+1 ; se utiliza un sigmoide como funci´on de activaci´on. La RNA que
modela la serie de tiempo de velocidad del viento ˆyt+1 puede definirse como:
ˆyt+i=f1(
w+1
X
l
wlxl),
xl=f2(
m
X
j
wlj yt−lj),
(1)
donde f1yf2son las funciones de activaci´on, y wson los coeficientes (tambi´en
conocidos pesos de sin´apticos).
Para modelar el comportamiento de la serie de tiempo de velocidad del viento,
se necesita proporcionar un modelo preciso. Para definir la exactitud del modelo
´optimo, se utilizo la medida estad´ıstica de la media del error al cuadrado (MSE),
que se define como:
MSE =1
n
n
X
i=1
(ˆyi−yi)2.(2)
Esta medida se minimizar´a durante el proceso de entrenamiento.
87
Pronóstico a corto plazo de velocidad del viento a partir de datos incompletos
Research in Computing Science 139 (2017)ISSN 1870-4069
Fig. 4. Arquitectura de RNA con m+ 1 observaciones pasadas, hneuronas en su capa
oculta y una ´unica salida (ˆyt+1 ).
Algoritmos gen´eticos (AG) son una t´ecnica de optimizaci´on inspirada en
el principio de la evoluci´on de Darwin. Esto es, imita una versi´on simplista del
proceso de evoluci´on biol´ogica, que consiste en crear una poblaci´on de individuos,
donde cada individuo representa una soluci´on prospectiva del problema que se
est´a resolviendo. AG modifica esta poblaci´on utilizando operadores gen´eticos:
selecci´on, mutaci´on y recombinaci´on [17].
Determinar la mejor arquitectura de RNA y el algoritmo de entrenamiento
es un problema de optimizaci´on. Esto es, definen la arquitectura de la RNA
determinando el n´umero de entradas y el n´umero de neuronas en la capa oculta.
Este es un paso cr´ıtico en el proceso de entrenamiento que generalmente se realiza
por ensayo y error. En trabajos anteriores, el uso de AG ha sido probado dando
excelentes resultados [8]. Cada individuo (el cromosoma) en el AG se define
como un vector binario que est´a codificando el n´umero de entradas y el n´umero
de neuronas ocultas de la RNA. El algoritmo empleado de AG para encontrar
la mejor topolog´ıa de RNA se describe paso a paso el Algoritmo 1.
El AG comienza generando una poblaci´on inicial, a partir de esta poblaci´on
se eval´uan todos sus individuos. El proceso continua aplicando selecci´on cruza,
mutaci´on a los individuos de la poblaci´on. Este procedimiento se repite hasta
que se alcanza un criterio de convergencia. El pseudoc´odigo de este proceso lo
encontramos en el Algoritmo 1. El algoritmo gen´etico proporciona b´asicamente
como resultado el n´umero de entradas, neuronas en la capa oculta y algoritmo
de entrenamiento. Despu´es de definir la topolog´ıa de la RNA, se comienza un
88
Hector Rodriguez Rangel, Noel A. Garcia Carrillo, Juan J. Flores, Luis A. Morales Rosales, et al.
Research in Computing Science 139 (2017) ISSN 1870-4069
proceso de refinamiento. El refinamiento es el mismo proceso, simplemente se da
la oportunidad de un entrenamiento m´as extenso con la topolog´ıa de la red ya
definida [7,3].
Algorithm 1 Encontrando la mejor topolog´ıa para la red usando AG
1: procedure AG
2: Generar una poblaci´on inicial
3: Computar la funci´on de evaluaci´on de cada individuo
4: while NOT Terminado do
5: //Producir nueva generaci´on
6: for Tama~no Poblaci´on/2 do
7: BEGIN //ciclo reproductivo
8: Seleccionar dos individuos de la anterior generaci´on, para el cruce
9: (probabilidad de selecci´on proporcional a la funci´on de evaluaci´on del
10: individuo).
11: Cruzar con cierta probabilidad los dos individuos obteniendo dos
12: descendientes.
13: Mutar los dos descendientes con cierta probabilidad.
14: Computar la funci´on de evaluaci´on de los dos descendientes mutados.
15: Insertar los dos descendientes mutados en la nueva generaci´on.
16: Seleccionar los np mejores individuos.
17: END //ciclo reproductivo
18: if La poblaci´on ha convergido then Terminado := True
19: return mejor individuo
2.1.3 Reconstrucci´on de datos
Para el proceso de reconstrucci´on, se utiliza la RNA que modela el compor-
tamiento de la serie de tiempo de velocidad del viento. Usando este modelo, se
puede comenzar con el proceso de reconstrucci´on. Este proceso comienza con
un vector de observaciones ordenadas que se eval´uan secuencialmente. Cuando
se encuentra un hueco o dato faltante en la serie temporal, comienza el proceso
de datos de reconstrucci´on. Este proceso utiliza las m´ultimas observaciones del
vector utilizado como entrada. La salida de la RNA ya entrenada en los pasos
anteriores se utiliza para llenar el vac´ıo. El proceso contin´ua hasta que se alcanza
el final del vector de observaci´on. La Figura 5 muestra el diagrama de flujo del
proceso de reconstrucci´on.
2.1.4 Pron´ostico a corto plazo mediante Vecinos m´as Cercanos (kNN)
89
Pronóstico a corto plazo de velocidad del viento a partir de datos incompletos
Research in Computing Science 139 (2017)ISSN 1870-4069
Serie%de%Tiempo%
Incompleta
Base%de%Datos
Existen%
datos?
Reconstruc ción
De%
Datos
Si
No
Fig. 5. Proceso de reconstrucci´on de datos faltantes
Para el pron´ostico a corto plazo de la velocidad del viento, se utilizan las series
reconstruidas de acuerdo a los pasos definidos previamente. Para el pron´ostico se
propone utilizar el algoritmo de k Vecinos m´as Cercanos (kNN). Este algoritmo es
una t´ecnica de clasificaci´on y regresi´on basada en la similaridad de los individuos
de una poblaci´on. La premisa de esta t´ecnica indica que los miembros de una
poblaci´on coexisten rodeados de individuos similares que tienen propiedades
similares. Esta idea sencilla es la regla de aprendizaje del los clasificador y
regresores kNN. Como se muestra en la Figura 6 donde se busca la similaridad
de los individuos m´as cercanos.
Fig. 6. Ejemplo de clasificaci´on basada en la similaridad de los individuos kNN.
Un algoritmo kNN particular, se caracteriza por cuestiones tales como el
n´umero de vecinos, el tipo de distancia utilizada, etc. El m´etodo usado en este
90
Hector Rodriguez Rangel, Noel A. Garcia Carrillo, Juan J. Flores, Luis A. Morales Rosales, et al.
Research in Computing Science 139 (2017) ISSN 1870-4069
documento, para realizar el pronostico de yt+1, es necesario buscar la similitud
del individuo xen la base de datos definida en la Tabla 1. Donde el individuo x
es definido como las observaciones pasadas de la serie de tiempo en un tiempo t
(x= [yt−w, yt−w+1, ..., yt]). Despu´es de evaluar las distancias de los individuos de
la base de datos, se toman los kvecinos m´as cercanos y el pronostico resultante
es el promedio de la columna yt+1 de la Tabla 1. La definici´on matem´atica de
nuestro modelo de kNN se puede observar a continuaci´on:
ˆyt+1 =1
k
k
X
i=1
P(V C(i, yt)).(3)
La distancia euclidiana de dos individuos se define por la Ec. (4):
d(r, s) = v
u
u
t
m
X
j=1
(rj−sj)2.(4)
La ventana que termina en el tiempo t, denotada por wtes la secuencia o
vector de las mmediciones hasta tcomo se indica en la Ec. (5):
wt= [yt−m+1, yt]∈Rm.(5)
La definici´on recursiva del conjunto de kvecinos m´as cercanos es:
V C(k , x) = argmin(d(w, x)|w∈W−Vk−1(x)),(6)
donde:
Vk(x) =
k
[
j=0
V Cj(k, x),
V(0, x) = φ.
(7)
Para la determinaci´on de los n´umeros adecuados de kywse realiz´o una
exploraci´on en un rango de valores lo suficientemente amplio para establecer las
combinaciones que permitan llegar a un valor de error menor. En este caso se
realizaron experimentos en donde se iteraron estos valores desde k= 1 hasta
k= 100 y desde w= 1 hasta w= 100. Un ejemplo gr´afico de esta exploraci´on se
observa en la Figura 7, en donde el eje vertical indica la magnitud de los errores.
3. Resultados
Para probar la aptitud de nuestra propuesta, se realizaron experimentos con
series de tiempo de la velocidad del viento procedentes de anem´ometros ubicados
en seis diferentes lugares dentro del estado de Michoac´an, M´exico, con registros
a intervalos horarios. Dado que los sensores son susceptibles a fallas de funciones
y errores de lectura, se tiene el problema de la obtenci´on de series de tiempo con
datos faltantes.
91
Pronóstico a corto plazo de velocidad del viento a partir de datos incompletos
Research in Computing Science 139 (2017)ISSN 1870-4069
Fig. 7. Exploraci´on de valores ´optimos de kywpara el pron´ostico mediante kNN.
Se realizaron varios experimentos aplicando el enfoque del m´etodo de re-
construcci´on de la serie de tiempo descrito en la Figura 2. Cada experimento
comienza eliminando la temporalidad de la serie temporal creando una base de
datos siguiendo el procedimiento descrito en la secci´on anterior. Una vez obtenida
la base de datos, definimos una RNA que modela el comportamiento de la serie
de tiempo de velocidad del viento.
La topolog´ıa obtenida en esta etapa se utiliza en un proceso de refinamiento,
que s´olo aumenta el n´umero de ´epocas, en este caso, se us´o hasta 3,000 ´epocas.
Una vez realizada la reconstrucci´on y obtenida la nueva serie de tiempo
reconstruida; ´esta es utilizada como entrada para el proceso de pron´ostico me-
diante el algoritmo de kNN. Realizamos experimentos con seis series de tiempo
de distintas estaciones de viento. Paralelamente se realiz´o el mismo proceso de
pron´ostico con las series de tiempo sin reconstruir. La aptitud de los pron´osticos
realizados se muestra en la Tabla 2.
Tabla 2. Comparativa de errores definidos por la medida estad´ıstica MSE obtenidos
en los pron´osticos utilizando RNA y kNN en series sin reconstruir y reconstruidas.
MSE en Pron´ostico RNA vs kNN
Sin reconstruir Reconstruida
RNA kNN Na¨ıve RNA KNN Na¨ıve
1 La Palma 0.0078 0.0028 0.0067 0.0079 0.0034 0.0086
2 La Piedad 0.0076 0.0047 0.0073 0.0077 0.0052 0.0081
3 Markazuza 0.0010 0.0008 0.0011 0.0010 0.0001 0.0005
4 Aristeo Mercado 0.0071 0.0037 0.0084 0.0073 0.0037 0.0087
5 Corrales 0.0022 0.0008 0.0012 0.0037 0.0001 0.0006
6 Melchor Ocampo 0.0144 0.0073 0.0112 0.0137 0.0082 0.0115
92
Hector Rodriguez Rangel, Noel A. Garcia Carrillo, Juan J. Flores, Luis A. Morales Rosales, et al.
Research in Computing Science 139 (2017) ISSN 1870-4069
Un ejemplo gr´afico del proceso de reconstrucci´on se muestra en la Figura 3.
En la Figura 3, la l´ınea continua representa los datos reales, y los punteados
representa la reconstrucci´on. Una vez realizado la reconstruci´on se procedio a
realizar el pronostico mediante el uso de kNN. En la Figura 8 muestra un ejemplo
de pron´ostico de tres series de tiempo correspondientes a Aristeo Mercado,
Corrales, y Melchor Ocampo. Para esta Figura 8, la linea continua representa
los datos reales y la punteada representa al pronostico.
50 100 150 200 Time
0.1
0.2
0.3
0.4
0.5
0.6
Magnitude
(a) Aristeo Mercado
50 100 150 200 Time
0.50
0.52
0.54
0.56
0.58
0.60
0.62
Magnitude
(b) Corrales
50 100 150 200
0.2
0.4
0.6
0.8
(c) Melchor Ocampo
Fig. 8. Resultado del pron´ostico kNN de las estaciones Aristeo Mercado, Corrales,
Melchor Ocampo, con serie reconstruida por RNA.
4. Conclusiones
Este art´ıculo ha propuesto un enfoque de reconstrucci´on de series de tiempo
basado en una metodolog´ıa neural-evolutiva h´ıbrida. Esta metodolog´ıa permite
determinar las arquitecturas ´optimas de RNA para modelar series temporales
incompletas y posteriormente para poder reconstruirlas. Los experimentos se
realizaron considerando m´ultiples series temporales con datos faltantes. Se ge-
neraron modelos y reconstrucci´on de datos. Se realiz´o una comparaci´on entre
93
Pronóstico a corto plazo de velocidad del viento a partir de datos incompletos
Research in Computing Science 139 (2017)ISSN 1870-4069
los pron´osticos obtenidos a partir de series de tiempo reconstruidas y series de
tiempo con datos faltantes. Se determin´o que en algunos casos la reconstrucci´on
puede mejorar la eficiencia del pron´ostico pero en otros caso no ocurr´ıa lo mismo.
Se requiere de realizar un an´alisis estad´ıstico para determinar la superioridad de
un m´etodo sobre otro. Los experimentos se realizaron utilizando la plataforma
Python utilizando la biblioteca Neurolab [14] para las implementaciones de RNA.
Referencias
1. Alexiadis, M., Dokopoulos, P., Sahsamanoglou, H., Manousaridis, I.: Short-term
forecasting of wind speed and related electrical power. Solar Energy 63(1), 61–68
(1998)
2. Barber, C., Bockhorst, J., Roebber, P.: Auto-regressive hmm inference with incom-
plete data for short-horizon wind forecasting. In: Advances in Neural Information
Processing Systems. pp. 136–144 (2010)
3. Barbounis, T.G., Theocharis, J.B., Alexiadis, M.C., Dokopoulos, P.S.: Long-term
wind speed and power forecasting using local recurrent neural network models.
IEEE Transactions on Energy Conversion 21(1), 273–284 (2006)
4. Cassola, F., Burlando, M.: Wind speed and wind energy forecast through kalman
filtering of numerical weather prediction model output. Applied energy 99, 154–166
(2012)
5. Chang, W.Y.: A literature review of wind forecasting methods. Journal of Power
and Energy Engineering 2(04), 161 (2014)
6. Erdem, E., Shi, J.: Arma based approaches for forecasting the tuple of wind speed
and direction. Applied Energy 88(4), 1405–1414 (2011)
7. Flores, J.J., Graff, M., Rodriguez, H.: Evolutive design of arma and ann models
for time series forecasting. Renewable Energy 44, 225–230 (2012)
8. Flores, J.J., Loaeza, R., Rodr´ıguez, H., Cadenas, E.: Wind speed forecasting
using a hybrid neural-evolutive approach. In: MICAI 2009: Advances in Artificial
Intelligence, pp. 600–609. Springer (2009)
9. Foley, A.M., Leahy, P.G., Marvuglia, A., McKeogh, E.J.: Current methods and
advances in forecasting of wind power generation. Renewable Energy 37(1), 1–8
(2012)
10. Giacomoni, M., Kanta, L., Zechman, E.: Complex adaptive systems approach to
simulate the sustainability of water resources and urbanization. Journal of Water
Resources Planning and Management 139(5), 554–564 (2013)
11. Hayashi, M., Kermanshahi, B.: Application of artificial neural network for wind
speed prediction and determination of wind power generation output. In: Procee-
dings of ICEE. pp. 12–15 (2001)
12. Lei, M., Shiyan, L., Chuanwen, J., Hongling, L., Yan, Z.: A review on the
forecasting of wind speed and generated power. Renewable and Sustainable Energy
Reviews 13(4), 915–920 (2009)
13. Liu, H., Tian, H., Pan, D., Li, Y.: Forecasting models for wind speed using wavelet,
wavelet packet, time series and artificial neural networks. Applied Energy 107,
191–208 (2013)
14. Neurolab: Neurolab a python plugin. Available:
https://pypi.python.org/pypi/neurolab [Online]
15. Observ, E.: Worldwide electricity production from renewable energy sources. Ninth
inventory (2012)
94
Hector Rodriguez Rangel, Noel A. Garcia Carrillo, Juan J. Flores, Luis A. Morales Rosales, et al.
Research in Computing Science 139 (2017) ISSN 1870-4069
16. Piwko, D., Jordan, G.: The economic value of day-ahead wind forecasts for power
grid operations. In: 2010 UWIG Workshop on Wind Forecasting (2010)
17. Rangel, H.R., Puig, V., Farias, R.L., Flores, J.J.: Short-term demand forecast using
a bank of neural network models trained using genetic algorithms for the optimal
management of drinking water networks. Journal of Hydroinformatics (2016),
http://jh.iwaponline.com/content/early/2016/08/31/hydro.2016.199
18. Rodriguez Rangel, H., Puig, V., Farias, R.L., Flores, J.J.: Short-term demand
forecast using a bank of neural network models trained using genetic algorithms for
the optimal management of drinking water networks. Journal of Hydroinformatics
(2016)
19. Yesilbudak, M., Sagiroglu, S., Colak, I.: A new approach to very short term wind
speed prediction using k-nearest neighbor classification. Energy Conversion and
Management 69, 77–86 (2013)
20. Zhao, X., Wang, S., Li, T.: Review of evaluation criteria and main methods of wind
power forecasting. Energy Procedia 12, 761–769 (2011)
21. Zhou, J., Shi, J., Li, G.: Fine tuning support vector machines for short-term wind
speed forecasting. Energy Conversion and Management 52(4), 1990–1998 (2011)
95
Pronóstico a corto plazo de velocidad del viento a partir de datos incompletos
Research in Computing Science 139 (2017)ISSN 1870-4069