ArticlePDF Available

Pronóstico a corto plazo de velocidad del viento a partir de datos incompletos Wind Speed Short-term Forecasting from Incomplete Data

Authors:

Abstract and Figures

En este artıculo se presenta un estudio realizado a la prediccion a corto plazo de la velocidad del viento en series de tiempo incompletas. Se ha propuesto realizar este estudio dado el incremento en el interes hacia la transicion global de la produccion de energıas limpias. Siendo el pronostico de dicha variable de suma importancia para las etapas de planeacio ́n, administracion y produccion. El proceso de pronostico implica el uso de observaciones pasadas de la variable a pronosticar (velocidad del viento). Para medir la velocidad del viento, las estaciones meteorologicas utilizan dispositivos llamados anemometros, pero debido a un mal mantenimiento, errores de conexion o desgaste natural, pueden presentar datos falsos o faltantes. En este trabajo, se explora la reconstruccion la serie de tiempo mediante Redes Neuronales Artificiales, para posteriormente realizar el pronostico a corto plazo de la serie de tiempo de la velocidad del viento utilizando el metodo de k Vecinos mas Cercanos. Para probar la metodologıa propuesta, se utilizaron datos recolectados de diferentes locaciones del estado de Michoacan.
Content may be subject to copyright.
Pron´ostico a corto plazo de velocidad del viento
a partir de datos incompletos
Hector Rodriguez Rangel1, Noel A. Garcia Carrillo1, Juan J. Flores2,
Luis A. Morales Rosales3, Giovanni Manjarrez Montelongo1
1Instituto Tecnol´ogico de Culiac´an, Divisi´on de Estudios de Posgrado e Investigaci´on,
Culiacan, M´exico
2Divisi´on de Estudios de Postgrado, Facultad de Ingenier´ıa El´ectrica,
Universidad Michoacana de San Nicol´as de Hidalgo, Morelia, Michoac´an, M´exico
3Facultad de Ingenier´ıa Civil,
CONACYT-Universidad Michoacana de San Nicol´as de Hidalgo,
Morelia, Michoac´an, M´exico
hrodriguez@itculiacan.edu.mx, noelandresg@gmail.com, juanf@umich.mx,
amorales@conacyt.mx, gmanjarrez@itculiacan.edu.mx
Resumen. En este art´ıculo se presenta un estudio realizado a la pre-
dicci´on a corto plazo de la velocidad del viento en series de tiempo
incompletas. Se ha propuesto realizar este estudio dado el incremento
en el inter´es hacia la transici´on global de la producci´on de energ´ıas
limpias. Siendo el pron´ostico de dicha variable de suma importancia
para las etapas de planeaci´on, administraci´on y producci´on. El proceso
de pron´ostico implica el uso de observaciones pasadas de la variable a
pronosticar (velocidad del viento). Para medir la velocidad del viento, las
estaciones meteorol´ogicas utilizan dispositivos llamados anem´ometros,
pero debido a un mal mantenimiento, errores de conexi´on o desgaste
natural, pueden presentar datos falsos o faltantes. En este trabajo, se
explora la reconstrui´on la serie de tiempo mediante Redes Neuronales
Artificiales, para posteriormente realizar el pron´ostico a corto plazo de
la serie de tiempo de la velocidad del viento utilizando el m´etodo de k
Vecinos m´as Cercanos. Para probar la metodolog´ıa propuesta, se utiliza-
ron datos recolectados de diferentes locaciones del estado de Michoac´an.
Palabras clave: pron´ostico de la velocidad del viento, recostrucci´on
de series de tiempo, RNA, kNN.
Wind Speed Short-term Forecasting
from Incomplete Data
Abstract. This paper presents a wind speed short-term forecasting
from incomplete time series. This study has been proposed given the in-
terest increasing in a global transition of clean energy production. Being
81
ISSN 1870-4069
Research in Computing Science 139 (2017)pp. 81–95; rec. 2017-03-12; acc. 2017-05-06
the forecast of interest variable an important process for the planning,
administration and production stages. The forecasting process involves
the use of historical data of the variable to be forecast (wind speed).
Measuring the wind speed, weather stations use devices called anemo-
meters, but due poor maintenance, connection errors or natural wear,
they may present false or missing data. In this work, the reconstruction of
the time series using Artificial Neural Networks is explored, and then the
short-term forecast of the time series of the wind speed using the method
of k Nearest Neighbors is presented. To test the proposed methodology,
we used data collected from different locations in the state of Michoacan.
Keywords: wind speed forecast, time series reconstruction, ANN, kNN.
1. Introducci´on
La energ´ıa desempe˜na un papel de suma importancia en las actividades
humanas. As´ı, la producci´on de energ´ıa se ha convertido en una de las principales
cuestiones econ´omicas y medioambientales en todo el mundo [15]. Adem´as, la
demanda de energ´ıa ha aumentado constantemente con el tiempo, causando
da˜nos al medio ambiente al producirla. Seg´un el censo realizado por Observ’ER &
Foundation ´
Energies pour le Monde en 2012, la producci´on de energ´ıa dominante
es la producida a trav´es de combustibles f´osiles, la cual abarca m´as de dos tercios
de la producci´on total de energ´ıa (68,1 %) [15]. Este tipo de energ´ıa, adem´as de
ser no renovable, genera da˜nos ambientales irreversibles a nuestro planeta, debido
a las grandes cantidades de di´oxido de carbono (CO2) emitidas a la atm´osfera,
lo que aumenta los gases de efecto invernadero.
Un mecanismo que busca contrarrestar los da˜nos ambientales y reducir los
costos de producci´on de energ´ıa es el uso de energ´ıa renovable, tambi´en llamada
energ´ıa limpia. Se encuentra una amplia gama de opciones dentro de las energ´ıas
renovables como: solar, e´olica, biomasa, geot´ermica, residuos no renovables e
hidroel´ectrica, entre otras. De lo anterior, la energ´ıa solar y e´olica han presentado
un crecimiento anual global entre 2002 y 2012 de 50.6 % y 26.1 %, respectiva-
mente [15].
Teniendo en cuenta el gran y continuo crecimiento de estas energ´ıas reno-
vables, se han encontrado muchos desaf´ıos (satisfacer la demanda, reducir los
costes de producci´on, mejorar la planificaci´on de las plantas energ´eticas, etc.).
Para llegar a una plena adopci´on de este tipo de energ´ıa es necesario encontrar
soluciones eficaces a estos desaf´ıos. Una de las necesidades principales es hacer
predicciones de las variables involucradas en la producci´on de energ´ıa. Es decir,
tener una estimaci´on de la cantidad de energ´ıa que se producir´a en los pr´oximos
minutos, horas, d´ıas o meses [18]. Algunas de las variables involucradas en la
producci´on de energ´ıa limpia podr´ıan ser las siguientes: velocidad del viento,
temperatura, humedad, presi´on atmosferica, niveles de presas, causales de rios,
etc. En este trabajo, se trata espec´ıficamente en el pron´ostico de velocidad del
viento. La predicci´on de estas variables puede realizarse a corto, mediano y largo
plazo. No hay un marco de tiempo definido para cada uno de los per´ıodos [10].
82
Hector Rodriguez Rangel, Noel A. Garcia Carrillo, Juan J. Flores, Luis A. Morales Rosales, et al.
Research in Computing Science 139 (2017) ISSN 1870-4069
Sin embargo, regularmente se utilizan previsiones a mediano y largo plazo para la
planificaci´on t´actica y estrat´egica, respectivamente. La predicci´on a corto plazo
se utiliza a nivel operativo y su periodicidad puede ser en escala de tiempo de
minutos, horas, o d´ıas [10,5].
La capacidad de predecir la velocidad del viento es esencial para la integraci´on
correcta de la energ´ıa e´olica en los sistemas el´ectricos. Seg´un Barber et al. [2],
la importancia de los pron´osticos de viento para la industria de energ´ıa e´olica se
deriva de tres hechos: 1) La potencia agregada producida y consumida en todo el
sistema el´ectrico debe estar casi en equilibrio en todo momento para garantizar
la fiabilidad y la seguridad del suministro. 2) La potencia de un parque e´olico es
muy variable ya que depende fuertemente de la velocidad y direcci´on del viento.
y 3) No existe un mecanismo eficiente y rentable de almacenamiento de energ´ıa
el´ectrica.
Recientemente, una estimaci´on para el a˜no 2030 menciona que un pron´ostico
perfecto ser´a valorado en 3 billones de d´olares anuales [16], para el sistema de
energ´ıa de Estados Unidos. La estimaci´on fue realizada por el Departamento de
Energ´ıa [2]. Por lo tanto, la previsi´on de la velocidad del viento sigue desem-
pe˜nando un papel importante en la tarea de suministro de energ´ıa [5].
En la literatura se encontr´o que han habido diferentes enfoques utilizados
para esta tarea [4,13,9,1]. Chang presenta [5] un estudio que categoriza diferentes
enfoques que se ocupan del problema de pron´ostico que establece la Persistencia,
F´ısica, Estad´ıstica, Correlaciones Espaciales, Inteligencia Artificial y M´etodos
H´ıbridos. El m´etodo Persistence (o Na¨ıve) es un m´etodo de pron´ostico b´asico,
donde Yt+=Yt[20]. Este m´etodo particular se utiliza a menudo como un
etodo basal. Los m´etodos f´ısicos son predicciones num´ericas del tiempo desa-
rrolladas por los meteor´ologos para una predicci´on del tiempo a gran escala [12].
Los m´etodos estad´ısticos (ME) utilizan datos hist´oricos para encontrar relaciones
dentro de la serie de tiempo de velocidad del viento. Dentro de los m´etodos
estad´ısticos, tenemos el Auto Regresivo (AR), Auto Regresivo de Media M´ovil
(ARMA), y el Auto Regresivo Integrado de Media M´ovil (ARIMA), entre otros
[8,7,6]. Los m´etodos de Inteligencia Artificial (MIA) utilizan Redes Neuronales
Artificiales (RNA) [7,3], M´aquinas de Soporte Vectorial (MSV) [21], k-Vecinos
as Cercanos (kNN) [19], entre otros como m´etodos de predicci´on. Los MIA me-
joran en algunos casos los resultados obtenidos utilizando m´etodos estad´ısticos.
Los m´etodos h´ıbridos son una combinaci´on de m´etodos de predicci´on [7] (por
ejemplo, la combinaci´on de m´etodos estad´ısticos y de inteligencia artificial).
Los ME o MIA usualmente realizan el pron´ostico usando datos hist´oricos.
Pero, si el conjunto de datos presenta huecos en la representaci´on de sus obser-
vaciones, el ME puede tener problemas para realizar un pron´ostico adecuado.
En realidad, las series de tiempo de viento presentan datos faltantes debido a
problemas con los sensores (por ejemplo, problemas de comunicaci´on, desgaste
natural, falta de mantenimiento, etc.). La velocidad del viento es irregular e in-
termitente [11], lo que sumado al hecho de que las series temporales se encuentran
incompletas, la tarea de pron´ostico a corto plazo es a´un m´as dif´ıcil.
En este art´ıculo, enfrenta del problema de la reconstrucci´on de la series de
83
Pronóstico a corto plazo de velocidad del viento a partir de datos incompletos
Research in Computing Science 139 (2017)ISSN 1870-4069
tiempo de la velocidad del viento. Se propone una metodolog´ıa que se ocupa
de este problema, la cual puede trabajar fuera de l´ınea y en tiempo real. La
propuesta presentada comienza caracterizando el comportamiento temporal de
la serie de tiempo, creando una base de datos de patrones. A continuaci´on, se
modela la serie de tiempo utilizando un m´etodo h´ıbrido. Este m´etodo utiliza
una RNA como un enfoque de predicci´on y Algoritmos Gen´eticos (AG) para
definir la mejor topolog´ıa de la RNA. Una vez entrenada a la RNA, se procede a
reconstruir la serie de tiempo de velocidad del viento. Con estas series de tiempo
reconstru´ıdas se procede a realizar pron´ostico a corto plazo de la velocidad del
viento utilizando el algoritmo de k-Vecinos M´as Cercanos (kNN). El resto del
trabajo est´a organizado de la siguiente manera: La Secci´on 2 describe la meto-
dolog´ıa propuesta para la realizaci´on de la predicci´on a corto plazo, en donde
uno de los pasos previos al pron´ostico es el de reconstruir una serie temporal
de velocidad del viento, la Secci´on 3 presenta los experimentos realizados con
nuestra propuesta y finalmente las conclusiones de este trabajo se presentan en
la Secci´on 4.
2. Predicci´on de la velocidad del viento
El problema del pron´ostico de series de tiempo de la velocidad del viento no es
algo nuevo. Es una tarea complicada ya que hay una amplia gama de patrones de
comportamiento diferentes en los datos a modelar. Cada serie de tiempo cumple
con distintas caracter´ısticas y al modelar series de tiempo de viento se observa
distintos comportamientos, por lo que es necesario modelar cada una de ellas.
Con anterioridad, distintos m´etodos de pron´ostico se han implementado con el
objetivo de realizar pron´osticos [5]. De estos m´etodos sobresalen los que emplean
ecnicas de inteligencia artificial como las RNA [7,3], dado que en muchos de los
casos este m´etodo de pron´ostico proporciona mejores resultados que los obtenidos
mediante los ME.
Aunado a que el problema de realizar pron´osticos de series de tiempo es
naturalmente complicado; si a˜nade el problema de que la serie temporal podr´ıa
encontrarse incompleta, el problema incrementa su complejidad, aunque, hoy en
d´ıa hay una serie de algoritmos y t´ecnicas que ofrece una pron´ostico eficaz [5,20].
Sin embargo, en la mayor parte de la literatura, el problema de la predicci´on de
la velocidad del viento se aborda suponiendo que la serie temporal est´a completa
(sin ning´un hueco). Sin embargo, este no es el caso en realidad. Regularmente,
hay problemas con sensores que dan como resultado datos faltantes dentro de
la serie de tiempo de velocidad del viento. Para hacer frente a este problema
utilizando m´etodos estad´ısticos como ARIMA o Holt-Winters se convierte en
un trabajo no muy sencillo de realizar, o incluso imposible. Por lo tanto, en
este art´ıculo trata el problema de la reconstrucci´on de las series de tiempo de
velocidad del viento como una subtarea previa a la realizaci´on del pron´ostico a
corto plazo y realiza una comparaci´on entre los pron´osticos obtenidos con series
de tiempo reconstru´ıdas y los obtenidos con las series de tiempo sin reconstru´ır.
El proceso completo de pron´ostico se observar en la Figura 1.
84
Hector Rodriguez Rangel, Noel A. Garcia Carrillo, Juan J. Flores, Luis A. Morales Rosales, et al.
Research in Computing Science 139 (2017) ISSN 1870-4069
Serie%de%Tiempo%
Incompleta
Reconstru cción
Con%RNA
Pronóstico%
Con%kNN 𝑦"+ 1
Serie%de%Tiempo%
Reconstru ida
Fig. 1. Proceso de reconstrucci´on y pron´ostico de la serie de tiempo de la velocidad
del viento.
2.1. Reconstrucci´on de series de tiempo
Como ha sido mencionado con anterioridad, nos hemos visto en la necesidad
de reconstruir las observaciones faltantes en la serie de tiempo. Para lograr esto
es necesario realizar una serie de pasos los cuales se pueden observar en la Figura
2. Una vez completada la reconstrucci´on de datos se obtiene una nueva serie de
tiempo; esta nueva serie de tiempo reconstru´ıda es utilizada para la realizaci´on
del pron´ostico. Un ejemplo de reconstrucci´on de datos se puede observar en la
figura 3.
Serie%de%Tiempo%
Incompleta
Eliminación%de
Tem po ra lid ad
Construcción%del
Modelo%de%ST
Serie%de%Tiempo
Reconstrui da
Base%de%Datos
Fig. 2. Diagrama de flujo del proceso de reconstrucci´on de la serie de tiempo de la
velocidad del viento
Para hacerle frente a los huecos dentro de la serie de tiempo, se propone
la remoci´on de la temporalidad. En lugar de tener una ventana deslizante de
tama˜no m, el proceso de eliminaci´on de temporalidad crea una base de datos
en la que se registran mcaracter´ısticas de las series temporales, asociadas con
su respectivo valor de pron´ostico. Con la base de datos creada, se comienza
a construir el modelo de serie de tiempo (CTME). Este proceso utiliza una
RNA para modelar la serie de tiempo y Algoritmos Gen´eticos para definir la
arquitectura de la RNA [8,7,6]. Una vez definida la estructura ´optima y realizado
el proceso de entrenamiento de RNA, se comienza el proceso de reconstrucci´on
85
Pronóstico a corto plazo de velocidad del viento a partir de datos incompletos
Research in Computing Science 139 (2017)ISSN 1870-4069
de datos. La Figura 2 muestra el diagrama de flujo del proceso de reconstrucci´on
de la serie temporal de velocidad del viento.
950 1000 1050 Time
0.2
0.4
0.6
0.8
Magnitude
Fig. 3. Ejemplo de reconstrucci´on de datos en serie de tiempo.
2.1.1 Proceso de eliminaci´on de la temporalidad
Para tratar el problema de los huecos producidos por datos faltantes en las series
de tiempo, se propone la creaci´on de una base de datos. Regularmente, para el
problema de pron´ostico, hay una ventana de tama˜no mque se desliza a trav´es
de la serie de tiempo. Pero debido a los agujeros dentro de la serie de tiempo,
esta ventana ya no puede ser utilizada de la misma manera. Es por ello que se
propone crear una base de datos con los patrones temporales dentro de la serie
de tiempo de velocidad del viento. La base de datos registra las caracter´ısticas
de m(lecturas anteriores de la serie de tiempo) y las asocia con sus respectivos
valores de pron´ostico. Despu´es de crear la base de datos, se eliminan todos los
registros donde se encuentra ausencia de datos. Al convertir la serie de tiempo
a una base de datos, se puede dejar de lado la dimensi´on de tiempo.
La Tabla 1 muestra el resultado de crear la base de datos y extraer las w
caracter´ısticas asociadas con una salida esperada. Cada registro dentro de la
base de datos representa las ´ultimas mobservaciones en un tiempo definido (t),
asociado a la salida esperada yt+1 (para prop´ositos de entrenamiento). De la
Tabla 1 se observa que los registros m+ 2, m+ 3, m+ 4, m+ 5, m+ 6, m+ 7
presentan un hueco (φ) en su interior. Estos registros se eliminan. Con la base
de datos definida (sin los huecos), se puede comenzar a buscar una RNA que
modela el comportamiento de la serie del tiempo de la velocidad del viento.
2.1.2 Construcci´on del modelo de series de tiempo
86
Hector Rodriguez Rangel, Noel A. Garcia Carrillo, Juan J. Flores, Luis A. Morales Rosales, et al.
Research in Computing Science 139 (2017) ISSN 1870-4069
Tabla 1. Transformaci´on de la serie temporal en un problema de clasificaci´on.
entradas (Wt) ˆyt+1 =P(Wt)
m y1,y2,a3, . . . ymym+1
m+ 1 y2,y3,y4, . . . ym+1 ym+2
m+ 2 y3,y4,y5, . . . ym+2 φ
m+ 3 y4,y5,y6, . . . φ ym+4
m+ 4 y5,y6,y7, . . . ym+4 ym+5
m+ 5 y6,y7,φ, . . . ym+5 ym+6
m+ 6 y7,φ,y9, . . . ym+6 ym+7
m+ 7 φ,y9,y10 , . . . ym+7 ym+8
m+ 8 y9,y10,y11 , . . . ym+8 ym+9
m+ 9 y10,y11 ,y12, . . . ym+9,ym+10 ,
. . . . . .
n1ynm,ynm+1,ynm+2 , . . . yn1yn
En trabajos recientes, se ha demostrado que las RNA presentan grandes cua-
lidades de clasificaci´on [5]. Una vez definida la base de datos, se aborda el
problema de regresi´on que permite crear un modelo capaz de representar el
comportamiento de la serie de tiempo de la velocidad del viento.
En este art´ıculo, la arquitectura propuesta de la RNA es un Feedforward
Multilayer Perceptron, entrenado por m´etodos basados en gradiente. La Figura
4 muestra la arquitectura de la RNA propuesta en este trabajo. Una RNA, como
un aproximador universal puede aprender cualquier funci´on dada. Un conjunto
de mobservaciones pasadas se consideran como los datos de entrada, la capa
oculta consta de hneuronas ocultas, la capa de salida corresponde al valor de
pron´ostico ˆyt+1 ; se utiliza un sigmoide como funci´on de activaci´on. La RNA que
modela la serie de tiempo de velocidad del viento ˆyt+1 puede definirse como:
ˆyt+i=f1(
w+1
X
l
wlxl),
xl=f2(
m
X
j
wlj ytlj),
(1)
donde f1yf2son las funciones de activaci´on, y wson los coeficientes (tambi´en
conocidos pesos de sin´apticos).
Para modelar el comportamiento de la serie de tiempo de velocidad del viento,
se necesita proporcionar un modelo preciso. Para definir la exactitud del modelo
´optimo, se utilizo la medida estad´ıstica de la media del error al cuadrado (MSE),
que se define como:
MSE =1
n
n
X
i=1
yiyi)2.(2)
Esta medida se minimizar´a durante el proceso de entrenamiento.
87
Pronóstico a corto plazo de velocidad del viento a partir de datos incompletos
Research in Computing Science 139 (2017)ISSN 1870-4069
Fig. 4. Arquitectura de RNA con m+ 1 observaciones pasadas, hneuronas en su capa
oculta y una ´unica salida (ˆyt+1 ).
Algoritmos gen´eticos (AG) son una t´ecnica de optimizaci´on inspirada en
el principio de la evoluci´on de Darwin. Esto es, imita una versi´on simplista del
proceso de evoluci´on biol´ogica, que consiste en crear una poblaci´on de individuos,
donde cada individuo representa una soluci´on prospectiva del problema que se
est´a resolviendo. AG modifica esta poblaci´on utilizando operadores gen´eticos:
selecci´on, mutaci´on y recombinaci´on [17].
Determinar la mejor arquitectura de RNA y el algoritmo de entrenamiento
es un problema de optimizaci´on. Esto es, definen la arquitectura de la RNA
determinando el n´umero de entradas y el n´umero de neuronas en la capa oculta.
Este es un paso cr´ıtico en el proceso de entrenamiento que generalmente se realiza
por ensayo y error. En trabajos anteriores, el uso de AG ha sido probado dando
excelentes resultados [8]. Cada individuo (el cromosoma) en el AG se define
como un vector binario que est´a codificando el n´umero de entradas y el n´umero
de neuronas ocultas de la RNA. El algoritmo empleado de AG para encontrar
la mejor topolog´ıa de RNA se describe paso a paso el Algoritmo 1.
El AG comienza generando una poblaci´on inicial, a partir de esta poblaci´on
se eval´uan todos sus individuos. El proceso continua aplicando selecci´on cruza,
mutaci´on a los individuos de la poblaci´on. Este procedimiento se repite hasta
que se alcanza un criterio de convergencia. El pseudoc´odigo de este proceso lo
encontramos en el Algoritmo 1. El algoritmo gen´etico proporciona b´asicamente
como resultado el n´umero de entradas, neuronas en la capa oculta y algoritmo
de entrenamiento. Despu´es de definir la topolog´ıa de la RNA, se comienza un
88
Hector Rodriguez Rangel, Noel A. Garcia Carrillo, Juan J. Flores, Luis A. Morales Rosales, et al.
Research in Computing Science 139 (2017) ISSN 1870-4069
proceso de refinamiento. El refinamiento es el mismo proceso, simplemente se da
la oportunidad de un entrenamiento m´as extenso con la topolog´ıa de la red ya
definida [7,3].
Algorithm 1 Encontrando la mejor topolog´ıa para la red usando AG
1: procedure AG
2: Generar una poblaci´on inicial
3: Computar la funci´on de evaluaci´on de cada individuo
4: while NOT Terminado do
5: //Producir nueva generaci´on
6: for Tama~no Poblaci´on/2 do
7: BEGIN //ciclo reproductivo
8: Seleccionar dos individuos de la anterior generaci´on, para el cruce
9: (probabilidad de selecci´on proporcional a la funci´on de evaluaci´on del
10: individuo).
11: Cruzar con cierta probabilidad los dos individuos obteniendo dos
12: descendientes.
13: Mutar los dos descendientes con cierta probabilidad.
14: Computar la funci´on de evaluaci´on de los dos descendientes mutados.
15: Insertar los dos descendientes mutados en la nueva generaci´on.
16: Seleccionar los np mejores individuos.
17: END //ciclo reproductivo
18: if La poblaci´on ha convergido then Terminado := True
19: return mejor individuo
2.1.3 Reconstrucci´on de datos
Para el proceso de reconstrucci´on, se utiliza la RNA que modela el compor-
tamiento de la serie de tiempo de velocidad del viento. Usando este modelo, se
puede comenzar con el proceso de reconstrucci´on. Este proceso comienza con
un vector de observaciones ordenadas que se eval´uan secuencialmente. Cuando
se encuentra un hueco o dato faltante en la serie temporal, comienza el proceso
de datos de reconstrucci´on. Este proceso utiliza las m´ultimas observaciones del
vector utilizado como entrada. La salida de la RNA ya entrenada en los pasos
anteriores se utiliza para llenar el vac´ıo. El proceso contin´ua hasta que se alcanza
el final del vector de observaci´on. La Figura 5 muestra el diagrama de flujo del
proceso de reconstrucci´on.
2.1.4 Pron´ostico a corto plazo mediante Vecinos m´as Cercanos (kNN)
89
Pronóstico a corto plazo de velocidad del viento a partir de datos incompletos
Research in Computing Science 139 (2017)ISSN 1870-4069
Serie%de%Tiempo%
Incompleta
Base%de%Datos
Existen%
datos?
Reconstruc ción
De%
Datos
Si
No
Fig. 5. Proceso de reconstrucci´on de datos faltantes
Para el pron´ostico a corto plazo de la velocidad del viento, se utilizan las series
reconstruidas de acuerdo a los pasos definidos previamente. Para el pron´ostico se
propone utilizar el algoritmo de k Vecinos m´as Cercanos (kNN). Este algoritmo es
una t´ecnica de clasificaci´on y regresi´on basada en la similaridad de los individuos
de una poblaci´on. La premisa de esta t´ecnica indica que los miembros de una
poblaci´on coexisten rodeados de individuos similares que tienen propiedades
similares. Esta idea sencilla es la regla de aprendizaje del los clasificador y
regresores kNN. Como se muestra en la Figura 6 donde se busca la similaridad
de los individuos m´as cercanos.
Fig. 6. Ejemplo de clasificaci´on basada en la similaridad de los individuos kNN.
Un algoritmo kNN particular, se caracteriza por cuestiones tales como el
umero de vecinos, el tipo de distancia utilizada, etc. El m´etodo usado en este
90
Hector Rodriguez Rangel, Noel A. Garcia Carrillo, Juan J. Flores, Luis A. Morales Rosales, et al.
Research in Computing Science 139 (2017) ISSN 1870-4069
documento, para realizar el pronostico de yt+1, es necesario buscar la similitud
del individuo xen la base de datos definida en la Tabla 1. Donde el individuo x
es definido como las observaciones pasadas de la serie de tiempo en un tiempo t
(x= [ytw, ytw+1, ..., yt]). Despu´es de evaluar las distancias de los individuos de
la base de datos, se toman los kvecinos m´as cercanos y el pronostico resultante
es el promedio de la columna yt+1 de la Tabla 1. La definici´on matem´atica de
nuestro modelo de kNN se puede observar a continuaci´on:
ˆyt+1 =1
k
k
X
i=1
P(V C(i, yt)).(3)
La distancia euclidiana de dos individuos se define por la Ec. (4):
d(r, s) = v
u
u
t
m
X
j=1
(rjsj)2.(4)
La ventana que termina en el tiempo t, denotada por wtes la secuencia o
vector de las mmediciones hasta tcomo se indica en la Ec. (5):
wt= [ytm+1, yt]Rm.(5)
La definici´on recursiva del conjunto de kvecinos m´as cercanos es:
V C(k , x) = argmin(d(w, x)|wWVk1(x)),(6)
donde:
Vk(x) =
k
[
j=0
V Cj(k, x),
V(0, x) = φ.
(7)
Para la determinaci´on de los n´umeros adecuados de kywse realiz´o una
exploraci´on en un rango de valores lo suficientemente amplio para establecer las
combinaciones que permitan llegar a un valor de error menor. En este caso se
realizaron experimentos en donde se iteraron estos valores desde k= 1 hasta
k= 100 y desde w= 1 hasta w= 100. Un ejemplo gr´afico de esta exploraci´on se
observa en la Figura 7, en donde el eje vertical indica la magnitud de los errores.
3. Resultados
Para probar la aptitud de nuestra propuesta, se realizaron experimentos con
series de tiempo de la velocidad del viento procedentes de anem´ometros ubicados
en seis diferentes lugares dentro del estado de Michoac´an, M´exico, con registros
a intervalos horarios. Dado que los sensores son susceptibles a fallas de funciones
y errores de lectura, se tiene el problema de la obtenci´on de series de tiempo con
datos faltantes.
91
Pronóstico a corto plazo de velocidad del viento a partir de datos incompletos
Research in Computing Science 139 (2017)ISSN 1870-4069
Fig. 7. Exploraci´on de valores ´optimos de kywpara el pron´ostico mediante kNN.
Se realizaron varios experimentos aplicando el enfoque del m´etodo de re-
construcci´on de la serie de tiempo descrito en la Figura 2. Cada experimento
comienza eliminando la temporalidad de la serie temporal creando una base de
datos siguiendo el procedimiento descrito en la secci´on anterior. Una vez obtenida
la base de datos, definimos una RNA que modela el comportamiento de la serie
de tiempo de velocidad del viento.
La topolog´ıa obtenida en esta etapa se utiliza en un proceso de refinamiento,
que s´olo aumenta el n´umero de ´epocas, en este caso, se us´o hasta 3,000 ´epocas.
Una vez realizada la reconstrucci´on y obtenida la nueva serie de tiempo
reconstruida; ´esta es utilizada como entrada para el proceso de pron´ostico me-
diante el algoritmo de kNN. Realizamos experimentos con seis series de tiempo
de distintas estaciones de viento. Paralelamente se realiz´o el mismo proceso de
pron´ostico con las series de tiempo sin reconstruir. La aptitud de los pron´osticos
realizados se muestra en la Tabla 2.
Tabla 2. Comparativa de errores definidos por la medida estad´ıstica MSE obtenidos
en los pron´osticos utilizando RNA y kNN en series sin reconstruir y reconstruidas.
MSE en Pron´ostico RNA vs kNN
Sin reconstruir Reconstruida
RNA kNN Na¨ıve RNA KNN Na¨ıve
1 La Palma 0.0078 0.0028 0.0067 0.0079 0.0034 0.0086
2 La Piedad 0.0076 0.0047 0.0073 0.0077 0.0052 0.0081
3 Markazuza 0.0010 0.0008 0.0011 0.0010 0.0001 0.0005
4 Aristeo Mercado 0.0071 0.0037 0.0084 0.0073 0.0037 0.0087
5 Corrales 0.0022 0.0008 0.0012 0.0037 0.0001 0.0006
6 Melchor Ocampo 0.0144 0.0073 0.0112 0.0137 0.0082 0.0115
92
Hector Rodriguez Rangel, Noel A. Garcia Carrillo, Juan J. Flores, Luis A. Morales Rosales, et al.
Research in Computing Science 139 (2017) ISSN 1870-4069
Un ejemplo gr´afico del proceso de reconstrucci´on se muestra en la Figura 3.
En la Figura 3, la l´ınea continua representa los datos reales, y los punteados
representa la reconstrucci´on. Una vez realizado la reconstruci´on se procedio a
realizar el pronostico mediante el uso de kNN. En la Figura 8 muestra un ejemplo
de pron´ostico de tres series de tiempo correspondientes a Aristeo Mercado,
Corrales, y Melchor Ocampo. Para esta Figura 8, la linea continua representa
los datos reales y la punteada representa al pronostico.
50 100 150 200 Time
0.1
0.2
0.3
0.4
0.5
0.6
Magnitude
(a) Aristeo Mercado
50 100 150 200 Time
0.50
0.52
0.54
0.56
0.58
0.60
0.62
Magnitude
(b) Corrales
50 100 150 200
0.2
0.4
0.6
0.8
(c) Melchor Ocampo
Fig. 8. Resultado del pron´ostico kNN de las estaciones Aristeo Mercado, Corrales,
Melchor Ocampo, con serie reconstruida por RNA.
4. Conclusiones
Este art´ıculo ha propuesto un enfoque de reconstrucci´on de series de tiempo
basado en una metodolog´ıa neural-evolutiva h´ıbrida. Esta metodolog´ıa permite
determinar las arquitecturas ´optimas de RNA para modelar series temporales
incompletas y posteriormente para poder reconstruirlas. Los experimentos se
realizaron considerando m´ultiples series temporales con datos faltantes. Se ge-
neraron modelos y reconstrucci´on de datos. Se realiz´o una comparaci´on entre
93
Pronóstico a corto plazo de velocidad del viento a partir de datos incompletos
Research in Computing Science 139 (2017)ISSN 1870-4069
los pron´osticos obtenidos a partir de series de tiempo reconstruidas y series de
tiempo con datos faltantes. Se determin´o que en algunos casos la reconstrucci´on
puede mejorar la eficiencia del pron´ostico pero en otros caso no ocurr´ıa lo mismo.
Se requiere de realizar un an´alisis estad´ıstico para determinar la superioridad de
un m´etodo sobre otro. Los experimentos se realizaron utilizando la plataforma
Python utilizando la biblioteca Neurolab [14] para las implementaciones de RNA.
Referencias
1. Alexiadis, M., Dokopoulos, P., Sahsamanoglou, H., Manousaridis, I.: Short-term
forecasting of wind speed and related electrical power. Solar Energy 63(1), 61–68
(1998)
2. Barber, C., Bockhorst, J., Roebber, P.: Auto-regressive hmm inference with incom-
plete data for short-horizon wind forecasting. In: Advances in Neural Information
Processing Systems. pp. 136–144 (2010)
3. Barbounis, T.G., Theocharis, J.B., Alexiadis, M.C., Dokopoulos, P.S.: Long-term
wind speed and power forecasting using local recurrent neural network models.
IEEE Transactions on Energy Conversion 21(1), 273–284 (2006)
4. Cassola, F., Burlando, M.: Wind speed and wind energy forecast through kalman
filtering of numerical weather prediction model output. Applied energy 99, 154–166
(2012)
5. Chang, W.Y.: A literature review of wind forecasting methods. Journal of Power
and Energy Engineering 2(04), 161 (2014)
6. Erdem, E., Shi, J.: Arma based approaches for forecasting the tuple of wind speed
and direction. Applied Energy 88(4), 1405–1414 (2011)
7. Flores, J.J., Graff, M., Rodriguez, H.: Evolutive design of arma and ann models
for time series forecasting. Renewable Energy 44, 225–230 (2012)
8. Flores, J.J., Loaeza, R., Rodr´ıguez, H., Cadenas, E.: Wind speed forecasting
using a hybrid neural-evolutive approach. In: MICAI 2009: Advances in Artificial
Intelligence, pp. 600–609. Springer (2009)
9. Foley, A.M., Leahy, P.G., Marvuglia, A., McKeogh, E.J.: Current methods and
advances in forecasting of wind power generation. Renewable Energy 37(1), 1–8
(2012)
10. Giacomoni, M., Kanta, L., Zechman, E.: Complex adaptive systems approach to
simulate the sustainability of water resources and urbanization. Journal of Water
Resources Planning and Management 139(5), 554–564 (2013)
11. Hayashi, M., Kermanshahi, B.: Application of artificial neural network for wind
speed prediction and determination of wind power generation output. In: Procee-
dings of ICEE. pp. 12–15 (2001)
12. Lei, M., Shiyan, L., Chuanwen, J., Hongling, L., Yan, Z.: A review on the
forecasting of wind speed and generated power. Renewable and Sustainable Energy
Reviews 13(4), 915–920 (2009)
13. Liu, H., Tian, H., Pan, D., Li, Y.: Forecasting models for wind speed using wavelet,
wavelet packet, time series and artificial neural networks. Applied Energy 107,
191–208 (2013)
14. Neurolab: Neurolab a python plugin. Available:
https://pypi.python.org/pypi/neurolab [Online]
15. Observ, E.: Worldwide electricity production from renewable energy sources. Ninth
inventory (2012)
94
Hector Rodriguez Rangel, Noel A. Garcia Carrillo, Juan J. Flores, Luis A. Morales Rosales, et al.
Research in Computing Science 139 (2017) ISSN 1870-4069
16. Piwko, D., Jordan, G.: The economic value of day-ahead wind forecasts for power
grid operations. In: 2010 UWIG Workshop on Wind Forecasting (2010)
17. Rangel, H.R., Puig, V., Farias, R.L., Flores, J.J.: Short-term demand forecast using
a bank of neural network models trained using genetic algorithms for the optimal
management of drinking water networks. Journal of Hydroinformatics (2016),
http://jh.iwaponline.com/content/early/2016/08/31/hydro.2016.199
18. Rodriguez Rangel, H., Puig, V., Farias, R.L., Flores, J.J.: Short-term demand
forecast using a bank of neural network models trained using genetic algorithms for
the optimal management of drinking water networks. Journal of Hydroinformatics
(2016)
19. Yesilbudak, M., Sagiroglu, S., Colak, I.: A new approach to very short term wind
speed prediction using k-nearest neighbor classification. Energy Conversion and
Management 69, 77–86 (2013)
20. Zhao, X., Wang, S., Li, T.: Review of evaluation criteria and main methods of wind
power forecasting. Energy Procedia 12, 761–769 (2011)
21. Zhou, J., Shi, J., Li, G.: Fine tuning support vector machines for short-term wind
speed forecasting. Energy Conversion and Management 52(4), 1990–1998 (2011)
95
Pronóstico a corto plazo de velocidad del viento a partir de datos incompletos
Research in Computing Science 139 (2017)ISSN 1870-4069
ResearchGate has not been able to resolve any citations for this publication.
Article
Full-text available
Efficient management of a drinking water network reduces the economic costs related to water production and transport (pumping). Model predictive control (MPC) is nowadays a quite well-accepted approach for the efficient management of the water networks because it allows formulating the control problem in terms of the optimization of the economic costs. Therefore, shortterm forecasts are a key issue in the performance of MPC applied to water distribution networks. However, the short-term horizon demand forecast in a horizon of 24 hours in an hourly based scale presents some challenges as the water consumption can change from one day to another, according to certain patterns of behavior (e.g., holidays and business days). This paper focuses on the problem of forecasting water demand for the next 24 hours. In this work, we propose to use a bank of models instead of a single model. Each model is designed for forecasting one particular hour. Hourly models use artificial neural networks. The architecture design and the training process are performed using genetic algorithms. The proposed approach is assessed using demand data from the Barcelona water network.
Article
Full-text available
In this paper, an overview of new and current developments in wind forecasting is given where the focus lies upon principles and practical implementations. High penetration of wind power in the electricity system provides many challenges to the power system operators, mainly due to the unpredictability and variability of wind power generation. Although wind energy may not be dispatched, an accurate forecasting method of wind speed and power generation can help the power system operators reduce the risk of unreliability of electricity supply. This paper gives a literature survey on the categories and major methods of wind forecasting. Based on the assessment of wind speed and power forecasting methods, the future development direction of wind forecasting is proposed.
Article
Full-text available
Wind power has characteristics of randomness and uncontrollability. China needs to learn from the successful experience of wind power prediction in European. Wind power forecasting (WPF) will be an important part of the power system construction in the future. Firstly, the classification of WPF is discussed according to the different classified methods. Secondly, the evaluation criteria about the uncertainty of WPF are summarized. Thirdly, we give a survey on the main methods of WPF. Finally, the development direction of WPF is proposed. (C) 2011 Published by Elsevier Ltd. Selection and/or peer-review under responsibility of University of Electronic Science and Technology of China (UESTC).
Article
Urban water resources should be managed to meet conflicting demands for environmental health, economic prosperity, and social equity for present and future generations. While the sustainability of water resources can depend on dynamic interactions among natural, social, and infrastructure systems, typical water resource planning and management approaches are based on methodologies that ignore feedbacks and adaptations among these systems. This research develops and demonstrates a new complex adaptive systems approach to model the dynamic interactions among population growth, land-use change, the hydrologic cycle, residential water use, and interbasin transfers. Agent-based and cellular automaton models, representing consumers and policymakers who make land- and water-use decisions, are coupled with hydrologic models. The framework is applied for an illustrative case study to simulate urbanization and the water supply system over a long-term planning horizon. Results indicate that interactions among the decentralized decisions of individual residents can significantly influence system-wide sustainability. Adaptive management policies are included to restrict the water use and land use of consumers as the availability of water decreases. These strategies are simulated and assessed based on their abilities to increase the sustainability of the water supply system under the stresses of population growth, land-use change, and drought.
Article
Wind speed forecasting is important for the security of wind power integration. Based on the theories of wavelet, wavelet packet, time series analysis and artificial neural networks, three hybrid models [Wavelet Packet-BEGS, Wavelet Packet-ARIMA-BFGS and Wavelet-BEGS] are proposed to predict the wind speed. The presented models are compared with some other classical wind speed forecasting methods including Neuro-Fuzzy, ANFIS (Adaptive Neuro-Fuzzy Inference Systems), Wavelet Packet-RBF (Radial Basis Function) and PM (Persistent Model). The results of three experimental cases show that: (1) the proposed three hybrid models have satisfactory performance in the wind speed predictions, and (2) the Wavelet Packet-ANN model is the best among them.
Article
The evolutionary design of time series forecasters is a field that has been explored for several years now. In this paper, a complete design and training of ARMA (Auto-Regressive Moving Average) and ANN (Artificial Neural Networks) models through the use of Evolutionary Computation is presented. That is, given a time series, our proposal (EDFM – Evolutionary Design of Forecasting Models) qualitatively and quantitatively identifies a competitive model to perform the forecasting task. In the qualitative phase of the model identification, EDFM identifies the variables relevant to the process; i.e. the subset of variables, within a given window width, that provides the best forecasting, following the parsimony criterion. In the quantitative phase of the identification process, all free parameters are numerically instantiated; i.e. the coefficient of the ARMA models, or the ANN weights are determined. The results show that ANN yield better forecasts than ARMA models in all the cases presented in this paper.
Article
Wind energy is an inexhaustible energy source and wind power production has been growing rapidly in recent years. However, wind power has a non-schedulable nature due to wind speed variations. Hence, wind speed prediction is an indispensable requirement for power system operators. This paper predicts wind speed parameter in an n-tupled inputs using k-nearest neighbor (k-NN) classification and analyzes the effects of input parameters, nearest neighbors and distance metrics on wind speed prediction. The k-NN classification model was developed using the object oriented programming techniques and includes Manhattan and Minkowski distance metrics except from Euclidean distance metric on the contrary of literature. The k-NN classification model which uses wind direction, air temperature, atmospheric pressure and relative humidity parameters in a 4-tupled space achieved the best wind speed prediction for k = 5 in the Manhattan distance metric. Differently, the k-NN classification model which uses wind direction, air temperature and atmospheric pressure parameters in a 3-tupled inputs gave the worst wind speed prediction for k = 1 in the Minkowski distance metric.
Article
Despite the major progress made by Numerical Weather Prediction (NWP) in the last decades, meteorological models are usually unable to provide reliable surface wind speed forecasts, especially in complex topography regions, because of shortcomings in horizontal resolution, physical parameterisations, initial and boundary conditions. In order to reduce these drawbacks, one of the most successful approaches is the Kalman filtering technique, which combines recursively observations and model forecasts to minimise the corresponding biases. In meteorology, Kalman filters are widely used to improve the prediction of variables characterised by well-defined cyclicities, whereas the evolution of wind speed is usually too irregular. In the present paper, the Kalman filter is analysed in order to find the best configuration for wind speed and wind power forecast. The procedure has been tested, in a hindcast mode, with 2-year-long data sets of wind speed provided by a NWP model and two anemometric stations located in the eastern Liguria (Italy). It is shown that, tuning time step and forecast horizon of the filter, this methodology is capable to provide significant forecast improvement with respect to the wind speed model direct output, especially when used for very short-term forecast. In this configuration, Kalman-filtered wind speed data have been used to forecast the wind energy output of the nearby wind farm of Varese Ligure. After 2 years of testing, the percentage error between simulated and measured wind energy values was still very low and showed a stable evolution.
Article
The use of renewable energy offers a decrease in external energy dependence; a boost to local and regional component manufacturing industries; promotion of regional engineering; increased R&D, decrease in impact of electricity production and transformation; increase in the level of services for the rural population; creation of employment, etc.To achieve these benefits, a series of actions are required, among which the following are particularly important: creation of a suitable climate for performing R&D; training of technicians in design, production, and maintenance of equipment; motivation for establishing a new market; proper financing; fostering of appropriate technologies; practical demonstration of results; etc.This article reviews the progress made in the Autonomous Community of Galicia in terms of the introduction of renewable energy technologies (RETs) and examines the possibility of meeting a target of 90% coverage (practical electrical self-sufficiency) by 2010.