ResearchPDF Available

Abstract and Figures

Modelado de procesos estocáticos aplicable a la simulación de sistemas de energía eléctrica como ser modelado de aportes hidráulicos a centrales hidroeléctricas, de velocidad de viento en parques eólicos y de radiación solar en granjas fotovoltaicas.
Content may be subject to copyright.
Modelo CEGH – Fundamentos. pág. 1/27
Fundamentos de modelo CEGH de procesos estocásticos multivariables.
SimSEE - Reporte técnico / IIE-FING-UDELAR
Ruben Chaer
Diciembre de 2011, rev. Junio 2013
Montevideo – Uruguay.
1. Introducción.
Uno de las mayores dificultades que aparece al intentar hacer un simulador de un sistema dado,
es la representación de los procesos estocásticos involucrados en la realidad concreta (el sistema)
que se está intentando simular.
A modo de ejemplo, supongamos un sistema formado por un aerogenerador un banco de
baterías y como carga o demanda del sistema el consumo de una vivienda rural. Para simular en
forma adecuada ese sistema, es necesario modelar de alguna forma la velocidad del viento y la
demanda de energía como los dos procesos estocásticos de mayor importancia, pero también la
disponibilidad del aerogenerador, la batería y la electrónica involucrada.
En algunos casos basta con disponer de un conjunto de realizaciones posibles de los procesos
estocásticos para observar el comportamiento del sistema mediante simulaciones imponiendo
dichos valores como “entradas al sistema”. En esos casos la evolución del sistema no tiene un lazo
de control que intente compensar las consecuencias de las trayectorias previsibles de los procesos
estocásticos y los procesos son modelados “sin estado” sin cometer por ello un error en los
resultados de la simulación.
En otros casos, el sistema es capaz de reaccionar frente a la previsión (o pronóstico) de
variación de las realizaciones de los procesos estocásticos. En estos casos, no basta con disponer de
un conjunto de realizaciones de los procesos, es necesario tener un MODELO que permita evaluar
las probabilidades de las realizaciones posibles futuras para poder calcular cuál sera la evolución del
sistema. En estos casos, el MODELO deberá incluir la definición del estado de los procesos
estocásticos en base al cuál se pueda condicionar las trayectorias que seguirán a partir de un instante
dado las realizaciones futuras.
Para fijar ideas, en el ejemplo de la instalación rural, la demanda del sistema puede tomar
acciones que contrarresten las evoluciones de la generación. Si el modelo que se tenga de la
velocidad de viento permite asignar una probabilidad alta a una día de poco viento, seguramente la
demanda restringirá el uso en lo posible de energía durante el día para tener buena carga en la
batería para la noche y a a inversa, si el modelo permite asignar alta probabilidad a un día de mucho
viento, entonces los usuarios serán más liberales con el uso de la energía durante el día a riesgo de
tener que prender velas en la noche. La operación de los sistemas con capacidad de almacenar
energía es siempre un compromiso entre usar parte de la energía almacenada en el presente o
guardarla para el futuro sustituyendo su uso en el presente por energías de otras fuentes (por ej.
prender velas en el ejemplo de instalación rural).
Los sistema, en menor o mayor grado, tienen inercias que hacen que la operación sea posible en
forma continua. Por ejemplo, es muy poco probable que el promedio de caudal a una central
hidroeléctrica tenga variaciones importantes en una hora para la siguiente. A mayor inercia en el
proceso representado mayor podrá ser el paso de tiempo de simulación que permite observar la
realización del proceso como una evolución suave y continua. A mayor inercia, mayor será el
impacto del pasado del sistema en su futuro. En la jerga de modelado y control de sistemas se dice
que un sistema es dinámico o tiene dinámica cuando el pasado del sistema es relevante para calcular
Modelo CEGH – Fundamentos. pág. 2/27
la evolución del sistema en el futuro. Es decir que además de la información de las entradas futuras
es necesario conocer información del pasado para calcular la evolución futura. Decimos que
disponemos de un modelo del sistema o de su dinámica cuando podemos tener una ecuación como
la ec. 1
˙
x=f
(
x , r , u , t
)
ec.(1) Modelo del sistema.
Ecuación de evolución del estado.
Dónde:
xRn
es el vector de estado del sistema y por definición captura la información necesaria del
pasado para poder calcular la evolución.
rRp
es un vector de entradas no-controlables. Es información externa, sobre la que no se tiene
control y que se supone independiente del valor de
x
uRm
es el vector de control. Son las variables sobre las que el Operador puede actuar. Por
ejemplo, la potencia despachada de cada generador.
t
Es el "tiempo".
La ec. 1 establece la derivada del estado como una función del estado actual, de las entradas no
controlables, de las entradas de control y del tiempo actual. La evolución del vector de estado es
entonces calculable a partir del conocimiento del estado
x0
en un tiempo inicial
t0
y de las
entradas
y
u
para
tt0
mediante la integración de la ec. 1 por la integral de la ec. 2.
x=x0+
ζ
=t0
ζ
=t
f
(
x(
ζ
), r (
ζ
), u (
ζ
),
ζ
)
d
ζ
ec.(2) Simulación del sistema
Para fijar rápidamente la idea de lo importante que es una buena representación de los procesos
estocásticos téngase en mente el caso de la simulación del sistema de generación eléctrica del
Uruguay. El Uruguay, tiene cuatro centrales hidroeléctricas ubicadas en dos ríos, con una potencia
instalada de aproximadamente 1500 MW. Dependiendo de las lluvias del año, el cubrimiento de la
demanda eléctrica se realizará con más o menos energía de origen hidráulico debiéndose cubrir el
resto con generación en base a combustibles fósiles o con importación de energía. Los costos de
éstas dos últimas fuentes rondan los 200 USD/MWh. La variabilidad de la generación hidráulica
anual es importante lo que tiene como consecuencia que el Costo de Abastecimiento de la Demanda
(CAD) tenga también un variabilidad importante. En la fig.1 se muestra la generación hidráulica
que tendría lugar en una simulación del año 2010 suponiendo que se vuelven a repetir las lluvias de
los últimos 100 años, ordenando de los años más lluviosos a los más secos de izquierda a derecha
respectivamente.
Modelo CEGH – Fundamentos. pág. 3/27
Insistiendo sobre el ejemplo de la generación hidroeléctrica (por ser la fuente de mayor
volatilidad de los costos de generación en Uruguay), notemos que la generación hidroeléctrica del
conjunto de las cuatro represas dependerá de los caudales afluentes a sus cuencas y de la capacidad
de embalsar el agua de cada hidroeléctrica. La capacidad de embalsar el agua, debe pensarse como
la capacidad de almacenar un recurso del sistema para su uso futuro. Almacener tiene sentido si se
sabe que ese recurso usado en el futuro evitará costos mayores que usado en el presente. Para tener
la capacidad de “adivinar” cuánto valdrá el recurso en el futuro es necesario que los procesos
estocásticos involucrados estén modelados de forma de representar lo mejor posible las “inercias”
ocultas en los sub-sistemas asociados a dichos procesos. No menos importante es representar
adecuadamente las correlaciones entre las diferentes variables estocásticas. A modo de ejemplo,
dada la superficie del Uruguay, existe una correlación positiva entre los aportes a las represas la
cual debe modelarse para no inducir al error de sobrevalorar la disponibilidad del recurso en una de
las hidroeléctricas dado que cuando esté disponible en una existe por la correlación positiva una
chance importante de que también esté en las demás. Otro ejemplo, es la velocidad de viento en los
parques eólicos distribuidos en el territorio nacional. Si por simplicidad se modelaran todos los
parques como instalados en un único sitio, todas las potencias de los parques variarían
simultáneamente mostrando mayor variabilidad que la real, dado que en la medida en que las
instalaciones se distancian geográficamente la correlación entre la velocidad de viento disminuye.
El propósito de este capítulo es mostrar una forma de analizar series temporales de datos que
representen la salida de un proceso estocástico e identificar en base a ese análisis un modelo de
Correlaciones en Espacio Gaussiano con Histograma - CEGH que puede ser utilizado en el la
representación de un sistema dinámico. En particular nuestro principal interés es el uso de estos
modelos en la plataforma SimSEE. El modelo identificado tiene la propiedad fundamental de tener
una estructura que facilita su inclusión en el modelado de la dinámica del sistema (ec. 1) y de
generar series sintéticas que conservan las auto-correlaciones y las correlaciones cruzadas (en un
espacio transformado que se describe más adelante) y los histogramas de amplitud en el espacio
real. La conservación de los histogramas de amplitud es importante pues el sistema de generación
de energía eléctrica tiene componente altamente no-lineales y por consiguiente la energía de los
procesos no se conservaría si no se respetan las amplitudes.
Fig. 1: Variabilidad de la generación hidráulica.
Modelo CEGH – Fundamentos. pág. 4/27
2. Elementos de estadística.
La intención de esta sección es resumir las bases de estadística necesarias para el desarrollo del
modelo y refrescar al lector las definiciones y notación utilizadas.
2.1. Función de distribución acumulada de probabilidad.
Dada una variable aleatoria
XR
su función de distribución acumulada de probabilidad
FX(x):RR
es por definición:
FX(x)=P(Xx)
, siendo
P(Xx)
la probabilidad de
que la variable aleatoria
X
tome valores inferiores o iguales al valor dado
x
.
Se puede probar que con esa definición,
FX(x)
es monótona creciente y va de 0 a 1.
2.2. Función de densidad de probabilidad.
Dado un vector de variables aleatorias
xRn
, podemos definir la función de densidad de
probabilidad
px(x):RnR
tal que la probabilidad de que el vector
x
pertenezca a un
volumen
Ω∈ Rn
está dado por la integral en el volumen:
ζ
∈Ω
px(
ζ
)dV
ζ
siendo
dV
ζ
=d
ζ
1.d
ζ
2...d
ζ
n
el elemento de volumen.
2.3. Algunos resultados para aleatorias univariadas.
A continuación se enumeran algunos resultados útiles para variables aleatorias univariadas.
a) Relación entre las funciones de distribución y de densidad para
una variable aleatoria univariada.
Por definición de la función de distribución acumulada y de densidad de probabilidad de las
secciones 2.1 y 2.2 se pueden establecer las relaciones siguientes:
FX(x)=P(Xx)=
ζ
=−
ζ
=x
pX(
ζ
)d
ζ
o lo que es equivalente:
pX(x)= d
dx FX(x)
ec.(3) Relación entre las funciones
de Distribución y la Densidad de
Probabilidad.
b) Transformación de una variable aleatoria.
Dada una variable aleatoria y su funciones características
F(x)
y
px(x)
y dada una
transformación
T:RR
monótona consideremos la variable aleatoria
y=T(x)
.
Por definición la Distribución de la nueva variable será:
FY(y)=P(Yy)=
ζ
=−∞
ζ
=y
pY(
ζ
)d
ζ
Modelo CEGH – Fundamentos. pág. 5/27
Si
y=T(x)
es monótona creciente, haciendo el cambio de variable en la integral se puede
escribir:
FY(y)=P(Yy)=
ζ
=−∞
ζ
=y
pY(
ζ
)d
ζ
=
β=−∞
β= x
pY(T(β)) T(
β
)
xdβ
donde
x=T1(y)
El integrando de la última integral es identificable como
px(x)
con lo que se puede escribir:
si
y=T(x)
entonces:
pY(y)= pX(x).
(
T(x)
x
)
1
ec.(4) Cambio de variable de una
aleatoria univariada.
c) Generador de números aleatorios con una función de densidad de
probabilidad dada.
Dada una función de densidad de probabilidad
pX(x)
es inmediato disponer de la
distribución acumulada de probabilidad
FX(x)
y viceversa a partir de la ec. 3.
La función de distribución acumulada
FX(x)
es monótona creciente desde el valor 0 (cero)
para
x=−∞
hasta el valor 1 (uno) para
x=+∞
y por lo tanto es invertible. Sea
FX
1(u)
la
inversa de la función de distribución. Por construcción
FX
1(u)
está definida del intervalo
[0,1]
en
R
.
Sea
u
una variable aleatoria con distribución uniforme en
[0,1]
. Típicamente los
diferentes lenguajes de programación tienen una función para generar números pseudo-aleatorios
con distribución uniforme. Por ejemplo, la función random de Pascal.
Por definición
pU(u)=
{
1;u
[
0,1
)
0;u
[
0,1
)
}
Consideremos el cambio de variable
ξ
=T(u)=FX
1(u)
y utilizando la relación de la ec. 4,
podemos escribir que:
p
ξ
(
ξ
)= pU(u).
(
T(u)
u
)
1
como:
T(u)
u=FX
1(u)
u=
(
FX(
ξ
)
x
)
1
=
(
pX(
ξ
)
)
1
, sustituyendo
T(u)
u
en la ec. anterior
tenemos:
p
ξ
(
ξ
)= pU(u).pX(x)
y como
ξ
=T(u)=FX
1(u)
mapea el intervalo
[0,1]
en
R
para
cualquier valor de
ξ
, podemos asegurar que
pU(u)=1
y por tanto hemos encontrado un
mecanismo para generar una variable aleatoria
ξ
cuya función densidad de probabilidad coincide
con una dada:
p
ξ
(
ξ
)= pX(x)
.
Este es el mecanismo utilizado en la plataforma SimSEE para generar variables aleatorias con
funciones características dadas a partir de un generador de números pseudo aleatorios.
d) Deformador Uniformizante.
En la sección anterior se mostró como generar una variable aleatoria con una distribución dada a
partir de una variable con distribución uniforme mediante el cambio de variable de la uniforme
usando a inversa de la función de distribución acumulada de la distribución objetivo. Utilizando la
inversa de dicha transformación es posible pasar de una variable con distribución dada a una
variable aleatoria con distribución uniforme.
Es decir, si se tiene una variable aleatoria
X
con distribución
FX(x)
entonces, la variable
Modelo CEGH – Fundamentos. pág. 6/27
aleatoria obtenida mediante la transformación
u=FX(x)
tendrá distribución uniforme.
En la jerga del modelado CEGH decimos que la distribución
FX(x)
es un “deformador
uniformizante” de la variable aleatoria
X
dada una serie de realizaciones de
X
si aplicamos
“deformador uniformizante” a cada punto de la serie se obtiene una serie de números entre 0 y 1
con distribución uniforme.
2.4.Independencia estadística.
Se dice que dos conjuntos de variables aleatorias
x
e
y
son independientes (o tienen
independencia estadística) si el conocimiento de los valores que tome uno de los conjuntos no
condiciona los valores que toma el otro.
Si dos variables aleatorias son independientes, entonces la función densidad de probabilidad del
conjunto de ambas variables es el producto de las funciones de densidad de cada una.
px,y(x , y )= px(x)py(y)
ec.(5) Proceso conjunto de variables
independientes.
Si las variables no son independientes, el conocimiento de los valores
x
condiciona los
valores que puede tomar
y
y viceversa. Para cada valor de
x
será entonces posible construir la
función densidad de probabilidad de suceso condicionado
y/x
(se lee "
y
dado
x
") y la
función densidad de probabilidad de conjunto
y , x
podrá calcularse como se muestra en la ec. 6
con la relación conocida como teorema de Bayes.
px,y(x , y )= px(x)py/x(x , y)= py(y)px/y(x , y)
ec.(6) Teorema de Bayes.
2.5.Medidas de probabilidad.
La forma de realizar medidas de probabilidad es mediante la integral de una función
m(x):RnRm
ponderada por la función densidad de probabilidad como se muestra en la ec. 7.
m(x)
x=
ζ
Rn
m(
ζ
).px(
ζ
)dV
ζ
ec.(7) Medida de probabilidad.
Para realizar entonces cualquier cuantificación probabilística es necesario conocer la función de
densidad de probabilidad
px(
ζ
)
.
Ejemplos de medidas de probabilidad son el Valor Esperado y la matriz de Covarianzas
definidas por las ec. 8 y ec. 9 respectivamente.
E(x)=
x
x=
ζ
Rn
x.px(
ζ
)dV
ζ
ec.(8) Valor Esperado
Σxx=
(xE(X))( xE(X))T
x
ec.(9) Matriz de Covarianzas.
Dos procesos aleatorios
xRn
e
yRn
con iguales funciones de densidad de probabilidad
px(x)= py(x)= p(x)
son equivalentes desde el punto de vista de cualquier medida de
Modelo CEGH – Fundamentos. pág. 7/27
probabilidad del tipo definido en la ec. 7. Por ejemplo, tendrán igual valor esperado e igual matriz
de covarianzas.
Observar que si dos procesos coinciden en valor esperado y en la matriz de covarianzas no
necesariamente tienen la misma función de densidad de probabilidad y por tanto podrán diferir en
otras medidas de probabilidad.
En resumen, lo importante a los efectos de caracterizar un proceso estocástico es obtener una
representación de su función de densidad de probabilidad. Sólo así se está en condiciones de
reproducir cualquier medida de probabilidad.
2.6. Transformaciones compactas.
Cualquier transformación biunívoca de
T:RnRn
que transforme conjuntos compactos del
espacio de salida en volúmenes compactos del espacio de llegada mantiene las equivalencias entre
los procesos estocásticos. Esto es sencillo de demostrar, pues cualquier integral de medida de
probabilidad (ec. 7) en el espacio de llegada, puede expresarse en el espacio de salida pues para
cada elemento de volumen
dV
ζ
del espacio de llegada se puede identificar el correspondiente
elemento de volumen
dV
β
del espacio de salida y viceversa.
Dado el proceso transformado,
y=T(x)
siendo
T
una transformación biunívoca es
posible escribir
x=T1(y)
. Las integrales de probabilidad del proceso transformado se pueden
expresar como se muestra en la ec.
ζ
Rn
m(
ζ
).py(
ζ
)dV
ζ
=
β
Rn
m(
β
).px(
β
)dV β
ec.(10) Correspondencia de las
medidas en una transformación
biunívoca.
Las integrales de la ec. 10 son integrales múltiples relacionadas por el cambio de variable
y=T(x)
. Esto permite establecer que las funciones de densidad de probabilidad están
relacionadas por la ec. 11.
px(x)=
JT(T(x))
.py(T(x))
dónde
JT(T(x))
es el determinante de la matriz Jacobiana de
la transformación
y=T(x)
ec.(11) Transformación de la
densidad de probabilidad.
2.7.Procesos estocásticos.
Un proceso estocástico genera una serie (o secuencia) de variables aleatorias definidas de "el
tiempo" en un conjunto dado. La expresión "el tiempo" significa los números reales para procesos
de tiempo continuo o el conjunto de los números enteros para procesos discretos. En ambos casos
con un sentido definido que dado un punto ordena el espacio en "pasado" y "futuro" en referencia a
dicho punto. Por comodidad y porque la implementación de modelado CEGH es para procesos que
serán tratados como discretos (en general son procesos continuos muestreados a intervalos de
tiempo constante) usaremos la variable entera
k
para representar el tiempo.
Se llama "realización del proceso estocástico" a cualquier serie
{
xk
}
de las posibles que
puede generar el proceso. El vector
xk
representa para el instante
k
los valores que toma el
conjunto de salidas del proceso. Se llama "ensamble de realizaciones" al conjunto de todas las
realizaciones posibles del proceso. Cuando se está hablando de procesos del mundo real, existe una
Modelo CEGH – Fundamentos. pág. 8/27
realización que se llama "la histórica" o también Crónica Histórica que es la realización que ha
tenido lugar en el pasado para ese proceso. A modo de ejemplo, si se observan los números de una
ruleta en el casino, es posible identificar por ejemplo los últimos 100 números salidos en forma
ordenada como la crónica de las últimas 100 jugadas. Cuando se mira hacia el futuro, el proceso
generará una realización de un conjunto de realizaciones posibles, pero no es posible adelantar cuál.
En el caso de la ruleta, el siguiente número sera uno entre 0 y 36 todos con igual probabilidad. En
este ejemplo, el pasado no condiciona las probabilidades de la realización del futuro. Es entonces un
ejemplo de proceso estocástico "sin estado". En este ejemplo, de una sola variable aleatoria resulta
intuitivo, que para describir la función densidad de probabilidad de los números de la siguiente
jugada (esto es tener la descripción del ensamble de realizacions posibles para la siguiente jugada)
es posible hacerlo en base a la realización histórica. Basta simplemente armar un histograma a partir
de ordenar los números y salvo defectos mecánicos del sistema se deberá obtener que la
probabilidad de cada número es 1/37. El que sea posible describir el ensamble a partir de una
realización del proceso, que resulta intuitivo para el ejemplo de la ruleta, no se cumple en todos los
casos. Por ejemplo, si la variable estocástica es el precio del barril de petróleo, como por simple
observación es un precio en "expansión" no es posible determinar por construcción del histograma
de los valores históricos las características del ensamble posible de realizaciones futuras.
a) Procesos en estado estacionarios.
Se dice que un proceso está en estado estacionario cuando las propiedades estadísticas en el
ensamble de cualquier subconjunto de su series de salida
xk, xk1,... xkn
son
independientemente del tiempo
k
. El ejemplo de los números de la ruleta es un proceso en
estado estacionario y el ejemplo del precio del barril de petróleo es claramente un proceso no
estacionario.
b) Procesos ergódicos.
Decimos que un proceso es ergódico para una cierta función medible
m(xk, x k1,... xkn)
definida sobre subconjuntos de la serie de salidas del proceso si la integral en el ensamble del
subconjunto
xk, xk1,... xkn
puede sustituirse por una integral de medida en el tiempo a partir
de una realización dada como se muestra en la ec. 12.
ζ
kRn(j2
j1+1)
m(
ζ
k).py(
ζ
k)dV
ζ
k=lim
H→+∞ (1
2H
j=−H
j=+ H
m(
β
j))
dónde:
ζ
k
es un punto del ensamble del conjunto de variables
xk, xk1,... xkn
referido al tiempo
k
y
β
j=xj, x j1,... xjn
es un punto de la realización considerada
para la estimación en el tiempo
j
.
ec.(12) Estimación de la medida en
el ensamble a partir de una
realización dada en un proceso
ergódico.
Observar que en la ec. 12, el límite del lado derecho no depende el instante de tiempo
k
al
que se refiere la medida del lado izquierdo y por lo tanto, la medida del lado izquierdo debe ser
independiente de
k
lo que implica que el proceso está en estado estacionario para dicha media.
Entonces, para que un proceso sea ergódico es necesario que sea estacionario.
Un ejemplo sencillo de proceso ergódico es el del juego de lotería previamente mencionado.
Modelo CEGH – Fundamentos. pág. 9/27
2.8.Procesos Gaussianos.
Se dice que un conjunto de variables aleatorias son gaussianas cuando su función densidad de
probabilidad puede escribirse de la forma:
px(x)= 1
(2π)n/2
Σ
1/2e1
2(xE(x))TΣ1(xE(x))
ec.(13) Densidad de probabilidad
gaussiana multivariable.
Un proceso es gaussiano si cualquier subconjunto
xk, xk1,... xkn
de sus salidas tiene
distribución gaussiana.
Entre las propiedades interesantes de los procesos gaussianos, destaca que su función de
densidad de probabilidad queda totalmente definida por el conocimiento del valor esperado y la
matriz de covarianzas. Si estamos hablando de una sola variable aleatoria, el conocimiento del valor
esperado y de la varianza determinan entonces completamente la función densidad de probabilidad
si la variable responde a un proceso gaussiano.
Otra propiedad relevante para los propósitos de este trabajo es que la combinación lineal de
variables aleatorias gaussianas independientes es gaussiana. Esto implica ni más ni menos que si un
sistema lineal es atacado por vector de ruidos blancos (por ruido blanco se entiende una señal “sin
memoria” o sea que el presente tiene independencia estadística del pasado) gaussianos
independientes, sus salidas son gaussianas pues la salida será una combinación de las entradas y sus
pasados que al suponerse entradas "sin memoria" son todas variables independientes.
Entonces, las dos propiedades de los procesos gaussianos que se utilizarán fuertemente en el
modelado CEGH son:
1. La función densidad de probabilidad queda totalmente determinada por el vector de valor
esperado y por la matriz de covarianzas.
2. La combinación lineal de variables aleatorias gaussianas independientes es una variable
aleatoria gaussiana.
3. Definición del Modelado CEGH
Como se mencionó en la introducción el objetivo del modelado CEGH es tener una
representación de un proceso estocástico que permita su incorporación en el modelado de un
sistema dinámico.
Para la identificación del modelo se dispone generalmente de la realización histórica del
conjunto de variables que forma
la salida del proceso estocástico
a modelar. El desafío del
modelado, es lograr crear un
modelo que “capte” la estructura
de la dinámica del proceso
estocástico de forma de poder
inferir en todo momento “el
Fig. 2: Salida de un proceso estocástico con inercia
Modelo CEGH – Fundamentos. pág. 10/27
cono de las salidas” del proceso. Si el proceso no tuviera dinámica, la salida siguiente no estaría
condicionada por el pasado y podría modelarse simplemente como un sorteo con un determinado
histograma. Por ejemplo, en el caso del La Ruleta, como proceso estocástico, el modelo sería
simplemente un sorteo uniforme entre 0 y 36 sin ninguna dependencia con el pasado.
En el caso de los procesos que intervienen en la simulación de sistemas de energía, como
pueden ser las lluvias, la radiación solar, el viento, la demanda, etc., los valores tienen cierta
continuidad que permite pensar en “el cono del futuro” como ramilletes de realizaciones posibles a
partir de un “presente conocido”. Este comportamiento de “continuidad” que permite dibujar las
salidas como un cono (ver Fig. 2), implica que la salida del proceso tienen dependencia estadística
con su pasado y por lo tanto es pensable en obtener para el proceso una representación del tipo de el
de la ec. 1 con la identificación de un “vector de estado” que almacena la información relevante del
pasado.
La idea detrás del modelado CEGH, es obtener un modelo del tipo del de la ec. 1; a partir de la
realización histórica de las salidas de un proceso estocástico; de forma de que el modelo obtenido,
si es usado para generar series sintéticas (o sea generar realizaciones), tenga la misma función de
densidad de probabilidad para cualquier subconjunto
xk, xk1,... xkn
de la series de
realizaciones. Observar que el índice
k
identifica una “posición temporal” en el ensamble de
realizaciones y los índices
k , k 1... kn
identifican una ventana de
n+1
posiciones del
ensamble de realizaciones que se desplaza al variar la posición temporal
k
del subconjunto.
Lo primero a recordar, es que el modelado se realiza a partir de la única realización histórica
disponible con lo cual las estimaciones NUNCA son en el ensamble de lo posible sino que son
sobre la realización histórica. Esto lleva que sea necesario intentar “ergodizar” el proceso mediante
transformaciones más o menos automáticas y que pueden contener información adicional propia del
conocimiento del proceso.
Por ejemplo, si se está modelando la radiación solar que recibe un panel solar sobre la superficie
de La Tierra, el conocimiento de la geometría estelar y del ciclo anual puede utilizarse para
modificar la serie de radiación a otra serie que no tenga la estacionalidad diaria y anual previo a
intentar el modelado.
Si se considera el subconjunto en que
n=0
(esto es la ventana en el ensamble selecciona solo
un casillero temporal), que el modelo genere series sintéticas con igual función densidad de
probabilidad que el proceso original (el de la serie usada para identificar el modelo) significa que el
histograma de amplitud de las series sintéticas coincide con el histograma de amplitudes de la
realización histórica.
Si se considera una ventana que involucre
n
elementos temporales; el modelo logra
reproducir la función de densidad de probabilidad conjunta de
xk, xk1,... xkn
y entonces el
modelo será capaz de captar la dependencia estadística de las salidas del proceso con su pasado
hasta
n
pasos de tiempos. En la frase anterior, se priorizó al hablar de la relación de dependencia
un sentido que es “el pasado influyendo sobre el presente”. Si bien puede no importar a la
formalidad matemática, en la práctica la hipótesis de trabajo es que la “causalidad” existe y que el
futuro no puede afectar al pasado.
Otro concepto del mundo real, es el de “El Olvido” en el sentido de que la dependencia
estadística tiene que ir perdiendo importancia en la medida en que el tiempo transcurre. Si bien el
primer principio de la termodinámica, nos puede llevar a pensar que al haber un balance permanente
de energía y materia, todo lo que no está en un lado está en otro y por lo tanto no hay olvido, el
segundo principio de la termodinámica implica un aumento permanente de la entropía que
“borronea” la información del pasado.
Modelo CEGH – Fundamentos. pág. 11/27
Notación. En lo que sigue usaremos la letra
y
para referirnos a la serie de medidas (la
realización histórica) o la salida del proceso y reservaremos la letra
x
para referirnos a la misma
serie en un espacio transformado en que las series son gaussianas. Es así que diremos que
x
es la
imagen de
y
en el Espacio Gaussiano y que
y
es la imagen de
x
en el Espacio Real (o
espacio de la señal original).
En la práctica, dado que la información disponible en la única realización histórica es finita, no
será posible identificar un modelo que asegure reproducir la función de densidad de probabilidad
para cualquier valor de la ventana
n
que determina los subconjuntos
xk, xk1,... xkn
. A
mayor valor de
n
que se pretenda abarcar, mayor será la cantidad de parámetros del modelo con
el mismo sustento estadístico (la información de la realización histórica).
Supongamos que se logra encontrar una transformación compacta que transforma el proceso
original a un espacio
G
donde el mismo es ergódico. (nadie está afirmando que dicha
transformación exista.) en ese caso, las funciones de densidad de probabilidad de los subconjuntos
yk, y k1,... ykn
transformados de los
subconjuntos
xk, xk1,... xkn
son
independientes de la posición temporal
k
.
El modelado CEGH, implica buscar una
transformación
yk, y k1,... ykn=G(xk, x k1,... xkn, k )
que
“ergodice” y “gaussianice” el proceso y lo
transforme en un proceso ergódico y gaussiano
y luego en el espacio transformado buscar un
sistema lineal que al ser atacado por ruido
blanco gaussiano reproduzca las funciones de densidad de probabilidad de los subconjuntos
yk, y k1,... ykn
. A los efectos de que el modelado en el espacio transformado sea útil, la
transformación
G(., k )
debe ser compacta (esto es transformar en unívocamente volúmenes
compactos del espacio de salida en volúmenes compactos del espacio de llegada). A la inversa de
esta transformación la denotaremos como
H(., k )=G1(., k )
.
Una vez obtenido el modelo CEGH, el mismo puede representarse por el esquema de la Fig. 3,
en el que de izquierda a derecha se tiene: Una fuente de ruidos blancos gaussianos (rbg)
independientes que genera la serie de vectores
{
rk
}
que alimenta la entrada del Sistema Lineal
(SL) el que genera a la su salida una serie de vectores
{
xk
}
cuyos elementos son gaussianas y que
si el modelo fue exitosamente identificado a partir de la información histórica mantienen la “misma
estructura estadística” que el proceso que intenta modelar. En este contexto, se entiende por “misma
estructura estadística” a que las integrales de medidas del estilo de las definidas por la ec. 7 se
aproximen a la misma integral calculada sobre la serie (ergodizada y gaussianizada) del proceso
original. Las integrales de medida utilizadas para realizar este chequeo pueden variar de acuerdo al
objetivo del modelado. Generalmente las medidas de interés son aquellas que guarden cierta
relación con la capacidad del sistema en el que se va a utilizar el modelo para “filtrar” variaciones.
Por último, el modelo transforma la serie
{
xk
}
del “espacio gaussiano” a una serie en el “espacio
real” mediante la transformación
H(., k )
.
No tenemos certeza de que la transformación que
G(., k )
exista ni un método genérico para
calcularla, pero en la práctica se ha desarrollado una aproximación que es la que se desarrolla en la
sección 3.2Primer aproximación al modelado de proceos multi variados. Transformaciones “por
paso” y “por señal”. que ha mostrado ser útil para los casos de modelado de algunos procesos
relacionados con variables de la Naturaleza como se los aportes a las centrales hidroeléctricas, la
Fig. 3: Modelo CEGH
rbg
xk
rk
yk
SL H
Modelo CEGH – Fundamentos. pág. 12/27
radiación solar y la velocidad de viento.
3.1.Proceso aleatorio ergódico univariado.
Dado proceso aleatorio con una salida de dimensión 1 (uno)
yk
. Las variables aleatorias
Yk
tendrán una cierta distribución
FYk(y)
. Si el proceso es ergódico, la distribución no
dependería del tiempo
k
y se puede escribir por tanto
FYk(y)= FY(y)
.
Supondremos que para estimar la distribución
FY(y)
se dispone de la realización histórica
{
yk
}
de las
Yk
.
En la búsqueda de una transformación
G(., k )
, observar que utilizando los resultados de las
secciones 2.3.c y 2.3.d es posible a partir de una distribución conocida de una variable aleatoria,
transformarla en otra variable aleatoria cuya distribución sea gaussiana. Para ello basta con
“uniformizar” la variable original con el resultado de 2.3.d y luego gaussianizar la variable
uniforme con el resultado de la 2.3.c. Esto nos asegura que la variable aleatoria tiene distribución
gaussiana, pero no necesariamente asegura que el proceso sea gaussiano.
El primer paso es estimar
FY(y)
a partir de la realización histórica
{
yk
}
lo que es posible
por haber supuesto que el proceso es ergódico. Una forma sencilla de realizar esta estimación es
re-ordenar los elementos de la realización histórica en en forma creciente obteniendo así una serie
monótona creciente con todos los valores históricos.
Sea
Fn(y)
la función de distribución de probabilidad acumulada de la distribución normal
(gaussiana de valor medio nulo y varianza unidad). Entonces, se pueden calcular las
transformaciones
G
y
H
como:
x=G(y , k )=Fn
1(FY(y))
y
y=H(x , k )=FY
1(Fn(x))
respectivamente. Como se puede apreciar en este caso al suponer que el proceso es ergódico para la
construcción de
FY(y)
se pierde la dependencia del tiempo
k
.
3.2.Primer aproximación al modelado de proceos multi variados.
Transformaciones “por paso” y “por señal”.
En esta sección se muestra un enfoque posible para la construcción delas funciones de
transformación de un conjunto de
N
señales a partir sus realizaciones históricas representadas
por la serie vectorial
{yk}
, siendo el índice
k
el identificador del “tiempo” en las series de
medidas e
yk
el vector de los
N
valores de la realización histórica del conjunto de señales en
el instante
k
. El sentido de la expresión “por paso” no es otro que el que expresa la dependencia
en
k
de las transformaciones
x=G(y , k )
y su inversa
y=G(x , k )
.
En la sección 3.1 se mostró cómo construir
G(., k )
para un proceso ergódico uni-variado. La
aproximación propuesta en esta sección para el cálculo de una
G(., k )
para un ramillete de series
es tratar cada señal como si fuese independiente al momento de identificar las transformaciones
G(., k )
y agregar la dependencia en el modelo lineal en espacio gaussiano. El que esa sea una
buena o mala aproximación a una transformación
G(., k )
que permita considerar al proceso de
las
N
en el espacio transformado como ergódico y gaussiano depende de la dependencia entre
las señales. Generalmente, mediante cambios de variables adecuados previos al cálculo de las
trasformaciones por señal es posible tener una buena aproximación pero hay casos de dependencia
entre las señales que no es posible identificar esos cambios de variables y entonces, el método de
buscar las transformaciones “por señal” no es aplicable.
Modelo CEGH – Fundamentos. pág. 13/27
Por construcción, al realizar las transformaciones “por señal”, se asegura que si se observa cada
señal por separado, el modelo “es bueno” y eso ya es un “marco” de aproximación al proceso del
conjunto de señales.
Dependiendo del proceso al que corresponden las series habrá cierto comportamiento estacional
(por ejemplo la radiación solar sobre un punto de la tierra tiene un comportamiento claramente de
estacionalidad anual) o podría haber también un comportamiento tendencial como el que tienen
típicamente las series que representan precios en una moneda dada.
Lo primero es detectar las estacionalidades y/o tendencias y quitarlas de las series tratando de
transformarlas en series que puedan estar asociadas a un proceso en estado estacionario. En esta
etapa juega un papel fuete el conocimiento que se tenga del fenómeno asociado al proceso
estocástico. Otra herramienta útil puede ser realizar un análisis de la distribución de potencias en el
espectro de frecuencias para determinar si el mismo tiene potencia concentrada en algunas
frecuencias que estén marcando la existencia de una señal periódica. El ejemplo de identificación de
la radiación solar es un ejemplo en el que el conocimiento del sistema solar ayuda en intentar
proponer un modelo de la radiación recibida en plano horizontal por un panel como el producto de
la radiación solar extraterrestre representada como una sinusoide multiplicada por un índice de
nubosidad.
Sea
{yk
i}
la serie correspondiente a la señal
i
que está representada por la componente
i-ésima del vector
yk
. Formas de transformar las
{yk
i}
para lograr series que por lo menos
parezcan salidas de un proceso ergódico hay muchas y posiblemente es en esta etapa del proceso de
identificación en que el “investigador” (o sea usted) puede agregar información del conocimiento
físico del proceso.
En término del análisis espectral, para poder identificar una periodicidad, en la práctica, la
misma debe ser de frecuencia tal que por lo menos tenga 5 (cinco) ciclos completos en la serie de
datos analizados. Por ejemplo, en el caso de aportes hidráulicos a las represas de Uruguay, se
dispone de 100 años de aportes medios semanales, con lo cual el límite para identificar un ciclo a
partir del análisis espectral 20 años. Es decir que ciclos con períodos de repetición superiores a 20
años deberán analizarse por otros métodos.
A los efectos de la identificación del modelo CEGH, se supone entonces que los
comportamientos tendenciales y/o variaciones de muy baja frecuencias fueron quitados previamente
de las señales (en base a conocimiento del fenómeno u otras técnicas) y que se está trabajando sobre
series que parecen corresponder a un proceso en estado estacionario aunque pueda tener
estacionalidades marcadas. Bajo este supuesto, las funciones
G(., k )
tendrán la dependencia en
el tiempo
k
que permite captar las estacionalidades. Lo típico es poder describir ciclos de
estacionalidad y para ello podemos especificar el largo del período estacional con un parámetro que
llamaremos
NPP
( Número de Puntos por Período) y buscar funciones
G(., k )
tal que
G(., k )=G(., k +hNPP)
para cualquier entero
h
. La idea es que el comportamiento
estadístico tienen una estacionalidad que se repite cada
NPP
puntos de la serie de datos. Para el
cálculo de las
NPP
funciones
G(., k )
de cada señal, habrá que generar
NPP
histogramas
de amplitudes de la variable para describir la variable según el momento dentro del ciclo estacional.
Por ejemplo si el proceso en cuestión es la radiación solar, y dividimos el año en cuatro estaciones
podemos construir los histogramas de la radiación recibida para cada una de las cuatro estaciones.
En la práctica, para el análisis de las series, el parámetro
NPP
determina que es suficiente
con crear
NPP
funciones
G(., k )
etiquetables con
k=1,, NPP
. Para la confección de
estos histogramas de amplitudes, el largo de la serie de datos se ve dividido por
NPP
disponiéndose por lo tanto de menos información para la confección de cada histograma estacional
que si se construyera un único histograma. Esta falta de información puede llevar a tener una
variación artificial de los histogramas de un paso a otro dentro del período estacional por causa de
Modelo CEGH – Fundamentos. pág. 14/27
la población reducida de datos con que fueron obtenidos. Para evitar dar un peso exagerado a la
ocurrencia de un valor particular de esa población escasa, es posible considerar que la precisión de
un dato dentro del período estacional puede ser relativa.
Puesto en palabras y sobre un ejemplo, si en la semana del 17/8/2011 hubo un aporte muy
importante de lluvias a una represa, en la realidad la precisión de esa fecha no es información
relevante (y se vuelve desinformación en una población escasa) y razonablemente se podría decir
que es esa fecha más menos 2 semanas en cuanto a la relevancia estadística del dato. Esto lleva a la
definición de un nuevo parámetro
NPO
que llamaremos número de pasos de Overlapping o
solapamiento, de forma tal que el dato
yk
i
participe de la formación de los histogramas de
amplitudes asociados a los pasos
kh=(k mod NPP)+ j
con
j
entero tal que
NPOjNPO
y siendo “mod” la operación residuo.
Si
NPO=0
el dato
yk
i
tiene peso estadístico en el histograma
kh=k mod NPP
y solo en
ese histograma.
Si
NPO=2
el dato
yk
i
tiene peso estadístico en el histogramas
kh=k mod NPP
y en los
dos siguientes y en los dos anteriores dentro del período estacional.
En el caso del análisis de las velocidades de viento, surgió la necesidad de definir un
comportamiento estacional diario además de la estacionalidad anual. En este caso hay un “mini-
ciclo” dentro de un un ciclo. Si las series son horarias, tendremos una estacionalidad de 8760 horas
correspondiente al ciclo anual y unos miniciclos de 24 horas. Para poder definir los miniciclos se
agregaron dos parámetros que son
NPMC
que es el número de puntos por miniciclo y
NPT
que es el número de puntos de Traslapping. En el ejemplo de la velocidades de viento, una
definición posible seria
NPP =8760; NPO=3; NPMC =24 ; NPT =2
lo que implicaría la
generación de 8760 histogramas en base a la serie de datos, para lo cual cada muestra se considerará
válida en el instante a la que corresponde en las tres horas anteriores y siguientes y ese esquema (de
6 horas) se considera que aporta información para el día al que corresponde el dato (miniciclo del
dato) y en los dos miniciclos siguientes y anteriores. Con esta configuración, un mismo dato aporta
información a
(1+2NPO )(1+2NPT )
de los
NPP
histogramas que se crearán. La
selección de los parámetros es un compromiso entre el conocimiento de los procesos físicos y el
largo de las series de datos disponibles que condiciona la población con que se realizara la
construcción de cada histograma. Si las series son muy largas, no es relevante preocuparse de los
parámetros
NPO
y
NPT
.
3.3. Identificación de sistema lineal a partir de series de entrada y
salida.
En esta sección se supondrá que se trabaja sobre series numéricas que son gaussianas de valor
medio nulo y varianza unitaria. Es decir supondremos que estamos trabajando siempre en el espacio
gaussiano.
Sea
{Xk}
la serie del vector salidas del filtro lineal a identificar y
{Zk}
la serie del vector de
entradas conocidas al filtro. Dado la cantidad de retardos
Nr
del filtro (cantidad de retardos a
considerar en su memoria) la ecuación del filtro que nos proponemos identificar es la siguiente:
Modelo CEGH – Fundamentos. pág. 15/27
Xk+1=
h=0
h=Nr1
Ah
Xkh+CZk+BRk
ec.(14) Modelo del proceso.
Supongamos que se dispone de una serie de medidas
{Xk}
de la salida de un proceso estocástico
que lo queremos modelar como una caja negra que recibe a su entrada la serie
{Zk}
que es
conocida y que se quiere identificar las matrices
Ah
,
B
y
C
que mejor modelen la
relación entre las entradas y las salidas siendo
{Rk}
una serie de ruidos desconocidos. El modelo
se identificará para minimizar la varianza de
{Rk}
.
Suponemos que las series
{Xk}
y
{Zk}
son gaussianas y de varianza unidad y que
corresponden a un proceso erogódico y estacionario.
Se supone que
{Rk}
y
{Xk}
son independientes. Esto es por la “no anticipación” del proceso.
El ruido que “ataca” en el instante
k
sólo puede tener efectos desde ese instante en adelante.
La ecuación 15 puede escribirse aplicada sobre las series resultando en la ecuación 15 a
continuación.
{Xk+1}=
h=0
h=Nr1
Ah
{Xkh}+C{Yk}+B{Rk}
ec.(15) Modelo aplicado a las series.
La ecuación 15 puede escribirse de forma de dejar explícita una matriz con las matrices
Ah
y
C
agrupadas como se muestra .a continuación:
{Xk+1}=
[
A0, A1,, ANr1, C
]
[
{Xk0}
{Xk1}
{Xk−(Nr1)}
{Yk}
]
+B{Rk}
ec.(16) Modelo matricial.
La solución de mínimos cuadrados que reduce el error de predicción
B{Rk}
es la solución del
sistema:
{Xk+1}
[
{Xk0}
{Xk1}
{Xk
(
Nr1
)
}
{Zk}
]
T
=
[
A0, A1,, ANr1,C
]
[
{Xk0}
{Xk1}
{Xk
(
Nr1
)
}
{Zk}
]
[
{Xk0}
{Xk1}
{Xk
(
Nr1
)
}
{Zk}
]
T
Que puede escribirse como:
[
Rxx
(
1
)
, Rxx
(
2
)
,, R xx
(
Nr
)
, Rxz
(
1
)
]
=
[
A0, A1,, ANr1, C
]
M
En dónde la matriz de correlaciones
Rzx(j)
de retardo
j
, entre las series de vectores
{Zk}
y
{Xk}
se define como:
Rzx
(
j
)
=〈{Zk}{Xkj}T〉≈ 1
N
k=1
k=N
ZkXkj
T
Modelo CEGH – Fundamentos. pág. 16/27
y
M=
[
Rxx
(
0
)
Rxx
(
1
)
Rxx
(
Nr1
)
Rxz
(
0
)
Rxx
(
1
)
Rxx
(
0
)
Rxx
(
Nr2
)
Rxz
(
1
)
⋮ ⋱ ⋮
Rxx
(
Nr1
)
Rxx
(
Nr2
)
Rxx
(
0
)
Rxz
(
Nr1
)
Rzx
(
0
)
Rzx
(
1
)
Rzx
(
Nr1
)
Rzz
(
0
)
]
Resolviendo
[
A0, A1,, ANr1,C
]
=
[
Rxx
(
1
)
, Rxx
(
2
)
,, Rxx
(
Nr
)
, Rxy
(
1
)
]
M1
Para calcular
B
multiplicamos ambos lados de la ecuación 16 por su transpuesto y tomamos el
valor esperado obteniendo:
{
Xk+1
}{
Xk+1
}
T
=
[
A0, A1,, ANr1, C
]
M
[
A0, A1,, ANr1, C
]
T+BBT
En dónde se ha usado que
{
Rk
}{
Rk
}
T
=I
Despejando
BBT
se tiene:
BBT=〈 {Xk+1}{Xk+1}T〉−
[
A0, A1,, ANr1, C
]
M
[
A0, A1,, ANr1, C
]
T
ec.(17)
Para el cálculo de
B
a partir del conocimiento de
BBT
se puede utilizar la descomposición
de Cholesky si
BBT
es definida positiva. En el caso en que sea semi-definida positiva, es posible
calcular
B
aplicando SVD (Singular Value Descomposición).
3.4.Incorporación de pronósticos a partir de sesgos y atenuadores.
La ecuación 15 representa la parte lineal en el espacio gaussiano de un sintetizador CEGH de
SimSEE. Como ya se describió, ese modelo lineal es obtenido mediante un proceso de
identificación. Este tipo de identificación captura el comportamiento estadístico de las series de
entrada reduciendo el error de pronóstico cuando la única información que se utiliza para
pronosticar es la contenida en el pasado de las propias series de datos. En las aplicaciones reales, se
utiliza más información para realizar el pronóstico de la evolución de las variables de interés que
aquella contenida en la realización histórica de las propias variables.
A modo de ejemplo, para el pronóstico de los aportes de los siguientes 10 días a las represas se
utiliza información para evaluar las probabilidades de lluvias y sus volúmenes estimados en las
cuencas basadas por ejemplo en imágenes satelitales información que no está en las series
históricas. Generalmente, esta información adicional es útil en el corto plazo luego del cual el
proceso se rige por la estadística de las series históricas.
Si nos imaginamos la salida de un proceso estocástico con dinámica como un cono del futuro
posible, el conocimiento de información adicional tiene valor, si permite “afinar” el cono de la
evolución futura de una variable reduciendo su apertura y posiblemente sesgando su guía. En la
Modelo CEGH – Fundamentos. pág. 17/27
fig.4 se muestra lo que podría ser el cono de las trayectorias de una variable
x
(
t
)
a partir de su
valor conocido en el instante
t=t0
en el vértice del cono. En la figura se muestra un cono rojo
que contendrá las realizaciones que generará el modelo CEGH si no se dispone información
adicional para el pronóstico. En la misma figura en color naranja se muestra cómo podría verse
modificado el cono que contiene las realizaciones futuras si se dispone de más información. La
curva celeste dibujada en el centro del cono naranja es lo que llamamos “la guía del cono” y es la
trayectoria de probabilidad de excedencia 50%. Es decir que dada una realización
x
(
t
)
sintetizada por el modelo CEGH, para cada tiempo
t
el valor de
x
(
t
)
tiene igual probabilidad
de estar por encima que por debajo de la guía.
a) Implementación en los modelos CEGH.
Para la introducción de la información de los pronósticos se agregó en los modelos CEGH la
posibilidad de especificar una serie de sesgos
{Sk}
y de factores de apertura
{Pk}
que actúan
como se muestra en la ec. 18 a los efectos de cambiar el cono de la dinámica de acuerdo a la
información disponible de corto plazo (el pronóstico).
Xk+1=
h=0
h=Nr1
Ah
Xkh+CYk+Sk+Pk
BRk
ec.(18) Modelo de proceso con
sesgos y factores de apertura del
ruido.
Donde:
el vector
{Xk}
representa el estado de las salidas sintetizador en el espacio gaussiano.
Las matrices
Ah
forman el filtro recursivo que aporta la información del pasado del
Fig. 4: Conos de dinámica con y sin pronósticos de corto plazo.
Modelo CEGH – Fundamentos. pág. 18/27
estado de las salidas, que tienen influencia en la determinación de la siguiente salida.
Las matrices
C
y
B
son las matrices que multiplican las entradas deterministas
Yk
y las aleatorias
Rk
.
El estado del filtro lineal está dado por el conjunto de vectores
[
Xk, X k1,, X k
(
Nr1
)
]
que es necesario conocer, además de las entradas
Yk
y
Rk
para poder calcular
Xk+1
.
El vector de entradas aleatorias
Rk
es un vector de ruidos blancos independientes con
distribución normal. La transformación lineal
B
transforma el vector
Rk
en otro
vector del mismo espacio que el del vector de estado
Xk
. Esta transformación tiene el
efecto de “mezclar” los canales de ruido. Por ejemplo en el caso de los aportes a las represas
capta comportamientos tales como el que si dos represas están cercanas, hay cierta
probabilidad de que cuando llueve en la cuenca de una también suceda en la de la otra.
Las matrices
Pk
, son matrices diagonales con “factores de apertura” por canal.
Multiplican las salidas de los canales de ruido ( resultantes de la mezcla realizada por
B
)
por un “factor de apertura” que permite regular el nivel de ruido y controlar por tanto la
apertura del cono de pronósticos a la salida del sintetizador. Si esos valores se mantienen en
CERO no se inyecta ruido y por lo tanto la salida del sintetizador es determinística. Cada
señal de apertura permite ir de una situación determinística (apertura = 0 ) a la situación de
máxima apertura (apertura=1) en cada canal de ruido en forma independiente.
La serie de vectores
Sk
, es la serie de vectores de sesgos que permite sesgar la salida del
filtro lineal. Cambiando la guía del cono de cada canal.
La forma de introducir la información de los pronósticos es entonces suministrando la serie de
vectores de sesgos
{Sk}
y la serie de matrices de apertura
{Pk}
.
b) Determinación de los sesgos a partir del pronóstico.
En la práctica, dado un punto de partida de una simulación en el presente, existen “pronósticos” que
permiten reducir la varianza en lo inmediato de lo que es esperable de un proceso estocástico
respecto a lo que daría la salida del CEGH si nos limitáramos a fijar el estado inicial y simplemente
simuláramos suponiendo
Sk=0
y
Pk=I
en la ec. 18.
La información de los pronósticos viene dada generalmente por una especificación del cono de
la dinámica de las variables que es esperable se verifique en el futuro inmediato. Parte de ese cono
puede coincidir con el cono de la dinámica “sin pronósticos”. La diferencia es en definitiva la
información agregada por el pronóstico sobre la dinámica del proceso contenida en la información
histórica de sus realizaciones.
Para fijar ideas, para la Programación Semanal (actividad que se realiza una vez por semana
para programar el despacho de las diferentes centrales de generación de acuerdo a los recursos
disponibles para la siguiente semana) es fundamental disponer de cierto pronóstico de cuales serán
los caudales de aportes hidráulicos a las represas. En la actualidad (2012) existen medidas y
modelos de previsión que brindan buenos pronósticos para los siguientes 7 días y con más error
hasta unos 15 días. Esos pronósticos se expresan con curvas como las que se muestran en la fig.5 en
la que se muestra el cono de aportes esperados para los siguientes veinte días en la central
hidroeléctrica de Salto Grande. La guía del cono corresponde a la probabilidad 50% y los laterales
inferior y superior a las probabilidades de excedencia de 95% y 5% respectivamente.
Modelo CEGH – Fundamentos. pág. 19/27
Dada la guía de probabilidad 50%
en el espacio real, mostraremos ahora
como a partir de la ec.18 es posible
obtener el los sesgos
{Sk}
a aplicar
en el espacio gaussiano.
El primer paso es pasar la GUÍA del
espacio real al espacio gaussiano.
Para eso basta con utilizar las
transformaciones no lineales del
modelo CEGH. llamemos
γ
k
a la
GUÍA de probabilidad 50% en el
espacio gaussiano. Ahora hay que
calcular los
Sk
para que
prob
(
Xk>
γ
k
)
=0.5
Observar que en el espacio
gaussiano cada componente del vector
Rk
tiene distribución normal por lo que el punto que deja
50% de valores de un lado y del otro es el CERO. Igualmente el vector
B Rk
es también un
conjunto de fuentes aleatorias gaussianas de valor esperado nulo por ser combinación lineal de
gaussianas de valor esperado nulo. En cada fila de la ecuación matricial ec.18 se está calculando el
valor siguiente de las componentes del estado
X
a partir de los valores anteriores (estado del
filtro) y de los valores determinísticos
Yk
.
Es así que el aporte de
B Rk
puede verse como la componente ruidosa alrededor de la
proyección determinística del estado. Si anulamos esa componente ruidosa, como es simétrica se
tiene que la proyección determinística del estado corresponde a la trayectoria de 50% de
probabilidad.
Si partimos de
k=0
como punto vértice del cono, tendremos que en ese punto el estado es
conocido así como las entradas determinísticas
Y0
y podemos calcular por tanto la proyección
determinística del estado en
k=1
como se muestra en la ec.19. Dónde el valor
S0
debe ser
calculado para que el vector
X1
coincida con el valor de las guías de probabilidad 50%
γ
1
X1=
h=0
h=Nr1
Ah
X0h+CY0+S0
ec.(19) Proyección determinística
del primer paso.
Despejando se tiene:
S0=X1
h=0
h=Nr1
Ah
X0h+CY0
y aplicando el mismo razonamiento para el
paso k se puede escribir:
Sk=Xk+1
h=0
h=Nr1
Ah
Xkh+CYk
ec.(20) Cálculo de los vectores de
sesgos para seguir la guía.
En el editor de SimSEE el formulario que permite editar los parámetros de las instancias de
modelos CEGH tiene la facilidad de introducción de pronósticos. La fig. 6 muestra el panel para
ingreso de pronósticos del formulario de edición de parámetros de una instancia CEGH en SimSEE
para un ejemplo en el que el CEGH tiene tres “canales” (o salidas) correspondientes a los aportes
medios semanales de caudales a las represas de Bonete, Palmar y Salto. El formulario tiene la
Fig. 5: Ejemlo de pronóstico de aportes a Salto Grande.
Modelo CEGH – Fundamentos. pág. 20/27
posibilidad de incluir un pronóstico determinístico (Columna “valores iniciales y guía del
pronóstico en la fig. 6), especificando los valores en el espacio real de la guía del cono. También se
puede seleccionar el Número de Pasos de Control del Cono (NPCC) en que esos valores
determinismos deben ser considerados para la generación de sesgos, el Número de Pasos de
Liberación del Cono (NPLC) en que el sesgo pasará del valor en que haya quedado en el último
paso de control a cero. Para controlar la apertura del cono se incluyeron dos parámetros, Número de
Pasos Sin Apertura (NPSA) y Número de Pasos de Apertura el Cono (NPAC). El parámetro NPSA
corresponde al número de pasos desde el inicio en que se considerará que la guía es determinística y
por tanto los factores de apartura del cono son nulos. Transcurridos los NPSA pasos con factores de
apertura nulos, el parámetro NPAC regula la cantidad de pasos en que los factores de apertura
pasarán de 0 (Cero) a 1.
La misma interface permite generar los sesgos y los factores de aperturas a partir de los valores
iniciales, la guía de pronósticos los valores
NPCC, NPAC, NPSA y NPLC de cada
canal mediante la aplicación de la ec. 20 y
las definiciones antes dadas a los
parámetros.
Presionar el botón “Calibrar Cono”, se
realizan los cálculos y como verificación se
realiza una simulación de 100 realizaciones
y se grafica para cada canal un gráfico
como el que se muestra en la fig. 6 para el
canal Palmar. En la gráfica se puede
apreciar, el vértice del cono (a la izquierda)
partiendo del valor inicial
59.0m3/s
seguido por tres valores sin dispersión
(dado que
NPSA=3
). De estos tres
valores, los dos primeros son
40.0 m3/s
y
30.0m3/s
obligados por ser los valores
especificados para la guía y el parámetro
NPCC =2
. Del quinto valor en adelante (es decir
pasado el primero que es el valor inicial y los siguientes 3 sin apertura del cono) comienza a
aparecer el ruido y por eso el cono de pronóstico se abre. En la figura se muestran en el centro del
cono la trayectoria de probabilidad 50% y la trayectoria del valor esperado. La inferior corresponde
a aquella que tiene valores inferiores con probabilidad 5% y la curva superior corresponde a la que
tiene valores superiores con probabilidad 5%. Entre la curva inferior y superior definen “el cono” de
probabilidad 90%.
Fig. 7: Ejemplo de pronóstico de aportes a Palmar
Fig. 6: Panel de introducción de pronósticos en modelo CEGH de SimSEE.
Modelo CEGH – Fundamentos. pág. 21/27
4. Reducción de la dimensión del estado de modelos CEGH
en la Programación Dinámica Estocástica.
Ruben Chaer – Julio 2013
4.1.Introducción.
Los modelos CEGH (Correlaciones en Espacio Gaussiano con Histograma) son utilizados
intensivamente en la plataforma SimSEE para el modelado de los procesos estocásticos.
En pocas palabras, el modelado CEGH implica primero identificar el modelo a partir de un
conjunto de series históricas de valores del vector de variables de interés. Por ejemplo, si el proceso
a modelar son los aportes a las represas de Bonete, Palmar y Salto Grande, el vector de valores
tendrá dimensión 3 y la serie histórica de ese vector podrá ser por ejemplo los aportes medios
semanales expresados en
m3/s
a las tres represas. Sea
{
Yk
}
la serie de vectores que
representan los valores históricos. En el modelado CEGH, se identifica una transformación del
espacio de los valores reales a un espacio transformado en que las series “se parecen” a series
gaussianas en estado estacionario. A los efectos de introducir la notación, identifiquemos esta
transformación como:
xk=TNL(yk, k )
xk, ykRn
ec.(21) Transformación al espacio
gaussiano.
A partir de las series
{
xk
}
(que se supone representan un proceso gaussiano conjunto y que
cada componente del vector por separado es una gaussiana con valor esperado nulo y varianza
unidad) se identifica un filtro lineal de forma que dicho filtro, cuando es alimentado por fuentes de
ruido blanco gaussiano genera en su salida un vector que reproduce las matrices de covarianza
xkxk
t
,
xkxk1
t
,...
xkxknr
t
.
La estructura del filtro lineal identificado puede ser cualquiera. En particular, la herramienta
AnalisisSerial [???] que forma parte de la plataforma SimSEE identifica una filtro lineal recursivo
puro con el formato:
xk+1=
h=0
h=nr1
Akh.xkh+B.rk
ec.(22) Estructura del filtro lineal
identificado por la herramienta
AnálisisSerial.
Al reproducir las matrices de covarianza para diferentes retardos
0, 1,... , nr
el modelo así
identificado tiene para el conjunto de variables aleatorias dado por las componentes del vector
z=
[
xk
xk1
....
xknr
]
cuya matriz de covarianzas se pude calcular como:
Modelo CEGH – Fundamentos. pág. 22/27
Σ=
[
xkxk
t
〉 〈
xkxk1
t
...
xkxknr
t
xk1xk
t
〉 〈
xk1xk1
t
...
xk1xknr
t
... ... ... ...
xknrxk
t
〉 〈
xknrxk1
t
...
xknrxknr
t
]
ec.(23) Matriz de covarianzas del
proceso conjunto de los vectores
z=
[
xk
xk1
....
xknr
]
Dada la matriz de covarianza de un proceso gaussiano conjunto, la función de densidad de
probablidad se puede calcular como:
pz(z)=e1
2(zΣ1zt)
ec.(24) Función densidad de
probabilidad del proceso conjunto Z
Observar que bajo el supuesto de que existe la
TNL
de la ec. 21 el sistema lineal identificado
en el espacio gaussiano, puede teóricamente sintetizar series que tienen la misma función densidad
de probabilidad que el proceso usado para la identificación. Por lo tanto, las series sintetizadas
cumplen cualquier medida de probabilidad que se realice con la integral sobre el espacio del
proceso usando como ponderador la
pz(z)
. Como la
TNL
de la ec. 21 es invertible y
transforma todo volumen compacto del espacio original en un volumen compacto del espacio
gaussiano; es posible calcular la función de densidad de probabilidad del proceso en el espacio
original a partir de
pz(z)
multiplicando dicha función por el jacobiano de
TNL1
.
Hasta aquí se realizó un resumen de los fundamentos de los modelos CEGH. A los efectos de la
consideración de un modelo CEGH en un algoritmo de Programación Dinámica Estocástica (PDE),
es necesario representar la función de Costo Futuro (CF) (también conocida como función de
Bellman) definida de el espacio de estados del sistema incluyendo los procesos estocásticos en los
reales. El CEGH con filtro lineal como el de 22 tiene un estado de dimensión igual a la dimensión
de
x
por la cantidad de retardos
nr
que se consideren. Como es sabido los algoritmos de PDE
sufren de “La Maldición de la Dimensionalidad de Bellman” [??] qué básicamente se trata de la
explosión combinatoria que implica el producto cartesiano de las discretizaciones que se consideren
sobre cada dimensión del espacio de estado. Para fijar ideas, si se tiene un sistema con un vector de
estado en
xR5
y para representar la función
CF (x):R5R
se fijan los rangos de variación
de cada componente de
x
y se discretiza cada rango en
10
puntos, se tendrá que el total de
puntos sobre los que hay que calcular
CF (x)
es
105
. Por este motivo, para poder llevar a cabo
la PDE, en muchas ocasiones se recurre a simplificar la representación del estado del sistema. Claro
está que dicha simplificación siempre significa pérdida de información y por lo tanto el resultado
será una función
CF (x)
con menos información. Dado que el gradiente de
xCF (x)
contiene la información de la Política de Operación Óptima del sistema, la pérdida de información
se traduce en la obtención de una política sub-óptima.
En este trabajo, se analiza como impacta sobre los modelos CEGH optar por reducir la
dimensión del espacio de estado del filtro lineal y cómo considerar en la PDE dicha pérdida de
información.
Modelo CEGH – Fundamentos. pág. 23/27
4.2.Reducción del espacio de estados en el espacio gaussiano de un
modelo CEGH.
El filtro lineal de la ec. 22 puede escribirse como un filtro recursivo de orden 1 como se muestra
en la ec. 25
zk+1=̄
A.zk+̄
B.rk
ec.(25) Sistema lieneal de orden 1.
Donde las matrices
̄
A
y
̄
B
son calculables fácilmente a partir de las matrices
Ah
y
B
de la ec. 22.
Entonces, sin pérdida de generalidad es posible trabajar sobre la estructura de filtro lineal de la
ec. 25.
Para la representación del filtro lineal en el algoritmo de Programación Dinámica Estocástica, se
decide utilizar una “reducción” del espacio de estado dada por una transformación
y=Mrz
. Por
simplicidad supondremos que las filas de esa matriz tiene filas ortogonales. Si
zRn
y
yRm
la operación de reducción implica que
m<n
.
En principio, si se quiere tener una transformación de “amplificación”
Ma
se tendría que
cumplir que si se aplica la amplificación sobre un punto
yRm
se obtenga un punto
zRn
tal
que si luego se aplica la transformación reductora
Mr
sobre
z
se vuelva a obtener el punto
y
. Por lo tanto se debe cumplir la realación de la ec. 26.
Mr.Ma=I
ec.(26) La cadena de Amplificación
y Reducción tiene que ser la
identidad.
Si se supone que las filas de
Mr
son ortonormales,
Ma=Mr
t
es solución de la ec. 26.
Por otro lado, por facilidad de la representación de las probabilidades en el espacio de estado, es
deseable que las componentes del vector de estado reducido tengan varianza unidad (esto es
(yk
i)2
=1;i=1...m
, siendo
yi
la componente i-ésima del vector
y
). Esto simplifica la
especificación de los estados como “bandas de probabilidad”. Para lograr este objetivo, hay que
escalar las filas de
Mr
para que la matriz de covarianzas
y.yt
tenga unos en la diagonal.
y.yt
=Mr
z.zt
Mr
t
ec.(27) Matriz de covarianzas del
vector de espacio reducidos.
Para lograr cumplir con la ec. 26 y que la matriz
y.yt
definida como en la ec. 27 tenga 1s
(unos) en su diagonal, dada una Propuesta de Transformación Reductora
̌
Mr
de filas
ortonormales y la matriz de covarianzas
z.zt
procedemos de la siguiente forma:
1) Calculamos
y.yt
=̌
Mr
z.zt
̌
Mr
t
y llamamos
ζ1
2, ζ2
2, ...ζm
2
los elementos de su diagonal.
2) Calculamos
Mr
dividiendo las filas de
̌
Mr
por los valores
ζ1, ζ2, ...ζm
como se
expresa en la ec. 28.
3) Calculamos una Propuesta de Transformación Amplificadora como
̌
Ma=̌
Mr
t
que por ser
̌
Mr
ortonormal se asegura el cumplimiento de la ec. 26.
4) Por último, para mantener el cumplimiento de la ec. 26 calculamos
Ma
escalando las
Modelo CEGH – Fundamentos. pág. 24/27
columnas de
̌
Ma
con los multiplicadores
ζ1, ζ2, ...ζm
como se muestra en la ec. 29
Mr=
[
1
ζ1
0 ... 0
01
ζ2
... 0
0 0 ... 1
ζm
]
.̌
Mr
ec.(28) Esclamiento de la propuesta
de transformción reductora para
asegurar varianza unitaria de las
componentes del vector de estado
reducido.
Ma=̌
Ma.
[
ζ10 ... 0
0ζ2... 0
0 0 ... ζm
]
ec.(29) Escalamiento de la propuesta
de transforamción aplificadora para
mantener el equilibrio de la ec. 26
4.3.Transformación Amplificadora en el espacio gaussiano de un
modelo CEGH.
En la sección 4.2 se mostró las características deseables que debieran tener las transformaciones
de reducción de la dimensión del estado
Mr
y de amplificación de la dimensión del estado
Ma
.
La reducción del espacio de estado, es usado durante el algoritmo de Programación Dinámica
Estocástica (PDE) para reducir la dimensión del espacio de estado (espacio sobre el que se calcula
la función de Costo Futuro (CF) ) como forma de disminuir el impacto de la Maldición de la
Dimencionalidad de Bellman. En la ejecución del algoritmo de PDE, se realiza un recorrido de las
etapas temporales (pasos de tiempo) en reversa en el tiempo (desde el último paso de tiempo al
primero) y para cada paso de tiempo se realiza un “barrido” de todos los puntos de la discretización
del espacio de estado sobre el que se quiere calcular la función CF. Es precisamente ese conjunto de
puntos que se obtiene por el producto cartesiano de las discretizaciones sobre cada dimensión del
espacio de estado que produce una de las explosiones combinatorias que da lugar a la Maldición de
Bellman.
Al trabajar con un estado reducido
yRm
en un espacio de menor dimensión que el original,
se estará “perdiendo información” respecto al estado real del sistema. Hay un conjunto de puntos
del espacio sin reducir que transformados por
Mr
dan el mismo
y
por lo tanto dado un
y
es imprecisa la posición del sistema en el espacio original.
Un problema de optimización adicional es determinar la transformación
Mr
que lleva a la
menor pérdida de información relevante para el operador. Este problema de optimización NO es
objeto de este trabajo. En este trabajo se supone que la transformación reductora es dada y a lo
sumo se recomienda escalar las filas de la matriz para que cada variable por separado tenga varianza
unidad en el espacio reducido con el solo propósito de facilitar la descripción de las variables.
Durante la resolución del algoritmo de PDE, al calcular el mínimo entre el costo de la etapa,
partiendo de un estado reducido
y
dado, más el costo futuro del estado
y '
alcanzado al final
Modelo CEGH – Fundamentos. pág. 25/27
de la etapa, es necesario para poder utilizar el modelo del sistema (ecuaciones que representan las
restricciones incluyendo la dinámica) asignar un valor del estado no reducido del sistema. Dado que
hay muchos valores posibles de ese estado que corresponden al estado reducido
y
, se tiene que
la reducción de estado, agrega al algoritmo una incertidumbre sobre el estado. En el caso de la
implementación propuesta para SimSEE, esta incertidumbre se refleja mediante la suma de ruido
sobre el valor
z=Ma.y
en la forma que muestra la ec.
z=Ma.y+Ba.wa
ec.(30) Inyección de Ruido en la
transformación de amplificación de
la dimensión del estado.
El principal objetivo de este trabajo es el cálculo de la matriz
Ba
de la ec. 30 de forma tal que
se logre el efecto de reproducir la matriz de covarianzas
z.z '
/y
del vector de estado conocido
el valor del vector de estado reducido
y
.
Si no se conociera el vector de estado reducido
y
el vector de estado
z
tiene una matriz de
covarianzas
z.z '
conocida que se puede calcular a partir de las matrices del filtro lineal 25.
Expresando la covarianza de ambos lado de la ec. 25 podemos escribir:
zk+1.zk+1'
=̄
A.
zk.zk'
.̄
A' +̄
B.
rk.rk'
.̄
B'
ec.(31) Calculando la matriz de
covarianzas del estado
z
Teniendo en cuenta que el proceso es ergódico, se puede escribir:
zk+1.zk+1'
=
zk.zk'
=
z.z '
. Además, por construcción
rk
es una serie de vectores de
ruidos blancos independientes por lo que
rk.rk'
=I
. Utilizando estas relaciones en la ec. 31 se
obtiene la ec. 32.
z.z '
=̄
A.
z.z'
.̄
A ' +̄
B.̄
B '
ec.(32) Sistema que determina la
matriz de covarianzas de z en
función de las matrices del filtro.r
Para resolver el sistema de la ec. 32 se observa que es un sistema lineal en
z.z '
y que se
puede expresar como un sistema lineal invertible vectorizando (creando vectores con las columnas
concatenadas de las matrices) ambos lados de la ecpresión y teniendo en cuenta que el vectorizado
del producto de tres matrices cumple:
vect (A.X.B)=Kron (B ' , A). vec(X)
dónde la operación
“vec” corresponde a crear un vector a partir de una matriz concatenando sus columnas y la
operación “Kron” es el Producto de Kronecker. (ver. Petersen & Pedersen, The Matrix Cookbook,
Version: November 14, 2008, Page 60 ).
z.z '
=reshape((IKron(̄
A , ̄
A))1.vec(̄
B.̄
B ' ))
,
dónde la operación “reshape” es la inversa de la operación “vec”.
ec.(33) Matriz de covarianzas del
estado del filtro lienal.
Si hubiera que adivinar la posición del sistema de la ec. 25 sin ninguna información disponible,
se podría representar el estado como:
z=H.w
siendo
H
cualquier matriz que cumpla
H.H ' =
z.z '
y
w
un vector de ruidos blancos gaussianos normales.
Modelo CEGH – Fundamentos. pág. 26/27
Observar que dada cualquier matriz ortonormal
F
, se cumple
H.F.F ' .H ' =
z.z '
.
Utilizando esta representación del vector de estado y la descomposición de la ec. 30 se puede
escribir:
z=Ma.y+Ba.wa=H.F.w
ec.(34)
Multiplicando la ec. 34 por la matriz reductora
Mr
se puede escribir:
Mr.z=Mr.Ma.y+Mr.Ba.wa=Mr.H.F.w
ec.(35)
Como
Mrr.z=y
y
Mrr.Ma=I
en le ec. 35 se deberá cumplir que
Mr.Ba.wa=0
y
y=Mr.H.F.w
.
Para lograr calcular
Ba
consistente con estas igualdades, se observa que las columnas de la
matriz
Mr.H
expanden el espacio
Rm
del estado reducido
y
. Como la matriz
Mr.H
tiene por construcción
m
filas y
n
columnas con
m<n
, la transformación
Mr.H
tiene
rango
m
y el núcleo de la transformación
Mr.H
tiene dimensión
nm
.
Si identificamos una base ortonormal
Fa
del núcleo de
Mr.H
y una base ortonormal
Fb
del subespacio ortogonal al núcleo, y construimos la matriz
F
cuyas primeras
nm
columnas son las de
Fa
y las siguientes
m
columnas son las de
Fb
y separamos el vector
w
de la ec. 35 en el vector
wa
con las primeras
nm
componentes de
w
y el vector
wb
con las siguientes
m
componentes de
w
, como la matriz
F
así construida es
ortonormal, se puede reescribir la ec. 35 como:
Mr.z=Mr.Ma.y+Mr.Ba.wa=Mr.H.
[
Fa, F b
]
.
[
wa
wb
]
ec.(36)
Y operando se puede escribir:
Mr.z=Mr.Ma.y+Mr.Ba.wa=Mr.H.Fa.wa+Mr.H.Fb.wb
ec.(37)
La ec. 37 se puede descomponer en las ec. 38 y ec. 39
y=Mr.H.Fb.wb
ec.(38)
0=Mr.Ba.wa=Mr.H.Fa.wa
ec.(39)
De la ec. 39 se obtiene una matriz
Ba=H.Fa
que es compatible con representar el estado por
el modelo de la ec. 34.
Modelo CEGH – Fundamentos. pág. 27/27
... The CEGH model allows the generation of synthetic series that correspond to the outputs of a stochastic process. This often requires the historical realization of the variables involved in the stochastic process since the modeling is based on an available historical realization from which estimations are generated [15]. In electric power systems, the processes involved usually have values with a certain continuity, which allows the process outputs to be represented in the form of a future cone, as shown in Figure 1. ...
... Output of a stochastic process-future cone[15]. ...
ResearchGate has not been able to resolve any references for this publication.