ArticlePDF Available

Modelos de regresión para el pronóstico de series temporales con estacionalidad creciente

Authors:

Abstract

In this paper, three regression models are compared according to their performance in terms of forecast accuracy, for the case of time series with increasing seasonality. 617 series are used in the comparison as well as three models, being one of them an original contribution of this work. In addition, the regression models are compared with the autoregressive approach, commonly used in the forecast of these series. The results indicate that the performance of the regression models depends on the forecast horizon and on the degree of curvature of the series. At fewer curvature and longer forecast horizon, its performance is better. The conditions under which the regression models outperform the autoregressive approach are discussed. Also, the performance of the prediction intervals in order to improve its effectiveness is analyzed.
Modelos de regresi ´
on para el pron´
ostico de series temporales con
estacionalidad creciente
Sergio David Madrigal Espinoza
Divisi´
on de Estudios de Posgrado, FIME, UANL,
San Nicol´
as de los Garza, NL,
Mexico
sergio.madrigales@uanl.edu.mx
Resumen.
Se compara el desempe
˜
no de tres modelos
de regresi
´
on, en t
´
erminos de su efectividad predictiva,
para el caso de series temporales con estacionalidad
creciente. Se emplearon 617 series en el cotejo as
´
ı
como tres modelos de los cuales, uno es propuesta
original de este trabajo. Adicionalmente, se compararon
estos modelos contra uno de ra
´
ıces unitarias, t
´
ıpicamente
empleado para el pron
´
ostico de las series de inter
´
es.
Entre los resultados m
´
as importantes, se muestra que la
efectividad de los modelos de regresi
´
on depender
´
a del
horizonte de pron´
ostico as´
ı como del grado de su curva-
tura. A menor curvatura y mayor horizonte, mejor ser
´
a
su desempe
˜
no. Se mostrar
´
an las condiciones bajo las
cuales, los modelos de regresi
´
on pueden pronosticar tan
bien o incluso mejor que la alternativa t
´
ıpica. Por
´
ultimo,
se realiza un an
´
alisis de los intervalos de predicci
´
on y
sobre c´
omo mejorar su efectividad.
Palabras clave.
Modelos de regresi
´
on, series tempora-
les, estacionalidad, econometr´
ıa.
Regression Models for Time Series
with Increasing Seasonality
Abstract.
In this paper, three regression models are com-
pared according to their performance in terms of forecast
accuracy, for the case of time series with increasing
seasonality. 617 series are used in the comparison as
well as three models, being one of them an original contri-
bution of this work. In addition, the regression models are
compared with the autoregressive approach, commonly
used in the forecast of these series. The results indicate
that the performance of the regression models depends
on the forecast horizon and on the degree of curvature of
the series. At fewer curvature and longer forecast horizon,
its performance is better. The conditions under which
the regression models outperform the autoregressive
approach are discussed. Also, the performance of the
prediction intervals in order to improve its effectiveness is
analyzed.
Keywords.
Regression models, time series, seasonality,
econometrics.
1. Introducci ´
on
En el contexto de la Econometr
´
ıa, los modelos
de regresi
´
on pueden ser preferidos ante otras meto-
dolog
´
ıas, no s
´
olo por costumbre, sino por sencillez
y riqueza en interpretaci
´
on. Algunos an
´
alisis t
´
ıpica-
mente realizados con esta clase de modelos son:
el
ceteris paribus
, el de elasticidades y an
´
alisis con
varios regresores, por mencionar algunos.
Un
modelo de regresi´
on
, es aquel en el que
existe una variable dependiente, que es explicada
por una o m
´
as variables independientes. Es com
´
un
que hayan varias variables independientes que
expliquen un fen
´
omeno. Si el tiempo es una de
esas variables, se debe tomar en cuenta que la
serie puede exhibir estacionalidad.
Para prop
´
ositos de este trabajo, se supondr
´
a que
el tiempo es la
´
unica variable independiente y que
explica la serie en su totalidad, incluyendo cada uno
de sus patrones. En [
11
], se hace referencia a este
tipo de modelos de regresi
´
on como
((
puramente
deterministas
))
, mientras que en [
8
], se emplea
el t
´
ermino
((
altamente determinista
))
, haciendo re-
ferencia a que las desviaciones de los modelos
siguen alg
´
un proceso autorregresivo. Sin embargo,
en el contexto econom
´
etrico, a
´
un cuando las desvia-
ciones de la regresi
´
on est
´
an autocorrelacionadas,
se sigue considerando al modelo como uno de
regresi
´
on, aunque hay cosas que cambian, como
el m
´
etodo de estimaci
´
on, de m
´
ınimos cuadrados
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
ISSN 2007-9737
ordinarios, a m
´
ınimos cuadrados iterativamente
reponderados. En este trabajo, se emplear
´
a el
t
´
ermino
((
regresi
´
on
))
para hacer referencia a mo-
delos altamente deterministas lineales y no lineales
(con transformaci
´
on de potencia u otro tipo de
interacci
´
on param
´
etrica no lineal) que dependan
del tiempo y contemplando que la fuente de varia-
ci
´
on del modelo, muestre o no autocorrelaciones.
Por ejemplo, cuando se hable de un modelo de
((
regresi
´
on lineal
))
, se estar
´
a hablando de un modelo
de regresi
´
on lineal m
´
ultiple cuyas desviaciones
pueden o no estar autocorrelacionadas.
El objetivo del presente trabajo es caracterizar el
desempe
˜
no de pron
´
ostico de diversos modelos de
regresi
´
on, al pronosticar series con estacionalidad
creciente. En la Fig. 1 se muestra una serie con
el patr
´
on de inter
´
es. Son las ventas nacionales de
veh
´
ıculos subcompactos por mes, desde enero de
1995, hasta diciembre de 2006. Se aprecia que
las ventas tuvieron un crecimiento constante en su
tendencia hasta aproximadamente el a
˜
no de 2004.
Despu
´
es de esta fecha, las ventas empezaron a
bajar, creando una tendencia con forma parab
´
olica.
Se observa tambi
´
en que las amplitudes estaciona-
les crecen de forma proporcional a la tendencia.
Es para series de esta naturaleza, para las que se
desea conocer, ¿cu
´
al es el modelo de regresi
´
on
que mejor las pronostica?
Para el caso de estacionalidad creciente, el
m
´
etodo empleado no es puramente de regresi
´
on
lineal, ya que se debe emplear la transformaci
´
on lo-
gar
´
ıtmica o alguna otra transformaci
´
on de la familia
Box-Cox para lograr que la estacionalidad creciente,
observada en los datos, se convierta en constante.
Despu
´
es, se utiliza el modelo de regresi
´
on lineal
con tendencia polinomial y variables dicot
´
omicas.
Por
´
ultimo, la transformaci
´
on inversa es aplicada al
modelo y se utiliza para el pron´
ostico de la serie.
En este trabajo, se proponen dos alternativas
que, hasta donde se tiene conocimiento, no se han
empleado en el contexto econom
´
etrico y mucho
menos han sido contrastadas con el procedimiento
con transformaci
´
on. La ventaja de las propuestas,
consiste en que no necesitan ning
´
un tipo de trans-
formaci
´
on de potencia, facilitando la interpretaci
´
on
directa de los componentes de cada modelo.
La primera de estas alternativas consiste en
extender un modelo de regresi
´
on lineal, empleado
para el caso de tendencia lineal y estacionalidad
creciente, al caso de tendencia polinomial. El re-
sultado es un modelo de regresi
´
on lineal, que
no necesita ning
´
un tipo de transformaci
´
on para
modelar el patr
´
on de estacionalidad creciente. Sin
embargo, este modelo utiliza muchos par
´
ametros,
lo que puede conducir a un sobreajuste.
La segunda alternativa, consiste en un modelo
de regresi
´
on que utiliza a lo mucho, un poco m
´
as de
la mitad de los par
´
ametros empleados en la primera
alternativa, pero manteniendo a la vez, una buena
capacidad de modelado. La desventaja de este
procedimiento radica en su no linealidad, aunque
este problema se puede solucionar si se supone el
conocimiento de uno o dos par´
ametros.
Los modelos de regresi
´
on utilizados en este
trabajo, son recomendados para el pron
´
ostico de
series temporales con estacionalidad creciente y
desviaciones autocorrelacionadas. No deben ser
empleados si las desviaciones de la serie que se
debe pronosticar exhiben
heterocedasticidad
; su
varianza no es constante a trav
´
es del tiempo. De
esta forma, no se recomiendan los modelos de
regresi
´
on para series temporales como las de los
mercados de divisas, ya que son vol
´
atiles y por tan-
to, heteroced
´
asticas. Tampoco es recomendable el
empleo de los modelos de regresi
´
on, si la serie que
se debe pronosticar muestra cambios repentinos
en sus patrones; la metodolog
´
ıa de modelos de
suavizado exponencial, ser
´
ıa m
´
as indicada en esta
situaci
´
on, ya que sus modelos est
´
an especialmente
dise˜
nados para lidiar con este problema.
Aparte de comparar los modelos mencionados
entre s
´
ı, tambi
´
en, se emplear
´
a un modelo con
dos ra
´
ıces unitarias, una asociada a la tendencia
y otra a la estacionalidad, y con transformaci
´
on
de Box-Cox. A este modelo, se har
´
a referencia
como
seasonal auto - regressive integrated and
transformed
(SARIT)
process
. Aunque este modelo
no sea una regresi
´
on propiamente dicha, es consi-
derado un procedimiento t
´
ıpico para el pron
´
ostico
de las series de inter
´
es. As
´
ı, se podr
´
a conocer el
desempe
˜
no de los modelos de regresi
´
on, compara-
do con alternativas com
´
unmente empleadas en la
literatura.
La
competici´
on M
, es una colecci
´
on de 1001
series temporales de naturaleza demogr
´
afica, in-
dustrial y macroecon
´
omica, que ha sido utilizada
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
822 Sergio David Madrigal Espinoza
ISSN 2007-9737
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
0
2
4
6
·104
A˜
nos
Ventas
Fig. 1. Ventas nacionales de veh´
ıculos subcompactos por mes
para comparar la efectividad de diferentes metodo-
log
´
ıas de pron
´
ostico [
18
]. Las frecuencias de las
series temporales de la competici
´
on M son mensual,
trimestral y anual, siendo las de frecuencia mensual
las que m
´
as abundan, con 617. En este trabajo, se
utilizar
´
an las series mensuales de la competici
´
on
M, para comparar la efectividad de los modelos de
regresi´
on.
Los resultados obtenidos indican que los mode-
los de regresi
´
on, pueden ser una buena alternativa
de pron
´
ostico, comparados con alternativas t
´
ıpicas
de la literatura como el modelo
SARIT
. Esto siem-
pre y cuando se observe que el grado de curvatura
de los modelos sea el indicado. Por ejemplo, el
modelo de regresi
´
on con variables dicot
´
omicas y
transformaci
´
on de potencia as
´
ı como la segunda
alternativa propuesta, no deben emplearse si el
grado del polinomio que modela la tendencia es
mayor o igual que tres. La primera alternativa de
regresi
´
on, no debe emplearse si su grado es mayor
o igual que uno. Aunque esto parezca restrictivo,
lo cierto es que hasta un 85.7 % de las series
pueden ser modeladas con estas imposiciones.
El horizonte de pron
´
ostico tambi
´
en es relevante.
Mientras que la primera y segunda alternativas
pronostican mejor horizontes mayores a cuatro y
siete, respectivamente, el modelo de regresi
´
on con
transformaci
´
on de potencia pronostica mejor que
el modelo
SARIT
desde el segundo horizonte de
pron
´
ostico. En general, la segunda alternativa es la
que mejores resultados de pron
´
ostico dar
´
a, adem
´
as
de ser la que m´
as series puede pronosticar.
El trabajo se organiza de la siguiente manera:
Primero, se ver
´
an los antecedentes y el marco te
´
ori-
co. Despu
´
es, la metodolog
´
ıa, donde se mostrar
´
an
los tres modelos de regresi
´
on utilizados en la com-
paraci
´
on, as
´
ı como el modelo
SARIT
t
´
ıpicamente
empleado en estos casos. Luego, se indicar
´
an los
lineamientos observados durante el desarrollo del
experimento comparativo, cuyos resultados ser
´
an
mostrados (resumidamente) y discutidos. Al final,
se presentan conclusiones y referencias.
2. Antecedentes
Existen varias alternativas para el pron
´
ostico
de series temporales con estacionalidad creciente.
Algunos ejemplos son:
1. M´
etodos de descomposici´
on [5, 6, 19].
2.
Modelos ARIMA con transformaci
´
on logar
´
ıtmi-
ca o de Box-Cox [3, 4].
3.
Modelos ARIMA con filtros diferenciadores y
componentes deterministas [2, 7, 8].
4. Suavizado exponencial [1, 13, 14, 16, 21].
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
Modelos de regresión para el pronóstico de series temporales con estacionalidad creciente 823
ISSN 2007-9737
5.
Modelos peri
´
odicos autorregresivos [
9
,
10
,
20
,
23].
Cada una de estas metodolog
´
ıas puede exhibir
diversas virtudes y defectos. V
´
ease [
17
] para una
lista exhaustiva. No se pretende, de ninguna ma-
nera, desacreditar o favorecer ninguna de estas
metodolog
´
ıas. S
´
olo se observa que los modelos
de regresi
´
on, son preferidos por los economistas,
debido que pueden modelar todos los patrones
observados con par
´
ametros. As
´
ı, es posible asignar
significados a
´
estos que puedan ser de utilidad,
como crecimiento, incrementos debidos a la esta-
cionalidad etc. Adem
´
as, los modelos de regresi
´
on
permiten realizar diversos an
´
alisis de inter
´
es como:
el
ceteris paribus
, el de elasticidades y an
´
alisis con
varios regresores.
Aun cuando se puede argumentar que lo anterior
es posible con otras metodolog
´
ıas de pron
´
ostico,
ya sea por utilidad o por costumbre, los modelos
de regresi
´
on son los m
´
as empleados en textos
econom´
etricos como [24].
3. Marco te ´
orico
En el presente documento, se emplear
´
a la meto-
dolog
´
ıa de regresi
´
on para el pron
´
ostico de series
con estacionalidad creciente. A continuaci
´
on, se
presentan dos modelos conocidos de regresi
´
on, as
´
ı
como un tercero que es propuesta original de este
trabajo. Note que los siguientes modelos se deben
emplear si la serie de inter
´
es, adem
´
as de mostrar
estacionalidad creciente, tambi
´
en muestra tenden-
cia lineal. La extensi
´
on a tendencias polinomiales
es el tema de la siguiente secci´
on.
3.1. Alternativas de regresi´
on
Un modelo simple pero efectivo para el pron
´
ostico
de series temporales con tendencia lineal y estacio-
nalidad creciente es el siguiente:
BC(yt,λ) = β0t+
m
X
s=1
βsDs,t+µt, (1)
donde
yt
es la observaci
´
on realizada al tiempo
t
(
t
= 1,
. . .
,
n
);
β0
es una constante que representa
la pendiente o racha de crecimiento de los datos;
βs
representa un incremento o decremento en la
serie debido a la estaci
´
on
s
(
s
= 1,
. . .
,
m
);
Ds,t
son
variables binarias que toman un valor igual a uno
si la estaci
´
on
s
se ocurre al tiempo
t
o cero de
otro modo;
µt
es la fuente de variaci
´
on del modelo;
finalmente,
BC
(
yt
,
λ
) representa alguna transforma-
ci
´
on de Box-Cox de la serie con la potencia
((λ))
. La
ecuaci
´
on
(1)
describe un modelo de uso com
´
un en
la literatura, sobretodo en textos de econometr
´
ıa
como [
24
]. Note que este modelo es adecuado si
la serie exhibe tendencia lineal. M
´
as adelante, se
ver
´
a c
´
omo extender este y los siguientes modelos
para el caso de tendencia no lineal.
Un segundo modelo de regresi
´
on para el pron
´
osti-
co de series temporales con tendencia lineal y
estacionalidad creciente puede encontrarse en [
2
].
Su propuesta es la siguiente:
yt=
m
X
s=1
(αs+βst)Ds,t+µt.(2)
El modelo
(2)
ajusta una recta, con intercepto
αs
y pendiente
βs
, a cada uno de los
m
conjuntos de
datos que representan una estaci
´
on. La ecuaci
´
on
(2)
, constituye un modelo de regresi
´
on lineal que no
necesita ning
´
un tipo de transformaci
´
on de potencia
para modelar el patr
´
on de estacionalidad creciente.
En [
8
], se reporta que este modelo pronostica mejor
que otras alternativas similares de la literatura.
Su desventaja radica en la excesiva utilizaci
´
on de
par
´
ametros. S
´
olo para el caso de tendencia lineal,
este modelo utilizar
´
a 2
m
par
´
ametros, lo cual aumen-
ta la probabilidad de que el modelo sobreajuste la
serie y conduzca a malos pron ´
osticos.
En [
17
], se propone un modelo de regresi
´
on,
para el caso particular con tendencia lineal, que
ajusta una recta a cada estaci
´
on. Adicionalmente,
este modelo supone que todas estas rectas se
interceptan en un solo punto del plano. La ecuaci
´
on
de este modelo es como sigue:
yt=y0+
m
X
s=1
βs(γ0+t)Ds,t+µt, (3)
donde
y0
y
γ0
componen la coordenada (
γ0
,
y0
)
en la que se interceptan las rectas. Imponer esta
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
824 Sergio David Madrigal Espinoza
ISSN 2007-9737
restricci
´
on, reduce el n
´
umero de par
´
ametros a utili-
zar. Para el caso de tendencia lineal, este modelo
utilizar
´
a solamente
m
+ 2 par
´
ametros, casi la mitad
de los utilizados por el modelo de la ecuaci´
on (2).
En la siguiente secci
´
on, se ver
´
a la extensi
´
on de
cada uno de estos modelos para el caso de ten-
dencias polinomiales. Se ver
´
a tambi
´
en, el modelo
SARIT
contra el cual, se comparar
´
a el desempe
˜
no
de los modelos de regresi´
on.
4. Metodolog´ıa
4.1. Generalizaci ´
on para tendencias
polinomiales
Se desea comparar los modelos vistos en la
secci
´
on anterior, en t
´
erminos de su pron
´
ostico, y sin
limitarse al caso de tendencia lineal. Es necesario
extender los modelos de regresi
´
on, dot
´
andolos de
la capacidad de pronosticar series con tendencia
no lineal (polinomial). Adem
´
as, se desea comparar
los modelos de regresi
´
on contra alguna alternati-
va, t
´
ıpicamente empleada en la literatura para el
pron
´
ostico de las series de inter
´
es. Por esta raz
´
on,
se presenta el modelo
SARIT
con transformaci
´
on
de Box-Cox. Las versiones extendidas, as
´
ı como la
alternativa t´
ıpica, se presentan a continuaci´
on:
(a)
El modelo con transformaci
´
on de Box-Cox
(MTBC):
BC(yt,λ) = α1t+α2t2+· · ·+αdtd+
m
X
s=1
Ds,tβs+µt.
(4)
Es a este modelo, al que se design
´
o en la
introducci
´
on como el modelo cl
´
asico con va-
riables dicot
´
omicas y transformaci
´
on de Box-
Cox. Su extensi
´
on al caso no lineal, no implica
ninguna novedad. Simplemente, se modific
´
o
la tendencia lineal (
αt
) por una polinomial
(
α1t
+
α2t2
+
· · ·
+
αdtd
). El par
´
ametro
d
, denota
el grado del polin
´
omio que modela la tendencia
de la serie.
(b) El modelo de regresi´
on lineal (MRL):
yt=
m
X
s=1
(αs+βst+γst2+· · · +ωstd)Ds,t+µt. (5)
Este modelo, en lugar de ajustar una recta,
ajusta una curva a cada conjunto de datos
que representa una estaci
´
on. Es una extensi
´
on
que, si bien ha sido sugerida, jam
´
as ha sido
empleada en la literatura. Su desempe
˜
no de
pron
´
ostico, es una de las inc
´
ognitas que este
trabajo revelar
´
a. En la introducci
´
on de este
trabajo, se hizo referencia a este modelo como
la primera alternativa. Es importante notar que,
a pesar de que la tendencia es modelada con
un polinomio de grado
d
, el
MRL
es, como su
nombre lo indica, un modelo de regresi
´
on lineal
m
´
ultiple; no es lineal respecto al tiempo, sino a
los par
´
ametros
αs
,
βs
,
γs
,
. . .
,
ωs
, ya que
´
estos
interact
´
uan de manera lineal (suma ponderada
por los t´
erminos ti,i= 0, 1, . . . ,d).
(c) El modelo de regresi´
on no lineal (MRNL):
yt=y0+
m
X
s=1
βs(γ0+γ1t+γ2t2
+. . . +γd1td1+td)Ds,t+µt.
(6)
Esta es una alternativa completamente nueva.
Mediante el polin
´
omio
γ0
+
γ1t
+
γ2t2
+
. . .
+
γd1td1
+
td
, se modela la tendencia de la serie.
No es necesario multiplicar el
´
ultimo t
´
ermino
por un par
´
ametro porque, implicitamente,
βs
lo
contiene. A este modelo, se hizo referencia en
la introducci´
on, como la segunda alternativa.
(d)
Un modelo
SARIT
con transformaci
´
on de po-
tencia:
1mBC(yt,λ) = µt. (7)
El filtro
1
, sirve para remover la tendencia de la
serie mientras que
m
, remueve su estacionali-
dad. Para remover el efecto de estacionalidad
creciente, se emplea la transformaci
´
on de Box-
Cox. Se considera que este modelo puede dar
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
Modelos de regresión para el pronóstico de series temporales con estacionalidad creciente 825
ISSN 2007-9737
buena idea del desempe
˜
no de pron
´
ostico de
los modelos de regresi
´
on, contra alternativas
t´
ıpicamente empleadas en la literatura.
4.2. Lineamientos observados
Al comparar estos modelos, se observaron los
siguientes lineamientos:
I.
Se pronosticaron las 617 series mensuales de
la competici´
on M con cada modelo.
II.
Para evitar problemas de optimizaci
´
on, se cam-
bi
´
o la escala original de las series, dividiendo
cada serie entre su valor m
´
aximo y luego,
multiplicando por cien.
III.
Antes de ajustar cada modelo de regresi
´
on
a una serie determinada, primero, se ajusta-
ron polin
´
omios con grados del uno al diez.
Esto para tener una mejor idea del grado de
curvatura de la tendencia de cada serie. Se
seleccion
´
o el polin
´
omio que minimizaba el
Criterio de Informaci
´
on de Akaike (AIC, por
sus siglas en ingl
´
es). Cuando se ajusta un
modelo a un conjunto de datos, se espera
que las desviaciones sean m
´
ınimas (o que
alguna otra medida de bondad de ajuste, como
la funci
´
on de verosimilitud, sea optimizada).
Siempre es posible lograr este objetivo a
˜
nadien-
do par
´
ametros al modelo. Sin embargo, esto
producir
´
a un sobreajuste. Es decir, el modelo
se ajustar
´
a bien a los datos conocidos, pero
lo har
´
a mal con datos nuevos. El criterio AIC,
permite elegir el modelo que, utilizando menos
par
´
ametros, da un mejor ajuste. Se espera que
el modelo que tiene el menor valor de AIC para
un conjunto de datos, sea el que mejor los
pronostique..
IV.
Se supuso que la fuente de variaci
´
on
µt
, era
un proceso AR(
p
), siendo
p
= 0, 1, 2,
. . .
,
pm´
ax
,
donde
pm´
ax
pod
´
ıa tomar alguno de los valores
0, 1, 3, 6, 9
´
o 12. El caso
pm´
ax
= 0, denota
la situaci
´
on en la que la fuente de variaci
´
on,
segu
´
ıa un proceso normal, independiente e
identicamente distribuido.
V.
Una vez postulado un valor para
p
, una opti-
mizaci
´
on local adicional para el estimador del
par´
ametro dera realizada.
VI.
Para cada modelo y cada serie, los valores de
p
y
d
, se seleccionaron de tal forma que el criterio
AIC fuera el m
´
ınimo. Lo propio se hizo para el
estimador del par
´
ametro
λ
en los casos con
transformaci
´
on de potencia. Los par
´
ametros de
cada modelo se estimaron de tal forma que su
funci´
on de verosimilitud fuera m´
axima.
VII.
Para los modelos con transformaci
´
on Box-Cox,
el AIC se calculaba directamente de la serie
transformada. Esto es lo sugerido en [3].
VIII.
Para el
MRNL
, el logaritmo de la verosimilitud
fue calculado suponiendo que los par
´
ametros
γ0
,
γ1
,
. . .
,
γd1
eran conocidos. Es decir, se
linealiz
´
o el modelo. Sin embargo, estos par
´
ame-
tros si fueron incluidos al momento de calcular
la penalizaci´
on del criterio AIC.
IX.
Como periodo de ajuste, se tomaron todos los
datos de cada serie, salvo los
´
ultimos doce, que
fueron designados como periodo de prueba.
Para conocer el desempe
˜
no de los modelos,
se contrast
´
o el pron
´
ostico de cada uno con las
observaciones del periodo de prueba.
X.
Para comparar el desempe
˜
no de los modelos,
durante cada uno de los doce horizontes de
pron
´
ostico, se emple
´
o el estad
´
ıstico
absolute
forecast error
(AFE), definido de la siguiente
manera:
AF Eh=|yn12+hˆyn12+h|,h= 1, . . . , 12.
El estad
´
ıstico AFE, brinda informaci
´
on bastante
precisa sobre la desviaci´
on de pron´
ostico ocu-
rrida en el horizonte
h
, de forma independiente
a las desviaciones de los horizontes pasados.
Gracias a esta caracter
´
ıstica, AFE puede de-
terminar el horizonte de pron
´
ostico para el
cual, cada modelo tiene un mejor desempe
˜
no.
Adem
´
as, puesto que los datos ya est
´
an esca-
lados, es posible comparar el desempe
˜
no de
cada modelo con cada serie, directamente y
sin porcentajes.
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
826 Sergio David Madrigal Espinoza
ISSN 2007-9737
XI.
Adicionalmente, se emplear
´
a el estad
´
ıstico
root mean squared forecast error
(RMSFE),
definido de la siguiente manera:
RM SF E =v
u
u
t
1
12
12
X
i=1
(yn12+iˆyn12+i)2.
El estad
´
ıstico RMSFE, resume en un solo dato,
el desempe
˜
no del modelo durante los doce
horizontes de pron
´
ostico. Ser
´
a de utilidad para
determinar, globalmente, que modelo es el
mejor.
XII.
Todo lo anterior se realiz
´
o con GNU R [
15
], el
software
estad
´
ıstico de c
´
odigo abierto. En par-
ticular, la funci
´
on
arima()
del paquete
stats
[
22
], fue de mucha ayuda, pues incluye la
capacidad de estimar modelos de regresi
´
on
lineal con desviaciones autocorrelacionadas.
El paquete
Mcomp
[
12
], fue de la mayor utilidad,
pues contiene las series de la competici
´
on M
de una manera ordenada y f´
acil de entender.
5. Resultados
5.1. Pron ´
ostico
En la Tabla 1, se muestran las medias sobre las
617 series, de los estad
´
ısticos
AFEh
(
h
= 1,
. . .
, 12)
y RMSFE. Tambi
´
en, se muestra la media sobre
todas las series y valores de
h
, obtenidas con
cada modelo. Durante el experimento, se encon-
traron resultados aberrantes. Como regla, todos los
pron
´
osticos que condujeran a un AFE promedio,
sobre los doce horizontes de pron
´
ostico, mayor
que 70, fueron excluidos. Result
´
o que el
MTBC
,
era el modelo m
´
as inestable (con 37 exclusiones),
seguido del
MRNL
(7) y el modelo
SARIT
(3). La
naturaleza lineal y la falta de transformaciones de
potencia, hicieron que el
MRL
no tuviera obser-
vaciones aberrantes. Los resultados indican que,
entre los modelos de regresi
´
on, la efectividad del
pron
´
ostico depender
´
a del horizonte. Por ejemplo,
para
h
= 1, 2, 3 el modelo
MTBC
es la mejor alterna-
tiva entre los modelos de regresi
´
on. Para el resto de
los horizontes, la mejor alternativa de regresi
´
on es
el
MRNL
, con la excepci
´
on de
h
= 10, 12 donde el
MRL
lo hizo mejor. Sin embargo, es un hecho que
los modelos de regresi
´
on fueron superados por el
modelo
SARIT
, pr
´
acticamente en todos los valores
de h.
Tabla 1.
Estad
´
ısticos promedio, excluyendo resultados
aberrantes
hMTBC MRL MRNL SARIT
1 6.55 9.54 7.86 5.94
2 7.44 10.14 8.57 7.41
3 9.09 11.3 9.61 7.77
4 10.44 11.43 9.67 8.43
5 11.65 12.15 9.73 8.88
6 13.84 12.79 11.22 10.13
7 15.87 13.12 12.08 11.05
8 17.29 12.39 12.03 11.13
9 19.38 12.8 11.94 11.86
10 21.26 13.36 13.73 12.64
11 23.71 13.1 12.92 12.92
12 27.03 13.49 14.11 14.32
RMSFE 21.25 14.35 13.1 12.28
Media 15.29 12.13 11.12 10.21
Excluidos 37 0 7 3
Seg
´
un la Tabla 1, el modelo
SARIT
supera el
desempe
˜
no de los modelos de regresi
´
on. Sin em-
bargo, esta tendencia puede revertirse, excluyendo
m
´
as datos aberrantes de los resultados. Esto podr
´
ıa
ser de utilidad,
´
unicamente si fuera posible conocer,
de antemano, cuales son las circumstancias que
causaran resultados aberrantes con cada modelo.
¿C
´
omo saber, a priori, si uno de estos modelos
terminar
´
a en un mal pron
´
ostico? Despu
´
es de inves-
tigar, fue posible responder esta pregunta. Result
´
o
que la bondad en el desempe
˜
no est
´
a fuertemente
asociada a valores peque
˜
nos de
d
. En la Tabla 2,
se muestran las medias, para cada valor de
d
y con
cada modelo.
En la Tabla 2, se muestran los valores del estima-
dor del parametro
d
para los cuales, el pron
´
ostico
con cada modelo ser
´
a
inaceptable
. Se supondr
´
a
que un modelo con valores promedio del estad
´
ıstico
AFE por encima de 12 es indeseable (no confundir
con aberrante). Para el
MTBC
, esto pasar
´
a cuando
d
3. De hecho, las observaciones aberrantes
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
Modelos de regresión para el pronóstico de series temporales con estacionalidad creciente 827
ISSN 2007-9737
Tabla 2.
Medias, respecto a cada valor de
d
. Entre
parentesis, est
´
a el n
´
umero de series con ese valor de
d
para cada modelo. El asterisco indica los casos en
los que se observaron (y removieron) pron
´
osticos con
valores promedio del estad
´
ıstico AFE mayores que 500
(nueve en total). Esto s´
olo ocurri ´
o con el MTBC
dMTBC MRL MRNL
1 9.46 (184) 11.11 (420) 8.1 (262)
2 11.37 (107) 13.72 (134) 10.75 (267)
3 15.4 (91) 13.6 (36) 23.13 (59)
4 26.6* (69) 18.26 (27) 39.81 (18)
5 37.64* (104) - 33.04 (7)
6 59.05* (44) - 49.28 (4)
7 46.55 (9) - -
ocurren cuando
d
toma los valores cuatro, cinco y
seis. El
MRL
, se debe emplear
´
unicamente si
d
= 1.
Aunque esto parezca restrictivo, se debe observar
que hubieron 420 series (68 %) que cumplieron
con esta caracter
´
ıstica. Finalmente, el
MRNL
debe
emplearse s
´
olo si
d
= 1
´
o
d
= 2. A
´
un con esta
restricci
´
on, el
MRNL
es el que mejor desempe
˜
no
tuvo cuando tom
´
o los valores de
d
para los que es
recomendado. De hecho, tomando estos valores,
el
MRNL
podr
´
a pronosticar aceptablemente 529
series (85.7 %).
Considerando los valores de
d
para los cuales,
cada modelo de regresi
´
on muestra un pron
´
ostico
aceptable, se elaboraron tres tablas en las que se
compara cada modelo de regresi
´
on contra el mo-
delo
SARIT
. Puesto que ahora se conoce a priori,
cu
´
al serie puede ser pronosticada aceptablemente
con cada modelo, se espera que los resultados
sean diferentes a los obtenidos en la Tabla 1. Los
resultados de las comparaciones, aparecen en las
Tablas 3, 4 y 5. Se est
´
an presentando las medias
del estad
´
ıstico AFI para cada valor de
h
, indicando
los valores del estimador del par
´
ametro
d
y el
porcentaje de las series empleado en cada compa-
raci´
on. No hubo datos aberrantes que remover.
A grandes rasgos, los resultados indican que los
modelos de regresi
´
on mostrar
´
an un mejor desem-
pe
˜
no de pron
´
ostico a mediano y largo plazo que
la alternativa t
´
ıpica de la literatura. De hecho, el
MTBC
ser
´
a mejor para cada valor de
h
que el
modelo
SARIT
, salvo en el caso
h
= 1. El
MRL
,
Tabla 3. MTBC Vs. SARIT, d= 1 y d= 2, 47.2 %
hMTBC SARIT
1 7.24 6.49
2 7.65 8.06
3 8.72 8.81
4 9.07 9.33
5 9.12 9.95
6 10.05 11.64
7 11.35 12.4
8 11.35 12.23
9 11.18 12.74
10 11.8 13.15
11 11.31 13.86
12 13.1 14.64
RMSFE 12.1 12.99
Media 10.16 11.11
Tabla 4. MRL Vs. SARIT, d= 1, 68 %
hMRL SARIT
1 8.82 6.19
2 9.73 8.4
3 10.42 8.74
4 10.71 9.38
5 11.09 10.32
6 11.8 11.39
7 11.86 12.4
8 11.1 12.58
9 11.31 13.35
10 12.26 13.81
11 11.86 14.16
12 12.36 15.61
RMSFE 13.13 13.29
Media 11.11 11.36
ser
´
a mejor a partir de la segunda mitad del a
˜
no
(
h
7). Finalmente, el
MRNL
mostrar
´
a su mejor
desempe
˜
no en los
´
ultimos dos cuatrimestres del
a
˜
no (
h
5). Esto demuestra que los modelos
de regresi
´
on, no s
´
olo son valiosos por sus inter-
pretaciones econom
´
etricas, sino por que pueden
brindar un pron
´
ostico tan bueno o incluso mejor que
alternativas t
´
ıpicas de la literatura. Esto siempre y
cuando se emplee la informaci
´
on del estimador de
den forma adecuada.
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
828 Sergio David Madrigal Espinoza
ISSN 2007-9737
Tabla 5. MRNL Vs. SARIT, d= 1 y d= 2, 85.7 %
hMRNL SARIT
1 7 5.83
2 6.97 7.12
3 8.18 7.72
4 8.5 8.17
5 8.53 9.15
6 9.58 9.88
7 10.42 10.63
8 10.12 10.83
9 9.93 11.33
10 11.5 12.12
11 10.65 12.4
12 11.83 13.44
RMSFE 11.09 11.65
Media 9.44 9.89
5.2. Intervalos de predicci ´
on
Una de los aspectos m
´
as relevantes de un mo-
delo de pron
´
ostico son sus intervalos predictivos.
B
´
asicamente, se espera que
´
estos cumplan con
la cobertura te
´
orica indicada, pero que tambi
´
en,
sean tan estrechos como sea posible. Aunque estos
objetivos est
´
en en conflicto, se espera que haya un
modelo que cubra mejor que los dem
´
as, a la vez
que la amplitud de sus intervalos predictivos sea
razoneblamente reducida. Se puede decir, que los
modelos de regresi
´
on tienen intervalos de predic-
ci
´
on reducidos, mas no cumplen con la cobertura
te
´
orica. Empleando un nivel de confiaza de 95 %,
los modelo
MTBC
,
MRL
y
MRNL
, mostraron una
cobertura media de 33 %, 46 % y 65 % con amplitu-
des medias de 65.71, 17.51 y 22, respectivamente.
La diferencia entre la cobertura postulada y la
observada, se debe a que la deducci
´
on de los
intervalos de predicci
´
on supone que los par
´
ametros
de cada modelo son conocidos. Esta suposici
´
on,
produce una disminuci
´
on en la estimaci
´
on de la
varianza de los intervalos de predicci
´
on, que son
de la forma:
ˆyn+h±1.96σh,h= 1, 2, . . . , 12,
donde
σh
es la desviaci
´
on del error de pron
´
ostico
h
pasos adelante. Puesto que se supuso que los
par
´
ametros eran conocidos, este valor debe estar
siendo subestimado. Para corregir esta situaci
´
on,
se buscar
´
a un valor
k
, tal que
kσh
, sea un
estimador adecuado de la desviaci
´
on del pron
´
ostico.
Es decir,
k
es una constante de correcci
´
on que
compensa la suposici
´
on de informaci
´
on perfecta. El
valor de
k
que produce una cobertura observada
similar a la te
´
orica para el
MRNL
es
k
= 3.34
con amplitud media de 73.46. Para los modelos
MTBC
y
MRL
, no fue posible encontrar un valor
de
k
menor a cincuenta, por lo que se concluye
que este ejercicio no puede realizarse con estos
modelos.
Sin embargo, si se observa la cobertura mediana
en lugar de la media, los valores de
k
para los
modelos
MTBC
,
MRL
y
MRNL
son
k
= 23.2, 2.94 y
k
= 1.74 con las amplitudes medianas 58.37, 45.8
y 34.77, respectivamente.
¿Cobertura media o mediana? Se recomienda
observar la cobertura mediana en lugar de la media.
´
Esto, no s
´
olo por que es la
´
unica disponible para
dos de los tres modelos, sino por la naturaleza
del estad
´
ıstico cobertura, al que se puede ver
como una variable aleatoria que toma valores en
el intervalo [0, 1] y cuya esperanza est
´
a cerca
del l
´
ımite derecho del intervalo. La distribuci
´
on de
esta variable no es sim
´
etrica; sus realizaciones
aberrantes, ocurrir
´
an siempre hacia la izquierda
y no podr
´
an ser compensadas por valores mucho
mayores que 0.95. Es en estos casos, en los que el
estad
´
ıstico mediana es m
´
as robusto que la media y
por eso es recomendado.
6. Conclusiones
Se estudi
´
o el desempe
˜
no de tres modelos de
regresi
´
on y se compararon frente a una alternativa
t
´
ıpica de la literatura. Los resultados indican que
el desempe
˜
no de pron
´
ostico de los modelos de
regresi
´
on, depender
´
a del grado de curvatura de
su tendencia as
´
ı como del horizonte de pron
´
ostico.
Entre menor sea la curvatura y mayor el horizonte
de pron
´
ostico, el desempe
˜
no de los modelos de
regresi´
on ser´
a mejor.
En cuanto a intervalos predictivos se refiere, los
modelos de regresi
´
on no tendr
´
an un buen desem-
pe
˜
no, debido a que la deducci
´
on de
´
estos supone
que los par
´
ametros son conocidos.
´
Unicamente se
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
Modelos de regresión para el pronóstico de series temporales con estacionalidad creciente 829
ISSN 2007-9737
puede esperar un buen desempe
˜
no si se aplica
una correcci
´
on a la varianza que sea consecuente
con dicha suposici
´
on. Es importante se
˜
nalar que
la mejora que se menciona, aplica si el estad
´
ıstico
observado es la cobertura mediana y no la media.
De los tres modelos de regresi
´
on que se em-
plearon en el cotejo, uno de ellos, el
MRNL
, es
propuesta y contribuci´
on original de esta investiga-
ci
´
on. Los resultados indican que el desempe
˜
no de
pron
´
ostico de este modelo, es al menos tan bueno
como el del
MTBC
. Debido a las caracter
´
ısticas
del
MRNL
, se recomienda su empleo si se busca
una alternativa al
MTBC
. Esto debido, no s
´
olo al
desempe
˜
no de pron
´
ostico mostrado por el
MRNL
,
sino a que resulta sencillo ver a este modelo como
uno de regresi
´
on lineal, para lo cual basta suponer
el conocimiento de uno o dos par´
ametros.
Agradecimientos
El autor desea expresar su agradecimiento al Pro-
grama de Mejoramiento al Profesorado (PROMEP)
por financiar la presente investigaci
´
on. La clave del
proyecto es: 103.5/12/3585.
Referencias
1. Akram, M., Hyndman, R. J., & Ord, J. K.
(
2009
).
Exponential smoothing and non-negative data.
Aus-
tralian and New Zealand Journal of Statistics
,
Vol. 51, No. 4, pp. 415–432.
2. Bowerman, B. L., Koehler, A. B., & Pack, D. J.
(
1990
). Forecasting time series with increasing
seasonal time variation.
Journal of Forecasting
,
Vol. 9, pp. 419–436.
3. Box, G. E. P., Jenkins, G. M., & Reinsell, G. C.
(
2008
).
Time series analysis: Forecasting and Con-
trol. WILEY, 4 edition.
4. Chatfield, C. & Prothero, D. L.
(
1973
). Box jenkins
seasonal forecasting: Problems in a case study (with
discussion).
Journal of The Royal Statistical Socity
A, Vol. 136, pp. 295–336.
5. Cleveland, W. S.
(
1983
). Seasonal and calendar
adjustment. In
Handbook of Statistics
, volume 3.
Elsevier Science Publishers B.V., 39–72.
6. Dagum, E. B.
(
1982
). Revisions of time varying
seasonal filters.
Journal of Forecasting
, Vol. 1,
pp. 20–28.
7. Franses, P. H.
(
1996
). Recent advances in modeling
seasonality.
Journal of Economic Surveys
, Vol. 10,
pp. 299–345.
8. Franses, P. H. & Koehler, A. B.
(
1998
). A model
selection strategy for time series with increasing sea-
sonal variation.
International Journal of Forecasting
,
Vol. 14, No. 3, pp. 405–414.
9. Ghysels, E.
(
1991
). Are business cycle turning
points uniformly distributed throughout the year?
Cahiers de recherche 9135, Universite de Montreal,
Departement de sciences economiques.
10. Ghysels, E.
(
1994
). On the periodic structure of the
business cycle.
Journal of Business and Economic
Statistics, Vol. 12, pp. 289–293.
11. Hylleberg, S., Engle, R. F., Granger, C. W. J., &
Yoo, B. S.
(
1990
). Seasonal integration and cointe-
gration.
Journal of Econometrics
, Vol. 44, No. 1-2,
pp. 215–238.
12. Hyndman, R. J.
(
2012
).
Mcomp: Data from the M-
competitions. R package version 2.04.
13. Hyndman, R. J., Koehler, A. B., Ord, J. K., & Sny-
der, R. D.
(
2005
). Prediction intervals for exponential
smoothing state space models.
International Journal
of Forecasting, Vol. 24, pp. 17–37.
14. Hyndman, R. J., Koehler, A. B., Ord, J. K., &
Snyder, R. D.
(
2008
).
Forecasting with Exponential
Smoothing: The State Space Approach
. Springer, 1
edition.
15. Ihaka, R. & Gentleman, R.
(
1996
). R: A lan-
guage for data analysis and graphics.
Journal of
Computational and Graphical Statistics
, Vol. 5, No. 3,
pp. 299–314.
16. Koehler, A. B., Snyder, R. D., & Ord, J. K.
(
2001
).
Forecasting models and prediction intervals for the
multiplicative holt-winters method.
International Jour-
nal of Forecasting, Vol. 17, pp. 269–286.
17. Madrigal Espinoza, S. D.
(
2011
). Pron
´
ostico de
series temporales con estacionalidad. Tesis Doctoral,
Universidad Aut´
onoma de Nuevo Le´
on.
18. Makridakis, S., Andersen, A., Carbone, R., Fil-
des, R., Hibon, M., Lewandowski, R., Newton, J.,
Parzen, E., & Winkler, R.
(
1982
). The accuracy
of extrapolation (time series) methods: Results of
a forecasting competition.
Journal of Forecasting
,
Vol. 1, No. 2, pp. 111–153.
19. Makridakis, S., Wheelwright, S. C., & Hyndman,
R. J.
(
1998
).
Forecasting Methods and Applications
.
John Wiley, 3 edition.
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
830 Sergio David Madrigal Espinoza
ISSN 2007-9737
20. Novales, A. & de Fruto, R. D.
(
1997
). Forecasting
with periodic models: A comparison with the time
invariant coefficient models.
International Journal of
Forecasting, Vol. 13, pp. 393–405.
21. Ord, J. K., Koehler, A. B., & Snyder, R. D.
(
1997
).
Estimation and prediction for a class of dynamic
nonlinear statistical models.
Journal of American
Statistical Association, Vol. 92, pp. 1621–1629.
22. Team, R. C.
(
2012
).
R: A Language and Environ-
ment for Statistical Computing
. R Foundation for
Statistical Computing, Vienna, Austria.
23. Wells, J. M.
(
1997
). Modelling seasonal patterns
and long-run trends in U.S. time series.
International
Journal of Forecasting, Vol. 13, pp. 407–420.
24. Wooldridge, J. M.
(
2001
).
Introducci´
on a la Econo-
metr´
ıa. Thomson Learning.
Sergio David Madrigal Espinoza
es profesor de tiempo
completo en la Divisi
´
on de Estudios de Posgrado de
la Facultad de Ingenier
´
ıa Mec
´
anica y El
´
ectrica de la
Universidad Aut
´
onoma de Nuevo Le
´
on. Sus investiga-
ciones est
´
an relacionadas con el an
´
alisis de series
temporales, modelos de pron
´
ostico, juegos de azar y
c´
omputo estad´
ıstico.
Article received on 16/09/2013; accepted on 01/09/2014.
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
Modelos de regresión para el pronóstico de series temporales con estacionalidad creciente 831
ISSN 2007-9737
... This will bring challenges to the accurate of tide forecasts (Consoli et al. 2014). There are various kinds of forecasting techniques and they are generally competitive (Espinoza 2015;Graff et al. 2017). Therefore, the use of forecasting models such as ARIMA and Artificial Neural Network (ANN) to correct forecasting errors. ...
Article
Recently, the rise of sea level has caused an increase in rising tides that affected about three million locations around the world. The tide rising phenomenon has been occurring in Peninsular Malaysia since the 20th century. The purpose of this study is to determine the most critical station and forecast three stations located on the West Coast of Peninsular Malaysia. The Box Plot analysis method has been used in this study; the results shown that Bagan Datuk Station is the most critical station. This is due to the maximum tide’s value of Bagan Datuk Station experienced the highest increment of 0.45 m, compared to Port Klang station and Permatang Sedepa Station with only 0.2 m increment in 10 years. However, these three stations are also experiencing rising tides. Thus, the focus of managing coastal structures should be given to all these three stations as well. In addition, for forecasting, the Artificial Neural Network (ANN) forecasting model provides better forecasting results compared to the Autoregressive Integrated Moving Average (ARIMA) model for long-term forecast. In this study, the artificial Neural Network (ANN) forecasting model obtained value of RMSE 0.05642 at Bagan Datuk Station compared to the RMSE value of 0.0928 obtained from the ARIMA model at the same station. Besides, MAE value of ANN method, 0.04387 compared to the MAE value of ARIMA which is worth 0.06391 at Bagan Datuk Station. This study can conclude that the Artificial Neural Network (ANN) forecasting model is better in high tide forecasting.
... The structural model, to be used in this research, Equation (1), assumes that the observed value of the series, Zt, in time period t is the result of the interaction of four components: Tt trend component, Ct cyclic component, St seasonal component and It residual or random component. The model ARIMA explains the value of the series as a function of the combination of two polynomials: the autoregressive polynomial and the moving average [4,11]. Adjustment of the ARIMA model is performed based on the exploration of the functions of autocorrelation, FAC, and partial autocorrelation, FPAC, which are obtained once adjusted to a stationary form through differentiations to stabilize the mean and transformations to stabilize variance. ...
Article
Full-text available
Two different sciences, physics and statistics, have worked, from the foundations of each, on the explanation and modelling of stochastic processes characterized by the succession of random variables whose realizations at each instant of time give rise to time series. From Physics we have worked with the Fourier transform to explain the dynamics of time series, a similar case occurs from statistics where dynamic models of time series are worked to explain the variations of the series and, in both cases, to make reliable forecasts. The main objective of this research is to adjust a model, using the methodology framed in the sequential update procedure of the forecast, to a time series of coal production observed quarterly during the years 2007 to 2011, in order to disaggregate quarterly the annual production for the years 2012 to 2018. Once the process has been carried out and validated, a quarterly production model is estimated which allows valid and reliable forecasts to be made for each quarter in subsequent years.
... To assess the model performance in regression problems we used two of the most popular performance measures that estimate how much the prediction ( , ⋯ , ) deviate from the actual target values ( 1 , ⋯ , ) [32]. These metrics are the Root Mean Square Error (RMSE) [33,35,36], ...
Article
Full-text available
Customer satisfaction questionnaires are a rich and strong source of information for companies to seek loyalty, customer and client retention, optimize resources, and repurchase products. Several advanced machine learning and statistical models have been employed to estimate the customer satisfaction score; however, there is no single model that can yield the best result in all situations. Ensembles of regression techniques have demonstrated their effectiveness for various applications, where the success of these models lies in constructing a set of single models. We perform an experimental study using a real database of 129,890 samples from airline companies in order to verify the benefits of ensemble models for predicting customer satisfaction. Accordingly, the present paper evaluates the BAGGING ensemble model using the well-renowned k-nn algorithm as the base learner. The obtained results indicate that the BAGGING ensemble performs better than the single classifier in terms of RMSE and MAE.
... In forecasting problems, it has been noted by several researchers (see e.g., Weigend and Gershenfeld 1994;Makridakis and Hibon 2000;Espinoza 2014) that simple forecasting techniques are very competitive, in fact, it is common that an auto-regressive integrated moving average (ARIMA) model outperforms an artificial neural network. For example, in Makridakis and Hibon (2000) one of the best forecasters is Theta, which is a decomposition technique with projection and combination of individual components. ...
Article
Full-text available
Genetic programming (GP) is an evolutionary algorithm that has received a lot of attention lately due to its success in solving hard world problems. There has been a lot of interest in using GP to tackle forecasting problems. Unfortunately, it is not clear whether GP can outperform traditional forecasting techniques such as auto-regressive models. In this contribution, we present a comparison between standard GP systems qand auto-regressive integrated moving average model and exponential smoothing. This comparison points out particular configurations of GP that are competitive against these forecasting techniques. In addition to this, we propose a novel technique to select a forecaster from a collection of predictions made by different GP systems. The result shows that this selection scheme is competitive with traditional forecasting techniques, and, in a number of cases it is statistically better.
Article
A step-by-step account is given of a Box-Jenkins analysis of some sales figures showing high multiplicative seasonal variation. Various practical problems are encountered and discussed. A critical appraisal is made of the Box-Jenkins procedure and some general remarks are made on short-term sales forecasting.
Article
The results of seasonal and calendar adjustment procedures are directly consumed by millions of people via radio, television, magazines, newspapers, government reports, company business reports, and scientific journals. The term “seasonal” is used in most applications of seasonal adjustment and the fundamental frequency of the component is one cycle/year, but the methodology does not in principle depend on the frequency. The individual values of the subseries are portrayed by vertical lines emanating from the midmean line. The seasonal subseries plot allows an assessment of the overall pattern of the seasonal component and also of the behavior of each monthly subseries. Removal of the calendar variation from the series is referred to as “calendar adjustment.” And as with seasonal adjustment, calendar adjustment is carried out by first describing the calendar component and then subtracting it from the series. The overall pattern of the seasonal is one in which September is the highest month; this is caused by the large number of household moves that occur in September.
Article
Four options for modeling and forecasting time series data containing increasing seasonal variation are discussed, including data transformations, double seasonal difference models and two kinds of transfer function-type ARIMA models employing seasonal dummy variables. An explanation is given for the typical ARIMA model identification analysis failing to identify double seasonal difference models for this kind of data. A logical process of selecting one option for a particular case is outlined, focusing on issues of linear versus non-linear increasing seasonal variation, and the level of stochastic versus deterministic behavior in a time series. Example models for the various options are presented for six time series, with point forecast and interval forecast comparisons. Interval forecasts from data-transformation models are found to generally be too wide and sometimes illogical in the dependence of their width on the point forecast level. Suspicion that maximum likelihood estimation of ARIMA models leads to excessive indications of unit roots in seasonal moving-average operators is reported.
Article
In the last few decades many methods have become available for forecasting. As always, when alternatives exist, choices need to be made so that an appropriate forecasting method can be selected and used for the specific situation being considered. This paper reports the results of a forecasting competition that provides information to facilitate such choice. Seven experts in each of the 24 methods forecasted up to 1001 series for six up to eighteen time horizons. The results of the competition are presented in this paper whose purpose is to provide empirical evidence about differences found to exist among the various extrapolative (time series) methods used in the competition.
Article
The main purpose of this study is to analyse the magnitude and the nature of the revisions that the time varying seasonal filters of the X-II and X-II-ARIMA methods introduce in the current seasonally adjusted series The total revision is measured by the mean absolute difference of the transfer functions corresponding to the forecasting and the concurrent seasonal filters with respect to the central‘final’seasonal filter. To take into consideration the fact that the spectrum of a typical economic time series peaks at the low and seasonal frequencies, the revision measures are calculated for selected frequency intervals associated to the trend-cycle, seasonal variations and the irregular component.
Article
Working with seventeen quarterly UK macroeconomic variables, characterized as periodically integrated in Franses and Romijn (1993), we have found that unconstrained periodic models do not beat time invariant alternatives in forecasting, even when cointegrating relationships among the seasons are taken into account. However, when appropriately constrained, the forecasting performance of periodic models can be much better than that of non-periodic models. Homogeneity restrictions among some seasons seem to be very important in that respect, which motivates us to propose switching for specific quarters between a periodic model and a non-periodic univariate AR to better capture the behaviour of these variables. Once season homogeneity is taken into account, incorporating the cointegrating relationships among the seasons through periodic error correction models achieves a substantial additional forecasting improvement.
Article
This paper discusses univariate methods used to deal with seasonal data with special emphasis on seasonal unit root and periodic models. These models are examined in the context of 15 U.S. macroeconomic variables. Many of these variables can be described as being periodically integrated, that is, having stochastic trends and seasonal elements that cannot be separated. Periodically varying parameter models are fitted to these variables and evaluated against other seasonal models using forecasting tests.
Article
This paper develops tests for roots in linear time series which have a modulus of one but which correspond to seasonal frequencies. Critical values for the tests are generated by Monte Carlo methods or are shown to be available from Dickey-Fuller or Dickey-Hasza-Fuller critical values. Representations for multivariate processes with combinations of seasonal and zero-frequency unit roots are developed leading to a variety of autoregressive and error-correction representations. The techniques are used to examine cointegration at different frequencies between consumption and income in the U.K.