Available via license: CC BY-NC 3.0
Content may be subject to copyright.
Modelos de regresi ´
on para el pron´
ostico de series temporales con
estacionalidad creciente
Sergio David Madrigal Espinoza
Divisi´
on de Estudios de Posgrado, FIME, UANL,
San Nicol´
as de los Garza, NL,
Mexico
sergio.madrigales@uanl.edu.mx
Resumen.
Se compara el desempe
˜
no de tres modelos
de regresi
´
on, en t
´
erminos de su efectividad predictiva,
para el caso de series temporales con estacionalidad
creciente. Se emplearon 617 series en el cotejo as
´
ı
como tres modelos de los cuales, uno es propuesta
original de este trabajo. Adicionalmente, se compararon
estos modelos contra uno de ra
´
ıces unitarias, t
´
ıpicamente
empleado para el pron
´
ostico de las series de inter
´
es.
Entre los resultados m
´
as importantes, se muestra que la
efectividad de los modelos de regresi
´
on depender
´
a del
horizonte de pron´
ostico as´
ı como del grado de su curva-
tura. A menor curvatura y mayor horizonte, mejor ser
´
a
su desempe
˜
no. Se mostrar
´
an las condiciones bajo las
cuales, los modelos de regresi
´
on pueden pronosticar tan
bien o incluso mejor que la alternativa t
´
ıpica. Por
´
ultimo,
se realiza un an
´
alisis de los intervalos de predicci
´
on y
sobre c´
omo mejorar su efectividad.
Palabras clave.
Modelos de regresi
´
on, series tempora-
les, estacionalidad, econometr´
ıa.
Regression Models for Time Series
with Increasing Seasonality
Abstract.
In this paper, three regression models are com-
pared according to their performance in terms of forecast
accuracy, for the case of time series with increasing
seasonality. 617 series are used in the comparison as
well as three models, being one of them an original contri-
bution of this work. In addition, the regression models are
compared with the autoregressive approach, commonly
used in the forecast of these series. The results indicate
that the performance of the regression models depends
on the forecast horizon and on the degree of curvature of
the series. At fewer curvature and longer forecast horizon,
its performance is better. The conditions under which
the regression models outperform the autoregressive
approach are discussed. Also, the performance of the
prediction intervals in order to improve its effectiveness is
analyzed.
Keywords.
Regression models, time series, seasonality,
econometrics.
1. Introducci ´
on
En el contexto de la Econometr
´
ıa, los modelos
de regresi
´
on pueden ser preferidos ante otras meto-
dolog
´
ıas, no s
´
olo por costumbre, sino por sencillez
y riqueza en interpretaci
´
on. Algunos an
´
alisis t
´
ıpica-
mente realizados con esta clase de modelos son:
el
ceteris paribus
, el de elasticidades y an
´
alisis con
varios regresores, por mencionar algunos.
Un
modelo de regresi´
on
, es aquel en el que
existe una variable dependiente, que es explicada
por una o m
´
as variables independientes. Es com
´
un
que hayan varias variables independientes que
expliquen un fen
´
omeno. Si el tiempo es una de
esas variables, se debe tomar en cuenta que la
serie puede exhibir estacionalidad.
Para prop
´
ositos de este trabajo, se supondr
´
a que
el tiempo es la
´
unica variable independiente y que
explica la serie en su totalidad, incluyendo cada uno
de sus patrones. En [
11
], se hace referencia a este
tipo de modelos de regresi
´
on como
((
puramente
deterministas
))
, mientras que en [
8
], se emplea
el t
´
ermino
((
altamente determinista
))
, haciendo re-
ferencia a que las desviaciones de los modelos
siguen alg
´
un proceso autorregresivo. Sin embargo,
en el contexto econom
´
etrico, a
´
un cuando las desvia-
ciones de la regresi
´
on est
´
an autocorrelacionadas,
se sigue considerando al modelo como uno de
regresi
´
on, aunque hay cosas que cambian, como
el m
´
etodo de estimaci
´
on, de m
´
ınimos cuadrados
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
ISSN 2007-9737
ordinarios, a m
´
ınimos cuadrados iterativamente
reponderados. En este trabajo, se emplear
´
a el
t
´
ermino
((
regresi
´
on
))
para hacer referencia a mo-
delos altamente deterministas lineales y no lineales
(con transformaci
´
on de potencia u otro tipo de
interacci
´
on param
´
etrica no lineal) que dependan
del tiempo y contemplando que la fuente de varia-
ci
´
on del modelo, muestre o no autocorrelaciones.
Por ejemplo, cuando se hable de un modelo de
((
regresi
´
on lineal
))
, se estar
´
a hablando de un modelo
de regresi
´
on lineal m
´
ultiple cuyas desviaciones
pueden o no estar autocorrelacionadas.
El objetivo del presente trabajo es caracterizar el
desempe
˜
no de pron
´
ostico de diversos modelos de
regresi
´
on, al pronosticar series con estacionalidad
creciente. En la Fig. 1 se muestra una serie con
el patr
´
on de inter
´
es. Son las ventas nacionales de
veh
´
ıculos subcompactos por mes, desde enero de
1995, hasta diciembre de 2006. Se aprecia que
las ventas tuvieron un crecimiento constante en su
tendencia hasta aproximadamente el a
˜
no de 2004.
Despu
´
es de esta fecha, las ventas empezaron a
bajar, creando una tendencia con forma parab
´
olica.
Se observa tambi
´
en que las amplitudes estaciona-
les crecen de forma proporcional a la tendencia.
Es para series de esta naturaleza, para las que se
desea conocer, ¿cu
´
al es el modelo de regresi
´
on
que mejor las pronostica?
Para el caso de estacionalidad creciente, el
m
´
etodo empleado no es puramente de regresi
´
on
lineal, ya que se debe emplear la transformaci
´
on lo-
gar
´
ıtmica o alguna otra transformaci
´
on de la familia
Box-Cox para lograr que la estacionalidad creciente,
observada en los datos, se convierta en constante.
Despu
´
es, se utiliza el modelo de regresi
´
on lineal
con tendencia polinomial y variables dicot
´
omicas.
Por
´
ultimo, la transformaci
´
on inversa es aplicada al
modelo y se utiliza para el pron´
ostico de la serie.
En este trabajo, se proponen dos alternativas
que, hasta donde se tiene conocimiento, no se han
empleado en el contexto econom
´
etrico y mucho
menos han sido contrastadas con el procedimiento
con transformaci
´
on. La ventaja de las propuestas,
consiste en que no necesitan ning
´
un tipo de trans-
formaci
´
on de potencia, facilitando la interpretaci
´
on
directa de los componentes de cada modelo.
La primera de estas alternativas consiste en
extender un modelo de regresi
´
on lineal, empleado
para el caso de tendencia lineal y estacionalidad
creciente, al caso de tendencia polinomial. El re-
sultado es un modelo de regresi
´
on lineal, que
no necesita ning
´
un tipo de transformaci
´
on para
modelar el patr
´
on de estacionalidad creciente. Sin
embargo, este modelo utiliza muchos par
´
ametros,
lo que puede conducir a un sobreajuste.
La segunda alternativa, consiste en un modelo
de regresi
´
on que utiliza a lo mucho, un poco m
´
as de
la mitad de los par
´
ametros empleados en la primera
alternativa, pero manteniendo a la vez, una buena
capacidad de modelado. La desventaja de este
procedimiento radica en su no linealidad, aunque
este problema se puede solucionar si se supone el
conocimiento de uno o dos par´
ametros.
Los modelos de regresi
´
on utilizados en este
trabajo, son recomendados para el pron
´
ostico de
series temporales con estacionalidad creciente y
desviaciones autocorrelacionadas. No deben ser
empleados si las desviaciones de la serie que se
debe pronosticar exhiben
heterocedasticidad
; su
varianza no es constante a trav
´
es del tiempo. De
esta forma, no se recomiendan los modelos de
regresi
´
on para series temporales como las de los
mercados de divisas, ya que son vol
´
atiles y por tan-
to, heteroced
´
asticas. Tampoco es recomendable el
empleo de los modelos de regresi
´
on, si la serie que
se debe pronosticar muestra cambios repentinos
en sus patrones; la metodolog
´
ıa de modelos de
suavizado exponencial, ser
´
ıa m
´
as indicada en esta
situaci
´
on, ya que sus modelos est
´
an especialmente
dise˜
nados para lidiar con este problema.
Aparte de comparar los modelos mencionados
entre s
´
ı, tambi
´
en, se emplear
´
a un modelo con
dos ra
´
ıces unitarias, una asociada a la tendencia
y otra a la estacionalidad, y con transformaci
´
on
de Box-Cox. A este modelo, se har
´
a referencia
como
seasonal auto - regressive integrated and
transformed
(SARIT)
process
. Aunque este modelo
no sea una regresi
´
on propiamente dicha, es consi-
derado un procedimiento t
´
ıpico para el pron
´
ostico
de las series de inter
´
es. As
´
ı, se podr
´
a conocer el
desempe
˜
no de los modelos de regresi
´
on, compara-
do con alternativas com
´
unmente empleadas en la
literatura.
La
competici´
on M
, es una colecci
´
on de 1001
series temporales de naturaleza demogr
´
afica, in-
dustrial y macroecon
´
omica, que ha sido utilizada
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
822 Sergio David Madrigal Espinoza
ISSN 2007-9737
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
0
2
4
6
·104
A˜
nos
Ventas
Fig. 1. Ventas nacionales de veh´
ıculos subcompactos por mes
para comparar la efectividad de diferentes metodo-
log
´
ıas de pron
´
ostico [
18
]. Las frecuencias de las
series temporales de la competici
´
on M son mensual,
trimestral y anual, siendo las de frecuencia mensual
las que m
´
as abundan, con 617. En este trabajo, se
utilizar
´
an las series mensuales de la competici
´
on
M, para comparar la efectividad de los modelos de
regresi´
on.
Los resultados obtenidos indican que los mode-
los de regresi
´
on, pueden ser una buena alternativa
de pron
´
ostico, comparados con alternativas t
´
ıpicas
de la literatura como el modelo
SARIT
. Esto siem-
pre y cuando se observe que el grado de curvatura
de los modelos sea el indicado. Por ejemplo, el
modelo de regresi
´
on con variables dicot
´
omicas y
transformaci
´
on de potencia as
´
ı como la segunda
alternativa propuesta, no deben emplearse si el
grado del polinomio que modela la tendencia es
mayor o igual que tres. La primera alternativa de
regresi
´
on, no debe emplearse si su grado es mayor
o igual que uno. Aunque esto parezca restrictivo,
lo cierto es que hasta un 85.7 % de las series
pueden ser modeladas con estas imposiciones.
El horizonte de pron
´
ostico tambi
´
en es relevante.
Mientras que la primera y segunda alternativas
pronostican mejor horizontes mayores a cuatro y
siete, respectivamente, el modelo de regresi
´
on con
transformaci
´
on de potencia pronostica mejor que
el modelo
SARIT
desde el segundo horizonte de
pron
´
ostico. En general, la segunda alternativa es la
que mejores resultados de pron
´
ostico dar
´
a, adem
´
as
de ser la que m´
as series puede pronosticar.
El trabajo se organiza de la siguiente manera:
Primero, se ver
´
an los antecedentes y el marco te
´
ori-
co. Despu
´
es, la metodolog
´
ıa, donde se mostrar
´
an
los tres modelos de regresi
´
on utilizados en la com-
paraci
´
on, as
´
ı como el modelo
SARIT
t
´
ıpicamente
empleado en estos casos. Luego, se indicar
´
an los
lineamientos observados durante el desarrollo del
experimento comparativo, cuyos resultados ser
´
an
mostrados (resumidamente) y discutidos. Al final,
se presentan conclusiones y referencias.
2. Antecedentes
Existen varias alternativas para el pron
´
ostico
de series temporales con estacionalidad creciente.
Algunos ejemplos son:
1. M´
etodos de descomposici´
on [5, 6, 19].
2.
Modelos ARIMA con transformaci
´
on logar
´
ıtmi-
ca o de Box-Cox [3, 4].
3.
Modelos ARIMA con filtros diferenciadores y
componentes deterministas [2, 7, 8].
4. Suavizado exponencial [1, 13, 14, 16, 21].
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
Modelos de regresión para el pronóstico de series temporales con estacionalidad creciente 823
ISSN 2007-9737
5.
Modelos peri
´
odicos autorregresivos [
9
,
10
,
20
,
23].
Cada una de estas metodolog
´
ıas puede exhibir
diversas virtudes y defectos. V
´
ease [
17
] para una
lista exhaustiva. No se pretende, de ninguna ma-
nera, desacreditar o favorecer ninguna de estas
metodolog
´
ıas. S
´
olo se observa que los modelos
de regresi
´
on, son preferidos por los economistas,
debido que pueden modelar todos los patrones
observados con par
´
ametros. As
´
ı, es posible asignar
significados a
´
estos que puedan ser de utilidad,
como crecimiento, incrementos debidos a la esta-
cionalidad etc. Adem
´
as, los modelos de regresi
´
on
permiten realizar diversos an
´
alisis de inter
´
es como:
el
ceteris paribus
, el de elasticidades y an
´
alisis con
varios regresores.
Aun cuando se puede argumentar que lo anterior
es posible con otras metodolog
´
ıas de pron
´
ostico,
ya sea por utilidad o por costumbre, los modelos
de regresi
´
on son los m
´
as empleados en textos
econom´
etricos como [24].
3. Marco te ´
orico
En el presente documento, se emplear
´
a la meto-
dolog
´
ıa de regresi
´
on para el pron
´
ostico de series
con estacionalidad creciente. A continuaci
´
on, se
presentan dos modelos conocidos de regresi
´
on, as
´
ı
como un tercero que es propuesta original de este
trabajo. Note que los siguientes modelos se deben
emplear si la serie de inter
´
es, adem
´
as de mostrar
estacionalidad creciente, tambi
´
en muestra tenden-
cia lineal. La extensi
´
on a tendencias polinomiales
es el tema de la siguiente secci´
on.
3.1. Alternativas de regresi´
on
Un modelo simple pero efectivo para el pron
´
ostico
de series temporales con tendencia lineal y estacio-
nalidad creciente es el siguiente:
BC(yt,λ) = β0t+
m
X
s=1
βsDs,t+µt, (1)
donde
yt
es la observaci
´
on realizada al tiempo
t
(
t
= 1,
. . .
,
n
);
β0
es una constante que representa
la pendiente o racha de crecimiento de los datos;
βs
representa un incremento o decremento en la
serie debido a la estaci
´
on
s
(
s
= 1,
. . .
,
m
);
Ds,t
son
variables binarias que toman un valor igual a uno
si la estaci
´
on
s
se ocurre al tiempo
t
o cero de
otro modo;
µt
es la fuente de variaci
´
on del modelo;
finalmente,
BC
(
yt
,
λ
) representa alguna transforma-
ci
´
on de Box-Cox de la serie con la potencia
((λ))
. La
ecuaci
´
on
(1)
describe un modelo de uso com
´
un en
la literatura, sobretodo en textos de econometr
´
ıa
como [
24
]. Note que este modelo es adecuado si
la serie exhibe tendencia lineal. M
´
as adelante, se
ver
´
a c
´
omo extender este y los siguientes modelos
para el caso de tendencia no lineal.
Un segundo modelo de regresi
´
on para el pron
´
osti-
co de series temporales con tendencia lineal y
estacionalidad creciente puede encontrarse en [
2
].
Su propuesta es la siguiente:
yt=
m
X
s=1
(αs+βst)Ds,t+µt.(2)
El modelo
(2)
ajusta una recta, con intercepto
αs
y pendiente
βs
, a cada uno de los
m
conjuntos de
datos que representan una estaci
´
on. La ecuaci
´
on
(2)
, constituye un modelo de regresi
´
on lineal que no
necesita ning
´
un tipo de transformaci
´
on de potencia
para modelar el patr
´
on de estacionalidad creciente.
En [
8
], se reporta que este modelo pronostica mejor
que otras alternativas similares de la literatura.
Su desventaja radica en la excesiva utilizaci
´
on de
par
´
ametros. S
´
olo para el caso de tendencia lineal,
este modelo utilizar
´
a 2
m
par
´
ametros, lo cual aumen-
ta la probabilidad de que el modelo sobreajuste la
serie y conduzca a malos pron ´
osticos.
En [
17
], se propone un modelo de regresi
´
on,
para el caso particular con tendencia lineal, que
ajusta una recta a cada estaci
´
on. Adicionalmente,
este modelo supone que todas estas rectas se
interceptan en un solo punto del plano. La ecuaci
´
on
de este modelo es como sigue:
yt=y0+
m
X
s=1
βs(γ0+t)Ds,t+µt, (3)
donde
y0
y
γ0
componen la coordenada (
−γ0
,
y0
)
en la que se interceptan las rectas. Imponer esta
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
824 Sergio David Madrigal Espinoza
ISSN 2007-9737
restricci
´
on, reduce el n
´
umero de par
´
ametros a utili-
zar. Para el caso de tendencia lineal, este modelo
utilizar
´
a solamente
m
+ 2 par
´
ametros, casi la mitad
de los utilizados por el modelo de la ecuaci´
on (2).
En la siguiente secci
´
on, se ver
´
a la extensi
´
on de
cada uno de estos modelos para el caso de ten-
dencias polinomiales. Se ver
´
a tambi
´
en, el modelo
SARIT
contra el cual, se comparar
´
a el desempe
˜
no
de los modelos de regresi´
on.
4. Metodolog´ıa
4.1. Generalizaci ´
on para tendencias
polinomiales
Se desea comparar los modelos vistos en la
secci
´
on anterior, en t
´
erminos de su pron
´
ostico, y sin
limitarse al caso de tendencia lineal. Es necesario
extender los modelos de regresi
´
on, dot
´
andolos de
la capacidad de pronosticar series con tendencia
no lineal (polinomial). Adem
´
as, se desea comparar
los modelos de regresi
´
on contra alguna alternati-
va, t
´
ıpicamente empleada en la literatura para el
pron
´
ostico de las series de inter
´
es. Por esta raz
´
on,
se presenta el modelo
SARIT
con transformaci
´
on
de Box-Cox. Las versiones extendidas, as
´
ı como la
alternativa t´
ıpica, se presentan a continuaci´
on:
(a)
El modelo con transformaci
´
on de Box-Cox
(MTBC):
BC(yt,λ) = α1t+α2t2+· · ·+αdtd+
m
X
s=1
Ds,tβs+µt.
(4)
Es a este modelo, al que se design
´
o en la
introducci
´
on como el modelo cl
´
asico con va-
riables dicot
´
omicas y transformaci
´
on de Box-
Cox. Su extensi
´
on al caso no lineal, no implica
ninguna novedad. Simplemente, se modific
´
o
la tendencia lineal (
αt
) por una polinomial
(
α1t
+
α2t2
+
· · ·
+
αdtd
). El par
´
ametro
d
, denota
el grado del polin
´
omio que modela la tendencia
de la serie.
(b) El modelo de regresi´
on lineal (MRL):
yt=
m
X
s=1
(αs+βst+γst2+· · · +ωstd)Ds,t+µt. (5)
Este modelo, en lugar de ajustar una recta,
ajusta una curva a cada conjunto de datos
que representa una estaci
´
on. Es una extensi
´
on
que, si bien ha sido sugerida, jam
´
as ha sido
empleada en la literatura. Su desempe
˜
no de
pron
´
ostico, es una de las inc
´
ognitas que este
trabajo revelar
´
a. En la introducci
´
on de este
trabajo, se hizo referencia a este modelo como
la primera alternativa. Es importante notar que,
a pesar de que la tendencia es modelada con
un polinomio de grado
d
, el
MRL
es, como su
nombre lo indica, un modelo de regresi
´
on lineal
m
´
ultiple; no es lineal respecto al tiempo, sino a
los par
´
ametros
αs
,
βs
,
γs
,
. . .
,
ωs
, ya que
´
estos
interact
´
uan de manera lineal (suma ponderada
por los t´
erminos ti,i= 0, 1, . . . ,d).
(c) El modelo de regresi´
on no lineal (MRNL):
yt=y0+
m
X
s=1
βs(γ0+γ1t+γ2t2
+. . . +γd−1td−1+td)Ds,t+µt.
(6)
Esta es una alternativa completamente nueva.
Mediante el polin
´
omio
γ0
+
γ1t
+
γ2t2
+
. . .
+
γd−1td−1
+
td
, se modela la tendencia de la serie.
No es necesario multiplicar el
´
ultimo t
´
ermino
por un par
´
ametro porque, implicitamente,
βs
lo
contiene. A este modelo, se hizo referencia en
la introducci´
on, como la segunda alternativa.
(d)
Un modelo
SARIT
con transformaci
´
on de po-
tencia:
∆1∆mBC(yt,λ) = µt. (7)
El filtro
∆1
, sirve para remover la tendencia de la
serie mientras que
∆m
, remueve su estacionali-
dad. Para remover el efecto de estacionalidad
creciente, se emplea la transformaci
´
on de Box-
Cox. Se considera que este modelo puede dar
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
Modelos de regresión para el pronóstico de series temporales con estacionalidad creciente 825
ISSN 2007-9737
buena idea del desempe
˜
no de pron
´
ostico de
los modelos de regresi
´
on, contra alternativas
t´
ıpicamente empleadas en la literatura.
4.2. Lineamientos observados
Al comparar estos modelos, se observaron los
siguientes lineamientos:
I.
Se pronosticaron las 617 series mensuales de
la competici´
on M con cada modelo.
II.
Para evitar problemas de optimizaci
´
on, se cam-
bi
´
o la escala original de las series, dividiendo
cada serie entre su valor m
´
aximo y luego,
multiplicando por cien.
III.
Antes de ajustar cada modelo de regresi
´
on
a una serie determinada, primero, se ajusta-
ron polin
´
omios con grados del uno al diez.
Esto para tener una mejor idea del grado de
curvatura de la tendencia de cada serie. Se
seleccion
´
o el polin
´
omio que minimizaba el
Criterio de Informaci
´
on de Akaike (AIC, por
sus siglas en ingl
´
es). Cuando se ajusta un
modelo a un conjunto de datos, se espera
que las desviaciones sean m
´
ınimas (o que
alguna otra medida de bondad de ajuste, como
la funci
´
on de verosimilitud, sea optimizada).
Siempre es posible lograr este objetivo a
˜
nadien-
do par
´
ametros al modelo. Sin embargo, esto
producir
´
a un sobreajuste. Es decir, el modelo
se ajustar
´
a bien a los datos conocidos, pero
lo har
´
a mal con datos nuevos. El criterio AIC,
permite elegir el modelo que, utilizando menos
par
´
ametros, da un mejor ajuste. Se espera que
el modelo que tiene el menor valor de AIC para
un conjunto de datos, sea el que mejor los
pronostique..
IV.
Se supuso que la fuente de variaci
´
on
µt
, era
un proceso AR(
p
), siendo
p
= 0, 1, 2,
. . .
,
pm´
ax
,
donde
pm´
ax
pod
´
ıa tomar alguno de los valores
0, 1, 3, 6, 9
´
o 12. El caso
pm´
ax
= 0, denota
la situaci
´
on en la que la fuente de variaci
´
on,
segu
´
ıa un proceso normal, independiente e
identicamente distribuido.
V.
Una vez postulado un valor para
p
, una opti-
mizaci
´
on local adicional para el estimador del
par´
ametro dera realizada.
VI.
Para cada modelo y cada serie, los valores de
p
y
d
, se seleccionaron de tal forma que el criterio
AIC fuera el m
´
ınimo. Lo propio se hizo para el
estimador del par
´
ametro
λ
en los casos con
transformaci
´
on de potencia. Los par
´
ametros de
cada modelo se estimaron de tal forma que su
funci´
on de verosimilitud fuera m´
axima.
VII.
Para los modelos con transformaci
´
on Box-Cox,
el AIC se calculaba directamente de la serie
transformada. Esto es lo sugerido en [3].
VIII.
Para el
MRNL
, el logaritmo de la verosimilitud
fue calculado suponiendo que los par
´
ametros
γ0
,
γ1
,
. . .
,
γd−1
eran conocidos. Es decir, se
linealiz
´
o el modelo. Sin embargo, estos par
´
ame-
tros si fueron incluidos al momento de calcular
la penalizaci´
on del criterio AIC.
IX.
Como periodo de ajuste, se tomaron todos los
datos de cada serie, salvo los
´
ultimos doce, que
fueron designados como periodo de prueba.
Para conocer el desempe
˜
no de los modelos,
se contrast
´
o el pron
´
ostico de cada uno con las
observaciones del periodo de prueba.
X.
Para comparar el desempe
˜
no de los modelos,
durante cada uno de los doce horizontes de
pron
´
ostico, se emple
´
o el estad
´
ıstico
absolute
forecast error
(AFE), definido de la siguiente
manera:
AF Eh=|yn−12+h−ˆyn−12+h|,h= 1, . . . , 12.
El estad
´
ıstico AFE, brinda informaci
´
on bastante
precisa sobre la desviaci´
on de pron´
ostico ocu-
rrida en el horizonte
h
, de forma independiente
a las desviaciones de los horizontes pasados.
Gracias a esta caracter
´
ıstica, AFE puede de-
terminar el horizonte de pron
´
ostico para el
cual, cada modelo tiene un mejor desempe
˜
no.
Adem
´
as, puesto que los datos ya est
´
an esca-
lados, es posible comparar el desempe
˜
no de
cada modelo con cada serie, directamente y
sin porcentajes.
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
826 Sergio David Madrigal Espinoza
ISSN 2007-9737
XI.
Adicionalmente, se emplear
´
a el estad
´
ıstico
root mean squared forecast error
(RMSFE),
definido de la siguiente manera:
RM SF E =v
u
u
t
1
12
12
X
i=1
(yn−12+i−ˆyn−12+i)2.
El estad
´
ıstico RMSFE, resume en un solo dato,
el desempe
˜
no del modelo durante los doce
horizontes de pron
´
ostico. Ser
´
a de utilidad para
determinar, globalmente, que modelo es el
mejor.
XII.
Todo lo anterior se realiz
´
o con GNU R [
15
], el
software
estad
´
ıstico de c
´
odigo abierto. En par-
ticular, la funci
´
on
arima()
del paquete
stats
[
22
], fue de mucha ayuda, pues incluye la
capacidad de estimar modelos de regresi
´
on
lineal con desviaciones autocorrelacionadas.
El paquete
Mcomp
[
12
], fue de la mayor utilidad,
pues contiene las series de la competici
´
on M
de una manera ordenada y f´
acil de entender.
5. Resultados
5.1. Pron ´
ostico
En la Tabla 1, se muestran las medias sobre las
617 series, de los estad
´
ısticos
AFEh
(
h
= 1,
. . .
, 12)
y RMSFE. Tambi
´
en, se muestra la media sobre
todas las series y valores de
h
, obtenidas con
cada modelo. Durante el experimento, se encon-
traron resultados aberrantes. Como regla, todos los
pron
´
osticos que condujeran a un AFE promedio,
sobre los doce horizontes de pron
´
ostico, mayor
que 70, fueron excluidos. Result
´
o que el
MTBC
,
era el modelo m
´
as inestable (con 37 exclusiones),
seguido del
MRNL
(7) y el modelo
SARIT
(3). La
naturaleza lineal y la falta de transformaciones de
potencia, hicieron que el
MRL
no tuviera obser-
vaciones aberrantes. Los resultados indican que,
entre los modelos de regresi
´
on, la efectividad del
pron
´
ostico depender
´
a del horizonte. Por ejemplo,
para
h
= 1, 2, 3 el modelo
MTBC
es la mejor alterna-
tiva entre los modelos de regresi
´
on. Para el resto de
los horizontes, la mejor alternativa de regresi
´
on es
el
MRNL
, con la excepci
´
on de
h
= 10, 12 donde el
MRL
lo hizo mejor. Sin embargo, es un hecho que
los modelos de regresi
´
on fueron superados por el
modelo
SARIT
, pr
´
acticamente en todos los valores
de h.
Tabla 1.
Estad
´
ısticos promedio, excluyendo resultados
aberrantes
hMTBC MRL MRNL SARIT
1 6.55 9.54 7.86 5.94
2 7.44 10.14 8.57 7.41
3 9.09 11.3 9.61 7.77
4 10.44 11.43 9.67 8.43
5 11.65 12.15 9.73 8.88
6 13.84 12.79 11.22 10.13
7 15.87 13.12 12.08 11.05
8 17.29 12.39 12.03 11.13
9 19.38 12.8 11.94 11.86
10 21.26 13.36 13.73 12.64
11 23.71 13.1 12.92 12.92
12 27.03 13.49 14.11 14.32
RMSFE 21.25 14.35 13.1 12.28
Media 15.29 12.13 11.12 10.21
Excluidos 37 0 7 3
Seg
´
un la Tabla 1, el modelo
SARIT
supera el
desempe
˜
no de los modelos de regresi
´
on. Sin em-
bargo, esta tendencia puede revertirse, excluyendo
m
´
as datos aberrantes de los resultados. Esto podr
´
ıa
ser de utilidad,
´
unicamente si fuera posible conocer,
de antemano, cuales son las circumstancias que
causaran resultados aberrantes con cada modelo.
¿C
´
omo saber, a priori, si uno de estos modelos
terminar
´
a en un mal pron
´
ostico? Despu
´
es de inves-
tigar, fue posible responder esta pregunta. Result
´
o
que la bondad en el desempe
˜
no est
´
a fuertemente
asociada a valores peque
˜
nos de
d
. En la Tabla 2,
se muestran las medias, para cada valor de
d
y con
cada modelo.
En la Tabla 2, se muestran los valores del estima-
dor del parametro
d
para los cuales, el pron
´
ostico
con cada modelo ser
´
a
inaceptable
. Se supondr
´
a
que un modelo con valores promedio del estad
´
ıstico
AFE por encima de 12 es indeseable (no confundir
con aberrante). Para el
MTBC
, esto pasar
´
a cuando
d≥
3. De hecho, las observaciones aberrantes
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
Modelos de regresión para el pronóstico de series temporales con estacionalidad creciente 827
ISSN 2007-9737
Tabla 2.
Medias, respecto a cada valor de
d
. Entre
parentesis, est
´
a el n
´
umero de series con ese valor de
d
para cada modelo. El asterisco indica los casos en
los que se observaron (y removieron) pron
´
osticos con
valores promedio del estad
´
ıstico AFE mayores que 500
(nueve en total). Esto s´
olo ocurri ´
o con el MTBC
dMTBC MRL MRNL
1 9.46 (184) 11.11 (420) 8.1 (262)
2 11.37 (107) 13.72 (134) 10.75 (267)
3 15.4 (91) 13.6 (36) 23.13 (59)
4 26.6* (69) 18.26 (27) 39.81 (18)
5 37.64* (104) - 33.04 (7)
6 59.05* (44) - 49.28 (4)
7 46.55 (9) - -
ocurren cuando
d
toma los valores cuatro, cinco y
seis. El
MRL
, se debe emplear
´
unicamente si
d
= 1.
Aunque esto parezca restrictivo, se debe observar
que hubieron 420 series (68 %) que cumplieron
con esta caracter
´
ıstica. Finalmente, el
MRNL
debe
emplearse s
´
olo si
d
= 1
´
o
d
= 2. A
´
un con esta
restricci
´
on, el
MRNL
es el que mejor desempe
˜
no
tuvo cuando tom
´
o los valores de
d
para los que es
recomendado. De hecho, tomando estos valores,
el
MRNL
podr
´
a pronosticar aceptablemente 529
series (85.7 %).
Considerando los valores de
d
para los cuales,
cada modelo de regresi
´
on muestra un pron
´
ostico
aceptable, se elaboraron tres tablas en las que se
compara cada modelo de regresi
´
on contra el mo-
delo
SARIT
. Puesto que ahora se conoce a priori,
cu
´
al serie puede ser pronosticada aceptablemente
con cada modelo, se espera que los resultados
sean diferentes a los obtenidos en la Tabla 1. Los
resultados de las comparaciones, aparecen en las
Tablas 3, 4 y 5. Se est
´
an presentando las medias
del estad
´
ıstico AFI para cada valor de
h
, indicando
los valores del estimador del par
´
ametro
d
y el
porcentaje de las series empleado en cada compa-
raci´
on. No hubo datos aberrantes que remover.
A grandes rasgos, los resultados indican que los
modelos de regresi
´
on mostrar
´
an un mejor desem-
pe
˜
no de pron
´
ostico a mediano y largo plazo que
la alternativa t
´
ıpica de la literatura. De hecho, el
MTBC
ser
´
a mejor para cada valor de
h
que el
modelo
SARIT
, salvo en el caso
h
= 1. El
MRL
,
Tabla 3. MTBC Vs. SARIT, d= 1 y d= 2, 47.2 %
hMTBC SARIT
1 7.24 6.49
2 7.65 8.06
3 8.72 8.81
4 9.07 9.33
5 9.12 9.95
6 10.05 11.64
7 11.35 12.4
8 11.35 12.23
9 11.18 12.74
10 11.8 13.15
11 11.31 13.86
12 13.1 14.64
RMSFE 12.1 12.99
Media 10.16 11.11
Tabla 4. MRL Vs. SARIT, d= 1, 68 %
hMRL SARIT
1 8.82 6.19
2 9.73 8.4
3 10.42 8.74
4 10.71 9.38
5 11.09 10.32
6 11.8 11.39
7 11.86 12.4
8 11.1 12.58
9 11.31 13.35
10 12.26 13.81
11 11.86 14.16
12 12.36 15.61
RMSFE 13.13 13.29
Media 11.11 11.36
ser
´
a mejor a partir de la segunda mitad del a
˜
no
(
h≥
7). Finalmente, el
MRNL
mostrar
´
a su mejor
desempe
˜
no en los
´
ultimos dos cuatrimestres del
a
˜
no (
h≥
5). Esto demuestra que los modelos
de regresi
´
on, no s
´
olo son valiosos por sus inter-
pretaciones econom
´
etricas, sino por que pueden
brindar un pron
´
ostico tan bueno o incluso mejor que
alternativas t
´
ıpicas de la literatura. Esto siempre y
cuando se emplee la informaci
´
on del estimador de
den forma adecuada.
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
828 Sergio David Madrigal Espinoza
ISSN 2007-9737
Tabla 5. MRNL Vs. SARIT, d= 1 y d= 2, 85.7 %
hMRNL SARIT
1 7 5.83
2 6.97 7.12
3 8.18 7.72
4 8.5 8.17
5 8.53 9.15
6 9.58 9.88
7 10.42 10.63
8 10.12 10.83
9 9.93 11.33
10 11.5 12.12
11 10.65 12.4
12 11.83 13.44
RMSFE 11.09 11.65
Media 9.44 9.89
5.2. Intervalos de predicci ´
on
Una de los aspectos m
´
as relevantes de un mo-
delo de pron
´
ostico son sus intervalos predictivos.
B
´
asicamente, se espera que
´
estos cumplan con
la cobertura te
´
orica indicada, pero que tambi
´
en,
sean tan estrechos como sea posible. Aunque estos
objetivos est
´
en en conflicto, se espera que haya un
modelo que cubra mejor que los dem
´
as, a la vez
que la amplitud de sus intervalos predictivos sea
razoneblamente reducida. Se puede decir, que los
modelos de regresi
´
on tienen intervalos de predic-
ci
´
on reducidos, mas no cumplen con la cobertura
te
´
orica. Empleando un nivel de confiaza de 95 %,
los modelo
MTBC
,
MRL
y
MRNL
, mostraron una
cobertura media de 33 %, 46 % y 65 % con amplitu-
des medias de 65.71, 17.51 y 22, respectivamente.
La diferencia entre la cobertura postulada y la
observada, se debe a que la deducci
´
on de los
intervalos de predicci
´
on supone que los par
´
ametros
de cada modelo son conocidos. Esta suposici
´
on,
produce una disminuci
´
on en la estimaci
´
on de la
varianza de los intervalos de predicci
´
on, que son
de la forma:
ˆyn+h±1.96σh,h= 1, 2, . . . , 12,
donde
σh
es la desviaci
´
on del error de pron
´
ostico
h
pasos adelante. Puesto que se supuso que los
par
´
ametros eran conocidos, este valor debe estar
siendo subestimado. Para corregir esta situaci
´
on,
se buscar
´
a un valor
k
, tal que
k∗σh
, sea un
estimador adecuado de la desviaci
´
on del pron
´
ostico.
Es decir,
k
es una constante de correcci
´
on que
compensa la suposici
´
on de informaci
´
on perfecta. El
valor de
k
que produce una cobertura observada
similar a la te
´
orica para el
MRNL
es
k
= 3.34
con amplitud media de 73.46. Para los modelos
MTBC
y
MRL
, no fue posible encontrar un valor
de
k
menor a cincuenta, por lo que se concluye
que este ejercicio no puede realizarse con estos
modelos.
Sin embargo, si se observa la cobertura mediana
en lugar de la media, los valores de
k
para los
modelos
MTBC
,
MRL
y
MRNL
son
k
= 23.2, 2.94 y
k
= 1.74 con las amplitudes medianas 58.37, 45.8
y 34.77, respectivamente.
¿Cobertura media o mediana? Se recomienda
observar la cobertura mediana en lugar de la media.
´
Esto, no s
´
olo por que es la
´
unica disponible para
dos de los tres modelos, sino por la naturaleza
del estad
´
ıstico cobertura, al que se puede ver
como una variable aleatoria que toma valores en
el intervalo [0, 1] y cuya esperanza est
´
a cerca
del l
´
ımite derecho del intervalo. La distribuci
´
on de
esta variable no es sim
´
etrica; sus realizaciones
aberrantes, ocurrir
´
an siempre hacia la izquierda
y no podr
´
an ser compensadas por valores mucho
mayores que 0.95. Es en estos casos, en los que el
estad
´
ıstico mediana es m
´
as robusto que la media y
por eso es recomendado.
6. Conclusiones
Se estudi
´
o el desempe
˜
no de tres modelos de
regresi
´
on y se compararon frente a una alternativa
t
´
ıpica de la literatura. Los resultados indican que
el desempe
˜
no de pron
´
ostico de los modelos de
regresi
´
on, depender
´
a del grado de curvatura de
su tendencia as
´
ı como del horizonte de pron
´
ostico.
Entre menor sea la curvatura y mayor el horizonte
de pron
´
ostico, el desempe
˜
no de los modelos de
regresi´
on ser´
a mejor.
En cuanto a intervalos predictivos se refiere, los
modelos de regresi
´
on no tendr
´
an un buen desem-
pe
˜
no, debido a que la deducci
´
on de
´
estos supone
que los par
´
ametros son conocidos.
´
Unicamente se
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
Modelos de regresión para el pronóstico de series temporales con estacionalidad creciente 829
ISSN 2007-9737
puede esperar un buen desempe
˜
no si se aplica
una correcci
´
on a la varianza que sea consecuente
con dicha suposici
´
on. Es importante se
˜
nalar que
la mejora que se menciona, aplica si el estad
´
ıstico
observado es la cobertura mediana y no la media.
De los tres modelos de regresi
´
on que se em-
plearon en el cotejo, uno de ellos, el
MRNL
, es
propuesta y contribuci´
on original de esta investiga-
ci
´
on. Los resultados indican que el desempe
˜
no de
pron
´
ostico de este modelo, es al menos tan bueno
como el del
MTBC
. Debido a las caracter
´
ısticas
del
MRNL
, se recomienda su empleo si se busca
una alternativa al
MTBC
. Esto debido, no s
´
olo al
desempe
˜
no de pron
´
ostico mostrado por el
MRNL
,
sino a que resulta sencillo ver a este modelo como
uno de regresi
´
on lineal, para lo cual basta suponer
el conocimiento de uno o dos par´
ametros.
Agradecimientos
El autor desea expresar su agradecimiento al Pro-
grama de Mejoramiento al Profesorado (PROMEP)
por financiar la presente investigaci
´
on. La clave del
proyecto es: 103.5/12/3585.
Referencias
1. Akram, M., Hyndman, R. J., & Ord, J. K.
(
2009
).
Exponential smoothing and non-negative data.
Aus-
tralian and New Zealand Journal of Statistics
,
Vol. 51, No. 4, pp. 415–432.
2. Bowerman, B. L., Koehler, A. B., & Pack, D. J.
(
1990
). Forecasting time series with increasing
seasonal time variation.
Journal of Forecasting
,
Vol. 9, pp. 419–436.
3. Box, G. E. P., Jenkins, G. M., & Reinsell, G. C.
(
2008
).
Time series analysis: Forecasting and Con-
trol. WILEY, 4 edition.
4. Chatfield, C. & Prothero, D. L.
(
1973
). Box jenkins
seasonal forecasting: Problems in a case study (with
discussion).
Journal of The Royal Statistical Socity
A, Vol. 136, pp. 295–336.
5. Cleveland, W. S.
(
1983
). Seasonal and calendar
adjustment. In
Handbook of Statistics
, volume 3.
Elsevier Science Publishers B.V., 39–72.
6. Dagum, E. B.
(
1982
). Revisions of time varying
seasonal filters.
Journal of Forecasting
, Vol. 1,
pp. 20–28.
7. Franses, P. H.
(
1996
). Recent advances in modeling
seasonality.
Journal of Economic Surveys
, Vol. 10,
pp. 299–345.
8. Franses, P. H. & Koehler, A. B.
(
1998
). A model
selection strategy for time series with increasing sea-
sonal variation.
International Journal of Forecasting
,
Vol. 14, No. 3, pp. 405–414.
9. Ghysels, E.
(
1991
). Are business cycle turning
points uniformly distributed throughout the year?
Cahiers de recherche 9135, Universite de Montreal,
Departement de sciences economiques.
10. Ghysels, E.
(
1994
). On the periodic structure of the
business cycle.
Journal of Business and Economic
Statistics, Vol. 12, pp. 289–293.
11. Hylleberg, S., Engle, R. F., Granger, C. W. J., &
Yoo, B. S.
(
1990
). Seasonal integration and cointe-
gration.
Journal of Econometrics
, Vol. 44, No. 1-2,
pp. 215–238.
12. Hyndman, R. J.
(
2012
).
Mcomp: Data from the M-
competitions. R package version 2.04.
13. Hyndman, R. J., Koehler, A. B., Ord, J. K., & Sny-
der, R. D.
(
2005
). Prediction intervals for exponential
smoothing state space models.
International Journal
of Forecasting, Vol. 24, pp. 17–37.
14. Hyndman, R. J., Koehler, A. B., Ord, J. K., &
Snyder, R. D.
(
2008
).
Forecasting with Exponential
Smoothing: The State Space Approach
. Springer, 1
edition.
15. Ihaka, R. & Gentleman, R.
(
1996
). R: A lan-
guage for data analysis and graphics.
Journal of
Computational and Graphical Statistics
, Vol. 5, No. 3,
pp. 299–314.
16. Koehler, A. B., Snyder, R. D., & Ord, J. K.
(
2001
).
Forecasting models and prediction intervals for the
multiplicative holt-winters method.
International Jour-
nal of Forecasting, Vol. 17, pp. 269–286.
17. Madrigal Espinoza, S. D.
(
2011
). Pron
´
ostico de
series temporales con estacionalidad. Tesis Doctoral,
Universidad Aut´
onoma de Nuevo Le´
on.
18. Makridakis, S., Andersen, A., Carbone, R., Fil-
des, R., Hibon, M., Lewandowski, R., Newton, J.,
Parzen, E., & Winkler, R.
(
1982
). The accuracy
of extrapolation (time series) methods: Results of
a forecasting competition.
Journal of Forecasting
,
Vol. 1, No. 2, pp. 111–153.
19. Makridakis, S., Wheelwright, S. C., & Hyndman,
R. J.
(
1998
).
Forecasting Methods and Applications
.
John Wiley, 3 edition.
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
830 Sergio David Madrigal Espinoza
ISSN 2007-9737
20. Novales, A. & de Fruto, R. D.
(
1997
). Forecasting
with periodic models: A comparison with the time
invariant coefficient models.
International Journal of
Forecasting, Vol. 13, pp. 393–405.
21. Ord, J. K., Koehler, A. B., & Snyder, R. D.
(
1997
).
Estimation and prediction for a class of dynamic
nonlinear statistical models.
Journal of American
Statistical Association, Vol. 92, pp. 1621–1629.
22. Team, R. C.
(
2012
).
R: A Language and Environ-
ment for Statistical Computing
. R Foundation for
Statistical Computing, Vienna, Austria.
23. Wells, J. M.
(
1997
). Modelling seasonal patterns
and long-run trends in U.S. time series.
International
Journal of Forecasting, Vol. 13, pp. 407–420.
24. Wooldridge, J. M.
(
2001
).
Introducci´
on a la Econo-
metr´
ıa. Thomson Learning.
Sergio David Madrigal Espinoza
es profesor de tiempo
completo en la Divisi
´
on de Estudios de Posgrado de
la Facultad de Ingenier
´
ıa Mec
´
anica y El
´
ectrica de la
Universidad Aut
´
onoma de Nuevo Le
´
on. Sus investiga-
ciones est
´
an relacionadas con el an
´
alisis de series
temporales, modelos de pron
´
ostico, juegos de azar y
c´
omputo estad´
ıstico.
Article received on 16/09/2013; accepted on 01/09/2014.
Computación y Sistemas, Vol. 18, No. 4, 2014, pp. 821–831
doi: 10.13053/CyS-18-4-1552
Modelos de regresión para el pronóstico de series temporales con estacionalidad creciente 831
ISSN 2007-9737