[R-es] ARIMA automatizados (Gregorio R. Serrano)

Gregorio R. Serrano grserrano en ccee.ucm.es
Lun Mayo 9 10:47:54 CEST 2011


Buenas.

De nada, para eso está la lista. Sobre tu nuevo algoritmo, me parece muy
sensato, pero:

1) ¿Existe alguna serie económica mensual o trimestral no estacional? Yo
creo que auto.arima decide las diferencias con algún contraste de raíces
unitarias (no he "mirado dentro"), pero en series económicas tendría que
buscar mucho para encontrar una serie que no requiere diferencia estacional
y cuando ocurre se debe a que la fuente ha planchado (suavizado,
desestacionalizado) los datos.

2) Los precios no sólo crecieron, sino que aceleraron, es decir, desde 2000
el crecimiento fue cada vez mayor (segunda derivada positiva). Para hacer
eso estacionario necesitas dos diferencias, o al menos probarlas (yo tengo
dos diferencias regulares en mi modelo de precios de vivienda, pero son
precios agregados, no provinciales). Yo probaría d=2 y D=1, después puedes
comprobar la no estacionariedad en la estimación.

3) El horizonte de previsión me parece excesivo, ya sé que eso suele ser
culpa de nuestros jefes/clientes que creen que se puede prever todo, pero
tal y como están las cosas es disparatado. ¿Te imaginas las previsiones
horizonte 12 trimestres que habrías hecho a finales de 2006?

4) Los alisados tienen mejor pinta, también puedes usar algún filtro tipo
Hodrick-Presscott, pero cualquiera de esas opciones tardará mucho más en
reaccionar ante un cambio de tendencia que el ARIMA. Yo hago previsiones con
ARIMA y después presento gráficos suavizados, pero no calculo previsiones de
datos suavizados.

¡Jó! qué pesado soy, pero es que en esto tengo la experiencia de muchos
informes periódicos de coyuntura a mis espaldas.

Un saludo
Gregorio


El 9 de mayo de 2011 09:44, <jluis.gilsanz en tasacionesh.com> escribió:

> Hola
>
> Gregorio muchas gracias por tu respuesta, veo que con tu experiencia no
> puedo confiar demasiado en la automatización de arimas de forecast.
>
> Sabiendo esta renuencia a hacer diferenciaciones del algoritmo, se me
> plantea una estrategia que quizás ayude al auto.arima de  forecast a
> funcionar mejor.
> Hacer un barrido previo a los 200 y picos modelos que tengo que generar y
> detectar aquellos en los que sea necesarios al menos una diferenciación
> estacional.
> Puesto que los datos se refieren a evolución de precios inmobiliarios en
> los que siempre existe una marcada tendencia (creciente desde 1995 -2007 y
> decreciente los tres últimos años), podría modificar el código que he
> escrito de forma que:
> -Para los casos en los que en el barrido previo detecte estacionalidad,
> inicializar el auto.arima con d=D=1
> -Para aquellos casos en los que el barrido no detecte estacionalidad
> inicializarlo con d=1 y D=0.
>
> De cualquier forma estoy contemplando la posibilidad de cambiar los modelos
> Arima por unos alisados exponenciales, ya que las estimaciones a realizar
>  son de un horizonte de 12 trimestres y las estimaciones a futuro que
> realizan los alisados tienen mejor "pinta" que los modelos arima que he
> construido hasta ahora.
>
> Si no fuera por limitado nivel de ingles le enviaría un mensaje al creador
> del paquete a ver si el puede explicarme el motivo de que el algoritmo
> encuentre modelos con coeficientes no significativos pero en los que la
> diagnosis del modelo es correcta.
>
> Un saludo
>
> *José Luis Gilsanz Gómez** *
> Estadística
> *
> Tasaciones Hipotecarias *
> María de Molina, 54 - 28006 - Madrid
> Tel. : 34-914549694
> Fax : 34-917822164
> Email : *jluis.gilsanz en tasacionesh.com* <jluis.gilsanz en tasacionesh.com>
> Site web: *www.tasacionesh.es* <http://www.tasacionesh.es/>
>
>
>
>
>
> -- AVISO LEGAL --
>
> Los datos personales que en esta comunicación aparecen, así como los que
> nuestra empresa mantiene de Vd. y de su empresa, son tratados con la
> finalidad de mantener el contacto así como realizar las gestiones que en
> esta aparecen (Ley Orgánica 15/1999, de 13 de diciembre, de Protección de
> Datos de Carácter Personal).
> Puede ejercer sus derechos de acceso, rectificación, cancelación y
> oposición dirigiéndose a *atencion.clientesth en tasacionesh.com*<atencion.clientesth en tasacionesh.com>
> .
> La utilización de su dirección de correo electrónico por parte de nuestra
> empresa queda sujeta a las disposiciones de la Ley 34/2002, de Servicios de
> la Sociedad de la Información y el Comercio Electrónico. Si Vd. recibe
> comunicación comercial por nuestra parte y desea dejar de recibirla, rogamos
> nos lo comunique por vía electrónica a través de la dirección *atencion.clientesth en tasacionesh.com
> * <atencion.clientesth en tasacionesh.com>.
>
>
>
> From:        r-help-es-request en r-project.org
> To:        r-help-es en r-project.org
> Date:        07/05/2011 12:03
> Subject:        Resumen de R-help-es, Vol 27, Envío 7
> Sent by:        r-help-es-bounces en r-project.org
> ------------------------------
>
>
> Asuntos del día:
>
>   1. Re: ARIMA automatizados (Gregorio R. Serrano)
>
>
> ----------------------------------------------------------------------
>
> Message: 1
> Date: Fri, 6 May 2011 15:41:29 +0200
> From: "Gregorio R. Serrano" <grserrano en ccee.ucm.es>
> To: jluis.gilsanz en tasacionesh.com
> Cc: r-help-es en r-project.org
> Subject: Re: [R-es] ARIMA automatizados
> Message-ID: <BANLkTik9X=rEdzDhbjrC9Tr2aj-oJXuR_A en mail.gmail.com>
> Content-Type: text/plain
>
> Hola.
>
> Yo trabajo bastante con modelos ARIMA para previsiones mensuales y
> auto.arima (de forecast) y yo no solemos coincidir en la especificación.
> auto.arima se resiste a diferenciar y eso da lugar a un p muy alto y
> también, a veces, a unos q inaceptables (y como consecuencia correlación
> excesiva entre los parámetros estimados). A veces lo utilizo como punto de
> partida o como complemento a la identificación y diagnosis, pero no uso
> automáticamente los modelos que devuelve.
>
> Por otra parte, no estoy dispuesto a que me cambie la especificación de un
> ARIMA sin "mi permiso", así que yo guardo los órdenes p,d,q, P,D,Q de mis
> modelos en un archivo y reestimo la misma especificación cada mes (cuando
> actualizo datos). Sólo si los residuos indican otra cosa me planteo cambiar
> el modelo, cosa que no debería ocurrir con frecuencia.
>
> Un saludo
> Gregorio R. Serrano
>
> El 6 de mayo de 2011 10:58, <jluis.gilsanz en tasacionesh.com> escribió:
>
> > Hola:
> >
> > Si no recuerdo mal creo que este es mi primer post, así que espero no
> > cometer ninguna "barbaridad"  y  que sean comprensivos conmigo.
> > Retomo mi contacto con R después de una pequeña introducción que hice
> hace
> > un par de años gracias a un curso de la UNED.
> >
> > El proyecto trata, a grandes rasgos de:
> > 1.- Conectarse a un servidor Microsoft SQL y bajarse a R  unos datos de
> > evolución de precios unitarios de vivienda (publicados por el Mto. de
> > Fomento de España) por cuatrimestres (desde 1995 a 2010 hacen un total de
> > 64 trimestres) y por provincias.
> > 2.- Generar un bucle en el que para cada una de las 52 provincias se
> > obtenga un modelo ARIMA automático, así como sus estimaciones a 3 años
> > vista.
> > 3.- Al final del bucle se guardara  en el SQL una tabla que contiene,
> para
> > cada provincia, entre otras cosas, el modelo ajustado , los AIC,AICC,BIC,
> > log-likehood, sigma2, así como una variable booleana que especifica si el
> > modelo tiene TODOS sus coeficientes significativos. También guardare una
> > tabla con las estimaciones efectuadas por cada modelo ajustada a cada
> > provincia.
> >
> > Si alguien tiene interés en el código que he desarrollado se lo puedo
> > proporcionar, o si se considera de interés publicarlo en la lista. No lo
> > envío ahora por ser demasiado extenso.
> >
> > Para ello utilizo los paquetes RODBC para conectarme al SQL Server donde
> > están los datos y forecast para calcular los modelos automatizados ARIMA,
> > y aquí es donde radica el problema.
> >
> > A pesar de que según el autor del paquete se especifica en este articulo
> > http://www.jstatsoft.org/v27/i03/paper que el algoritmo garantiza la
> > obtención de un modelo valido, me he encontrado que alguno de los 52
> > modelos ajustados tiene alguno de sus coeficientes no significativos
> > (usando un nivel de significación de 0,05), a pesar de que usando tsdiag
> > los gráficos muestran una buena diagnosis del modelo.
> >
> > Extrañado por ello me he decido aplicar, a modo de prueba,  el
> > procedimiento de obtención de ARIMA automatizados del paquete forecast a
> > la secuencia de datos AirPassengers con la que muchos aprendimos a
> > trabajar con modelos ARIMA. Para dicha secuencia de datos el mejor modelo
> > obtenido segun se especifico en su día por Box & Jenkins es un
> > ARIMA(0,1,1)(0,1,1)[12] , mientras que el procedimiento automatizado del
> > paquete forecast propone un modelo ARIMA(0,1,0)(0,0,2)[12]   usando la
> > opción por pasos o bien un modelo ARIMA(2,1,1)(0,0,2)[12] with drift
> > usando la opción que prueba con todos los modelos posibles.
> > En ambos casos me sorprende que no haga ninguna diferenciación estacional
> > a pesar de que se trata de una serie claramente estacional.
> >
> > Se me plantean muchas dudas que espero que me puedan resolver.
> > ¿Estoy equivocando la forma de enfocar el proyecto?
> > ¿Puedo confiar en el paquete forecast a pesar de estos resultados tan
> > desconcertantes?
> > ¿Existe algún otro paquete alternativo que me permita realizar algo
> > similar?.
> >
> > Desde ya, muchísimas gracias por haber leído esta extensa exposición
> >
> > Muchas gracias
> >
> > Un saludo
> >
> > José Luis Gilsanz Gómez
> >
> >
> >
> > -- AVISO LEGAL --
> >
> > Los datos personales que en esta comunicación aparecen, así como los que
> > nuestra
> > empresa mantiene de Vd. y de su empresa, son tratados con la finalidad de
> > mantener
> > el contacto así como realizar las gestiones que en esta aparecen (Ley
> > Orgánica
> > 15/1999, de 13 de diciembre, de Protección de Datos de Carácter
> Personal).
> > Puede ejercer sus derechos de acceso, rectificación, cancelación y
> > oposición
> > dirigiéndose a atencion.clientes en tasacionesh.com
> > La utilización de su dirección de correo electrónico por parte de nuestra
> > empresa
> > queda sujeta a las disposiciones de la Ley 34/2002, de Servicios de la
> > Sociedad de
> > la Información y el Comercio Electrónico. Si Vd. recibe comunicación
> > comercial por
> > nuestra parte y desea dejar de recibirla, rogamos nos lo comunique por
> vía
> > electrónica
> > a través de la dirección atencion.clientes en tasacionesh.com
> >
> >        [[alternative HTML version deleted]]
> >
> >
> > _______________________________________________
> > R-help-es mailing list
> > R-help-es en r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
> >
>
>
> -- AVISO LEGAL --
>
> Los datos personales que en esta comunicación aparecen, así como los que
> nuestra
> empresa mantiene de Vd. y de su empresa, son tratados con la finalidad de
> mantener
> el contacto así como realizar las gestiones que en esta aparecen (Ley
> Orgánica
> 15/1999, de 13 de diciembre, de Protección de Datos de Carácter Personal).
>
> Puede ejercer sus derechos de acceso, rectificación, cancelación y
> oposición
> dirigiéndose a atencion.clientes en tasacionesh.com
> La utilización de su dirección de correo electrónico por parte de nuestra
> empresa
> queda sujeta a las disposiciones de la Ley 34/2002, de Servicios de la
> Sociedad de
> la Información y el Comercio Electrónico. Si Vd. recibe comunicación
> comercial por
> nuestra parte y desea dejar de recibirla, rogamos nos lo comunique por vía
> electrónica
> a través de la dirección atencion.clientes en tasacionesh.com
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Dr. Gregorio R. Serrano
Dpto. Economía Cuantitativa (UCM)
Voz:+34 91394 2361
Fax:+34 91394 2591
http://www.grserrano.es
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20110509/824226e1/attachment-0001.html>
------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: no disponible
Type: image/jpeg
Size: 24195 bytes
Desc: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20110509/824226e1/attachment-0001.jpe>


Más información sobre la lista de distribución R-help-es