[R-es] Sobre series de tiempo y automatización.-

Marcuzzi, Javier Rubén javier.ruben.marcuzzi en gmail.com
Jue Abr 12 19:37:59 CEST 2012


Estimado Freddy López

No se si entendí justo lo que necesita, pero por lo comprendido de mi parte:

¿Cuánto es el tamaño de sus datos en la base de datos? Le pregunto esto 
porque si el modelo es fijo, pero por decirlo de alguna forma, puede quedar 
desactualizado al ingresar nuevos datos desde la base de datos, suponiendo y 
simplificando su trabajo, llevando todo a solo un ajuste de curvas donde 
únicamente se observa el R2, a lo largo de las semanas cuando de va 
ejecutando el modelo hay nuevos valores de R2 que corresponden a cada 
procesamiento.

¿Es posible guardar este parámetro (bueno, el que corresponda)?

Sobre mi consulta sobre el tamaño de los datos, es porque antes trabajaba 
con un sistema de respaldo, cada día que realizaba un respaldo creaba todos 
los archivos de nuevo almacenados con la fecha, en el disco quedaba la fecha 
de mi respaldo anterior con todos los archivos, la fecha de mi respaldo 
actual con todos los archivos, ..., en caso de un problema podía regresar en 
las fechas y buscar el o los archivos necesarios (consumía disco rígido en 
una forma extraordinaria). Trasladando esto podría ser una consulta en la 
base de datos utilizando la fecha (hoy), que justo hoy no sería necesaria 
porque es el último día, pero si es almacenada como una variable en una 
lista, podría plantear consultas al día x, x1, x2, x3, ejecutando todo el 
modelo como modelo x1, modelox2, modelox3. Pero esto tiene un costo de 
procesamiento que posiblemente se pueda evitar al guardar en archivos 
almacenados por fechas.

Resumiendo, podrían ser tres alternativas, guardar todo por fecha en el 
disco, procesar todo bajo un modelo (anterior y actual), o guardar 
parámetros en archivos de texto (podría haber un data.frame que lee el 
resultado del análisis anterior, se procesa, se agrega una fila al 
data.frame con los valores nuevos, se guarda el archivo).

Javier


-----Mensaje original----- 
From: Freddy López
Sent: Thursday, April 12, 2012 12:51 PM
To: r-help-es en r-project.org
Subject: [R-es] Sobre series de tiempo y automatización.-

Hola,

Espero que todos estén muy bien.

Les cuento la situación: En estos momentos estamos trabajando en un
proyecto sobre el modelado de unas series de tiempo semanales y
estamos confeccionando un proceso de forma tal que cada semana solo
hay que ejecutar un par de guiones que nos da el pronóstico de las 3 o
4 semanas siguientes. Con esta forma de trabajar se está apuntando a
la automatización principalmente.

El modelo que está involucrado en la predicción contempla variables
predictoras y estas alimentan al modelo cada semana de forma que cada
semana se 'actualizan' los parámetros (pues se estiman los parámetros
con una semana adicional). La estructura del modelo no cambia.

Existe el temor inminente que el proceso que estamos asumiendo que
rige las series cambie de un momento a otro.

Mis dudas son: ¿cuáles son las buenas prácticas con este procedimiento
que estamos siguiendo?¿conocen ustedes documentación sobre cada cuánto
tiempo se debe 'revisar' el modelo?¿es recomendable esta estrategia?

De antemano agradezco sus comentarios y pregunto aquí porque sé que
está repleto de expertos estadísticos aunque no haya orientado mi
pregunta específicamente al uso de R (por cierto, todo lo tenemos
hecho en R con una conexión a una base de datos para obtener los
datos).

Mil gracias y salud.

--
«But Gwindor answered: 'The doom lies in yourself, not in your name.'»

JRR Tolkien

_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es



Más información sobre la lista de distribución R-help-es