[R-es] Sobre series de tiempo y automatización.-
Marcuzzi, Javier Rubén
javier.ruben.marcuzzi en gmail.com
Jue Abr 12 19:37:59 CEST 2012
Estimado Freddy López
No se si entendí justo lo que necesita, pero por lo comprendido de mi parte:
¿Cuánto es el tamaño de sus datos en la base de datos? Le pregunto esto
porque si el modelo es fijo, pero por decirlo de alguna forma, puede quedar
desactualizado al ingresar nuevos datos desde la base de datos, suponiendo y
simplificando su trabajo, llevando todo a solo un ajuste de curvas donde
únicamente se observa el R2, a lo largo de las semanas cuando de va
ejecutando el modelo hay nuevos valores de R2 que corresponden a cada
procesamiento.
¿Es posible guardar este parámetro (bueno, el que corresponda)?
Sobre mi consulta sobre el tamaño de los datos, es porque antes trabajaba
con un sistema de respaldo, cada día que realizaba un respaldo creaba todos
los archivos de nuevo almacenados con la fecha, en el disco quedaba la fecha
de mi respaldo anterior con todos los archivos, la fecha de mi respaldo
actual con todos los archivos, ..., en caso de un problema podía regresar en
las fechas y buscar el o los archivos necesarios (consumía disco rígido en
una forma extraordinaria). Trasladando esto podría ser una consulta en la
base de datos utilizando la fecha (hoy), que justo hoy no sería necesaria
porque es el último día, pero si es almacenada como una variable en una
lista, podría plantear consultas al día x, x1, x2, x3, ejecutando todo el
modelo como modelo x1, modelox2, modelox3. Pero esto tiene un costo de
procesamiento que posiblemente se pueda evitar al guardar en archivos
almacenados por fechas.
Resumiendo, podrían ser tres alternativas, guardar todo por fecha en el
disco, procesar todo bajo un modelo (anterior y actual), o guardar
parámetros en archivos de texto (podría haber un data.frame que lee el
resultado del análisis anterior, se procesa, se agrega una fila al
data.frame con los valores nuevos, se guarda el archivo).
Javier
-----Mensaje original-----
From: Freddy López
Sent: Thursday, April 12, 2012 12:51 PM
To: r-help-es en r-project.org
Subject: [R-es] Sobre series de tiempo y automatización.-
Hola,
Espero que todos estén muy bien.
Les cuento la situación: En estos momentos estamos trabajando en un
proyecto sobre el modelado de unas series de tiempo semanales y
estamos confeccionando un proceso de forma tal que cada semana solo
hay que ejecutar un par de guiones que nos da el pronóstico de las 3 o
4 semanas siguientes. Con esta forma de trabajar se está apuntando a
la automatización principalmente.
El modelo que está involucrado en la predicción contempla variables
predictoras y estas alimentan al modelo cada semana de forma que cada
semana se 'actualizan' los parámetros (pues se estiman los parámetros
con una semana adicional). La estructura del modelo no cambia.
Existe el temor inminente que el proceso que estamos asumiendo que
rige las series cambie de un momento a otro.
Mis dudas son: ¿cuáles son las buenas prácticas con este procedimiento
que estamos siguiendo?¿conocen ustedes documentación sobre cada cuánto
tiempo se debe 'revisar' el modelo?¿es recomendable esta estrategia?
De antemano agradezco sus comentarios y pregunto aquí porque sé que
está repleto de expertos estadísticos aunque no haya orientado mi
pregunta específicamente al uso de R (por cierto, todo lo tenemos
hecho en R con una conexión a una base de datos para obtener los
datos).
Mil gracias y salud.
--
«But Gwindor answered: 'The doom lies in yourself, not in your name.'»
JRR Tolkien
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es
Más información sobre la lista de distribución R-help-es