[R-es] "Step" para modelos lineales usando medidas de error alternativas a AIC

Carlos J. Gil Bellosta cgb en datanalytics.com
Jue Sep 9 15:23:02 CEST 2010


Hola, ¿qué tal?

Recientemente, enfrentándome a un problema de minería de datos (*),
eché de menos una característica de R (que tal vez exista y de ahí mi
pregunta en la lista).

Quería plantear un modelo lineal con muchas variables de entrada y
utilizar alguna de las variantes de "step" para descartar la mayor
parte de las presumiblemente menos informativas.

_step_ utiliza AIC como criterio de parada. Sin embargo, a mí me
interesaba más poder detener la búsqueda de nuevas variables en
función de criterios alternativos basados en los datos mismos: por
ejemplo, la minimización del error cuadrático (o absoluto) medio sobre
un conjunto de control.

¿Existe algo así ya implementado en R?

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


(*) No sin cierta dosis de oportunismo, aprovecho la ocasión para dar
a conocer las circunstancias del problema (una competición) y mi
resultado en ella:

http://www.datanalytics.com/blog/2010/09/08/datanalytics-segunda-posicion-en-la-competicion-internacional-de-mineria-de-datos/



Más información sobre la lista de distribución R-help-es