[R-es] DUDA SOBRE PARTICIÓN DE DATOS PARA VALIDACIÓN CRUZADA

Carlos J. Gil Bellosta cgb en datanalytics.com
Mie Sep 26 22:30:47 CEST 2012


Utiliza el paquete caret.

En http://cran.r-project.org/web/packages/caret/vignettes/caretMisc.pdf dice:

"Similarly, createResample can be used to make simple bootstrap
samples and createFolds can be used to generate balanced
cross–validation groupings from a set of data."

Creo que es más o menos lo que necesitas.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El día 26 de septiembre de 2012 22:21, rod lopez <rod99hare en gmail.com> escribió:
>>
>>
> Estimados muy buenas quería hacerles unas consulta:
>
> Estoy trabajando en mi tesis sobre mejoramiento animal y mi objetivo es
> evaluar la habilidad predictiva de modelos estadísticos mediante validación
> cruzada.
>
> Pero antes la intención es dividir mi base de datos en 3 partes y quisiera
> que todos los efectos incluidos en el estudio y cada uno de sus niveles,
> estén lo más equitativamente representados en los tres subconjuntos.
>
> Mis efectos son año (32 niveles), sexo (3 niveles), edad (2 niveles) y
> efecto     genético animal (5561 niveles).
>
> ¿Existe alguna forma de realizar una partición al azar de mi base de datos
> en 3 partes pero que a su vez estén representados todos los efectos y sus
> niveles de forma representativa en los 3 subconjuntos?
>
> Desde ya muchas gracias.
>
> Saludos,
>
> Rodrigo.
>
>         [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



Más información sobre la lista de distribución R-help-es