[R-es] libreria(s) preparar datos

Carlos Ortega cof en qualityexcellence.es
Lun Feb 6 13:29:13 CET 2017


Hola Pedro,

La opción de "vtreat" es buena, de un tirón (con una sola función) puedes
ajustar múltiples cosas. Pero también ahí está el problema que quizás esté
un tanto sobre-parametrizada y hay ciertas cosas que tienes que conocer muy
bien para no liarla. Pero vaya, para imputar missings, hacer hot-encoding
(crear variables dummy) y tratar alta cardinalidad (esto creo que es de lo
último que están metiendo) está muy bien.

Pero también con "caret" puedes hacer estas cosas, con varias funciones por
separado. Casi te preguntaría por el problema que tienes con "caret" por si
es que hay algo que quieras hacer para lo que no has encontrado una forma
fácil....

Gracias,
Carlos.

El 6 de febrero de 2017, 13:02, Pedro Concejero Cerezo <
pedro.concejerocerezo en telefonica.com> escribió:

> Amigos eRReros
> Tengo (como todos) el problema de preparar datos si es posible de forma
> automatica. He estado usando caret para quitar near-zero-variance y
> otras, pero resulta pesado y hay cosas que no hace o no se como hacer.
> Sobre todo reagrupar niveles de factores...
> He encontrado vtreat
> https://cran.r-project.org/web/packages/vtreat/index.html
>
> Pero estoy seguro que teneis experiencia en muchos otros paquetes y me
> gustaria saber si teneis alguno preferido.
>
> Gracias y saludos!!
>
> --
> *Pedro Concejero
> E-mail: pedro.concejerocerezo en telefonica.com
> skype: pedro.concejero
> twitter @ConcejeroPedro <https://twitter.com/ConcejeroPedro>
> linkedin pedroconcejero <http://www.linkedin.com/in/pedroconcejero/es>
> Entusiasta R, me encontrareis aqui gRupo R madRid
> <http://madrid.r-es.org/?s=concejero&searchsubmit.x=21&searchsubmit.y=13>
> (sin acentos a proposito)
>
> *
>
>         [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es