[R-es] Como abordar un problema?

Jesús Para Fernández j.para.fernandez en hotmail.com
Vie Ene 27 19:44:45 CET 2017


Buenas,


Empieza el finde, así que abro un hilo algo OFF TOPIC en cuanto a R se conoce.


Imaginad un problema cualquiera supervisado, por ejemplo la relacione entre variables y que un suceeso ocurra o no. ¿Cómo lo abordamos?


Yo empezaría de la siguietne manera:

1- Hablar con la gente que conozca el proceso del cual provienen esos datos y entender bien le proceso

2. Buscar la sanidad del dataset (datos faltantes,outliers, distribucion de los datos, normalizarlos...)

3. Hacer un clustering para entender posibles asociaciones entre datos

4. Partir los datos en train y test

5. Poner los modelos y pasarlos por un Kfold en funcion del train/test

6. Ver el mejor modelo

7. Extraeer conclusiones de ese modelo.


¿Vosotros que haceis? Usais el clustering para el análisis exploratorio?


Un saludo y buen finde

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es