[R-es] Sin mejoras con H2O

Jesús Para Fernández j.para.fernandez en hotmail.com
Mie Jun 7 10:06:26 CEST 2017


Buenas,


Tras vuestra recomendación, estoy probando con H2O en local viendo las mejoras que me aporta. Con Sys.time controlo el comienzo y final de ejecución de los modelos, y haciendo la diferencia de tiempos obtengo el tiempo de ejecución.


Con una simple prueba hago lo siguiente:


iris


inicio<-Sys.time()

modelo<-randomForest(Species~.,data=iris,ntrees=500)

fin<-Sys.time()

fin-inio


iris2<-as.h2o(iris)

inicio<-Sys.time()

modelo<-h2o.randomForest(x=1:4,y=5,iris2,ntrees=500)

fin<-Sys.time()


fin-inicio


Y para mi sorpresa es más rápido R sin h2o. Analizando un poco la situación, creo que es por usarlo en local en una máquina poco potente:


Estoy ejecutando R 64 bits en un equipo con windows7 con un i5 de procesador y 4 gigas de RAM. Al iniciar h2o, dejo la configuración por defecto h2o.init(), que crea el siguiente "nodo":


    H2O cluster total nodes:    1
    H2O cluster total memory:   0.85 GB
    H2O cluster total cores:    4
    H2O cluster allowed cores:  2
    H2O cluster healthy:        TRUE
    H2O Connection ip:          localhost
    H2O Connection port:        54321
    H2O Connection proxy:       NA
    H2O Internal Security:      FALSE
    R Version:                  R version 3.3.2 (2016-10-31)

Note:  As started, H2O is limited to the CRAN default of 2 CPUs.
       Shut down and restart H2O as shown below to use all your CPUs.



¿Alguna idea de porque crea el modelo más lento usando h20 que sin hacer uso de h20?


Gracias

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es