[R-es] OFFTOPIC: SPARK Y H2O

Jesús Para Fernández j.para.fernandez en hotmail.com
Sab Jul 1 11:06:21 CEST 2017


Buenas erreros!!


Una cuestión de las que tengo ciertas dudas es saber en que se diferencian Spark y H2o, si son competencia, si  valen para lo mismo o no....


Según lo poco que se, Spark es una manera de agilizar el Map-Reduce, y con la libreria MLlib, puedes hacer datamining de grandes datasheets, y si lo conectas con R o con Python, puedes usar ese lenguaje.


H2O es una herramienta que nos permite hacer datamining para grandes datasets, balanceando entre los nodos/clusters del sistema, y  conectado con R o Python puedes hacerlo usando el lenguaje de estos.

Entonces, para que me vale Spark si tengo ya H2O?


Es que no veo claro para que vale cada herramienta.


Gracias

Jesús

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es