[R-es] OFFTOPIC: SPARK Y H2O
Jesús Para Fernández
j.para.fernandez en hotmail.com
Sab Jul 1 11:06:21 CEST 2017
Buenas erreros!!
Una cuestión de las que tengo ciertas dudas es saber en que se diferencian Spark y H2o, si son competencia, si valen para lo mismo o no....
Según lo poco que se, Spark es una manera de agilizar el Map-Reduce, y con la libreria MLlib, puedes hacer datamining de grandes datasheets, y si lo conectas con R o con Python, puedes usar ese lenguaje.
H2O es una herramienta que nos permite hacer datamining para grandes datasets, balanceando entre los nodos/clusters del sistema, y conectado con R o Python puedes hacerlo usando el lenguaje de estos.
Entonces, para que me vale Spark si tengo ya H2O?
Es que no veo claro para que vale cada herramienta.
Gracias
Jesús
[[alternative HTML version deleted]]
Más información sobre la lista de distribución R-help-es