[R-es] Big data con R o phyton?

Jesús Para Fernández j.para.fernandez en hotmail.com
Lun Dic 5 12:09:54 CET 2016


Te agradezco la repsuesta, aunque no te he entendido muy bien.

Se que para Spark está PySpark que entiendo que lo que hace es comunicar Python con Spark, al igual que SparkR comunica R con spark.

Lo que había entendido es que con esas librerias podia hacer lo que quisiera en R o Python como lo haria en local pero con los volumenes de informacion que Spark me permite, pero por lo que te leo, esto no es del todo así???


en cuanto al muestreo de datos, totalmente de acuerdo contigo. Smart data antes que Big data

________________________________
De: José Luis Cañadas <canadasreche en gmail.com>
Enviado: lunes, 5 de diciembre de 2016 10:57
Para: Jesús Para Fernández
Cc: r-help-es en r-project.org
Asunto: Re: [R-es] Big data con R o phyton?

Hola
Hombre, aprender python no estorba. Pero en realidad en temas de bigdata python lo que tiene es pyspark que es una api para los modelos que hay en spark. En R está sparkR pero no están todos los modelos que hay en mllib de spark, se supone que el paquete sparklyr soluciona este tema, a ver como evoluciona.
Por otro lado tienes h2o http://www.h2o.ai/ , que puede integrarse con spark y tiene apis para R, python y scala.  Y bueno, también existe la posibilidad de muestrear los datos, ¿o ya no nos acordamos?

Saludos

El 5 de diciembre de 2016, 10:49, Jesús Para Fernández <j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com>> escribió:
Merece la pena aprender python para Big data con Spark o usando la libreria que acaba de salir para R es suficiente? Qué creeis?



        [[alternative HTML version deleted]]


_______________________________________________
R-help-es mailing list
R-help-es en r-project.org<mailto:R-help-es en r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es


	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es