[R-es] Alto rendimiento

javier.ruben.marcuzzi en gmail.com javier.ruben.marcuzzi en gmail.com
Mar Oct 11 15:55:03 CEST 2016


Estimados

En el sitio de https://www.rstudio.com/  hay un aviso sobre http://spark.rstudio.com/index.html ( sparklyr ).

Microsoft publico un artículo donde comparan el R Server que está dentro de SQL server (o por separado, depende un poco), o el Microsoft R, junto con algunas librerías que se pueden compilar y obtener lo mismo en Ubuntu.

Supongamos que tengo el dinero como para comprar por ejemplo http://www.intel.la/content/www/xl/es/processors/xeon/xeon-processor-e7-family.html uno de estos procesadores con 36 núcleos.

Supongamos que tengo aún más dinero y puedo comprar 4 computadoras y colocarlas de tal forma que puedan trabajar en conjunto.

Ahora mi pregunta, spark (sparklyr) utiliza mis cuatro computadoras pero ¿un solo núcleo o los 36? (java usa solo un núcleo)

La parte de Microsoft utiliza los 36 procesadores, pero las librerías que están en los repositorios de Microsoft (no las de CRAN) ¿están optimizadas para los 36 procesadores?

O solo hay partes en spark como mlib o lo específico de R Microsoft optimizado, que puedan utilizar todos los núcleos y/o procesadores. Por ejemplo MCMCglmm ¿tiene beneficios en cualquiera de estas tecnologías o solo utiliza lo mismo que puede procesar en una portátil?

O si compro los cuatro equipos con 36 núcleos, instalo la versión de Microsoft junto con sparklyr y: ¿tengo una capacidad de cálculo impresionante, o esa capacidad es solo en sectores de R siendo el resto procesado en forma tradicional?

¿Hay comentarios al respecto desde la experiencia de alguno del grupo?

Javier Rubén Marcuzzi


	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es