<div dir="ltr"><div class="gmail_default" style="font-family:verdana,sans-serif">Hola,</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Es que también habría que definir a que etapa del proceso de BigData te estás refiriendo.</div><div class="gmail_default" style="font-family:verdana,sans-serif">Supongo que te refieres a la etapa de Machine Learning / Analytics, ¿es así?.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Desde la fuente del dato hasta conseguir "información operacional", información que puede transformarse en una acción para el negocio; hay muchas etapas y en cada una de ellas existe un auténtico zoo de soluciones cada una de ellas utilizando un lenguaje específico.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Este gráfico de cómo lo pinta Microsoft ayuda mucho a ver todas estas etapas:</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default"><img src="cid:ii_159a376de00f845b" alt="Imágenes integradas 1" width="474" height="199"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Y en particular para el capítulo de <b>Machine Learning / Analytics</b>, sigue habiendo muchas soluciones. Claramente lo que está más implantado todavía son soluciones SAS, que por coste fundamentalmente y porque los nuevos que llegan, ya llegan con R y Python, hay un movimiento de cambio. Costará la transformación, pero se está forzando mucho, pero avanzando lento (el efecto Lindy que no terminamos de entender [1] y pensamos que los cambios son de la noche a la mañana) </div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Y sobre soluciones de Machine Learning/Analytics para BigData, R sigue teniendo para mí un punto de ventaja. Curiosamente, la mayor parte de las soluciones enterprise para esta etapa lo primero que te cuentan es que son compatibles con "R": IBM, Oracle, etc. Y si apuestas por soluciones opensource tendrás que entonces también bajar un peldaño más y definir el tipo de problemas que quieres solucionar. Para el tipo de modelización habitual (no "deep learning") R/H2O es muy bueno (incluso para un glm de 30 millones o más de registros, ja, ja) y sparklyr/sparkR también son soluciones  muy buenas. Pero si tu problema es de "deep learning" entonces, Python con Keras/Tehano es el camino aunque ahora todo el mundo habla de TensorFlow. R tiene ya mxnet y la solución H2O está en camino.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Por otro lado, Python es un lenguaje de propósito general y es normal su popularidad sea muy alta, pero "R" no anda muy lejos en popularidad, siendo un lenguaje de propósito muy específico. Ahí está la última encuesta de popularidad de lenguajes del IEEE [2] donde "R" es el quinto y Python es el segundo. Pero cuando hablamos de popularidad entre los Científicos de datos, en las encuestas de Kdnuggets en lo que se lleva haciendo la encuestas "R" es el primero, aunque Python subiendo muy rápidamente [3].</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">De todas formas, volviendo al principio, no sé si lo adecuado es hablar de "perder la batalla", ¿hubo alguna vez una guerra?...</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Saludos,</div><div class="gmail_default" style="font-family:verdana,sans-serif">Carlos.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">[1]: <a href="https://www.wired.com/2012/12/worlds-not-ending-but-technologys-aging-backwards/">https://www.wired.com/2012/12/worlds-not-ending-but-technologys-aging-backwards/</a></div><div class="gmail_default" style="font-family:verdana,sans-serif">[2]: <a href="http://spectrum.ieee.org/computing/software/the-2016-top-programming-languages">http://spectrum.ieee.org/computing/software/the-2016-top-programming-languages</a></div><div class="gmail_default" style="font-family:verdana,sans-serif">[3]: <a href="http://blog.revolutionanalytics.com/2016/06/r-holds-top-ranking-in-kdnuggets-software-poll.html">http://blog.revolutionanalytics.com/2016/06/r-holds-top-ranking-in-kdnuggets-software-poll.html</a></div></div><div class="gmail_extra"><br><div class="gmail_quote">El 15 de enero de 2017, 18:02, José Luis Cañadas <span dir="ltr"><<a href="mailto:canadasreche@gmail.com" target="_blank">canadasreche@gmail.com</a>></span> escribió:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hola.<br>
Pues no sabría decirte. Yo vivo rodeado de pythonistas, supongo que por<br>
todo el auge del Big data y los "learning" machine learning,deep learning<br>
¿quien pone los nombres? ;),  mucha gente viene de otras áreas y están<br>
acostumbrados a usar Python y otros lenguajes.<br>
También es cierto que todo lo relacionado con el Big data ha llegado con<br>
Scala y Python. Pero aparte de sparklyr, que pienso que todavía anda un<br>
poco cojo hay que destacar que en la última versión de spark, la api para R<br>
(sparkr) ya incorpora los algoritmos de MLlib. Y tampoco podemos olvidarnos<br>
de h2o que se integra bastante bien con R. Y por último y no menos<br>
importante, para la gran mayoría de problemas de analisis con Big Data no<br>
hace falta el Big, el muestreo lleva tiempo con nosotros y tomando pequeñas<br>
y medianas muestras se obtienen iguales resultados y con menor esfuerzo.<br>
Pero claro, está la cosa esta de decir, ¡ he hecho un glm con 30 millones<br>
de datos!  ¿y?<br>
No sé si impondrá python, R o lo que esté por venir. Aunque he de decir que<br>
para analizar datos me parece más natural R que Python.<br>
<br>
Saludos<br>
<br>
El dom., 15 ene. 2017 14:55, Jesús Para Fernández <<br>
<a href="mailto:j.para.fernandez@hotmail.com">j.para.fernandez@hotmail.com</a>> escribió:<br>
<div><div class="h5"><br>
> Hace poco me puse al tema del big data y la verdad es que een este campo<br>
> la decisión parece clara. Python ahora mismo está un paso por delante de R,<br>
> aunque sparklyR puede igualar la contienda.<br>
><br>
> Pero lo que me empieza a preocupar es que parece que si nos alejamos del<br>
> Big Data, Python tb está ganando adeptos a pasos agigantados. ¿Está<br>
> perdiendo R la batalla?<br>
><br>
><br>
><br>
>         [[alternative HTML version deleted]]<br>
><br>
</div></div>> ______________________________<wbr>_________________<br>
> R-help-es mailing list<br>
> <a href="mailto:R-help-es@r-project.org">R-help-es@r-project.org</a><br>
> <a href="https://stat.ethz.ch/mailman/listinfo/r-help-es" rel="noreferrer" target="_blank">https://stat.ethz.ch/mailman/<wbr>listinfo/r-help-es</a><br>
<br>
        [[alternative HTML version deleted]]<br>
<br>
______________________________<wbr>_________________<br>
R-help-es mailing list<br>
<a href="mailto:R-help-es@r-project.org">R-help-es@r-project.org</a><br>
<a href="https://stat.ethz.ch/mailman/listinfo/r-help-es" rel="noreferrer" target="_blank">https://stat.ethz.ch/mailman/<wbr>listinfo/r-help-es</a><br>
</blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature" data-smartmail="gmail_signature"><span style="font-family:verdana,sans-serif">Saludos,</span><br style="font-family:verdana,sans-serif">
<span style="font-family:verdana,sans-serif">Carlos Ortega</span><br style="font-family:verdana,sans-serif">
<span style="font-family:verdana,sans-serif"><a href="http://www.qualityexcellence.es" target="_blank">www.qualityexcellence.es</a></span></div>
</div>