[R-es] Descarga html

Javier Marcuzzi j@vier@ruben@m@rcuzzi @ending from gm@il@com
Lun Sep 17 18:39:28 CEST 2018


Estimado Sergio Castro

Rvest es otra forma, puede ser curl en una forma más compleja, hay algo por
citar solo un sitio
https://www.analyticsvidhya.com/blog/2017/03/beginners-guide-on-web-scraping-in-r-using-rvest-with-hands-on-knowledge/

Sin embargo, Rselenium es bueno, no recuerdo exactamente como anda con la
última versión, yo continuaría con lo que usted seleccionó como inicio,
pero tenga en cuenta que no es tan simple, es probable que un sitio html so
sea complicado, pero cuándo comienza JavaScript a tener alguna ejecución,
rselenium soluciona ese problema.

Javier Marcuzzi

El lun., 17 sept. 2018 a las 12:47, Sergio Castro (<
castro.rodriguez.sergio using gmail.com>) escribió:

> Buenas tardes,
>
> Estoy intentando automatizar unas tareas en la web y ando un poco perdido.
> Quiero descargar con un Script de R el html de varias páginas de una web.
> Previamente me tengo que identificar (usuario y password) en la web para
> poder acceder a las páginas que me interesan. ¿Tienen alguna idea de por
> donde empezar a mirar? Estoy viendo RSelenium pero si se les ocurre alguna
> forma sencilla, se lo agradecería.
>
> Muchas gracias de antemano.
>
> Un saludo.
>
>         [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es using r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es