[R-es] Scrapping con R
Carlos J. Gil Bellosta
cgb en datanalytics.com
Sab Feb 2 14:52:33 CET 2013
Hola, ¿qué tal?
Lo que necesitas es una "araña web",
http://es.wikipedia.org/wiki/Ara%C3%B1a_web
para descargar contenido (siguiendo reglas: p.e., no seguir un enlace
si te lleva fuera del dominio que te interesa, etc.) y luego, tal vez
con R, filtrar el contenido descargado.
R es bueno para hacer "scraping" (procesar contenido de una url
concreta) pero para descargar contenido de un dominio completo no.
Para eso hay herramientas específicas.
Aunque también podrías usar Google restringiendo la búsqueda a tu
dominio de interés.
Un saludo,
Carlos J. Gil Bellosta
http://www.datanalytics.com
El día 1 de febrero de 2013 17:47, Beatriz Martínez <mtnezb en gmail.com> escribió:
> Buenas tardes a todos:
>
> No sé si alguno de vosotros sabe si con R es posible buscar una palabra en
> una web (por ejemplo, buscar "Alicante" en www.lasprovincias.es) y que,
> cada vez que lo encuentre, vaya almacenado las urls en un data.frame
>
>
> gracias de antemano!
>
> --
> Beatriz Martínez
>
> [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
Más información sobre la lista de distribución R-help-es