[R-es] Scrapping con R

Carlos J. Gil Bellosta cgb en datanalytics.com
Sab Feb 2 14:52:33 CET 2013


Hola, ¿qué tal?

Lo que necesitas es una "araña web",

http://es.wikipedia.org/wiki/Ara%C3%B1a_web

para descargar contenido (siguiendo reglas: p.e., no seguir un enlace
si te lleva fuera del dominio que te interesa, etc.) y luego, tal vez
con R, filtrar el contenido descargado.

R es bueno para hacer "scraping" (procesar contenido de una url
concreta) pero para descargar contenido de un dominio completo no.
Para eso hay herramientas específicas.

Aunque también podrías usar Google restringiendo la búsqueda a tu
dominio de interés.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El día 1 de febrero de 2013 17:47, Beatriz Martínez <mtnezb en gmail.com> escribió:
> Buenas tardes a todos:
>
> No sé si alguno de vosotros sabe si  con R es posible buscar una palabra en
> una web (por ejemplo, buscar "Alicante" en www.lasprovincias.es) y que,
> cada vez que lo encuentre, vaya almacenado las urls en un data.frame
>
>
> gracias de antemano!
>
> --
> Beatriz Martínez
>
>         [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



Más información sobre la lista de distribución R-help-es