[R-es] usar Selenium para web scraping

José Luis Cañadas Reche canadasreche en gmail.com
Vie Jun 5 13:28:06 CEST 2015


Hola.

Tengo que bajarme varias tablas del INE y necesito interactuar con el 
navegador. Ví el fantástico post que  escribió Gregorio Serrano (que la 
tierra le sea leve), en 
http://www.grserrano.net/wp/2014/01/relenium-el-siguiente-nivel-de-web-scraping-con-r/ 
y estoy intentando reproducirlo para aprender como funciona relenium

Pero relenium me da error después de

if(!require(relenium)) install.packages("relenium")

precios <- 
"http://www.ine.es/jaxi/tabla.do?path=/t38/bme2/t07/a081/l0/&file=1300010.px&type=pcaxis&L=0"

firefox <- firefoxClass$new()

Error in exceptionTable[, 1] : subíndice fuera de  los límites

Total que me he puesto a trastear con RSelenium,  y consigo seleccionar 
el elemento combobox pero no sé como obtener los valores que muestra ni 
como seleccionarlos. ¿Alguna idea?



library(RSelenium)
checkForServer()
startServer()

remDr <- remoteDriver(remoteServerAddr = "localhost"
                              , port = 4444
                              , browserName = "firefox"
)

remDr$open()


remDr$navigate(precios)

# buscar por id
webElem1 <- remDr$findElement(using = 'id', value = 'cri1')



Más información sobre la lista de distribución R-help-es